收藏 分享(赏)

专题06 统计(知识梳理)-2020-2021学年高一数学单元复习(人教A版必修3).docx

上传人:a**** 文档编号:829538 上传时间:2025-12-15 格式:DOCX 页数:3 大小:24.90KB
下载 相关 举报
专题06 统计(知识梳理)-2020-2021学年高一数学单元复习(人教A版必修3).docx_第1页
第1页 / 共3页
专题06 统计(知识梳理)-2020-2021学年高一数学单元复习(人教A版必修3).docx_第2页
第2页 / 共3页
专题06 统计(知识梳理)-2020-2021学年高一数学单元复习(人教A版必修3).docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、专题06第二章 统计(知识梳理) 学习目标1.梳理本章知识,构建知识网络.2.会根据不同的特点选择适当的抽样方法获得样本数据.3.能利用图、表对样本数据进行整理分析,用样本和样本的数字特征估计总体.4.能利用散点图对两个变量是否相关进行初步判断,能用线性回归方程进行预测1抽样方法(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数(2)两种抽样方法的异同点类别各自特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先

2、确定的规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.用样本估计总体频率分布直方图1作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称

3、这条光滑曲线为总体密度曲线用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便(2)样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本数据波动大小的,包括方差及标准差样本的数字特征1众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中

4、位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,xn,那么这n个数的平均数平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s .(2)方差:标准差的平方s2s2(x1)2(x2)2(xn)2,其中xi(i1,2,3,n)是样本数据,n是样本容量,是样本平均数3变量间的相关关系回归分析1变量间的相关关系(1)常见的两变量之间的关系有两类:一类

5、是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)回归方程为x,其中,.(3)通过求Q (yibxia)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法(4)相关系数:当r0时,表明两个变量正相关;当r0时,表明两个

6、变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系通常|r|大于0.75时,认为两个变量有很强的线性相关性独立性检验假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量)易误提醒(1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 语文

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1