1、章末复习课 整合网络构建警示易错提醒1(1)简单随机抽样中易忽视样本是从总体中逐个抽取的,是不放回抽样,且每个个体被抽到的概率相等(2)系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列(3)分层抽样中,易忽视每层抽取的个体的比例是相同的,即均为.(4)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的(5)易忽视频率分布直方图中纵轴表示的应为.(6)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎
2、与叶的含义(7)回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过的点是(,),可能所有的样本数据点都不在直线上(8)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值)专题一抽样方法及其应用随机抽样有简单随机抽样、系统抽样和分层抽样三种其共同点是在抽样过程中每个个体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,多采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样其中简单随机抽样是最简单、最基本的抽样方法在进行系统抽样和分层抽样时都要用到简单随机抽样例1(1)为了解某地区中小学生的视力情况,拟从该地区的中小
3、学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样 D系统抽样(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11B12C13D14解:(1)因为男女生视力情况差异不大,而各学段学生的视力情况有较大差异,所以应按学段分层抽样,故选C.(2)因为84042201,故编号在481,720内的人数为2402012.答案:(1)C(2
4、)B归纳升华1系统抽样是将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取一个个体2分层抽样从各部分抽取的个体数与该部分个体数的比等于样本容量与总体容量的比变式训练(2014天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_名学生解析:依题意,应从一年级本科生中抽取的学生人数为30060.答案:60专题二利用样本的频率分布估计总体分布本专题主要利用统计表、统计图分析、估计总体的分布规律要熟练掌握绘制统计
5、图表的方法,明确图表中有关数据的意义是正确分析问题的关键从图形与图表中获取有关信息并加以整理,是近年来高考命题的热点问题例2(2014重庆卷改编)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示(1)求频率分布直方图中a的值;(2)分别求出成绩落在50,60)与60,70)中的学生人数解:(1)据直方图知组距为10,由(2a3a7a6a2a)101,解得a0.005.(2)成绩落在50,60)中的学生人数为20.00510202.成绩落在60,70)中的学生人数为30.00510203.归纳升华1已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整
6、体的关系,利用频率和等于1就可求出其他数据2已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解变式训练学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n且支出在20,60)元的样本,其频率分布直方图如图所示,其中支出在50,60)元的同学有30人,则n的值为_(2)(2014江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.解析:(1)支出在50,60)元的频率为10.360.240.10.3,因此0.3,故n1
7、00.(2)底部周长在80,90)的频率为0.015100.15,底部周长在90,100)的频率为0.025100.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.150.25)6024.答案:(1)100(2)24专题三利用样本的数字特征估计总体的数字特征总体的平均数与标准差往往通过样本的平均数、标准差来估计一般地,样本容量越大,对总体的估计越精确平均数描述集中趋势,方差、标准差描述波动大小,也可以说方差、标准差反映各个数据与其平均数的离散程度一组数据的方差或标准差越大,说明这组数据波动越大方差的单位是原数据单位的平方,标准差的单位与原单位相同例3(2014课标全国卷)
8、从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)由数据可作出如下频率分布直方图:(2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100.质量指标值的
9、样本方差为s2(20)20.06(10)20.2600.381020.222020.08104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.380.220.080.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定归纳升华利用频率分布直方图求数字特征的方法1众数是最高的矩形的底边的中点的横坐标2中位数左右两侧直方图的面积相等3平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和4利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出
10、的不一致但它们能粗略估计其众数、中位数和平均数变式训练抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_解析:设甲、乙两位射击运动员的平均成绩分别为甲,乙,方差分别为s,s.由题意得,甲9090,s(x1甲)2(x2甲)2(x5甲)2(3)21202(1)2324;乙9090,s(y1乙)2(y2乙)2(y5乙)2(1)20212(2)2222.因为ss,所以成绩较为稳定(方差较小)的那位运动员成绩的方差为2.答案:2专题四回归分析及其应用回归分析
11、是对具有相关关系的两个变量进行统计分析的一种常用方法相关性问题是日常生活中普遍存在的问题生活中有些变量之间存在着明显的函数关系,有些变量之间不满足函数关系,但是它们之间又存在着一种明显的依赖关系利用回归分析的方法对两个具有线性相关关系的变量研究的步骤为:1画出这两个变量的散点图2求回归直线方程3利用回归直线方程进行预报例4(2014课标全国卷)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表所示年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(
12、2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:解:(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3,4.30.542.3,所求回归方程为0.5t2.3.(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元归纳升华对一组数
13、据进行线性回归分析时,应先画出散点图,看其是否呈直线形,再依,的计算公式算出,.变式训练有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据,如下表所示平均气温/2356销售额/万元20232730根据以上数据,用线性回归的方法,求得销售额y与平均气温x之间的线性回归方程x的系数2.4.则预测平均气温为8 时该商品的销售额为()A34.6万元B35.6万元C36.6万元 D37.6万元解:4,25,所以25(2.4)(4)a.所以15.4.所以回归直线方程为2.4x15.4.当x8时,y34.6,即预测平均气温为8 时,该商品的销售额为34.6万元故选A.答案:A专题五数形结合思想数形结
14、合思想在本章中的重要应用是通过频率分布的态势对总体进行估计及根据散点图确定两个变量是否具有相关关系,并做出判断统计图表(频率分布直方图、茎叶图)与数字特征(平均数、中位数、方差)是高考的重点和热点内容,几乎每年必考,通常以茎叶图和频率分布直方图为载体,考查平均数、中位数、方差等的计算,高考对变量间的相关性的考查呈逐年上升的趋势,主要考查借助散点图直观地分析两个变量间的相关关系,知道回归直线经过样本中心,会求回归方程,并能利用方程对有关变量做出估计例5从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲、乙两组数据的平均数分别为甲,乙,中位数分别
15、为m甲,m乙,则()A.甲m乙 B.甲乙,m甲乙,m甲m乙 D.甲乙,m甲m乙解析:由茎叶图得到甲的取值有一半在20以下,乙取值主要集中在20以上,故甲乙,m甲m乙,选B.答案:B归纳升华求解茎叶图问题,需注意以下两点:1在绘制茎叶图时应注意重复出现的数据应重复记录,不能遗漏2茎叶图在样本数据较少、较为集中且位数不多时比较适用由于它较好地保留了原始数据,所以可以帮助分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征,如众数、中位数、平均数等变式训练(2015课标全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关解析:依据给出的柱形图,逐项验证对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确对于B选项,由图知由2006年到2007年矩形高度明显下降,因此B正确对于C选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正确对于D选项,由图知2006年以来我国二氧化硫年排放量与年份负相关,故D错误答案:D