1、第十六讲统计及统计案例真题试做1(2013高考课标全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样 D系统抽样2(2013高考重庆卷)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()A0.2 B0.4C0.5 D0.63(2013高考湖北卷)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以
2、下四个结论:() y与x负相关且2.347x6.423; y与x负相关且3.476x5.648; y与x正相关且5.437x8.493; y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A BC D4(2013高考福建卷)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A588 B480C450 D120考情分析统计的主要内容包括随机抽样、样本估计总体、
3、变量的相关性该部分在高考中主要是以选择题或填空题的形式考查随机抽样方法,根据样本的频率分布表和频率分布直方图考查用样本估计总体,根据茎叶图考查数据特征数的计算及变量的相关性等,近年来把统计和概率结合起来命制解答题是高考考查的一个趋势统计案例的主要内容包括回归分析和独立性检验高考对该部分的考查主要是线性回归分析和独立性检验的基本思想方法考点一抽样方法抽样方法的考查主要以考查分层抽样为主,次之考查系统抽样,试题往往以选择题或填空题的形式单独命题考查,或与概率、统计等问题以解答题的形式综合考查试题难度不大,分值在512分左右(2013高考陕西卷)某单位有840名职工,现采用系统抽样方法抽取42人做问
4、卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11B12C13 D14【思路点拨】根据系统抽样的方法结合不等式求解在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为(N为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体强化训练1某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270;使
5、用系统抽样时,将学生统一随机编号1,2,270,并将整个编号依次分为10段如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是()A、都不能为系统抽样B、都不能为分层抽样C、都可能为系统抽样D、都可能为分层抽样考点二用样本估计总体用样本估计总体一般考查应用频率分布直方图、茎叶图、求解中位数、众数、平均
6、数和方差等问题,此类试题主要以选择题或填空题的形式考查,试题难度不大,分值为5分,易得满分(1)(2013高考重庆卷)右面茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5C5,8 D8,8(2)(2013高考湖北卷)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示直方图中x的值为_;在这些用户中,用电量落在区间100,250)内的户数为_【思路点拨】(1)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解(2)根
7、据频率分布直方图中各个小矩形的面积之和等于1,可求出x的值;求出月用电量落在100,250)内的频率,即可求得月用电量在100,250)内的户数 (1)解决与茎叶图有关的问题时,关键是搞清“茎”和“叶”分别代表什么(2)用样本估计总体时,如果已知频率分布直方图,那么就用样本在各个小组的频率估计总体在相应区间内的频率,用样本的均值估计总体的均值,根据频率分布直方图估计样本均值的方法是取各个小组的中点值乘以各个小组的频率之和进行的强化训练2(1)(2013东城区3月联考题)从某校高三学生中随机抽取100名同学,将他们的考试成绩(单位:分)绘制成频率分布直方图(如图),则图中a_,由图中数据可知此次
8、成绩平均分为_(2)(2013武昌区联考)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按140编号,并按编号顺序平均分成5组按系统抽样方法在各组内抽取一个号码若第1组抽出的号码为2,则所有被抽出职工的号码为_;分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为_考点三变量的相关性与统计案例本考点以考查线性回归系数、独立性检验、回归分析为主,并借助一些简单的实际问题来了解一些基本的统计思想本部分的命题主要以选择题和填空题为主,属中档题(2013高考重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:
9、千元)的数据资料,算得样本平均值,线性回归方程也可写为x.【思路点拨】根据线性回归方程知识直接运算求解(1)由回归方程分析得出的数据只是预测值不是精确值,此类问题的易错点是方程中的计算,代入公式计算要细心(2)独立性检验是指利用22列联表,通过计算随机变量K2来确定在多大程度上两个分类变量有关系的方法K2值越大,说明两个分类变量X与Y有关系的可能性越大要会用临界值表判断X与Y有关系的可信程度强化训练3(2013昆明市调研)气象部门提供了某地区今年六月份(30天)的日最高气温的统计表如下:日最高气温t(单位:)t2222t282832天数612YZ由于工作疏忽,统计表被墨水污染,Y和Z数据不清楚
10、,但气象部门提供的资料显示,六月份的日最高气温不高于32 的频率为0.9.(1)若把频率看作概率,求Y,Z的值;(2)把日最高气温高于32 称为本地区的“高温天气”,根据已知条件完成下面22列联表,并据此推测是否有95%的把握认为本地区的“高温天气”与西瓜“旺销”有关?说明理由.高温天气非高温天气合计旺销1不旺销6合计附:K2P(K2k)0.100.0500.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828数据处理能力统计中的数据收集与处理数据处理能力是从大量数据中学会收集、整理、分析数据,抽取对研究问题有用的信息,并能做出正确判断(2013
11、高考山东卷)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:87794010x91则7个剩余分数的方差为()A.B.C36 D.【解析】根据茎叶图,去掉1个最低分87,1个最高分99,则8794909190(90x)9191,x4.s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2【答案】B平均分91分不是9个得分的平均分茎叶图中有两个87只能去掉1个,而最高一定是99.公式应用要正确,计算要仔细 跟踪训练为了解某校高三学生的视力情况,随机地抽
12、查了该校200名高三学生的视力情况,得到频率分布直方图,如图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到4.9之间的学生数为b,则a,b的值分别为()A0.27,132B0.27,166C2.7,132 D2.7,166体验真题把脉考向_1【解析】选C.由于三个学段学生的视力情况差别较大,故需按学段分层抽样2【解析】选B.由题意知,这10个数据落在区间22,30)内的有22、22、27、29,共4个,所以其频率为0.4,故选B.3【解析】选D.由正负相关性的定义知一定不正确4【解析】选B.不少于60分的学生的频率为(0.0300
13、.0250.0150.010)100.8,该模块测试成绩不少于60分的学生人数应为6000.8480._典例展示解密高考_【例1】【解析】抽样间隔为20.设在1,2,20中抽取号码x0(x01,20),在481,720之间抽取的号码记为20kx0,则48120kx0720,kN*.24k36.,1,k24,25,26,35,k值共有3524112(个),即所求人数为12.【答案】B强化训练1【解析】选D.分析所产生的四组数据的可能用的抽样方法,然后,再与选项结合对于,我们清楚了它可能是系统抽样抽取的实际上,由于前108号中有四个,即“7,34,61,88”;在109至190中有三个,即“115
14、,142,169”;在190以后的号中有三个,即“196,223,250”;于是,也可能是分层抽样的结果;当然,也可能是简单随机抽样的结果按系统抽样,第一段127号中只有一个号,因此,它不可能是系统抽样产生的因为前108号中有4个,在109到190内有3个,190号以后有3个,因此它也可能是分层抽样的结果,当然还可以是简单随机抽样的结果可能是系统抽样产生的:实际上,由于前108号中也有四个,即“11,38,65,92”;在109至190中也有三个,即“119,146,173”;在190以后的号中也是三个,即“200,227,254”;于是,也可能是分层抽样的结果;当然,也可能是简单随机抽样的结
15、果最后看,我们知道它不是系统抽样产生的,由于它在前108号中只有三个,即“30,57,84”,因此,也不是分层抽样的结果,那么,它只能是简单随机抽样产生的综上所述,正确答案为D.【例2】【解析】(1)由于甲组数据的中位数为1510x,x5.又乙组数据的平均数为16.8,y8.x,y的值分别为5,8.(2)由于(0.002 40.003 60.006 0x0.002 40.001 2)501,解得x0.004 4.数据落在100,250)内的频率是(0.003 60.006 00.004 4)500.7,所以月用电量在100,250)内的户数为1000.770.【答案】(1)C(2)0.004
16、470强化训练2【解析】(1)根据频率分布直方图中“各矩形的高度之和组距1”可得(0.005a0.030.020.010)101a0.035,频率分布直方图估计样本的均值是取各个小组的中点值乘以各个小组的频率之和得:平均成绩为:450.00510550.03510650.0310750.0210850.0101064.5.(2)由题意知被抽出职工的号码为2,10,18,26,34.由茎叶图知5名职工体重的平均数x69,则该样本的方差s2(5969)2(6269)2(7069)2(7369)2(8169)262.【答案】(1)0.03564.5(2)2,10,18,26,3462【例3】【解】(
17、1)由题意知n10, 由此得b0.3,ay,bx,20.380.4,故所求线性回归方程为y0.3x0.4.(2)由于变量y的值随x值的增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)强化训练3【解】(1)由已知得:P(t32)0.9,P(t32)1P(t32)0.1,Z300.13,Y30(6123)9.(2)由题意得到如下22列联表:高温天气非高温天气合计旺销12122不旺销268合计32730K22.727,2.7273.841,没有95%的把握认为本地区的“高温天气”与西瓜“旺销”有关_名师讲坛精彩推荐_跟踪训练【解析】选A.由图可知(4.3,4.4,(4.4,4.5的频率分别为0.01,0.03,由于前四组的频数成等比数列,故前四组的频率也成等比数列,且公比为3,所以前四组频率依次为:0.01,0.03,0.09,0.27,设最后一组频率为x,则由后6组频数成等差数列知,后6组频率也成等差数列,所以610.010.030.09,解得x0.02.故后5组频率依次为0.22,0.17,0.12,0.07,0.02.因此,a0.27,b200(0.270.220.17)132.