1、题型专题(七)统计与统计案例抽样方法主要有简单随机抽样、系统抽样和分层抽样三种,这三种抽样方法各自适用于不同特点的总体,但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值题组练透1(2016兰州模拟)为了解城市居民的环保意识,某调查机构从一社区的120名年轻人、80名中年人、60名老年人中,用分层抽样方法抽取了一个容量为n的样本进行调查,其中老年人抽取了3名,则n()A13 B12 C10 D9解析:选A由分层抽样可得603,解得n13,选A.2高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在
2、样本中,则样本中还有一个学生的编号为()A13 B17 C19 D21解析:选C从56名学生中抽取4人,用系统抽样方法,则分段间隔为14,若第一段抽出的号码为5,则其他段抽取的号码分别为:19,33,47.3(2016兰州模拟)采用系统抽样方法从1 000人中抽取50人做问卷调查,将他们随机编号1,2,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间1,400的人做问卷A,编号落入区间401,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为()A12 B13 C14 D15解析:选A根据系统抽样的特点可知,所有做问卷调查的人
3、的编号构成首项为8,公差d20的等差数列an,通项公式an820(n1)20n12,令75120n121 000,得n,又nN*,39n50,做问卷C的共有12人,故选A.技法融会解决抽样问题的策略(1)随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量较多且差别不大时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样(2)在系数抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则分段间隔即为(N为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.1频率分布直方图中横坐标表示组距,纵坐标表示
4、,频率组距.2频率分布直方图中各小长方形的面积之和为1.3利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者的含义:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和题组练透1(2016山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方
5、图,这200名学生中每周的自习时间不少于22.5小时的人数是()A56 B60 C120 D140解析:选D由直方图可知每周自习时间不少于22.5小时的频率为(0.160.080.04)2.50.7,则每周自习时间不少于22.5小时的人数为0.7200140.故选D.2(2016湖南东部六校联考)如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为_解析:把10场比赛的所得分数按顺序排列:5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为15.答案:153(2016江苏高考)已知一组数据4.7,4.8,5.1,5
6、.4,5.5,则该组数据的方差是_解析:5个数的平均数x5.1,所以它们的方差s2(4.75.1)2(4.85.1)2(5.15.1)2(5.45.1)2(5.55.1)20.1.答案:0.14(2015湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示(1)直方图中的a_;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_解析:(1)由0.11.50.12.50.1a0.12.00.10.80.10.21,解得a3.(2)区间0.3,0.5)内的频率为0.11.50
7、.12.50.4,故0.5,0.9内的频率为10.40.6.因此,消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000.答案:(1)3(2)6 000技法融会1方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大2(易错提醒)混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错1回归分析方程x称为线性回归方程,其中,yx;(,)称为样本点的中心2独立性检验K2,若k03.841,则有95%的把握认为两个事件有关;若k06
8、.635,则有99%的把握认为两个事件有关题组练透1(2016河南八市联考)为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如下表所示:开业天数1020304050销售额/天(万元)62758189根据上表提供的数据,求得y关于x的线性回归方程为0.67x54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为()A67 B68 C68.3 D71解析:选B设表中模糊看不清的数据为m.因为x30,又样本点的中心(x,y)在回归直线0.67x54.9上,所以y0.673054.9,得m68,故选B.2(2016重庆模拟)为了判定两个分类变量X和Y是否
9、有关系,应用独立性检验算得K2的观测值为5,又已知P(K23.841)0.05,P(K26.635)0.01,则下列说法正确的是()A有95%的把握认为“X和Y有关系”B有95%的把握认为“X和Y没有关系”C有99%的把握认为“X和Y有关系”D有99%的把握认为“X和Y没有关系”解析:选A依题意,K25,且P(K23.841)0.05.因此有95%的把握认为“X和Y有关系”,选A.技法融会1求回归直线方程的关键(1)正确理解,的计算公式并能准确地进行运算(2)根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值2独立性检验的关键(
10、1)根据22列联表准确计算K2,若22列联表没有列出来,要先列出此表(2)K2的观测值k0越大,对应假设事件H0成立的概率越小,H0不成立的概率越大.一、选择题1某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90 B100 C180 D300解析:选C设该样本中的老年教师人数为x,由题意及分层抽样的特点得,故x180.2以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组
11、数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5 C5,8 D8,8解析:选C由于甲组的中位数是15,可得x5,由于乙组数据的平均数为16.8,得y8.3(2016山西四校联考)某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为20,40),40,60),60,80),80,100,若低于60分的人数是15,则该班的学生人数是()A45 B50 C55 D60解析:选B20,40),40,60)的频率为(0.0050.01)200.3,该班的学生人数是50.4为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万
12、元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元解析:选B由题意知,10,8,80.76100.4,当x15时,0.76150.411.8(万元)5(2016贵州模拟)一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为()A13 B12 C11.52 D.解析:选D由频率分布直方图可得第一组的频率是0.08,第二组的频率是0.32,第三组的频率是0.36,则中位数在第三组内,估计样本数据的
13、中位数为104,选项D正确6某月月底,某商场想通过抽取发票存根的方法估计该月的销售总额先将该月的全部销售发票的存根进行了编号:1,2,3,然后拟采用系统抽样的方法获取一个样本若从编号为1,2,3,10的前10张发票的存根中随机抽取1张,然后再按系统抽样的方法依编号顺序逐次产生第2张、第3张、第4张、,则抽样中产生的第2张已编号的发票存根,其编号不可能是()A13 B17 C19 D23解析:选D因为第一组的编号为1,2,3,10,所以根据系统抽样的定义可知第二组的编号为11,12,13,20,故第2张已编号的发票存根的编号不可能为23.7(2016山西质检)某同学将全班某次数学考试成绩整理成频
14、率分布直方图后,将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示),据此估计此次考试成绩的众数是()A100 B110 C115 D120解析:选C分析频率分布折线图可知众数为115.8将参加夏令营的600名学生编号为:001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,三个营区被抽中的人数依次为()A26,16,8 B25,17,8 C25,16,9 D24,17,9解析:选B依题意及系统抽样的意义可知,将这600名学生按编号依次分
15、成50组,每一组各有12名学生,第k (kN*)组抽中的号码是312(k1)令312(k1)300,得k,因此A营区被抽中的人数是25.令300312(k1)495,得5.024,因为P(K25.024)0.025,所以这种推断犯错误的概率不超过0.025.12(2016开封模拟)下列说法错误的是()A自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B在线性回归分析中,相关系数r的值越大,变量间的相关性越强C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好解析:选B根据相关关系的
16、概念知A正确;当r0时,r越大,相关性越强,当r0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.二、填空题13(2016海口调研)如图是某班8位学生诗词比赛得分的茎叶图,那么这8位学生得分的众数和中位数分别为_解析:依题意,结合茎叶图,将题中的数由小到大依次排列得到:86,86,90,91,93,93,93,96,因此这8位学生得分的众数是93,中位数是92.答案:93,9214(2016广州模拟)一个总体中有60个个体
17、,随机编号0,1,2,59,依编号顺序平均分成6个小组,组号依次为1,2,3,6.现用系统抽样方法抽取一个容量为6的样本,若在第1组随机抽取的号码为3,则在第5组中抽取的号码是_解析:间隔为10,在第5组中抽取的号码是3(51)1043.答案:4315(2016湖北优质高中联考)某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表如下:气温()1813101用电量(度)24343864由表中数据得回归直线方程x中2,预测当气温为4 时,用电量为_解析:回归直线过(x,y),根据题意得x10,y40,将(10,40)代入2x,解得60,所以2x60,当x4时,(2)(4)6068,所以用电量为68度答案:68度16为了研究雾霾天气的治理,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y,z,依次构成等差数列,且4,y,z4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为_解析:由题意可得即解得z12,或z4(舍去),故y8.所以甲、乙、丙三组城市的个数分别为4,8,12.因为一共要抽取6个城市,所以抽样比为.故乙组城市应抽取的个数为82.答案:2