1、复习课(二)统计抽样方法系统抽样、分层抽样是各类考试命题的热点多以选择、填空题形式出现,有时与用样本估计总体或概率问题交汇命题属于中、低档题1简单随机抽样(1)特征:一个一个不放回的抽取;每个个体被抽到可能性相等(2)常用方法:抽签法;随机数表法2系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本3分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样典例(1)采用系统抽样方法从960人中抽
2、取32人做问卷调查为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A7B9C10 D15(2)某地区有小学150所,中学75所,大学25所现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取_所学校解析(1)从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an930(n1)30n21,由
3、45130n21750,得n,所以n16,17,25,共有2516110人(2)小学中抽取3018所学校;从中学中抽取309所学校答案(1)C(2)189类题通法1系统抽样的特点(1)适用于元素个数很多且均衡的总体(2)各个个体被抽到的机会均等(3)总体分组后,在起始部分抽样时采用的是简单随机抽样(4)如果总体容量N能被样本容量n整除,则抽样间隔为k.2与分层抽样有关问题的常见类型及解题策略(1)确定抽样比可依据各层总数与样本数之比,确定抽样比(2)求某一层的样本数或总体个数可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数(3)求各层的样本数可依据题意,求出各层的抽
4、样比,再求出各层样本数1某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法 B系统抽样法C分层抽样法 D随机数法解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法2某学校高一、高二、高三3个年级共有430名学生,其中高一年级学生160名,高二年级学生180名,为了解学生身体状况,现采用分层抽样方法进行调查,在抽取的样本中高二学生有32人,则该样本中高三学生人数为_解析:高三年级学生人数为43016018090,设高三年级抽取x人,由分层抽样可得,解得x16.答案:163某单
5、位有职工960人,其中青年职工420人,中年职工300人,老年职工240人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为_解析:因为分层抽样的抽样比应相等,所以,样本容量32.答案:32用样本的频率分布估计总体的频率分布题型既有选择题、填空题,也有解答题,主要考查频率分布直方图的画法以及频率分布直方图的读图问题1频率分布直方图2茎叶图典例(1)如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),
6、23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为_ (2)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100求图中a的值;根据频率分布直方图,估计这100名学生语文成绩的平均分;若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在50,90)之外的人数.分数段50,60)60,70)70,80)80,90)xy11213445解析(1)设样
7、本容量为n,则n(0.10.12)111,所以n50,故所求的城市个数为500.189.答案:9(2)解:由频率分布直方图可知(0.040.030.022a)101.所以a0.005.该100名学生的语文成绩的平均分约为0.05550.4650.3750.2850.059573.由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段50,60)60,70)70,80)80,90)x5403020xy11213445y5204025于是数学成绩在50,90)之外的人数为100(5204025)10.类题通法与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布
8、直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解1.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()A0.2 B0.4C0.5 D0.6解析:选B由茎叶图可知数据落在区间22,30)内的频数为4,所以数据落在区间22,30)内的频率为0.4,故选B.2为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示根据此图,估计该校2 000名高中男生
9、中体重大于70.5公斤的人数为()A300 B360C420 D450解析:选B样本中体重大于70.5公斤的频率为:(0.040.0340.016)20.09020.18.故可估计该校2 000名高中男生中体重大于70.5公斤的人数为:2 0000.18360(人)3某商场在庆元宵节促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为_万元解析:总销售额为25(万元),故11时至12时的销售额为0.42510(万元)答案:10用样本的数字特征估计总体的数字特征题型为选择题或填空题,常与直观图、茎叶图等内容相
10、结合命题1有关数据的数字特征2众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会相应引起平均数的变动(3)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映问题(4)中位数仅与数据的大小排列顺序有关,某些数据的变动可能对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势典例(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图
11、所示,则()A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差(2)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_(从小到大排列)解析(1)由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为(46)2(56)2(66)2(76)2(86)22,(56)2(56)2(56)2(66)2(96)2,C对;甲、乙的成绩的极差均为4,
12、D错故选C.(2)假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,则又s 1,(x12)2(x22)22.同理可求得(x32)2(x42)22.由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x2)2(y2)22上的点,分析知x1,x2,x3,x4应为1,1,3,3.答案(1)C(2)1,1,3,3类题通法平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小1(山东高考)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数
13、据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()A BC D解析:选B法一:甲29,乙30,甲s乙故可判断结论正确法二:甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论正确,故选B.2.甲和乙两个城市去年上半年每月的平均气温(单位:)用茎叶
14、图记录如图所示,根据茎叶图可知,两城市中平均温度较高的城市是_,气温波动较大的城市是_解析:根据题中所给的茎叶图可知,甲城市上半年的平均温度为16,乙城市上半年的平均温度为19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大答案:乙乙3甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm):甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机
15、床加工的这种零件更符合要求解:(1)甲100(mm),乙100(mm),s(99100)2(100100)2(98100)2(100100)2(100100)2(103100)2(mm2),s(99100)2(100100)2(102100)2(99100)2(100100)2(100100)21(mm2)(2)因为ss,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求.线性回归主要考查线性相关关系的判断,回归方程的求法以及利用回归分析解决实际问题考查形式为选择题、填空题、解答题,属于中低档题1两个变量的线性相关(1)散点图:将样本中n个数据点(xi,yi)(i1,2,n)描在平面直
16、角坐标系中得到的图形(2)正相关与负相关:正相关:散点图中的点散布在从左下角到右上角的区域负相关:散点图中的点散布在从左上角到右下角的区域2回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(2)线性回归方程:方程x是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的线性回归方程,其中a,b是待定参数典例某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求
17、回归直线方程x,其中20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解(1)由于(88.28.48.68.89)8.5,(908483807568)80.所以80208.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1 00020(x8.25)2361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润类题通法(1)线性回归分析就是研究两组变量间线性相关关系的一
18、种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算(2)回归直线方程恒过点(,)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x()1011131286就诊人数y(人)222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进
19、行检验(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程x;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?解:(1)将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15个基本事件,设抽到相邻两个月的
20、事件为A,则A(1,2),(2,3),(3,4),(4,5),(5,6)共5个基本事件,P(A).(2)由表中数据求得11,24,iyi1 092,498.代入公式可得.再由,求得,所以y关于x的线性回归方程为x.(3)当x10时,2;同样,当x6时,2.所以该小组所得线性回归方程是理想的1某全日制大学共有学生5 600人,其中专科生有1 300人、本科生有3 000人、研究生有1 300人,现采用分层抽样的方法抽取280人,调查学生利用因特网查找学习资料的情况,则应在专科生、本科生与研究生这三类学生中分别抽取()A65人,150人,65人B30人,150人,100人C93人,94人,93人D
21、80人,120人,80人解析:选A抽样比为,所以专科生应抽取1 30065(人),本科生应抽取3 000150(人),研究生应抽取1 30065(人),故选A.2某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,根据学号(001056),用系统抽样的方法抽取一个容量为4的样本,已知007号、021号、049号在样本中,那么样本中还有一个学生的学号为()A014B028C035 D042解析:选C由系统抽样的原理知抽样的间隔为14,故第一组的学号为001014,所以007为第一组内抽取的学号,所以第二组抽取的学号为021;第三组抽取的学号为035;第四组抽取
22、的学号为049.故选C.3如图是2016年某中学举行的校园之星评选活动中,七位评委为某位同学打出的分数的茎叶图,则该组数据的中位数和众数分别为()A.86,84 B84,84C85,84 D85,93解析:选B将打分按从小到大的顺序排列为79,84,84,84,86,87,93,则中位数为84,而众数就是出现次数最多的数,即84,故选B.4为了解某市高三男生的体重情况,随机抽查了该市100名高三男生的体重(单位:kg),得到的频率分布直方图如图所示,则这100名男生中体重在56.5,64.5)kg(阴影部分)内的人数是()A20 B30C40 D50解析:选C阴影区域的面积等于2(0.030.
23、050.050.07)0.4,所以体重在56.5,64.5)kg内的男生人数是0.410040.5某题的得分情况如下:得分/分01234频率/%37.08.66.028.220.2其中众数是()A37.0% B20.2%C0分 D4分解析:选C根据众数的概念可知C正确6观察下列各图:其中两个变量x,y具有相关关系的图是()A BC D解析:选C由散点图知具有相关关系7某学生在一门功课的22次考试中,所得分数如茎叶图所示,则该学生该门功课考试分数的极差与中位数之和为_.解析:最大数为98,最小数为56,极差为985642,中位数为76,所以极差与中位数之和为118.答案:1188为了解篮球爱好者
24、小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为_;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_解析:平均命中率(0.40.50.60.60.4)0.5;而3,xiyi7.6,x55,由公式得0.01, 0.50.0130.47,0.01x0.47,令x6,得0.53.答案:0.50.539某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三
25、年级抽取的人数是_解析:高三的人数为900240260400,所以在高三抽取的人数为40020.答案:201020名学生某次数学考试成绩(单位:分)的频率分布直方图如图:(1)求频率分布直方图中a的值;(2)分别求出成绩落在50,60与60,70中的学生人数解:(1)据直方图知组距为10,由(2a3a7a6a2a)101,解得a0.005.(2)成绩落在50,60)中的学生人数为20.00510202.成绩落在60,70)中的学生人数为30.00510203.11高三某班学生每周用于物理学习的时间x(单位:小时)与物理成绩y(单位:分)之间有如下关系:x24152319161120161713
26、y92799789644783687159根据上表可得回归方程的斜率为3.53,求回归直线在y轴上的截距(保留一位小数)解:由已知可得17.4,74.9.设回归直线方程为3.53x,则74.93.5317.4,解得13.5.12为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患
27、者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?解:(1)设A药观测数据的平均数为,B药观测数据的平均数,由观测结果可得(0.61.21.21.51.51.82.22.32.32.42.52.62.72.72.82.93.03.13.23.5)2.3,(0.50.50.60.80.91.11.21.21.31.41.61.71.81.92.12.42.52.62.73.2)1.6,由以上计算结果可得,因此可以看出A药的疗效更好(2)由观测结果可绘制如下茎叶图从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,B药疗效的试验结果有的叶集中在茎0,1上,由此可以看出A药的疗效更好