1、巩固层知识整合提升层题型探究抽样方法的选择与应用【例1】(1)在下列问题中,分别可以采用什么方法抽取样本?a从20台液晶电视中抽取4台进行检验;b某学校有300名教职员工,其中教师210人,行政人员35人,后勤服务人员55人,为了解教职工对学校工作的满意度,需要抽取一个容量为60的样本;c从800辆车中抽取8辆进行检测(2)一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表:轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆求z的值;用分层抽样的方法在C类轿车中抽取
2、一个容量为5的样本解(1)a.用简单随机抽样抽取样本即可b用分层抽样的方法抽取样本,不同职位的人的满意度是不同的c用系统抽样比较合适,因为样本容量较大(2)设该厂本月生产轿车n辆,由题意得,所以n2 000,则z2 000100300150450600400.设所抽取的样本中有m辆舒适型轿车,因为用分层抽样的方法在C类轿车中抽取一个容量为5的样本,所以,解得m2,即在C类轿车中抽取2辆舒适型轿车,3辆标准型轿车1进行系统抽样时,必须满足总体容量可以被样本容量整除当不能整除时,应用简单随机抽样的方法从总体中剔除部分个体,其中剔除的个体数是总体中的个体数除以样本容量的余数2进行分层抽样时,每层中所
3、抽取的个数应按各层个体数在总体中所占的比例抽取,即抽样比.在实际操作中,应先计算出抽样比,再按抽样比确定每层需要抽取的个体数:该层个体数目1某高级中学有学生270人,其中一年级108人,二、三年级各81人现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样、分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270;使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,
4、195,200,265;11,38,65,92,119,146,173,200,227,254;20,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A都不能为系统抽样B都不能为分层抽样C都可能为系统抽样D都可能为分层抽样D按分层抽样时,在一年级抽取1084(人),在二年级、三年级各抽取813(人),则在号码段1,2,108中抽取4个号码,在号码段109,110,189中抽取3个号码,在号码段190,191,270中抽取3个号码,符合,所以可能是分层抽样,不符合,所以不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,符合
5、,不符合,所以都可能为系统抽样,都不能为系统抽样用样本的频率分布估计总体分布【例2】有1个容量为100的样本,数据的分组及各组的频数如下:12.5,15.5),6;15.5,18.5),16;18.5,21.5),18;21.5,24.5),22;24.5,27.5),20;27.5,30.5),10;30.5,33.5,8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图;(3)估计数据小于30.5的数据约占多大百分比解(1)样本的频率分布表如下:分组频数频率累积频率12.5,15.5)60.060.0615.5,18.5)160.160.2218.5,21.5)180.1
6、80.4021.5,24.5)220.220.6224.5,27.5)200.200.8227.5,30.5)100.100.9230.5,33.580.081.00合计1001.00(2)频率分布直方图如下图(3)小于30.5的数据约占92%.1绘制频率分布直方图应注意的四个问题(1)计算全距,需要找出这组数的最大值和最小值当数据很多时,可选一个数当参照(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目一般来说,数据越多,分组越多(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且使第一组的起点比最小值稍微小一点(4)画频率分布直方图时,纵坐标表示频率与组
7、距的比值,一定不能标成频率2频率分布直方图中,纵坐标的含义是频率比组距2有一容量为200的样本,数据的分组以及各组的频数如下:20,15),7;15,10),11;10,5),15;5,0),40;0,5),49;5,10),41;10,15),20;15,20,17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率解(1)频率分布表如下:分组频数频率20,15)70.03515,10)110.05510,5)150.0755,0)400.20,5)490.2455,10)410.20510,15)200.115,20170.085合计2001
8、.00(2)如图是频率分布直方图和频率分布折线图:(3)样本数据不足0的频率为:00350.0550.0750.20.365.用样本的数字特征估计总体的数字特征【例3】某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔一小时抽一包产品,称其重量(单位:克)是否合格,分别记录抽查数据,获得重量数据茎叶图如图(1)写出甲的众数和乙的中位数;(2)根据样本数据,计算甲、乙两个车间产品重量的均值与方差,并说明哪个车间的产品的重量相对稳定解(1)甲的众数是111,乙的中位数是111.(2)设甲、乙两个车间产品重量的均值分别为甲、乙,方差分别为s、s,则甲113,乙113,s(122113)2(1
9、14113)2(113113)2(111113)2(111113)2(107113)221,s(124113)2(110113)2(112113)2(115113)2(108113)2(109113)229.33,由于ss,所以甲车间的产品的重量相对稳定在实际问题中,仅靠平均数不能完全反映问题,还要研究数据偏离平均数的离散程度(即方差或标准差).标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定.3要从甲、乙两名工人中选出一名参加机床技术表演,先对甲、乙两名工人进行测试,使用同一台机床,甲、乙两人各在10天内每天出的次品数如下:甲:2,1,0,2,3,1,0,
10、4,2,0;乙:1,2,0,3,1,1,2,1,0,1.分别计算这两个样本的平均数与方差,从计算结果看,应选哪一名工人参加技术表演?解甲1.5;乙(1203112101)1.2;s(21.5)2(11.5)2(01.5)2(21.5)2(31.5)2(11.5)2(01.5)2(41.5)2(21.5)2(01.5)2(0.5251.5242.52)1.65;s(11.2)2(21.2)2(01.2)2(31.2)2(11.2)2(11.2)2(21.2)2(11.2)2(01.2)2(11.2)20.76,甲乙,ss,应选乙工人参加比赛线性回归分析【例4】已知10只狗的血细胞体积及红细胞数的
11、测量值如下表:血细胞体积x(mm3)45424648423558403950红细胞数y(百万)6.536.309.527.506.995.909.496.206.558.72(1)根据上表画出散点图;(2)根据散点图,判断血细胞体积x与红细胞数y之间是否具有相关关系;(3)求回归方程解(1)散点图如下图所示(2)从散点图可以看出,两个变量的对应点都集中在一条直线的附近,且y随x的增大而增大,因此血细胞体积x与红细胞数y之间具有相关关系(3)(45424648423558403950)44.50,(6.536.309.527.506.995.909.496.206.558.72)7.37,xiy
12、i3 346.32,x20 183,设回归方程为yabx,则b0.175,ab0.418.回归方程为y0.175x0.418.解答回归分析问题的五个注意点1先用散点图确定是否线性相关;2准确计算回归方程中的各个系数;3回归直线必过样本中心点;4利用线性回归方程求出的值只是估计值,会与实际值有一定的误差;5回归直线必定经过样本的中心点,样本的数据点不一定在回归直线上4某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这种服装件数x之间有如下一组数据:x3456789y66697381899091已知:x280,xiyi3 487.(1)求,;(2)求纯利y与每天销售件数x之间的线性回归方程;(3)估计每天销售10件这种服装时纯利润为多少元?解(1)由已知得(3456789)6,(66697381899091)79.86.(2)设线性回归方程为ybxa,则b4.75,ab79.864.75651.36.所求线性回归方程为y4.75x51.36.(3)当x10时,y98.86,估计每天销售这种服装10件可获纯利98.86元