1、巩固层知识整合提升层题型探究抽样方法【例1】某商场有四类食品,食品类别和种数见下表:类别粮食类植物油类动物性食品类果蔬类种数40103020现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为_6因为总体的个数为40103020100,所以根据分层抽样的定义可知,抽取的植物油类食品种数为202,抽取的果蔬类食品种数为204,所以抽取的植物油类与果蔬类食品种数之和为246.1抽样方法有:简单随机抽样、分层抽样2两种抽样方法比较3选择抽样方法与总体的个体数有关在具体的抽样过程中还需明确下列运算关系:(1)两种抽样方法中每个个体被抽到的可
2、能性p.(2)对于分层抽样,设第i层的个体数及从其中抽取的样本个体数分别为Ni,ni(iN*),则分层抽样比p.跟进训练1从30个个体(编号为0029)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为_9264460720213920776638173256164058587766317005002593054553707814288966286757823115890062004738155131818637094521666553255383270290557196217232
3、07111413844359448817,00,02,07在随机数表中,将处于0029的号码选出,满足要求的前4个号码为17,00,02,07.2利用简单随机抽样,从n个个体中抽取一个容量为10的样本若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为_根据题意,解得n28.故在整个抽样过程中每个个体被抽到的概率为.用样本的频率估计总体分布【例2】有1个容量为100的样本,数据(均为整数)的分组及各组的频数如下:12.5,15.5),6;15.5,18.5),16;18.5,21.5),18;21.5,24.5),22;24.5,27.5),20;27.5,
4、30.5),10;30.5,33.5,8.(1)列出样本的频率表;(2)画出频率直方图;(3)估计数据小于30的数据约占多大百分比思路点拨(1)每组频率.(2)频率直方图中,纵轴表示的是.(3)小于30的数据所占百分比也就是前6组的频率之和,可用两种方法求解,法一:前6组频率相加,法二:用1减去第7组频率解(1)样本的频率表如下:分组频数频率12.5,15.5)60.0615.5,18.5)160.1618.5,21.5)180.1821.5,24.5)220.2224.5,27.5)200.2027.5,30.5)100.1030.5,33.580.08合计1001.00(2)频率直方图如图
5、(3)法一:小于30的数据占(0.060.160.180.220.200.10)100%92%.法二:因为所有组的频率之和为1,大于30的数据占0.08,故小于30的数据占(10.08)100%92%.1样本频率直方图的制作步骤(1)求全距,确定组距和组数,要根据全距的大小和数据的多少,选择恰当的组距,使表格不至于太长或太短当不是整数时,组数的“取舍”一般不是依据四舍五入,而是按组数1确定,即取的整数部分加1.(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间(3)计算频数、频率,列出频率表(4)建立平面直角坐标系,把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,
6、高等于该组的,这样得到一系列矩形,每一个矩形的面积恰好是该组上的频率,这些矩形构成了频率直方图2求频率、频数的方法与技巧(1)频率,已知其中任意两个量就可以求出第三个量(2)各小组的频数和等于样本容量,频率和等于1.(3)由样本的频率可估计总体的频率,从而估计出总体的频数跟进训练3为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为_544.7,4.8)之间频率为0.32,4.6,4.7)之间频率为10.620.050.1110.78
7、0.22.所以a(0.220.32)10054.4为了解高中一年级学生身高情况,某校按10%的比例对全校700名高中一年级学生按性别进行抽样检查,测得身高频数分布表如表1,表2.表1:男生身高频数分布表身高(cm)160,165)165,170)170,175)175,180)180,185)185,190频数25141342表2:女生身高频数分布表身高(cm)150,155)155,160)160,165)165,170)170,175)175,180频数1712631(1)求该校男生的人数并画出频率直方图;(2)估计该校学生身高在165 cm180 cm的人数占总人数的百分比解(1)样本中
8、男生人数为40,分层抽样比例为10%,可得全校男生人数为400.频率直方图如图(2)由表1、表2知,样本中身高在165 cm180 cm的学生人数为5141363142,样本容量为70,所以样本中学生身高在165 cm180 cm的频率为,故估计该校学生身高在165 cm180 cm的人数占总人数的60%.用样本的特征数估计总体的特征数 【例3】甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为甲:99,100,98,100,100,103;乙:99,100,102,99,100,100.(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工
9、零件的质量更稳定思路点拨利用平均数公式及方差公式计算求解,方差小的质量更稳定解(1)甲(9910098100100103)100,乙(9910010299100100)100.s(99100)2(100100)2(98100)2(100100)2(100100)2(103100)2,s(99100)2(100100)2(102100)2(99100)2(100100)2(100100)21.(2)两台机床所加工零件的直径的平均数相同,又ss,所以乙机床加工零件的质量更稳定样本的特征数可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准
10、差我们常通过样本的特征数估计总体的特征数跟进训练5有容量为100的样本,数据分组及各组的频数、频率如下:12.5,14.5),6,0.06;14.5,16.5),16,0.16;16.5,18.5),18,0.18;18.5,20.5),22,0.22;20.5,22.5),20,0.20;22.5,24.5),10,0.10;24.5,26.5,8,0.08.试估计总体的平均数解法一:总体的平均数约为(13.5615.51617.51819.52221.52023.51025.58)19.42.故总体的平均数约为19.42.法二:求组中值与对应频率积的和1350.0615.50.1617.5
11、0.1819.50.2221.50.2023.50.1025.50.0819.42.故总体的平均数约为19.42.6对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲6080709070乙8060708075问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?解甲的平均成绩为甲74,乙的平均成绩为乙73.所以甲的平均成绩好甲的方差是s(14)262(4)2162(4)2104,乙的方差是s72(13)2(3)2722256.因为ss,所以乙的各门功课发展较平衡.统计图表的综合应用【例4】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表
12、:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)在相应位置上作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?思路点拨(1)由频数分布表,计算各组的频率,再利用频率除以组距,得到各个小矩形的高,进一步画出频率直方图;(2)求出各组组中值和相应频率的乘积,再求和即可;(3)先计算质量指标值不低于95的产品所占比例的估计值解(1)频率分布直方图如图:(
13、2)质量指标值的样本平均数为800.06900.261000.381100.221200.08100.质量指标值的样本方差为s2(20)20.06(10)20.2600.381020.222020.08104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.380.220.080.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定1画频率直方图,需要先列出频率分布表2利用频率直方图计算样本的平均数,利用各组组中值和相应频率的乘积,再求和即可3以样本
14、估计总体的变化规律,使得统计更加具有应用价值跟进训练7为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程非一户一表用户电费采用“合表电价”收费标准:0.65元/度“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:第一档第二档第三档每户每月用电量(单位:度)0,200(200,400(400,)电价(单位:元/度)0.610.660.91例如:某用户11月用电410度,采用合表电价收费标准,应交电费4100.65266.5(元),若采用阶梯电价收费标准,应交电费2000.61(400200)0.66(410400)0.91263.1(元)为调查阶梯电价是
15、否能取到“减轻居民负担”的效果,随机调查了该市100户居民的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为88、268、370、140、440、420、520、320、230、380.组别月用电量频数统计频数频率0,100(100,200正正一(200,300正正正正(300,400正正正正正(400,500正正正正(500,600合计(1)完成频率分布表,并绘制频率分布直方图;(2)根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);(3)设某用户11月用电量为x度(xN),按照合表电价收费标准应交y1元
16、,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?解(1)频率分布表如下:组别月用电量频数统计频数频率0,10040.04(100,200正正120.12(200,300正正正正240.24(300,400正正正正正正300.30(400,500正正正正正一260.26(500,60040.04合计1001频率分布直方图如图:(2)该100户用户11月的平均用电量500.041500.122500.243500.34500.265500.04324(度),所以估计全市住户11月的平均用电量为324度(3)y10.65x,y2 由y2y1得 或 或 ,解得x423.1.因为xN,故x的最大值为423.根据频率分布直方图,x423时的频率为0.040.120.240.3230.002 60.759 80.75,故估计“阶梯电价”能给不低于75%的用户带来实惠