1、5.1.4用样本估计总体5.2数学探究活动:由编号样本估计总数及其模拟(略)素养目标定方向课程标准学法解读1.能用样本的数字特征估计总体的数字特征2能用样本的分布估计总体的分布通过用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养必备知识探新知知识点用样本估计总体 (1)前提样本的容量恰当,抽样方法合理(2)必要性在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力有时候总体的数字特征不可能获得,只能用_样本_估计总体(3)误差估计一般是有_误差_的但是,大数定律可以保证,当样本的容量_越来越大_时,估计的误差很小的可能性将越来越大思考:用样本估计总体出现误差的原因有哪
2、些?提示:样本抽取的随机性;样本抽取的方法不合适,导致代表性差;样本容量偏少等知识点用样本的数字特征来估计总体的数字特征 (1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的_数字特征_即可(2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征以分两层抽样的情况为例.条件假设第一层有m个数,分别为x1,x2,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,yn,平均数为,方差为t2结论如果记样本的平均值为a,样本方差为b,则,b2知识点用样本的分布来估计总体的分布如果总体在每一个分组的频率记为1,2,n,样本在第一组对应的频率记为p1,p2,pn,一般来说,
3、(ipi)2不等于零当样本的容量_越来越大_时,上式很小的可能性将越来越大关键能力攻重难题型探究题型用样本的特征数估计总体的特征数角度1简单随机抽样的数字特征典例剖析_典例1甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定解析(1)甲(9910098100100103)100,乙(9910010299100100)100s(99100)2(100100)2(98100)2(100100)2(10010
4、0)2(103100)2,s(99100)2(100100)2(102100)2(99100)2(100100)2(100100)21(2)两台机床所加工零件的直径的平均值相同,又ss,所以乙机床加工零件的质量更稳定规律方法:(1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体(2)此类问题需计算样本的平均值和方差来估计总体对点训练_1为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示估计这个学校学生体重的平均数和方差4597966518960 解析将样本中的每一个数都减去50,可得5,1,3,1,4,4,1,8,9,10
5、,这组数的平均数为1,方差为30.4,因此可估计这个学校学生体重的平均数为51,方差为30.4角度2分层抽样的数字特征典例剖析_典例2在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?解析把样本中男生的身高记为x1,x2,x23,其平均数记为,方差记为s;把样本中女生的身高记为y1,y2,y27,其平均数记为,方差记为s,把样本的平均数记为,方差记为s2则165.2,s251.
6、486 2,即样本的方差为51.486 2因此估计高一年级全体学生身高的方差为51.486 2规律方法:1.求分层随机抽样的平均数的步骤(1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式进行求解2求分层随机抽样的方差的步骤(1)求样本中不同层的平均数;(2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式进行求解对点训练_2为了解某公司员工的身体情况,利用分层抽样的方法抽取了9名男员工的身高和体重数据,计算得到他们的体质指数的平均数为25.1,方差为6,抽取了5名女员工的身高和体重数据,计算得到她们的体质指数的平均数为20.3,方差为3.求样本平均数与方差解析样本平均数23
7、.4,方差s210.2题型用样本的分布估计总体的分布典例剖析_典例3我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨)
8、,估计x的值,并说明理由解析(1)由频率分布直方图知,月均用水量在0,0.5)中的频率为0.080.50.04,同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02由0.040.080.5a0.200.260.5a0.060.040.021,解得a0.30(2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.060.040.020.12由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 0000.1236 000(3)因为前6组的频率之和为0.04
9、0.080.150.200.260.150.880.85,而前5组的频率之和为:0.040.080.150.200.260.730.85,所以2.5x3,由0.3(x2.5)0.850.73,所以x2.9,所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准规律方法:(1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值(2)可用样本的分布估计总体的分布对点训练_3某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),
10、80,90,并整理得到如图所示的频率分布直方图:(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等试估计总体中男生和女生人数的比例解析(1)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9,分数在区间40,50)内的人数为1001000.955所以总体中分数在区间40,50)内的人数估计为40020(2)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060,所以样本中分数不小于70的男生人数为6030所以样本中的男生
11、人数为30260,女生人数为1006040,男生和女生人数的比例为604032所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为32易错警示典例剖析_典例4在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩/m1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数、中位数与平均数错解根据以上数据可得众数为1.75,中位数为1.725,平均数为1.69辨析所求数据要注意单位问题,另外中位数计算错误正解在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75 m表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70 m;这组数据的平均数是(1.5021.6031.901)1.69(m)故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m