1、22.2用样本的数字特征估计总体的数字特征预习课本P7178,思考并完成以下问题(1)如何根据样本数据的频率分布直方图,分别估计总体的众数、中位数和平均数? (2)如何理解众数、中位数、平均数与极端数据的关系? (3)平均数向我们提供了样本数据的重要信息,平均数会使我们作出对总体的片面判断吗? (4)方差、标准差有什么区别与联系? 1众数、中位数、平均数的概念(1)众数:一组数据中出现次数最多的数(2)中位数:一组数据按大小顺序排列后,处于中间位置的数如果个数是偶数,则取中间两个数据的平均数(3)平均数:一组数据的和除以数据个数所得到的数2三种数字特征的比较名称优点缺点众数体现了样本数据的最大
2、集中点;容易计算它只能表达样本数据中很少的一部分信息;无法客观地反映总体的特征中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响;容易计算,便于利用中间数据的信息对极端值不敏感平均数代表性较好,是反映数据集中趋势的量一般情况下,可以反映出更多的关于样本数据全体的信息任何一个数据的改变都会引起平均数的改变数据越“离群”,对平均数的影响越大3.标准差、方差的概念与计算公式(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用s表示,s .(2)方差: 标准差的平方s2叫做方差s2(x1)2(x2)2(xn)2,其中,xn是样本数据,n是样本容量,是样本平均数点睛(1)标准差、方差描述
3、了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小(2)标准差、方差的取值范围:0,)标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性1下列说法不正确的是()A方差是标准差的平方B标准差的大小不会超过极差C若一组数据的值大小相等,没有波动变化,则标准差为0D标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:选D标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散210名工人某天生产同一零件,生产的件数是15
4、,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()AabcBbcaCcab Dcba解析:选D将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a(101214215216173)14.7,中位数b15,众数c17,显然abc,选D.3.某校连续12天对同学们的着装进行检查,着装不合格的人数用茎叶图表示,如图,则该组数据的中位数是() A24B26C27 D32解析:选C由茎叶图得:10,11,20,21,22,24,30,33,35,35,37,38,将这组数据从小到大重新排列后,观察数据可知,最中间的
5、两个数为24,30,其平均数即中位数是27.4样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为_解析:由题意知(a0123)1,解得a1.所以样本方差为s2(11)2(01)2(11)2(21)2(31)22.答案:2众数、中位数、平均数的计算典例某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、
6、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?解(1)甲群市民年龄的平均数为15(岁),中位数为15岁,众数为15岁平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征(2)乙群市民年龄的平均数为15(岁),中位数为6岁,众数为6岁由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算活学活用(广东高考)已知样本数据x1,x2,xn的均值5,则样本数据2x11,2x21,2
7、xn1的均值为_解析:由条件知5,则所求均值02125111.答案:11标准差(方差)的计算及应用典例甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况若要从这两人中选一人参加射击比赛,选谁去合适?解(1)甲(86786591047)7(环),乙(6778678795)7(环)(2)由方差公式s2(x1)2(x2)2(xn)2,得s3,s1.2.(3)甲乙,说明甲、乙两战士的平均水平相当
8、又ss,说明甲战士射击情况波动比乙大因此,乙战士比甲战士射击情况稳定从成绩的稳定性考虑,应选择乙参加比赛计算标准差的5步骤(1)求出样本数据的平均数.(2)求出每个样本数据与样本平均数的差xi(i1,2,n)(3)求出xi(i1,2,n)的平方值(4)求出上一步中n个平方值的平均数,即为样本方差(5)求出上一步中平均数的算术平方根,即为样本标准差活学活用从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25 41 40 37 22 14 19 39 21 42;乙:27 16 44 27 44 16 40 40 16 40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的
9、苗长得齐?解:(1)甲(25414037221419392142)30030(cm),乙(27164427441640401640)31031(cm)所以甲乙即乙种玉米苗长得高(2)s(2530)2(4130)2(4030)2(3730)2(2230)2(1430)2(1930)2(3930)2(2130)2(4230)2(2512110049642561218181144)1 042104.2(cm2),s2(2731)23(1631)22(4431)23(4031)21 288128.8(cm2)所以s乙,s0.5,所以中位数应约位于第四个小矩形内设其底边为x,高为0.03,所以令0.03
10、x0.2,得x6.7,故中位数应约为706.776.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,即每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可所以平均成绩为45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02410)95(0.01610)76.2. 层级二应试能力达标1.如图为甲、乙两名篮球运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的和是()A56分B57分C58分D59分解析:选B易得甲得分的中位数是32,乙得分的中位数是25,其和为322557.2在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
11、9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A9.4,0.484 B9.4,0.016C9.5,0.04 D9.5,0.016解析:选D9.5,s2(0.1240.22)0.016.3如果数据x1,x2,xn的平均数为,方差为s2,则5x12,5x22,5xn2的平均数和方差分别为()A.,s B52,s2C52,25s2 D.,25s2解析:选C数据x1,x2,xn的平均数为,方差为s2,5x12,5x22,5xn2的平均数为52,方差为25s2.4为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测
12、试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为,则()Amem0 Bmem0Cmem0 Dm0me解析:选D由题目所给的统计图可知,30个数据按大小顺序排列好后,中间两个数为5,6,故中位数为me5.5.又众数为m05,平均值(324351066738292102),m0me.5随机调查某校50个学生在学校的午餐费,结果如表:餐费(元)678人数102020这50个学生的午餐费的平均值和方差分别是_,_.解析:根据题意,计算这50个学生午餐费的平均值是(610720820)7.2,方差是s210(67.2)220(77.2)220(87.2)20.56.答案:7.2
13、0.566某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:等待时间(分钟)0,5)5,10)10,15)15,20)20,25频数48521用上述分组资料计算出病人平均等待时间的估计值_.解析:(2.547.5812.5517.5222.51)9.5.答案:9.57某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为_;(2)命中环数的标准差为_解析:(1)(78795491074)7.(2)s2(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,所以s2.答案:(1)
14、7(2)28从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125频数62638228(1)作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表)(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解:(1)频率分布直方图如图所示:(2)质量指标值的样本平均数为:800.06900.261000.381100.221200.08100.质量指标
15、值的样本方差为:s2(80100)20.06(90100)20.26(100100)20.38(110100)20.22(120100)20.08104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.380.220.080.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定9某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄1401036192728342441131204329393401238214130434
16、41133922373138533144323343242640154524423353745163925373437842173826443549943183627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据(2)计算(1)中样本的均值和方差s2.(3)36名工人中年龄在s与s之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n2(n1,2,9),其年龄数据为:44,40,36,43,36,37,44,43,37.(2)由均值公式知:40,由方差公式知:s2(4440)2(4040)2(3740)2.(3)因为s2,s,所以36名工人中年龄在s和s之间的人数等于年龄在区间37,43上的人数,即40,40,41,39,共23人所以36名工人中年龄在s和s之间的人数所占的百分比为100%63.89%.