1、22.2用样本的数字特征估计总体的数字特征预习课本P6569,思考并完成以下问题(1)如何用样本平均数估计总体平均数?(2)样本方差、标准差公式是什么?它们的区别与联系是什么?1样本平均数平均数是指样本数据的算术平均数,即(x1x2xn)2用样本标准差估计总体标准差(1)数据的离散程度可以用极差、方差或标准差来描述样本方差描述了一组数据围绕平均数波动的大小一般地,设样本的元素为x1,x2,xn,样本的平均数为,定义样本方差s2.(2)为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根,即样本标准差s .点睛标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据
2、的离散程度越大;标准差、方差越小,数据的离散程度越小1下列说法不正确的是()A方差是标准差的平方B标准差的大小不会超过极差C若一组数据的值大小相等,没有波动变化,则标准差为0D标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散解析:选D标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散2奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为()A减少计算量B避免故障C剔除异常值 D活跃赛场气氛解析:选C因为在体操比赛的评分中使用的
3、是平均分,记分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平3已知一组数据4,6,5,8,7,6,那么这组数据的平均数为_答案:64样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为_解析:由题意知(a0123)1,解得a1.所以样本方差为s2(11)2(01)2(11)2(21)2(31)22.答案:2平均数的求法典例甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图所示,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10
4、天甲、乙两人日加工零件的平均数分别为_和_解析甲10天每天加工零件的个数分别为:18,19,20,20,21,22,23,31,31,35,所求平均数为甲(18192020212223313135)24.乙10天每天加工零件的个数分别为:11,17,19,21,22,24,24,30,30,32,所求平均数为:乙(11171921222424303032)23.答案2423求平均数的步骤(1)求和:数据x1,x2,xn的和为x1x2xn;(2)求平均数:和除以数据的个数n,即x1,x2,xn的平均值为(x1x2xn)注意求平均数时要注意数据的个数,不要重计或漏计活学活用(广东高考)已知样本数据
5、x1,x2,xn的均值5,则样本数据2x11,2x21,2xn1的均值为_解析:由条件知5,则所求均值02125111.答案:11标准差(方差)的计算及应用典例甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况若要从这两人中选一人参加射击比赛,选谁去合适?解(1)甲(86786591047)7(环),乙(6778678795)7(环)(2)由方差公式s2(x1)2(x2)2(xn)2,得
6、s3,s1.2.(3)甲乙,说明甲、乙两战士的平均水平相当又ss,说明甲战士射击情况波动比乙大因此,乙战士比甲战士射击情况稳定从成绩的稳定性考虑,应选择乙参加比赛计算标准差的5步骤(1)求出样本数据的平均数.(2)求出每个样本数据与样本平均数的差xi(i1,2,n)(3)求出xi(i1,2,n)的平方值(4)求出上一步中n个平方值的平均数,即为样本方差(5)求出上一步中平均数的算术平方根,即为样本标准差活学活用从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25 41 40 37 22 14 19 39 21 42;乙:27 16 44 27 44 16 40 40
7、16 40.问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解:(1)甲(25414037221419392142)30030(cm),乙(27164427441640401640)31031(cm)所以甲乙即乙种玉米苗长得高(2)s(2530)2(4130)2(4030)2(3730)2(2230)2(1430)2(1930)2(3930)2(2130)2(4230)2(2512110049642561218181144)1 042104.2(cm2),s2(2731)23(1631)22(4431)23(4031)21 288128.8(cm2)所以s0.5,因此中位数位于第四个矩
8、形内,得0.10.03(x70),所以x73.3.众数、中位数、平均数与频率分布直方图的关系众数众数是最高长方形底边的中点所对应的数据,表示样本数据的中心值中位数在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;表示样本数据所占频率的等分线平均数平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和;平均数是频率分布直方图的重心,是频率分布直方图的平衡点活学活用为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则(1)这20名工人中一天生产该产品数量在55,75)的人数是_(2)这20名工人中一天生
9、产该产品数量的中位数为_(3)这20名工人中一天生产该产品数量的平均数为_解析:(1)在55,75)的人数为(0.040100.02510)2013.(2)设中位数为x,则0.2(x55)0.040.5,x62.5.(3)0.2500.4600.25700.1800.059064.答案:(1)13(2)62.5(3)64层级一学业水平达标1.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是()A63B64C65 D66解析:选A甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是362763.2一个容量为8的样本的平均数为5,方差
10、为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则()A.5,s22C.5,s25,s22解析:选A设(x1x2x8)5,则(x1x2x85)5,5.加入新数据5后,稳定性比原来强,s22,故选A.3如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为_解析:根据题中统计图,可估计有4人成绩在0,20)之间,其考试分数之和为41040;有8人成绩在20,40)之间,其考试分数之和为830240;有10人成绩在40,60)之间,其考试分数之和为1050500;有6人成绩在60,80)之间,其考试分数之和为670420;有2人成绩在80,100)之间,其考试分
11、数之和为290180,由此可知,考生总人数为48106230,考试总成绩为402405004201801 380,平均数为46.答案:464某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?解:(1)甲群市民年龄的平均数为15(岁),中位数为15岁,众数为15岁平
12、均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征(2)乙群市民年龄的平均数为15(岁),中位数为6岁,众数为6岁由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差层级二应试能力达标1.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A46,45,56B46,45,53C47,45,56D45,47,53解析:选A样本中数据共30个,中位数为46;显然样本数据中出现次数最多的为45,故众数为45;极差为681256,故选A.210名工人某天生产同一零件,生产的件数是15,17
13、,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()AabcBbcaCcab Dcba解析:选D将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a(101214215216173)14.7,中位数b15,众数c17,显然abc,选D.3在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A9.4,0.484 B9.4,0.016C9.5,0.04 D9.5,0.016解析:选D9.5,s2(0.1
14、240.22)0.016.4一个样本a,3,5,7的平均数是b,且a,b是方程x25x40的两根,则这个样本的方差是()A3 B4C5 D6解析:选Cx25x40的两根是1,4.显然a1,b4.故方差s2(14)2(34)2(54)2(74)25.5五个数1,2,3,4,a的平均数是3,则a_,这五个数的标准差是_解析:由3,得a5;由s2(13)2(23)2(33)2(43)2(53)22,得标准差s.答案:56某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:等待时间(分钟)0,5)5,10)10,15)15,20)20,25频数48521用上述分组资料计算出病人平均等待时间的估计
15、值_.解析:(2.547.5812.5517.5222.51)9.5.答案:9.57某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为_;(2)命中环数的标准差为_解析:(1)(78795491074)7.(2)s2(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,所以s2.答案:(1)7(2)28某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,
16、0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩解:(1)由图可知众数为65,第一个小矩形的面积为0.3,设中位数为60x,则0.3x0.040.5,得x5,中位数为60565.(2)依题意,平均成绩为550.3650.4750.15850.1950.0567,故平均成绩约为67.9(广东高考)某工厂36名工人的年龄数据如下表.工人编号年龄工人编号年龄工人编号年龄工人编号年龄14010361927283424411312043293934012382141304344113392237313853314432334324264015452442335
17、3745163925373437842173826443549943183627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据(2)计算(1)中样本的均值和方差s2.(3)36名工人中年龄在s与s之间有多少人?所占的百分比是多少(精确到0.01%)?解:(1)36人分成9组,每组4人,其中第一组的工人年龄为44,所以它在组中的编号为2,所以所有样本数据的编号为4n2(n1,2,9),其年龄数据为:44,40,36,43,36,37,44,43,37.(2)由均值公式知:40,由方差公式知:s2(4440)2(4040)2(3740)2.(3)因为s2,s,所以36名工人中年龄在s和s之间的人数等于年龄在区间37,43上的人数,即40,40,41,39,共23人所以36名工人中年龄在s和s之间的人数所占的百分比为100%63.89%.