1、22.2用样本的数字特征估计总体的数字特征1.了解平均数、标准差、方差、样本数据的提取方法2.理解样本数据标准差的意义和作用3掌握平均数、标准差、方差的求法, 学生用书P40)1样本平均数(1)定义:样本中所有个体的平均数叫做样本平均数(2)样本平均数与平均数的特点平均数描述了数据的平均水平,定量地反映了数据的集中趋势所处的水平用样本的平均数估计总体的平均数时,样本平均数只是总体的平均数的近似值(3)样本平均数的作用n个样本数据x1,x2,xn的平均数,则有nx1x2xn也就是把每个xi(i1,2,n)都用代替后,数据总和保持不变所以平均数对数据有“取齐”的作用,代表了一组数据的数值平均水平2
2、用样本标准差估计总体标准差(1)数据的离散程度可以用极差、方差或标准差来描述样本方差描述了一组数据围绕平均数波动的大小一般地,设样本的元素为x1,x2,xn,样本的平均数为,定义s2(x1)2(x2)2(xn)2,表示样本方差(2)为了得到以样本数据的单位表示的波动幅度,通常要求出样本方差的算术平方根s,s表示样本标准差1判断正误(对的打“”,错的打“”)(1)数据5,4,4,3,5,2的众数为4.()(2)数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半()(3)方差与标准差具有相同的单位()(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变()解析:(
3、1)中的众数应为4和5;(2)正确;(3)二者单位不一致;(4)正确,平均数也应减去该常数,方差不变答案:(1)(2)(3)(4)2已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A平均数中位数众数B平均数中位数众数C中位数众数平均数D众数中位数平均数解析:选D.平均数、中位数、众数皆为50,故选D.3已知五个数据3,5,7,4,6,则该样本的标准差为_解析:因为(35746)5,所以s .答案:样本平均数的计算学生用书P41一个球队所有队员的身高如下(单位:cm):178,179,181,182,176,183,176,180,183,1
4、75,181,185,180,184,问这个球队的队员平均身高是多少?(精确到1 cm)【解】法一:利用平均数的公式计算(178179181180184)2 523180.法二:建立新数据,再利用平均数简化公式计算取a180,将上面各数据同时减去180,得到一组新数据:2,1,1,2,4,3,4,0,3,5,1,5,0,4.(21124340351504)30.2.所以a0.2180180.法三:利用加权平均数公式计算(1851184118321821181218021791178117621751)2 523180.法四:建立新数据,再利用加权平均数公式计算514132211202(1)1(
5、2)1(4)2(5)130.2,所以a0.2180180.(1)平均数公式是一个计算平均数的基本公式,在一般情况下,要计算一组数据的平均数可使用这个公式 (2)当数据较大,且大部分数据在某一常数左右波动时,“法二”可以减轻运算量,故此法比较简便,常数a通常取接近这组数据(大约估计)平均数的较“整”的数,以达到简化计算过程的目的,常数a的取法并不唯一,比如本例中取a181也可以(3)当一组数据中有不少数重复出现时,可用加权平均数公式来计算平均数. 个体户王某经营一家餐馆,下面是餐馆所有工作人员的某个月的工资:王某厨师甲厨师乙杂工招待甲招待乙会计3 000元1 450元1 400元1 320元1
6、350元1 320元1 410元(1)计算工作人员的平均工资;(2)计算出的平均工资能否反映工作人员在这个月收入的一般水平?(3)去掉王某的工资后,再计算平均工资;(4)(3)中所求的平均工资能代表工作人员的收入吗?解:(1)工作人员的平均工资为v1 607(元)(2)计算出的平均工资不能反映工作人员的这个月收入的一般水平,因为王某的数据为一极端数据(3)去掉王某的工资后,工作人员的平均工资为u1 375(元)(4)(3)中所求的平均工资能代表工作人员的收入标准差、方差的计算及应用学生用书P41为了考察甲、乙两种小麦的长势,分别从甲、乙两种麦苗中各抽10株,测得它们的株高分别为(单位:cm):
7、甲:25414037221419392142乙:27164427441640401640(1)哪种小麦的苗长得高?(2)哪种小麦的苗长得齐?【解】(1)甲(25414037221419392142)30030(cm)乙(27164427441640401640)31031(cm)显然甲乙,所以乙种小麦的苗长得高(2)s(2530)2(4130)2(4030)2(3730)2(2230)2(1430)2(1930)2(3930)2(2130)2(4230)2(2512110049642561218181144)1 042104.2.s(2731)2(1631)2(4431)2(2731)2(44
8、31)2(1631)2(4031)2(4031)2(1631)2(4031)2(1622516916169225818122581)1288128.8.显然ss,所以甲种小麦的苗长得齐(1)用样本的标准差、方差估计总体的方法用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况(2)标准差(方差)的作用在实际应用中,常常把平均数与标准差结合起来进行决策在平均数相等的情况下,比较方差或标准差以确定稳定性 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件测量数据为:甲:99
9、10098100100103乙:9910010299100100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定解:(1)甲(9910098100100103)100,乙(9910010299100100)100,s(99100)2(100100)2(98100)2(100100)2(100100)2(103100)2,s(99100)2(100100)2(102100)2(99100)2(100100)2(100100)21.(2)由(1)知甲乙,比较它们的方差,因为ss,故乙机床加工零件的质量更稳定利用样本的数字特征估计总体的数字特征学生用书P42随机抽
10、取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)用样本数据估计甲班总体中有多少数据落入区间(s,s)中【解】(1)由茎叶图可知,甲班身高集中于160179 cm之间,而乙班身高集中于170180 cm之间因此,乙班平均身高高于甲班(2)170.甲班的样本方差为(158170)2(162170)2(163170)2(168170)2(168170)2(170170)2(171170)2(179170)2(179170)2(182170)257.2.(3)由(2)知,s7.56,故区
11、间(s,s)(162.44,177.56)由茎叶图可知,甲班总体中落入区间(162.44,177.56)中的数据约为50%.平均数反映了这组数据的平均水平,方差或标准差反映了这组数据的稳定与波动、集中与离散程度,在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越好 对自行车运动员甲、乙两人在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下:甲273830373531乙332938342836试判断选谁参加某项重大比赛更合适解:可以从平
12、均成绩及方差、标准差方面来考察样本数据的水平及稳定性他们的平均速度为甲(273830373531)33(m/s),乙(332938342836)33(m/s)他们的平均速度相同,再看方差:s(6)252(3)24222(2)2(m2/s2),s(4)25212(5)232(m2/s2)则ss,即s甲s乙故乙的成绩比甲稳定所以,应选乙参加比赛更合适1样本的标准差描述了总体数据围绕平均数波动的大小程度,样本的标准差越大,总体数据估计越分散;样本的标准差越小,总体估计越集中特别地,当样本的标准差为0时,则表明总体数据估计没有波动,估计数据全相等2样本的平均数和标准差是两个重要的数字特征,在应用平均数
13、和标准差解决问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由标准差研究其与平均数的偏离程度3常用性质及计算方法(1)性质若x1,x2,x3,xn的平均数是,那么mx1a,mx2a,mxna的平均数是ma.数据x1,x2,xn与数据x1a,x2a,xna的方差相等若x1,x2,xn的方差为s2,那么ax1,ax2,axn的方差为a2s2.(2)方差的计算基本公式s2(x1)2(x2)2(xn)2简化计算公式:s2(xxx)n2,或写成s2(xxx)2,即方差等于原数据平方的平均数减去平均数的平方1防止计算出错2对平均数、方差的理解要准确1下列说法正确的是()A在两组数据中,平
14、均值较大的一组方差较大B平均数反映数据的集中趋势,方差则反映数据离平均值的程度大小C方差的求法是求出各个数据与平均值的差的平方后再求和D在记录两个人射击环数的两组数据中,方差大的表示射击水平高解析:选B.由平均数、方差的定义及公式可知2样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()ABC D2解析:选D.因为样本的平均值为1,所以(a0123)1,所以a1,所以样本方差s2(11)2(01)2(11)2(21)2(31)22.3临近元旦,老师们陆续收到毕业学生寄送的贺卡和名信片孔老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方
15、差s2_解析:该组数据的平均数7,方差s2.答案:4甲、乙两名运动员在同样条件下练习射击,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9,则两名运动员射击成绩中_的成绩较稳解析:甲8,乙8.s(68)2(88)2(98)2(98)2(88)2,s(108)2(78)2(78)2(78)2(98)2.因为甲乙,ss,所以甲比乙稳定答案:甲, 学生用书P105(单独成册)A基础达标1某中学人数相等的甲、乙两班学生参加了同一次数学测验,两班平均分和方差分别为甲82分,乙82分;s245,s190,那么成绩较为集中的是()A甲班B乙班C两班一样 D无法确定解析:选B.方
16、差越小,成绩越集中2某样本数据的茎叶图如图所示,若该组数据的中位数为85,平均数为85.5,则xy()A12 B13C14 D15解析:选B.因为中位数为85,所以4x25,解得x6.又平均数为85.5,所以73793848687889390y855,所以y7.故xy13.3甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差解析:选C.由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均
17、数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为(46)2(56)2(66)2(76)2(86)22,(56)2(56)2(56)2(66)2(96)2,C对;甲、乙的成绩的极差均为4,D错4如图是一容量为100的样本的重量的频率分布直方图,则由图可估计样本重量的中位数为()A11 B11.5C12 D12.5解析:选C.由题图可知:区间5,10对应的频率为0.3.令中位数对应的点为x,则在区间10,15中有0.1(x10)0.50.3,解得x12.5如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则()AAB,
18、sAsB BAB,sAsBCAB,sAsB DAB,sAsB解析:选B.A中的数据都不大于B中的数据,所以AB,但A中的数据比B中的数据波动幅度大,所以sAsB.6若a1,a2,a20,这20个数据的平均数为,方差为0.20,则数据a1,a2,a20,这21个数据的方差为_解析:这21个数的平均数仍为,从而方差为200.2()20.19.答案:0.197已知样本9,10,11,x,y的平均数是10,标准差是,则xy_解析:平均数(91011xy)10,所以xy20,标准差s .x2y220(xy)192,x2y21922020208,(xy)22xy208,2022xy208,xy96.答案:
19、968某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生1号2号3号4号5号甲班67787乙班67679则以上两组数据的方差中较小的一个为s2_解析:甲7,s(1202021202);乙7,s(1202120222).答案:9为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计请你根据下面尚未完成的频率分布表和频率分布直方图,解答下列问题:组号分组频数频率150,60)40.08260,70)80.16
20、370,80)100.20480,90)160.32590,100合计(1)填充频率分布表中的空格;(2)如图,不具体计算,补全频率分布直方图;(3)估计这900名学生竞赛的平均成绩(同一组中的数据用该组区间的中点值作代表)解:(1)50,即样本容量为50.第5组的频数为5048101612,从而第5组的频率为0.24.又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.(2)根据小长方形的高与频数成正比,设第一个小长方形的高为h1,第二个小长方形的高为h2,第五个小长方形的高为h5.由等量关系得,补全的频率分布直方图如图所示(3)50名学生竞赛的平均成绩为79.
21、880(分)利用样本估计总体的思想可得这900名学生竞赛的平均成绩约为80分10为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图:(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为1,2,估计12 的值解:(1)设甲校高三年级学生总人数为n.由题意知0.05,解得n600.样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高
22、三年级这次联考数学成绩的及格率为1.(2)设甲、乙两校样本平均数分别为1,2.根据样本茎叶图可知30(12)301302(75)(55814)(241265)(262479)(2220)92249537729215.因此120.5.故12的估计值为0.5分B能力提升11一组数据的方差是s2,将这组数据中的每一个数都乘以2,得到一组新数据,其方差是()As2 B2s2C4s2 Ds2解析:选C.设一组数据x1,x2,xn,则s2,将每一个数乘以2,则2.所以s2(x1)2(x2)2(xn)24s2.故答案选C.12从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其中使用寿命跟踪调查,结果如
23、下(单位:年):甲:3,4,5,6,8,8,8,10乙:4,6,6,6,8,9,12,13丙:3,3,4,7,9,10,11,12三个厂家在广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲_,乙_,丙_解析:甲中的众数是8,乙中的平均数是8,丙中的中位数8.答案:众数平均数中位数13为了了解市民的环保意识,高一某班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如下表:每户丢弃旧塑料袋个数2345户数6161513(1)求这50户居民每天丢弃旧塑料袋的平均数;(2)求这50户居民每天丢弃旧
24、塑料袋的标准差;(3)由样本估计总体中有多少数据落入区间(s,s)解:(1)平均数(26316415513)3.7.(2)这50户居民每天丢弃旧塑料袋的方差为s26(23.7)216(33.7)215(43.7)213(53.7)248.50.97,所以标准差s0.985.(3)由(1)(2)知,区间(s,s),即(2.715,4.685),则估计总体中落入区间(s,s)的数据约为100%62%.14(选做题)在一次科技知识竞赛中,两组学生的成绩如下表:分数5060708090100人数甲组251013146乙组441621212已经算得两个组的平均分都是80分请根据你所学过的统计知识,进一步
25、判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数看,甲组成绩较好(2)甲、乙两组成绩的中位数、平均数都是80分其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人从这一角度看,甲组成绩较好(3)s2(5080)25(6080)210(7080)213(8080)214(9080)26(10080)2172,s4(5080)24(6080)216(7080)22(8080)212(9080)212(10080)2256.显然ss,故甲组成绩比乙组成绩稳定,从这一角度看,甲组成绩较好(4)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩分布在高分段的人数多同时,乙组得满分的人数比甲组得满分的人数多6.从这一角度看,乙组成绩较好