1、 2.2.2用样本的数字特征估计总体的数字特征在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。用样本的数字特征估计总体的数字特征。一 、复习众数、中位数、平均数的概念2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数众数、中位数、平均
2、数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.3、平均数:一般地,如果n个数,那么,叫做这n个数的平均数。1、求下列各组数据的众数(1)、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)1,2,3,4,5没有众数2、求下列各组数据的中位数(1)1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4巩固练习(3)1,1,3,3,5,5没有众数3.求下列10个数字的平均数5、5、5、6、6、6、6、7、7、7解:也可以说平均数为各个不同数字乘以相应频率之和。众数、中位数、平均数
3、的简单应用例1:某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资 2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中周工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?众数:200中位数:220平均数:300只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。二、三种数字特征的优缺点1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征。2、中位数是样本数据所占频率的等分线,它不受少数几个
4、极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。3、平均数与每一个样本的数据有关,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:在抽样调查的100位居民的月均用水量的数据中,我们得知这一组样本数据的,并画出这组数据的频率分布直方图.众数=2.3(t)中位数=2.0(t)平均数=2.0(t)现在,观察这组数据的频率分布直方图,能否得出这组数据的众数、中位数和平均数?众数、中位数和平均数三:众数.中位数.平均数与频
5、率分布直方图的关系0.52.521.5143.534.5频率组距2.251.你能从频率分布直方图里面得出众数吗?1 众数:在频率分布直方图中,就是最高矩形的中点的横坐标思考:2.25这个众数的估计值,与样本的众数值2.3不一样,你能解释其中原因吗?答:2.25这个众数的估计值,与样本的众数值2.3不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的众数估计值往往与样本的实际众数值不一致.0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.06
6、0.040.02提示:中位数左边的数据个数与右边的数据个数是相等的。2.你能从直方图里面得出中位数吗?0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02前四个小矩形的面积和=0.49后四个小矩形的面积和=0.262.02 分析总结得:在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。在这个频率分布直方图中,左边的直方图的面积代表50个单位,右边的直方图也是代表50个单位,它们的分界线与x轴交点的横坐标就是中位数。中位
7、数在样本数据的频率分布直方图中,就是把频率分布直方图划分为左右两个面积相等的分界线与x轴交点的横坐标。思考讨论以下问题:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02思考:在频率分布直方图中,
8、各个组的平均数如何找?3.你能从直方图里面得出平均数吗?0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.04 0.02.0.751.75 2.25 2.75 3.25 3.75 4.251.250.25求解过程:平均数为2.02为什么这样去求?上面介绍过平均数为各个不同数字乘以相应频率之和。在频率分布直方图中,没有原始数据,我们取每个小矩形底边中点的横坐标代表各组数据的平均数。总结归纳得:平均数是频率分布直方图的“重心”,是直方图的平衡点。先找出每个小长方形的“重心”,即每小组的平均数,再按比例算出直方图的平均数。平均数在样本数据的频率
9、分布直方中,等于频率分布直方图中每个小长方形面积乘以小矩形底边中点的横坐标之和。方图如图所示,根据直方图求该班学生成绩的众数.中位数.平均数各是多少。作业:样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.例:有两位射击运动员在一次射击测试中各
10、射靶10次,每次命中的环数如下:甲:乙:如果你是教练,你应当如何对这次射击作出评价?如果要选一位运动员去比赛,该选谁?如果看两人本次射击的平均成绩,由于两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?标准差思考:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.14 5 6 7 8 9 10 O(甲)环数频率0.40.30.20.14 5 6 7 8 9 10 O(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.甲10(最大值)4(最小值)6乙9(最大值)5(最小值)4甲:乙:极 差:极差越大,数据
11、越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论。考察样本数据的分散程度的大小,最常用的统计量是方差和标准差。标准差定义:标准差是样本数据到平均数的一种平均距离,常用s表示.1.平均距离假设样本 数据是,表示这组数据的平均数,到的距离是,于是,样本数据到的”平均距离”是:2.标准差练习:求数据1,2,3,4,5的平均数与标准差.标准差的取值范围是什么?标准差为0的样本数据有什么特点?标准差是怎样表现数据的离散程度的?标准差的取值范围:0,+)标准差为0的样本数据都等于样本平均数.标
12、准差反映了各个样本数据聚集于样本平均数周围的程度:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小.它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差的作用:返回引例例2:甲乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm)甲乙从生产的零件内径的尺寸来看,谁生产的质量较高?X甲25.401X乙25.406s甲0.037S乙0.068解:依题意计算可得x1=900 x2=900 s123.8 s2 42.6甲乙两种水稻6年平均产量的平均数相同,但甲的标准差比乙的小,所以甲的生产比较稳定.练习课本P79 练习解:(1)平均重量约为496.86 g,标准差约为6.55(2)重量位于(x-s,x+s)之间有14袋白糖,所占百分比为66.67%.解:平均数x19.25,中位数为15.2,标准差s12.50.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,x 15.2 说明存在大的异常数据,这些异常数据使得标准差增大.