1、9.2.2总体百分位数的估计9.2.3总体集中趋势的估计素养目标定方向素养目标学法指导1学会计算样本百分位数,会对总体百分位数做出合理估计.(数学运算)2理解平均数、众数、中位数的定义,会从已知数据中获得上述特征数值.(数据分析)1对比中位数,感受百分位数的含义,进一步体会四分位数的特征和价值.2要始终基于具体的案例体会数据向均值集中的趋势.必备知识探新知知识点1百分位数1第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有_p%_的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值.2计算一组n个数据的第p百分位数的步骤第1步,按_从小到大_排
2、列原始数据.第2步,计算inp%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的_平均数_.3四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.知识点2众数、中位数和平均数的定义(1)众数:一组数据中_出现次数最多_的数.(2)中位数:一组数据按大小顺序排列后,处于_中间_位置的数.如果个数是偶数,则取_中间_两个数据的平均数.(3)平均数:一组数据的_和_除以数据个数所
3、得到的数.知识解读1众数、中位数、平均数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.说明:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,x2n1,则称xn1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,x2n,则称为这组数的中位数.(3)如果给定的一组数是x1,x2,xn,则这组数的平均数为(x1x2xn).众数、中位数、平均数都是刻画“中
4、心位置”的量,它们从不同角度刻画了一组数据的集中趋势.2众数、中位数和平均数的比较名称优点缺点众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变,数据越“离群”,对平均数的影响越大关键能力攻重难题型探究题型一百分位数的计算典例1从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7
5、.8,8.3,8.0(1)分别求出这组数据的第25,50,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解析(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以1225%3,1250%6,1295%11.4,则第25百分位数是8.15,第50百分位数是8.5,第95百分位数是第12个数据为9.9(2)因为共有12个数据,所以1215%1.8,则
6、第15百分位数是第2个数据为7.9即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g,第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.归纳提升1计算一组n个数据的第p百分位数的一般步骤:(1)排列:按照从小到大排列原始数据;(2)算i:计算inp%;(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;
7、若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数.2根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.【对点练习】(1)求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20(2)某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:13,14),14,15),15,16),16,17),17,18,得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为13763,那么成绩的70%分位数约
8、为_16.5_秒.解析(1)把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,计算1225%3,1250%6,1275%9,所以数据的第25百分位数为16.5,第50百分位数为21,第75百分位数为27.5(2)设成绩的70%分位数为x,因为0.55,0.85,所以x16,17),所以0.55(x16)0.70,解得x16.5(秒).题型二众数、中位数、平均数的计算典例2某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5
9、,6,6,6,6,56(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?解析(1)甲群市民年龄的平均数为15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为15(岁),中位数为6岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.归纳提升平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、
10、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.【对点练习】某班甲、乙两位同学在5次阶段性检测中的数学成绩(百分制)如下所示,甲的成绩是75,83,85,85,92,乙的成绩是74,84,84,85,98,甲、乙两位同学得分的中位数分别为x1,x2,得分的平均数分别为y1,y2,则下列结论正确的是(D)Ax1x2,y1y2Bx1y2Cx1x2,y1y2Dx1x2,y1x2,而甲的平均数y1(7583858592)84,乙的平均数y2(7484848598)85,故y10.5,因此中位数位于第四个矩形内,得0.10.03(x70),所以x73.3由题图知这次数学成绩
11、的平均分为:0.005100.015100.02100.03100.025100.0051072(2)由于数据是来自高二年级全部参加学业水平测试的学生的简单随机样本,所以可以估计高二年级参加学业水平测试的学生的众数是75,中位数是73.3,平均分是72归纳提升用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【对点练习】某工
12、厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数为(C)A20B25C22.5D22.75解析产品的中位数出现在概率是0.5的地方.自左至右各小矩形面积依次为0.1,0.2,0.4,设中位数是x,则由0.10.20.08(x20)0.5,得x22.5,故选C易错警示不能正确理解平均数的含义典例4下列判断正确的是(D)A样本平均数一定小于总体平均数B样本平均数一定大于总体平均数C样本平均数一定等于总体平均数D样本量越大,样本平均数越接近于总体平均数错解A或B或C错因分析错解的原因是对样本平均数与总体平均数之间关系的理解不到位.对用样本数据估计总体要有一个辩证的理解,即要考虑到它有时会出现偏差,要解决这一问题,可适度增加样本量,样本量越大,它与总体的接近程度就越大,可信度也就越大.正解D误区警示对于样本平均数与总体平均数,若样本的选取较为合理,能够代替总体,则它们间的平均数差距较小,否则样本与总体之间不具备可比性.【对点练习】判断:样本的平均数是频率分布直方图中最高长方形的中点对应的数据. ()