1、9.2.2总体百分位数的估计学 习 目 标核 心 素 养1.结合实例,能用样本估计百分位数(重点)2.理解百分位数的统计含义(重点、难点)1.通过对百分位数概念的学习,培养数学抽象素养.2.通过计算样本的百分位数,培养数学运算素养.某省数学考试结果揭晓,根据规定,0.8%的同学需要补考问题:那么如何确定需要补考的分数线呢?1第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100p)%的数据大于或等于这个值2计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据第2步,计算inp%.第3步,若i不是整数,而大于
2、i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数3四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数思考:(1) 班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?(2)“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?提示(1)不是是指能够考取本科院校的同学占同学总数的百分比(2)有70%的同学数学测试成绩小于或等于85分1思考辨析(正确的画“”,错误的画“”)(1)若一组样本数据各不相等,则其75%分位数大于25%分位数()(2)若一
3、组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.()(3)若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.()提示(1)正确(2)错误若一组样本数据的第10%分位数是23,则在这组数据中有10%的数据小于或等于23.(3)正确答案(1)(2)(3)2下列关于一组数据的第50百分位数的说法正确的是()A第50百分位数就是中位数B总体数据中的任意一个数小于它的可能性一定是50%C它一定是这组数据中的一个数据D它适用于总体是离散型的数据A由百分位数的意义可知选项B,C,D错误3数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1
4、的第30百分位数是_8.4因为830%2.4,故30%分位数是第三项数据8.4.4一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为_样本数据低于10的比例为0.08 0.320.40,样本数据低于14的比例为0.40 0.360.76,所以此样本数据的第50百分位数在10,14内,估计此样本数据的第50百分位数为104.百分位数的计算【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数(2)请
5、你找出珍珠质量较小的前15%的珍珠质量(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以1225%3,1275%9,1295%11.4,则第25百分位数是8.15,第75百分位数是8.75,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以1215%1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质
6、量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g,第50百分位数为8.5 g, 第95百分位数是9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品计算一组n个数据的第p百分位数的一般步骤(1)排列:按照从小到大排列原始数据;(2)计算i:计算inp%;(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i1)项数据的平均数.以下数据为参加数学竞赛决赛的
7、15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )A90B90.5C91D91.5B把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为1580%12,所以这15人成绩的第80百分位数是90.5.百分位数的综合应用探究问题1第p百分位数有什么特点?提示总体数据中的任意一个数小于或等于它的可能性是p.2某组数据的第p百分位数在此组数据中一定存在吗?为什么?提示不一定因为按照计算第p百分位数的步骤,第2步计算所得的inp%如果是整数,则
8、第p百分位数为第i项与第(i1)项数据的平均数,若第i项与第(i1)项数据不相等,则第p百分位数在此组数据中就不存在【例2】某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图若这100户居民中,今年1月份
9、用电费用不超过260元的占80%,求a,b的值(3)根据(2)中求得的数据计算用电量的75%分位数解(1)当0x200时,y0.5x;当200400时,y0.52000.82001.0(x400)x140.所以y与x之间的函数解析式为y(2)由(1)可知,当y260时,x400,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知解得a0.001 5,b0.002 0.(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.0010.0020.003)10060%,用电量不超过400千瓦时的占80%,所以75%分位数为m在300,400)内,所以0.6(m300)0.00
10、20.75,解得m375千瓦时,即用电量的75%分位数为375千瓦时根据例2的(2)题中求得的数据计算用电量的15%分位数解设15%分位数为x,因为用电量低于100千瓦时的所占比例为0.00110010%,用电量不超过200千瓦时的占30%,所以15%分位数为x在100,200)内,所以0.1(x100)0.0020.15,解得x125千瓦时,即用电量的15%分位数为125千瓦时根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.一、知识必备百分位数是用于衡量数据的位置的量度,但它所衡
11、量的不一定是中心位置百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息,对于无大量重复的数据,第p百分位数将它分为两个部分,大约有p%的数据项的值比第p百分位数小,而大约有(100p)%的数据项的值比第p百分位数大二、方法必备掌握求一组数据百分位数的方法步骤1下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A3.2B3.0C4.4D2.5A把这组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8, 4.0,4.2,4.4,5.3,5.6,由i1025%2.5,不是整数,则第3个数据3.2是第25百分位数2
12、已知100个数据的第75百分位数是9.3,则下列说法正确的是()A这100个数据中一定有75个数小于或等于9.3B把这100个数据从小到大排列后,9.3是第75个数据C把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数C因为10075%75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,故选C32019年某学科能力测试共有12万考生参加,成绩采用15级分,测试成绩分布图如图,试估计成绩高于11级分的人数为()A8 000B10 000 C20 000D60 000B从题
13、图中可以看出,12级分的有2.5%左右,13级分的有3%左右,14级分的有1%左右,15级分的有1.5%左右,高于11级分的有8%左右,其人数约为12万的8%,即120 0000.089 600人选项B最接近故选B4(一题两空)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丢失,则依据此图可得:(1)25,30)年龄组对应小矩形的高度为_;(2)由频率分布直方图估计志愿者年龄的95%分位数为_岁(1)0.04(2)42.5(1)设25,30)年龄组对应小矩形的高度为h,则5(0.01h0.070.060.02)1,解得h0.04.(2)由题图可知年龄小于40岁的频率为(0.010.040.070.06)50.9,且所有志愿者的年龄都小于45岁,所以志愿者年龄的95%分位数在40,45内,因此志愿者年龄的95%分位数为40542.5岁