1、4.2分层随机抽样的均值与方差4.3百分位数学 习 目 标核 心 素 养1结合具体实例,掌握分层随机抽样的样本均值和样本方差(难点、重点)2结合实例,能用样本估计百分位数,理解百分位数的统计含义(难点、重点)1通过计算分层随机抽样的样本的均值和方差,培养数学运算素养2通过学习分层随机抽样的样本均值和样本方差的意义,培养数据分析素养.1分层随机抽样的均值和方差的计算公式是什么?2百分位数的概念是什么?如何求解?有何意义?3什么是四分位数?1分层随机抽样的均值设样本中不同层的平均数和相应权重分别为1,2,和 w1,w2, ,wn,则这个样本的平均数为w11w22wn.为了简化表示,引进求和符号,记
2、作w11w22wnnwii.2分层随机抽样的方差设样本中不同层的平均数分别为1,2,n,方差分别为s,s,s,相应的权重分别为w1,w2,wn,则这个样本的方差为s2wis()2 ,其中为样本平均数3百分位数(1)定义:一般地,当总体是连续变量时,给定一个百分数p(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.(2)常用的百分位数:四分位数:25%,50%,75%,其它常用的百分位数:1%,5%,10%,90%,95%,99%.(3)计算一组n个数据的p分位数的一般步骤如下:第1步,按照从小到大排列原始数据;第2步,计算inp;第3步,若i不是整数,大于
3、i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i1)项数据的平均数(1)甲班和乙班各有学生20人、40人,甲班的数学成绩的平均数为80分,方差为2,乙班的数学成绩的平均数为82分,方差为4,那么甲班和乙班这60人的数学成绩的平均分是81分吗?方差是3吗?为什么?(2)“这次数学测试成绩的70%分位数是85分”这句话是什么意思?提示(1)不是,因为甲班和乙班在这60人中的权重是不同的(2)有70%的同学数学测试成绩小于或等于85分1.下列一组数据的25%分位数是()21, 3.0, 3.2, 3.8, 3.4, 4.0, 4.2, 4.4, 5.3, 5.6.A3
4、.2B3.0C4.4D2.5A把该组数据按照由小到大排列,可得:2.1, 3.0, 3.2, 3.4, 3.8, 4.0, 4.2, 4.4, 5.3, 5.6.由i1025%2.5,不是整数,则第3个数据3.2是25%分位数2.某单位共有员工100人,其中年轻人有20人,平均年薪为5万元,中年人有80人,平均年薪为8万元,则该单位员工的平均年薪为()A5万元B8万元C6.5万元D7.4万元 D由题意可知587.4(万元) 类型1分层随机抽样的均值与方差【例1】工厂为了解每个工人对某零件的日加工量,统计员分别从两车间抽取了甲、乙两人日加工量的两个样本抽到甲的一个样本容量为10,样本平均数为5,
5、方差为1;乙的一个样本容量为12,样本平均数为6,方差为2.现将这两组样本合在一起,求合在一起后的样本的平均数与方差解设抽到甲的一个样本数据为x1,x2,x10;乙的一个样本数据为y1,y2,y12,由题意知x i5,方差s2(xi5)21,yi6,方差t2(yi6)22,则合在一起后的样本容量为22,w甲,w乙样本平均数为w甲w乙565.55,样本方差为b2w甲s2()2w乙t2()21(55.55)22(65.55)21.79.求分层随机抽样背景下的样本平均数、方差设样本中不同分层的平均数、方差和相应权重分别为1,2,n、s,s,s和w1,w2,wn,则样本平均数w11w22wnnii.样
6、本方差s2is(i)21在某学校为了调查高一年级学生每周的锻炼时间(单位:h)时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本均值与样本方差解由题意知,甲同学抽取的样本容量m10,样本平均值为5,样本方差为s29;乙同学抽取的样本容量n8,样本平均值为6,样本方差t216.故合在一起后的样本平均值为w甲w乙565.44.样本方差为w甲s2(55.44)2w乙t2(65.44)290.442160.56212.36. 类型2百分
7、位数的计算【例2】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:79,9.0,8.9,8.6,8.4,8.5,85,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的25%,75%,95%分位数(2)请你找出珍珠质量较小的前15%的珍珠质量(3)若用25%,50%,95%分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以1225%3,1275
8、%9,1295%11.4,则25%分位数是8.15,75%分位数是8.75,95%分位数是第12个数据为9.9.(2)因为共有12个数据,所以1215%1.8,则15%分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的25%分位数是8.15 g,50%分位数为8.5 g,95%分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.5 g的珍珠为合格品,质量大于8.5 g且小于等于9.9的珍珠为优等品,质量大于9.9 g的珍珠为特优品百分位数的计算问题,先理解清楚百分位数的概念,
9、再利用百分位数求解步骤逐步计算即可2在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩(单位:m)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的中位数,25%分位数和75%分位数解这组数据有17个数,1725%4.25,1775%12.75,这组数据的中位数是x91.70,25%分位数是x51.60,75%分位数是x131.75. 类型3百分位数的综合应用【例3】某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦
10、时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值(3)根据(2)中求得的数据计算用电量的75%分位数解(1)当0x200时,y0.5x;当200400时,y0.52000.82001.0(x400)x140.所以y与x之间的函数解析式为y(2)由(1)可知,当y260时,x40
11、0,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知解得a0.001 5,b0.002 0.(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.0010.0020.003)10060%,用电量不超过400千瓦时的占80%,所以75%分位数为m在300,400)内,所以0.6(m300)0.0020.75,解得m375千瓦时,即用电量的75%分位数为375千瓦时(变设问)根据本例(2)中求得的数据计算用电量的15%分位数解设15%分位数为x,因为用电量低于100千瓦时的所占比例为0.00110010%,用电量不超过200千瓦时的占30%,所以15%分位数为x在100
12、,200)内,所以0.1(x100)0.0020.15,解得x125千瓦时,即用电量的15%分位数为125千瓦时根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得3某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:20,25),第二组:25,30),第三组30,35),第四组:35,40),第五组:40,45),得到如图所示的频率分布直方图,
13、已知第一组有5人(1)求x;(2)求抽取的x人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“中国梦”的伟大构想的认知程度,并谈谈你的感想解(1)第一组频率为0.0150.05,所以x100.(2)由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在30,35)内,由30532,所以抽取的x人的年龄的50%分位数为32.(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,
14、92,92,95,96,96,97,98,99,计算1020%2,所以这10人成绩的20%分位数为91,这10人成绩的平均数为(88909292959696979899)94.3.评价:从百分位数和平均数来看,参赛人员的认知程度很高感想:结合本题和实际,符合社会主义核心价值观即可.1思考辨析(正确的画“”,错误的画“”)(1)若一组样本数据各不相等,则75%分位数大于25%分位数()(2)计算分层随机抽样的均值与方差时,必须已知各层的权重()(3)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.()提示(1)正确(2)正确(3)错误若一组样本数据的10%分位数是23,
15、则在这组数据中有10%的数据小于或等于23.答案(1) (2)(3)2临近学期结束,某中学要对本校高中部一线任课教师进行“评教评学”调査,经调査,高一年级80名一线任课教师好评率为90%,高二年级75名一线任课教师好评率为92%,高三年级80名一线任课教师好评率为95%.依此估计该中学高中部一线任课教师的好评率约为()A92%B93%C94%D95%A由题意,知该校高中部共有一线任课教师N807580235(名),依此估计该中学高中部一线任课教师的好评率约为92%.3以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的80%分位数是()A90B90.5C91D91.5B把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为1580%12,所以这15人成绩的80%分位数是90.5.4数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数是_8.4因为830%2.4,故30%分位数是第三项数据8.4.5已知甲、乙两地人口之比为23,其中甲地人均年收入为8万元,乙地人均年收入为10万元,则甲、乙两地的人均年收入为_万元9.28109.2(万元)