1、1作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图2频率分布折线图和总体密度曲线(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线3茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数4标准差和方差(1)标准差是样本数据到平均数的一种平均距离(2)标准差:s1nx
2、1 x 2x2 x 2xn x 2.(3)方差:s21n(x1 x)2(x2 x)2(xn x)2(xn 是样本数据,n 是样本容量,x 是样本平均数)【知识拓展】1频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率组距频率组距.(2)频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观2平均数、方差的公式推广(1)若数据 x1,x2,xn 的平均数为 x,那么 mx1a,mx2a,mx3a,mxna 的平均数
3、是 m x a.(2)数据 x1,x2,xn 的方差为 s2.数据 x1a,x2a,xna 的方差也为 s2;数据 ax1,ax2,axn 的方差为 a2s2.【思考辨析】判断下列结论是否正确(请在括号中打“”或“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(5)在频率分布直方图中,最高的小长方形底边中点的横
4、坐标是众数()(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()1.(教材改编)若某校高一年级 8 个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是_答案 91.5 和 91.5解析 这组数据由小到大排列为 87,89,90,91,92,93,94,96,中位数是9192291.5,平均数 x 8789909192939496891.5.2(2015陕西改编)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为_答案 137解析 由题干扇形统计图可得该校女教师人数为 11070%150(160%)137.
5、3(2016宿迁模拟)若数据 x1,x2,x3,xn 的平均数为 x 5,方差 s22,则数据 3x11,3x21,3x31,3xn1 的平均数和方差分别为_答案 16,18解析 x1,x2,x3,xn 的平均数为 5,x1x2x3xnn5,3x13x23x33xnn135116,x1,x2,x3,xn 的方差为 2,3x11,3x21,3x31,3xn1 的方差是 32218.4(2016江苏)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_答案 0.1解析 x 4.74.85.15.45.555.1,则方差 s215(4.75.1)2(4.85.1)2(5.15.
6、1)2(5.45.1)2(5.55.1)20.1.5(2017扬州质检)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有_株树木的底部周长小于 100 cm.答案 24解析 底部周长在80,90)的频率为 0.015100.15,底部周长在90,100)的频率为 0.025100.25,样本容量为 60,所以树木的底部周长小于 100 cm 的株数为(0.150.25)6024.题型一 频率分布直方图的绘制与应用例 1(2016北京)某市居民用水拟实行阶梯水价,每人月用水
7、量中不超过 w 立方米的部分按4 元/立方米收费,超出 w 立方米的部分按 10 元/立方米收费从该市随机调查了 10 000 位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果 w 为整数,那么根据此次调查,为使 80%以上居民在该月的用水价格为 4 元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替当 w3 时,估计该市居民该月的人均水费解(1)如图所示,用水量在0.5,3)的频率的和为(0.20.30.40.50.3)0.50.85.用水量小于等于 3 立方米的频率为 0.85,又 w 为整数,为使 80%以上的居民在该月的用水价格为
8、 4 元/立方米,w 至少定为 3.(2)当 w3 时,该市居民该月的人均水费估计为(0.110.151.50.220.252.50.153)40.15340.05(3.53)0.05(43)0.05(4.53)107.21.81.510.5(元)即该市居民该月的人均水费估计为 10.5 元思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为 1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据(2015课标全国)某公司为了解用户对其产品的满意度,从 A,B 两地区分别随机调查了 40 个用户,根据用户对产品
9、的满意度评分,得到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度评分的频数分布表A 地区用户满意度评分的频率分布直方图图B 地区用户满意度评分的频数分布表满意度评分分组50,60)60,70)70,80)80,90)90,100频数2814106(1)在图中作出 B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)B 地区用户满意度评分的频率分布直方图图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于 70 分70 分到 89 分不低于 90 分满意度等级不满意满意非常满意估计哪个地区
10、用户的满意度等级为不满意的概率大?说明理由解(1)如图所示通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于 A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而 A 地区用户满意度评分比较分散(2)A 地区用户的满意度等级为不满意的概率大记 CA 表示事件:“A 地区用户的满意度等级为不满意”;CB 表示事件:“B 地区用户的满意度等级为不满意”由直方图得 P(CA)的估计值为(0.010.020.03)100.6,P(CB)的估计值为(0.0050.02)100.25.所以 A 地区用户的满意度等级为不满意的概率大题型二 茎叶图的应用例 2(
11、1)(2015山东改编)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温;甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差其中根据茎叶图能得到的统计结论的编号为_(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为 15,乙组数据的平均数为
12、 16.8,则 x,y 的值分别为_答案(1)(2)5,8解析(1)甲地 5 天的气温为 26,28,29,31,31,其平均数为 x 甲2628293131529;方差为 s2甲15(2629)2(2829)2(2929)2(3129)2(3129)23.6;标准差为 s 甲 3.6.乙地 5 天的气温为 28,29,30,31,32,其平均数为 x 乙2829303132530;方差为 s2乙15(2830)2(2930)2(3030)2(3130)2(3230)22;标准差为 s 乙 2.x 甲 x 乙,s 甲s 乙(2)由茎叶图及已知得 x5,又乙组数据的平均数为 16.8,即9151
13、0y1824516.8,解得 y8.引申探究1本例(2)中条件不变,试比较甲、乙两组哪组成绩较好解 由原题可知 x5,则甲组平均数为912152427517.4.而乙组平均数为 16.8,所以甲组成绩较好2在本例(2)条件下:求乙组数据的中位数、众数;求乙组数据的方差解 由茎叶图知,乙组中五名学生的成绩为 9,15,18,18,24.故中位数为 18,众数为 18.s215(916.8)2(1516.8)2(1816.8)22(2416.8)223.76.思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数
14、据,没有任何信息损失,第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐(1)(2016连云港模拟)一次数学考试后,某老师从自己所带的两个班级中各抽取5 人,记录他们的考试成绩,得到如图所示的茎叶图已知甲班 5 名同学成绩的平均数为 81,乙班 5 名同学成绩的中位数为 73,则 xy 的值为_(2)(2016盐城模拟)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_答案(1)3(2)6.8解析(1)由题意得,727780 x8690581x0,且易知 y3,xy3.(2)由茎叶图可得该运动员得分的平均数为89101315511,
15、则方差为8112911210112131121511256.8.题型三 用样本的数字特征估计总体的数字特征例 3(1)(2017南京模拟)抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下:运动员第 1 次第 2 次第 3 次第 4 次第 5 次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_答案 2解析 x 甲15(8791908993)90,x 乙15(8990918892)90,s2甲15(8790)2(9190)2(9090)2(8990)2(9390)24,s2乙15(8990)2(9090)2(9190)2(8890
16、)2(9290)22.(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图分别求出两人得分的平均数与方差;根据图和上面算得的结果,对两人的训练成绩作出评价解 由图象可得甲、乙两人五次测试的成绩分别为甲:10 分,13 分,12 分,14 分,16 分;乙:13 分,14 分,12 分,12 分,14 分x 甲1013121416513;x 乙1314121214513,s2甲15(1013)2(1313)2(1213)2(1413)2(1613)24;s2乙15(1313)2(1413)2(1213)2(1213)2(1413)20.8.由 s2甲s2乙,可知乙的成绩较稳定从折线
17、图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小(2016全国乙卷)某公司计划购买 1 台机器,该种机器使用三年后即被淘汰机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元在机器使用期间,如果备件不足再购买,则每个 500 元现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种机器在三年使用期内更换的易损零件数,得以下柱状图:记 x
18、 表示 1 台机器在三年使用期内需更换的易损零件数,y 表示 1 台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数(1)若 n19,求 y 与 x 的函数解析式;(2)若要求“需更换的易损零件数不大于 n”的频率不小于 0.5,求 n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这 100 台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买 1 台机器的同时应购买 19 个还是 20 个易损零件?解(1)当 x19 时,y3 800;当 x19 时,y3 800500(x19)500 x
19、5 700.所以 y 与 x 的函数解析式为y3 800,x19,500 x5 700,x19(xN)(2)由柱状图知,需更换的零件数不大于 18 的频率为 0.46,不大于 19 的频率为 0.7,故 n 的最小值为 19.(3)若每台机器在购机的同时都购买 19 个易损零件,则这 100 台机器中有 70 台在购买易损零件上的费用为 3 800 元,20 台的费用为 4 300 元,10 台的费用为 4 800 元,因此这 100 台机器在购买易损零件上所需费用的平均数为1100(3 800704 300204 80010)4 000(元),若每台机器在购机同时都购买 20 个易损零件,则
20、这 100 台机器中有 90 台在购买易损零件上的费用为 4 000 元,10 台的费用为 4 500 元,因此这 100 台机器在购买易损零件上所需费用的平均数为1100(4 000904 50010)4 050(元)比较两个平均数可知,购买 1 台机器的同时应购买 19 个易损零件9高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有填空题,也有解答题,难度为低中档用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩形时,宽窄要一
21、致通过频率分布表和频率分布直方图可以对总体作出估计频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误典例(14 分)(2016四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图(1)求直方图中 a 的值;(2)设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由;(3)估计居民月均
22、用水量的中位数规范解答解(1)由频率分布直方图可知,月均用水量在0,0.5)的频率为 0.080.50.04.同 理,在 0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5 等 组 的 频 率 分 别 为0.08,0.21,0.25,0.06,0.04,0.02.3 分由 1(0.040.080.210.250.060.040.02)0.5a0.5a,解得 a0.30.5 分(2)由(1)知,100 位居民月均用水量不低于 3 吨的频率为 0.060.040.020.12.由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 00
23、00.1236 000.9 分(3)设中位数为 x 吨因为前 5 组的频率之和为 0.040.080.150.210.250.730.5.而前 4 组的频率之和为0040.080.150.210.480.5.所以 2x2.5.12 分由 0.50(x2)0.50.48,解得 x2.04.故可估计居民月均用水量的中位数为 2.04.14 分1(2016 苏北四市模拟)从某班抽取 5 名学生测量身高(单位:cm),得到的数据为160,162,159,160,159,则该组数据的方差 s2_.答案 65解析 数据的平均数为 160,则这组数据的方差 s2411565.2(2016山东改编)某高校调查
24、了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是_答案 140解析 设所求人数为 N,则 N2.5(0.160.080.04)200140.3某一个班全体学生参加某次选拔测试,成绩的频率分布直方图如图,则可估计该班的平均分是_答案 68解析 由直方图可知各组的频率分别是 0.1,0.2,0.4,0.3,则可估计该班的平均分是 300.1500.2700.
25、4900.368.4某公司 10 位员工的月工资(单位:元)为 x1,x2,x10,其平均数和方差分别为 x 和 s2,若从下月起每位员工的月工资增加 100 元,则这 10 位员工下月工资的平均数和方差分别为_答案 x 100,s2解析 x1x2x1010 x,yixi100,所以 y1,y2,y10 的均值为 x 100,方差不变5已知样本(x1,x2,xn)的平均数为 x,样本(y1,y2,ym)的平均数为 y(x y),若样本(x1,x2,xn,y1,y2,ym)的平均数 z a x(1a)y,其中 0a12,则 n,m 的大小关系为_答案 nm解析 由题意可得 x x1x2xnn,y y1y2ymm,z x1x2xny1y2ymnmnnmx1x2xnn mnmy1y2ymmnnm x mnm y a x(1a)y,所以nnma,mnm1a,又 0a12,所以 0nnm12 mnm,故 n x 乙,s2甲s2乙,所以甲组的研发水平优于乙组(2)记恰有一组研发成功为事件 E,在所抽得的 15 个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共 7 个因此事件 E 发生的频率为 715.用频率估计概率,即得所求概率为 P(E)715.