1、3用样本估计总体分布31从频数到频率32频率分布直方图新课程标准解读核心素养能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性数据分析、直观想象与传统相机比较,在数码相机中,有一种十分实用的功能,这就是直方图显示功能直方图就是通过在LCD上显示出来的曝光量柱形图来确定照片曝光量大小的工具,通过直方图的横轴和纵轴我们可以直观地看出拍摄的照片的曝光情况,在拍摄时能给摄影者带来很大的方便问题你会画这样的柱形图吗?知识点一从频数到频率1频率表示频数与总数的比值2频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数在实际问题中,如果总体容量比较小,频数也
2、可以较客观地反映总体分布;当总体容量较大时,频率就更能客观地反映总体分布容量为100的样本数据被分为6组,如表:组号123456频数14171820x15第5组的频率是()A0.15B0.16C0.18 D0.20答案:B知识点二频率分布直方图1定义:频率分布直方图中每个小矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积组距频率我们把这样的图叫作频率分布直方图2频率分布直方图与频率的关系频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小3频率分布直方图的好处(1)能清楚直观地显示各组频率分布情况及各组频率之间的差别
3、;(2)当考虑数据落在若干个组内的频率之和时,可以用相应矩形面积之和来表示4画频率分布直方图的步骤(1)计算极差;(2)确定组距与组数;(3)分组;(4)列表;(5)画频率分布直方图5频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图频率分布直方图应关注的问题(1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成512组;(2)画频率分布直方图时,同一组数据,分组时组距要相等
4、,每个矩形的高与频率成正比,这点应特别注意 频数分布直方图与频率分布直方图有什么不同?提示:频数分布直方图能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各小组数据在所有数据中所占的比例大小的角度来表示数据分布的规律对某活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组25,30)的数据不慎丢失,依据此图回答以下问题:(1)年龄组25,30)对应小矩形的高度为_;(2)据此估计本次活动中志愿者年龄在25,35)内的人数为_解析:(1)设年龄组25,30)对应小矩形的高度为h,则5(0.01h0.070.060.02)1,解得h0.04.(2)由(
5、1)得志愿者年龄在25,35)内的频率为5(0.040.07)0.55,故志愿者年龄在25,35)内的人数约为0.55800440.答案:(1)0.04(2)440知识点三其他统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图直观描述不同类别或分组数据的频数和频率几种表示样本分布的方法的比较表示样本分布的方法优点缺点频率分布表在数量表示上比较确切不够直观、形象,损失了样本的一些信息,分析数据分布的总体态势不够方便频率分布直方图能够很容易地表示大量数据,非常直观地表示数据分布的情况,能看到在频率分布表中看不清楚的数据模式从直方图本身不能得出原始的数据内容,把数据表示成直方图后,原有
6、的数据信息被抹掉了折线图反映了数据的变化趋势原有的具体数据信息被抹掉了条形图能够使人们一眼看出各个数量的多少,易于比较数据之间的差别不能直观地看出各部分占总体的百分比扇形图能反映部分与整体的关系,可以清楚地看出各部分所占的百分比不能看出各部分的数量要反映某市一周内每天的最高气温的变化情况,宜采用()A条形统计图 B扇形统计图C折线统计图 D频率分布直方图解析:选C描述数据随时间的变化趋势宜采用折线统计图频数与频率的有关计算例1已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是_,频率是_解析因为频率,所以频数频率样本容量
7、,因为第五组的频率是0.2,所以频数是0.2408,第六组的频数是40(567108)4,所以第六组的频率是0.1.答案40.1频数与频率的求解策略对于频数与频率的问题,首先要明确几个等量关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清已知、未知,选择合适的公式进行解题 跟踪训练一个容量为20的样本数据,分组后组距与频数如下表:组距10,20)20,30)30,40)40,50)50,60)60,70频数234542则样本数据在区间10,50)上的频率为_解析:区间10,50)包括四部分的数据,在这四部分上的数据的频数和是
8、234514,样本容量为20,所以样本数据在区间10,50)上的频率为0.7.答案:0.7频率分布直方图、频率折线图的画法例2(链接教科书第161页例3)为了了解某片经济林的生长情况,随机测量其中的100棵树的底部周长,得到如下数据(单位:cm):13598102110991211109610010312597117113110921021091041121091248713197102123104104128105123111103105921141081041021291269710011511110611710410911189110121801201211041081181299990
9、9912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少解(1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.频率分布表如下:底部周长分组频数频率80,85)10.010.00285,90)20.020.00490,95)40.040
10、.00895,100)140.140.028100,105)240.240.048105,110)150.150.030110,115)120.120.024115,120)90.090.018120,125)110.110.022125,130)60.060.012130,13520.020.004(2)频率分布直方图和频率折线图如图所示(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.010.020.040.140.21,样本中底部周长不小于120 cm的频率为0.110.060.020.19.所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 c
11、m的树占19%.绘制频率分布直方图应注意的2个问题(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“频率/组距”所占的比例来定高如我们预先设定以“”为一个单位长度,代表“0.1”,则若一个组的为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推;(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30120个左右时,应分成512组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,
12、频率之和为1. 跟踪训练有一容量为50的样本,数据的分组及各组的频数如下:10,15),4;15,20),5;20,25),10;25,30),11;30,35),9;35,40),8;40,45,3.(1)求出样本中各组的频率;(2)画出频率分布直方图及频率折线图解:(1)由所给的数据,可得下表:分组频数频率10,15)40.0815,20)50.1020,25)100.2025,30)110.2230,35)90.1835,40)80.1640,4530.06(2)频率分布直方图如图所示,频率折线图如图所示频率分布直方图的应用例3(链接教科书第163页思考交流)为了了解高一学生的体能情况,
13、某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?解(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为0.08.又因为第二小组频率,所以样本容量150.(2)由题图可估计该校高一学生的达标率约为100%88%.母题探究1(变设问)若本例条件不变,试求样本中不达标的学生人数解:由达标率为88%,样本容量为150,不达标的
14、学生频率为10.880.12.所以样本中不达标的学生人数为1500.1218.2(变设问)若本例条件不变,试求第三小组的频数解:第三小组的频率为0.34.又因为样本容量为150.所以第三小组的频数为1500.3451.由频率分布直方图进行相关计算时,需掌握下列关系式:(1)组距频率;(2)频率,此关系式的变形为:样本容量,样本容量频率频数 跟踪训练某电子商务公司对10 000名网络购物者2020年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示(1)直方图中的a_;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_解析:(1
15、)由0.11.50.12.50.1a0.12.00.10.80.10.21,解得a3.(2)区间0.3,0.5)内的频率为0.11.50.12.50.4,故0.5,0.9内的频率为10.40.6.因此,消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000.答案:(1)3(2)6 000统计图的综合应用例4如图是根据某市3月1日至3月10日的最低气温(单位:)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:)的扇形统计图和条形统计图解该城市3月1日至10日的最低气温(单位:)情况如下表:日期/日12345678910最低气温/32
16、01120122其中最低气温为3 的有1天,占10%;最低气温为2 的有1天,占10%;最低气温为1 的有2天,占20%;最低气温为0 的有2天,占20%;最低气温为1 的有1天,占10%;最低气温为2 的有3天,占30%,扇形统计图和条形统计图如图所示1条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率2扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数3在画折线图时,要注意明确横轴、纵轴的实际含义 跟踪训练1如图是根据某中学为地震灾区捐款的情况而制作的统计图已知该校在校
17、学生3 000人,根据统计图计算该校共捐款_元解析:根据统计图,得高一人数为3 00032%960,捐款9601514 400(元);高二人数为3 00033%990,捐款9901312 870(元);高三人数为3 00035%1 050,捐款1 0501010 500(元)所以该校学生共捐款14 40012 87010 50037 770(元)答案:37 7702甲、乙两个城市2021年4月中旬,每天的最高气温统计图如图所示,这9天里,气温比较稳定的城市是_解析:从折线统计图中可以很清楚的看到乙城市的气温变化较大,而甲城市气温相对来说较稳定,变化基本不大答案:甲1从一堆苹果中任取了20个,并
18、得到它们的质量(单位:克)数据分布表如下:分组100,110(110,120(120,130(130,140(140,150(150,160频数134642根据频数分布表,可以估计在这堆苹果中,质量大于130克的苹果数约占苹果总数的()A10%B30%C60% D80%解析:选C根据频数分布表可知,0.6,所以质量大于130克的苹果数约占苹果总数的60%.故选C.2有一个容量为200的样本,样本数据分组为50,70),70,90),90,110),110,130),130,150,其频率分布直方图如图所示根据样本的频率分布直方图估计样本数据落在区间90,110)内的频数为()A48 B60C6
19、4 D72解析:选B由(0.005 00.007 50.010 00.012 5a)201,解得a0.015,所以样本数据落在区间90,110)内的频率为0.015200.3,所以样本数据落在区间90,110)内的频数为2000.360,故选B.3某班全体学生英语测试成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()A45 B50C55 D60解析:选B根据频率分布直方图,可知低于60分的人数的频率是(0.0050.010)200.3,所以该班的学生人数是50.4(多选)如图给出的是某
20、高校土木工程系大四55名学生期末考试专业成绩的频率折线图,其中组距为10,且本次考试中最低分为50分,最高分为100分根据图中所提供的信息,下列结论中正确的是()A成绩是75分的人数为20B成绩是100分的人数比成绩是50分的人数多C成绩落在70,90)内的人数为35D成绩落在70,80)内的人数为20解析:选CD成绩落在70,80)内的人数为105520,不能说成绩是75分的人数为20,所以A错误,D正确;从频率折线图看不出成绩是100分的人数比成绩是50分的人数多,只能看出成绩落在50,60)内的人数和成绩落在90,100内的人数相等,所以B错误;成绩落在70,90)内的人数为5535,所以C正确5交通管理部门为了解某一段公路上小汽车的行驶速度,随机抽取了200辆通过这一段公路的小汽车,其速度的频率分布直方图如图所示,则这200辆汽车中在该路段上行驶速度低于60 km/h的有_辆解析:由频率分布直方图,可知该路段上行驶速度低于60 km/h的有200(0.010.03)1080(辆)答案:80