1、22总体分布的估计22.1频率分布表22.2频率分布直方图与折线图1.了解频数、频率的概念,了解全距、组距的概念2.能正确地编制频率分布表,会用样本频率分布去估计总体分布3.理解运用频率分布直方图和折线图分析样本的分布,从而估计总体分布的思想方法4.掌握用频率分布表作频率分布直方图和频率折线图的方法1频率分布表(1)定义:频数是某一研究对象在某范围内出现的次数,频率指某一研究对象出现的频数与总次数的比值,它能更好地反映出某一对象出现的频繁程度当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况),
2、就叫做样本的频率分布(2)当总体容量很大或不便于获得时,可以用样本的频率分布估计总体的频率分布我们把反映总体频率分布的表格称为频率分布表(3)全距与组距:整个取值区间的长度称为全距;分成的区间的长度称为组距2频率分布直方图(1)定义:我们利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图(2)作频率分布直方图的步骤求全距,即一组数据中最大值和最小值的差决定组距与组数,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚的呈现出来将数据分组计算各小组的频率,作频率分布表,各小组的频率.画频率分布直方图:作直角坐标系,横轴表示样本数据,纵轴表示;把横轴分成若干段,
3、每一线段对应一个组的组距,然后以此为底作一矩形,它的高等于该组的.3频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频率折线图4总体分布的密度曲线如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线1判断下列关于频率分布直方图的说法是否正确(正确的打“”,错误的打“”)(1)直方图的高表示取某数的频率()(2)直方图的高表示该组上的个体在样本中出现的频数与组距的比值()(3)直方图的高表示该组上的个体在样本中出现的频率()(4)直方图的高表示该组上的个体在样本中出现频
4、率与组距的比值()解析:频率分布直方图的高表示该组上的个体在样本中出现的频率与组距的比值答案:(1)(2)(3)(4)2将容量为100的样本数据按由小到大排列分成8个小组,如表所示,但第3组被墨汁污染,则第三组的频率为()组号12345678频数1013141513129A0.14B0.12C0.03 D0.10解析:选A.第三组的频数为100(1013141513129)14.故第三组的频率为0.14.3一个容量为n的样本分成若干组,已知某组的频数和频率分别为20和0.25,则n_解析:由频率,利用此式可知二求一,即0.25,所以n80.答案:804有一个容量为200的样本,其频率分布直方图
5、如图所示根据样本的频率分布直方图估计,样本数据落在区间10,12内的频数为_解析:由直方图得样本数据在10,12内的频率为0.18,则样本数据在区间10,12内的频数为36.答案:365为了让学生更多地了解“数学史”知识,某班级举办一次“追寻先哲的足迹,倾听数学的声音”的数学史知识竞赛活动现将初赛答卷成绩(得分均为整数,满分为100分)进行统计,制成如下频率分布表:序号分组(分数段)频数(人数)频率160,70)0.16270,80)22380,90)140.28490,100合计501则此频率分布表中应填空格_;_;_;_解析:设处的数值分别为A、B、C、D,则0.16,所以A8;B0.44
6、;C50(82214)6;D1(0.160.440.28)0.12.答案:80.4460.12频率分布表的应用(1)为了解某校高一年级男生的身高情况,从中选取一个容量为60的样本(60名男生的身高单位:cm),分组情况如下:分组151.5158.5158.5165.5165.5172.5172.5179.5频数621m频率a0.1则表中的m_,a_(2)容量为20的样本数据,分组后的频数如下表:分组10,20)20,30)30,40)40,50)50,60)60,70频数234542则样本数据落在区间10,40)的频率为_【解析】(1)由频数样本容量频率,得m600.16,在165.5172.
7、5 cm上的频数为60(6216)27,所以a0.45.故m6,a0.45.(2)由题可知样本数据落在区间10,40)内的频数为2349,样本总数为20,故样本数据落在区间10,40)内的频率为0.45.故填0.45.【答案】(1)60.45(2)0.45确定样本的频率分布表的步骤(1)求全距:MmaxAminA(样本的最大值减最小值),求出了全距,就知道了这组数据变动的范围有多大(2)确定组数和组距:全距组数组距(3)决定分点:在决定分点时,应避免样本中的数据作为分点,常常将分点的数值取比样本中的数据多一位小数(4)列频率分布表,求出各小组的频率,填表 1.随机抽取21个国家和地区,他们的第
8、三产业就业占三次产业总就业的百分比如下:29340.474.865.647.863.553.742638.775.635.343.423.965.174758.469.157.134.558.769.3(1)将数据适当分组,列出频率分布表;(2)全世界有220个国家和地区,试估计第三产业就业占三次产业总就业的百分比低于30%和高于50%的国家和地区分别有多少个?解:(1)分组频数频率23,32)20.1032,41)40.1941,50)30.1450,59)40.1959,68)30.1468,77)50.24合计211(2)不足22个,约125个频数条形图的制作及应用某校为了了解学生的课外
9、阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间数据(如下表)阅读时间(小时)00.51.01.52.0人数(频数)52010105根据所统计的数据:(1)作出频数条形图;(2)根据频数条形图估计全校学生在这一天平均每人课外阅读时间【解】(1)以横轴表示阅读时间,纵轴表示课外阅读达到该时间的人数,得出该统计问题的频数条形图(2)由随机抽查的50名学生的每人平均课外阅读时间为0.9小时估计全校学生在这一天平均每人课外阅读时间约为0.9小时制作或应用条形图时,首先要看条形图的横轴和纵轴分别代表什么量,其次要认清图中所包含的数量关系 2.小波一星期的总开支分布如图1所示,一星期的
10、食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为_解析:由题图2知,小波一星期的食品开支为30401008050300元;由图1知,小波一星期的总开支为1 000元,则小波一星期的鸡蛋开支占总开支的百分比为100%3%.答案:3%频率分布直方图、折线图的制作和应用下表给出了某校500名12岁男孩的身高(单位:cm)资料:身高122,126)126,130)130,134)134,138)138,142)人数20354090140身高142,146)146,150)150,154)154,158人数85452520(1)列出样本的频率分布表;(2)绘制频率分布直方图和频率分布折线图【
11、解】(1)频率分布表如下:身高122,126)126,130)130,134)134,138)138,142)人数20354090140频率0.040.070.080.180.28身高142,146)146,150)150,154)154,158人数85452520频率0.170.090.050.04(2)频率分布直方图和频率分布折线图如图所示: (1)明确纵、横轴的意义,纵轴表示(频率),横轴表示样本数据 (2)直方图中每一个小矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.由此可以估计样本数据落在某个区间的频率或概率3.(1)某城市为了解游客人数的变
12、化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳(2)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.
13、5小时的人数是()A56B60C120 D140解析:(1)根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误(2)根据频率分布直方图,200名学生中每周的自习时间不少于22.5小时的频率为(0.160.080.04)2.50.7,故200名学生中每周的自习时间不少于22.5小时的人数为2000.7140.答案:(1)A(2)D频率分布表列出的是在各个不同区间内取值的频率,用直方图中小长方形面积的大小来表示在各个区间内取值的频率直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积组距频率;从频率分布直方图可以清楚地看出数据分布的总体趋势,但直方图
14、本身得不出原始的数据内容给出如下样本数据:10,8,6,10,8,11,13,11,10,12,7,8,9,11,9,12,9,10,11,12.分组如下:分组频数频率5.5,7.5)7.5,9.5)9.5,11.5)11.5,13.5合计201.0(1)完成上面的频率分布表;(2)根据上表,在直角坐标系中作出频率分布直方图【解】(1)频率分布表如下:分组频数频率5.5,7.5)20.17.5,9.5)60.39.5,11.5)80.411.5,13.540.2合计201.0(2)频率分布直方图如图所示:(1)易错将纵轴表示成频率,例如当数据在9.5,11.5)时,频率为0.4,而0.2,故图
15、中最高的这个矩形的高度应为0.2个单位,而不是0.4个单位;(2)表示频率分布直方图的每一个小矩形的宽应相等防范措施:频率分布直方图中,各个小矩形的面积等于相应各组的频率,因为各组频率之和为1,故所有矩形面积之和等于1.根据这一点,也可以判断画出的频率分布直方图是否正确1下列关于频率分布折线图的说法正确的是()A频率分布折线图与总体密度曲线无关B频率分布折线图就是总体密度曲线C样本容量很大的频率分布折线图就是总体密度曲线D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线解析:选D.总体密度曲线通常都是用样本频率分布估计出来的如果样本容量无限增大,分组的组距
16、无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线2某厂对一批元件的长度(单位:mm)进行抽样检测,得到如图所示的频率分布直方图若长度在区间90,96)内的元件为合格品,则估计这批元件中合格产品所占的百分比是()A70%B75% C80% D85%解析:选C.易知在区间90,96)内的直方图的面积S1(0.027 50.027 50.045 0)20.8,故合格品所占的百分比是80%.3在抽查某产品尺寸的过程中,将其尺寸分成若干组,a,b)是其中一组,抽查出的个体数在该组内的频率为m,该组直方图的高为h,则|ab|的值_解析:小长方形的高,所以|ab|.答案:
17、4某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数_解析:根据频率分布直方图的特点可知,低于60分的频率是(0.0050.01)200.3,所以该班的学生人数是50.答案:50A基础达标1下列说法中错误的是()用样本的频率分布估计总体频率分布的过程中,样本容量越大,估计越精确;一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为240;频率分布直方图中,小长方形的高等于该小组的频率;将频率分布直方图中各小长方形上端的一个端点顺次连结起来,就可
18、以得到频率分布折线图;每一个总体都有一条总体分布的密度曲线,它反映了总体在各个范围内取值的百分比ABC D解析:选C.样本越多往往越接近于总体,所以正确;中n400.125320;中频率分布直方图中,小长方形的高等于该小组的频率组距;中应将频率分布直方图中各小长方形上端的中点顺次连接起来得到频率分布折线图;中有一些总体不存在总体分布的密度曲线,如“掷硬币”这样的离散型总体(结果是固定的,只有正面和反面两种可能,且可能性相等),故错误2观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在2 700,3 000)g的频率为()A0.1 B0.2C0.3 D0.4解析:选C.由题图可得,新生儿
19、体重在2 700,3 000)g的频率为0.0013000.3,故选C.3一个容量为80的样本数据的最大值是140,最小值是60,组距是10,则应将样本数据分为_组()A14 B10C8 D6解析:选C.因为组数,所以组数8.4在样本的频率分布直方图中,某个小长方形的面积是其他小长方形面积之和的 ,已知样本容量是80,则该组的频数为()A20 B16C30 D35解析:选B.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x4x80,解得x16,即该组的频数为16,故选B.5某厂对一批产品进行抽样检测,如图是抽检产品净重(单位:克)的频率分布直方图,样本数据分组为76,78),
20、78,80),84,86若这批产品有120个,估计其中净重大于或等于78克且小于84克的产品的个数是()A12 B18C25 D90解析:选D.净重大于或等于78克且小于84克的频率为(0.1000.1500.125)20.75,所以在该范围内的产品个数为1200.7590.6已知200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在60,70)的汽车大约有_辆解析:时速在60,70)的频率为100.040.4,因为共有200辆汽车,则时速在60,70)的汽车大约有2000.480(辆)答案:807从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(
21、如图所示),由图中数据可知a_若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_解析:因为0.005100.03510a100.020100.010101,所以a0.030.设身高在120,130),130,140),140,150三组内的学生各有x、y、z人,则0.03010,所以x30.同理y20,z10.所以从140,150中抽取183(人)答案:0.03038为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,2
22、0,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心制图时先计算最大值与最小值的差是_若取组距为2,则应分成_组;若第一组的起点定为18.5,则在26.5,28.5)内的频数为_解析:由题意知,全距为301911;由于组距为2,则5.5不是整数,所以取6组;捐款数落在26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.答案:11659在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n1)个小矩形面积的,且样本容量为300,求中
23、间一组的频数解:设中间一个小矩形的面积为x,则其余(n1)个小矩形面积和为5x,所以x.设中间一组频数为m,则,故m50.10有一容量为50的样本,数据的分组及各组的频数如下:10,15),4;15,20),5;20,25),10;25,30),11;30,35),9;35,40),8;40,45,3.(1)列出样本的频率分布表;(2)画出频率分布直方图及折线图解:(1)由所给的数据,不难得出以下样本的频率分布表分组频数频率10,15)40.0815,20)50.1020,25)100.2025,30)110.2230,35)90.1835,40)80.1640,4530.06合计501(2)
24、频率分布直方图如图所示,频率分布折线图如图所示B能力提升1从一堆苹果中任取10个,称得它们的质量如下(单位:克):125,120,122,105,130,114,116,95,120,134.则样本数据落在114.5,124.5)内的频率为_解析:找出样本数据落在114.5,124.5)的个数除以10即可求得,因为落在该范围内的共有4个数据,故所求频率为0.4.答案:0.42为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计请你根据尚未完成并有局部污损的
25、频率分布表,解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内);分组频数频率50.5,60.5)40.0860.5,70.5)0.1670.5,80.5)1080.5,90.5)160.3290.5,100.5合计50(2)画出频率分布直方图;(3)学校决定成绩在75.5,85.5)分的学生获二等奖,问该校获得二等奖的学生约为多少人?解:(1)分组频数频率50.5,60.5)40.0860.5,70.5)80.1670.5,80.5)100.2080.5,90.5)160.3290.5,100.5120.24合计501.00(2)频率分布直方图如图所示(3)成绩在75.5,80.
26、5)的学生占成绩在70.5,80.5)的学生的,因为成绩在70.5,80.5)的学生的频率为0.2,所以成绩在75.5,80.5)的学生的频率为0.1;成绩在80.5,85.5)的学生占成绩在80.5,90.5)的学生的,因为成绩在80.5,90.5)的学生频率为0.32,所以成绩在80.5,85.5)的学生频率为0.16,所以成绩在75.5,85.5)的学生频率为0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约为0.26900234(人)3(选做题)某高校在2017年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下:组号分组频数频率第
27、1组160,165)50.05第2组165,170)0.35第3组170,175)30第4组175,180)200.20第5组180,185100.10合计1001.00(1)请先求出频率分布表中处应填写的数据,并完成如图所示的频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样的方法抽取6名学生进入第二轮面试,求第3,4,5组每组各应抽取多少名学生进入第二轮面试解:(1)由题意可知,第2组的频数为0.3510035,第3组的频率为0.30,故处填35,处填0.30.频率分布直方图如图所示(2)因为第3,4,5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,抽样比为,故第3组应抽取303(名)学生,第4组应抽取202(名)学生,第5组应抽取101(名)学生,所以第3,4,5组应抽取的学生人数分别为3,2,1.