1、5 用样本估计总体 5.1 估计总体的分布 必备知识自主学习 1.频率分布表和频率分布直方图(1)频率分布表编制的方法步骤:导思 1.频率分布直方图纵轴的含义是什么?2.频率分布直方图的制作步骤是什么?3.如何画频率折线图?【思考】频率分布表与频率分布直方图有什么不同?提示:频率分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2.频率折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的 左边区间的_开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间 的中点,就可以得到一条折
2、线,我们称之为_.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳 定于总体在相应区间内取值的_.也就是说,一般地,样本容量越大,用样本的 频率分布去估计总体的分布就越_.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则 会相应随之_,相应的频率折线图就会越来越接近于一条_.中点 频率折线图 概率 精确 减小 光滑曲线【思考】频率分布表、频率分布直方图与频率折线图各有什么优缺点?【基础小测】1.辨析记忆(对的打“”,错的打“”)(1)频率分布直方图中的纵坐标指的是频率的值.()(2)频率分布直方图的宽度没有实际意义.()(3)频率分布直方图中各小
3、矩形的面积之和可以不为1.()(4)在画频率折线图时,可以画成与横轴相连.()(5)在用样本的频率分布估计总体的分布时,当样本容量发生变化时,不会影响估计的结果.()2.已知一个容量为40的样本,把它分成6组,第一组到第四组的频数分别为5,6,7,10,第五组的频率是0.2,那么第六组的频数是_,频率是_.【解析】第五组的频数为0.240=8.所以第六组的频数为40-5-6-7-10-8=4.频率为 =0.1.答案:4 0.1 4403.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在50,60)内的汽车有_.4.(教材二次开发:例题改编)一个容量为n的样本,分成若干组,已知
4、某组的频数 和频率分别为50和0.25,则n=_.【解析】由题意得 =0.25,所以n=200.答案:200 50n关键能力合作学习 类型一 频率分布直方图的绘制(数据分析、直观想象)【典例】1.频率分布直方图中,小矩形的面积等于()A.组距 B.频率 C.组数 D.频数 2.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180
5、 176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.【思路导引】1.根据频率直方图中小矩形的几何意义,即可求解.2.极差=180-151=29,组距为3,可分为10组.【解题策略】绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各
6、个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.【跟踪训练】1.在样本频率分布直方图中,某个小矩形的面积是其他小矩形面积之和的 ,已知样本容量是80,则该组的频数为()A.20 B.16 C.30 D.35【解析】选B.设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得 x+4x=80,解得x=16,即该组的频数为16.142.某中学同年级40名男生的体重数据如下(单位:千克):61 60 59 59 59 58 58 57 57 57 57 56 56 56 56 56 56 56 55 55 5
7、5 55 54 54 54 54 53 53 52 52 52 52 52 51 51 51 50 50 49 48 列出样本的频率分布表,画出频率分布直方图.【补偿训练】某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107109,3株;109111,9株;111113,13株;113115,16株;115117,26株,117119,20株;119121,7株;121123,4株;123125,2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109121范围内的可能性是百分之几.类型二 频
8、率折线图的画法及应用【典例】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):4050,2;5060,3;6070,10;7080,15;8090,12;90100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率折线图;(3)估计成绩在6090分的学生比例.【思路导引】画频率分布直方图和折线图制作好频率分布表纵坐标表示频率与组距的比值.【变式探究】本例条件不变,估计成绩在5080分的学生的比例.【解析】成绩在5060分的学生的频数为3,在6070的学生的频数为10,在 7080分的学生的频数为15,所以成绩在5080分的学生的频数为28,占总体 的
9、 2814.5025【解题策略】频率折线图的作法及应用(1)作法:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)应用:频率折线图也是用一个单位长度表示一定的数量,但是,它是根据数量的多少在图中描出各个点,然后把各个点用线段顺次连接成的折线,因此,它不但可以表现出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量的增减变化的情况.提醒:画图时,横轴和纵轴的单位可不一致.【跟踪训练】有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:起始月薪(百元)13,14)14,15)15,16)16,17)频数 7 11 26 23 起始月薪(百元)17,
10、18)18,19)19,20)20,21 频数 15 8 4 6(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.【补偿训练】某学校随机抽取部分新生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学路上所需时间的范围是0,100,样本数据分组为0,20),20,40),40,60),60,80),80,100.(1)求直方图中x的值;(2)如果上学路上所需时间不少于40分钟的学生可申请在学校住宿,请估计学校1 000名新生中有多少名学生可以申请住宿.类型三 用样本分布估计总体
11、分布【典例】1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100.若低于60分的人数是15,则该班的学生人数是_.2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【思路导引】1.利用
12、频率分布直方图,计算出低于60分的人数的频率p,利用频数除以相应的频率p得总人数.2.利用110次以上(含110次)的矩形面积除以所有的矩形面积之和,即可估计高一学生的达标率.【解题策略】用样本估计总体的常用方法(1)用频率分布表估计总体分布.根据样本数据可以制作频率分布表,利用频率分布表中的数据,如各小组的频数、频率,可以对总体中的有关量进行估计.(2)用频率分布直方图估计总体分布.根据样本数据绘制出的频率分布直方图具有直观的特点,可以直接判断出样本中数据的分布特点和变化趋势与规律,并由此对总体进行估计.(3)用频率折线图估计总体分布.由样本频率分布直方图可以绘制出频率折线图,且样本容量越大
13、,分组的组距不断缩小,那么折线图就越接近于总体分布,从而由频率折线图对总体估计就越精确.【跟踪训练】某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是96,106(单位:厘米),样本数据分组为96,98),98,100),100,102),102,104),104,106.(1)求出x的值;(2)已知样本中身高小于100厘米的人数是36,求出样本容量N的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率 B.频率分布直方图中各个小矩形的面积
14、之和等于1 C.频率分布直方图中各个小矩形的宽一样大 D.频率折线图是依次连接频率分布直方图的每个小矩形上端中点得到的【解析】选A.频率分布直方图的每个小矩形的高=课堂检测素养达标.频率组距2.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5【解析】选D.由题意知,共20个数据,频率为0.2,在此范围内的数据有200.2=4个,只有在11.513.5范围内有4个数据:13,12,12,12.3.如图是一个容量为200的样本的频率
15、分布直方图,请根据图形中的数据填空.(1)样本数据落在59内的频率为_.(2)样本数据落在913内的频率为_.【解析】(1)59对应的矩形的高是0.08,组距为4,所以频率是0.084=0.32.(2)913对应的矩形的高是0.09,组距为4,所以频率是0.094=0.36.答案:(1)0.32(2)0.36 4.(教材二次开发:练习改编)如图是根据部分城市某年6月份的平均气温(单位:)数据得到的样本频率分布直方图,其中平均气温的范围是20.5,26.5,样本数据的分组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5.已知样本中平均气温低于22.5 的城市个数为11,则样本中平均气温不低于25.5 的城市个数为_.5.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图.由图中数据求身高在120,130)内的学生人数.