1、22用样本估计总体22.1用样本的频率分布估计总体分布目标 1.理解用样本的频率分布估计总体分布的方法;2.掌握列频率分布表、画频率分布直方图、频率分布折线图、茎叶图的方法;3.能够利用图形解决实际问题重点 频率分布直方图的画法及茎叶图的画法难点 应用频率分布直方图估计总体的分布知识点一频率分布表和频率分布直方图 填一填1频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差(2)决定组距与组数,组距与组数的确定没有固定的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多,当样本容量不超过100时,按照数据的多少,常分为512组(3)将数据分组(4)列频率分布
2、表,计算各小组的频率,作出频率分布表(5)画频率分布直方图其中横轴表示样本数据,纵轴表示频率与组距的比2频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.答一答1如何确定组距?提示:组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同)2频率分布直方图中长方形的面积有什么含义?提示:在频率分布直方图中,由于长方形的面积S组距频率,所以各个小长方形的面积表示相应各组的频率这样,频率分布直方图就以面积的形式反映了数据落在各个小组上的频率的大小知识点二频率分布折线图
3、、总体密度曲线 填一填1频率分布折线图的定义连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图2总体密度曲线的定义在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它能够精确地反映总体在各个范围内取值的百分比,它能给我们提供更加精细的信息答一答3频率分布折线图有什么优缺点?提示:频率分布折线图的优点是它可以表示数量的多少,直观地反映数量的增减情况,即变化趋势;缺点是它不适合总体分布较多的情况知识点三茎叶图 填一填1茎叶图的适用范围在样本数据较少时,用茎叶图表示数据的效果较好2茎叶图的
4、优点它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便3茎叶图的缺点当样本数据较多时,枝叶就会很长,茎叶图就显得不太方便答一答4画茎叶图时,重复出现的数据只记录一次吗?提示:不是绘制茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”位置的数据同一数据出现几次,就要在图中体现几次类型三画样本的频率分布直方图 例1下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm)区间界限122,126)126,130)130,134)人数5810区间界限134,138)138,142)142,146)人数223320区间界限146,150)150,154
5、)154,158人数1165(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比解(1)样本频率分布表如下:分组频数频率122,126)50.04126,130)80.07130,134)100.08134,138)220.18138,142)330.28142,146)200.17146,150)110.09150,154)60.05154,15850.04合计1201(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.040.070.080.19,所以我们估计身高小于134 cm的人数占总人数的
6、19%.在该问题中,分组区间已经给出,只需计算相应的频率即可列表.在画频率分布直方图时,小长方形的高是频率除以组距,需要预先进行计算.画频率分布直方图时,还需注意比例适当.从频率分布表或频率分布直方图,可以估计总体的分布情况.变式训练1为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:10.75,10.85),3;10.85,10.95),9;10.95,11.05),13;11.05,11.15),16;11.15,11.25),26;11.25,11.35),20;11.35,11.45),7;11.45,11.55),4;11.55,11.65),2.(1)
7、列出频率分布表;(2)画出频率分布直方图和频率分布折线图解:(1)频率分布表如下:分组频数频率10.75,10.85)30.0310.85,10.95)90.0910.95,11.05)130.1311.05,11.15)160.1611.15,11.25)260.2611.25,11.35)200.2011.35,11.45)70.0711.45,11.55)40.0411.55,11.65)20.02合计1001.00(2)频率分布直方图及频率分布折线图如图所示:类型二频率分布直方图的应用 例2为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频
8、率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?解(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为0.08.因为第二小组的频率,所以样本容量150.(2)由直方图可估计该校全体高一年级学生的达标率约为100%88%.由频率分布直方图进行相关计算时,需掌握下列关系式:(1) 组距频率.(2)频率,此关系式的变形为样本容量,样本容量频率频数.变式训练2从某小学随机抽取100名同学
9、,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)由图中数据可知a0.030.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为3.解析:根据(0.035a0.0200.0100.005)101,求得a0.030.身高在120,130)内学生有0.0301010030人,在130,140)内学生有0.0201010020人,在140,150内学生有0.0101010010人,则从身高在140,150内的学生中选取的人数为103(人)类型三茎叶图及应用 例3某良种培育基地
10、正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验两种小麦各种植了25亩,所得亩产量数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(
11、3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,得出统计结论分析两组数据比较多,注意不要漏掉数据,根据茎叶图的特点(分布情况)写出统计结论解(1)茎叶图如图(2)样本容量不大,画茎叶图很方便,此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息丢失,而且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种A亩产量的平均数比品种B亩产量的平均数大;品种A的亩产量波动比品种B的亩产量波动大,故品种A的亩产量稳定性较差(1)利用茎叶图进行数据分析时,通常从茎叶图中各个“叶”上的数字多少来分析该组数据的分布对称性、稳定性等.(2)如果茎叶图中的数据大致集中在某一行附近,
12、那么说明这组数据比较稳定.,(3)茎叶图只适用于样本数据较少的情况.变式训练3为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:0010:00间各自的点击量,得到如图所示的茎叶图,根据茎叶图解答下列问题:(1)求乙网站点击量的极差;(2)求甲网站点击量在10,40间的频数和频率;(3)请你估计甲、乙两网站哪个更受欢迎?并说理由解:(1)根据茎叶图,得乙网站的点击量的最大值是71,最小值是5,则乙网站的极差为71566.(2)观察茎叶图,得甲网站点击量在10,40间的点击量有20,24,25,38共4个,所以甲网站点击量在10,40间的频数为4,频率为.(3)观察茎叶图,得甲网站
13、的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲的平均数大于乙的平均数,所以甲网站更受欢迎1一个容量为40的样本数据分组后组数与频数如下:25,25.3),6;25.3,25.6),4;25.6,25.9),10;25.9,26.2),8;26.2,26.5),8;26.5,26.8),4.则样本在25,25.9)上的频率为(C)A.B. C.D.解析:25,25.9)包括25,25.3),6;25.3,25.6),4;25.6,25.9),10,频数之和为20,频率为,故选C.2在用样本频率分布估计总体分布的过程中,下列说法正确的是(C)A总体容量越大
14、,估计越精确B总体容量越小,估计越精确C样本容量越大,估计越精确D样本容量越小,估计越精确3从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm),根据数据估计(D)A甲种玉米比乙种玉米不仅长得高而且长得整齐B乙种玉米比甲种玉米不仅长得高而且长得整齐C甲种玉米比乙种玉米长得高但长势没有乙整齐D乙种玉米比甲种玉米长得高但长势没有甲整齐解析:甲种玉米株高集中在21 cm37 cm,极差为371621 cm,乙种玉米株高集中在2745且极差为451431 cm,因此可以判断乙种玉米比甲种玉米长得高但长势没有甲整齐故选D.4为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的
15、舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组如图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为(C)A6B8 C12 D18解析:由题图可知,第一组与第二组的频率之和为(0.240.16)10.4.因为第一组与第二组共有20人,所以该试验共选取志愿者50(人),故第三组共有500.3618(人),没有疗效的有6人,故有疗效的有18612(人)5甲、乙两名篮球运动员在某几场比赛得分情况为甲:12,15,25,24,3
16、9,36,31,37,49,44,50;乙:16,13,14,26,23,28,39,33,38,51.(1)画出甲、乙两名篮球运动员在某几场比赛得分的茎叶图;(2)甲、乙两人这几场比赛得分的中位数之和是多少解:(1)以得分的十位数为“茎”,个位数为“叶”在同一图中画出即可茎叶图如图所示(2)甲得分的中位数为第六个数36,乙得分的中位数为第五个和第六个数的平均数,即27,所以甲、乙得分的中位数之和为63.本课须掌握的两大问题1理解频率分布直方图注意以下几点:(1)在频率分布直方图中,各小长方形的面积的总和等于1,利用这一点可以检验所画的直方图是否正确(2)同样一组数据,如果组距不同,横轴、纵轴
17、的单位不同,得到的直方图的形状也不相同不同的形状给人以不同的印象,这种印象很多时候会影响我们对总体的判断 (3)同一个总体,由于抽样的随机性,如果随机地抽取另外一个样本,所形成的样本频率分布一般会与前一个样本的频率分布有所不同,但是它们都可以近似地看作总体的分布2对茎叶图的认识:(1)茎叶图在样本数据较少、较为集中且位数不多时比较适用由于它较好地保留了原始数据且能够展示数据的分布情况,所以可以帮助我们分析样本数据的大致频率分布,还可以用来分析样本的一些数字特征(2)用茎叶图表示数据有两个突出的优点:其一,图上没有原始数据的损失,所有信息都可从这个茎叶图中得到;其二,茎叶图可以随时记录,方便记录
18、与表示不能正确理解频率分布直方图开讲啦 在频率分布直方图中,每个小长方形的面积表示相应各组的频率,所有小长方形的面积之和为1.在解题时,常因把小长方形的高误认为是频率而导致错误典例为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17.518岁之间的男生体重(单位:kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在56.5,64.5)的学生人数是()A20B30C40 D50错答A正答C错因分析错解步骤如下:体重在56.5,64.5)的频率为0.030.0520.070.2,故学生人数为0.210020.错解原因在于将小长方形的高误认为是频率了,而实际上小长方形的
19、面积才是频率故体重在56.5,64.5)的频率为(0.030.0520.07)20.4,学生人数为0.410040.针对训练某中学举行了一次“环保知识竞赛”活动为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本(样本容量为n)进行统计按照50,60),60,70),70,80),80,90),90,100的分组作出了频率分布直方图,并作出了分数的茎叶图(图中仅列出得分在50,60),90,100的数据),如图则样本容量n和频率分布直方图中x,y的值分别为(A)A50,0.030,0.004 B30,0.040,0.003C30,0.030,0.040 D50,0.300,0.400解析:由题意可知,样本容量n50,y0.004,x0.1000.0040.0100.0160.0400.030.