1、第二章 统 计22 用样本估计总体 2.2.1 用样本的频率分布估计总体分布 第二章 统 计 1.理解用样本的频率分布估计总体分布的方法 2.会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图 3能够利用图表解决实际问题,培养学生数据处理能力1频率分布表与频率分布直方图(1)频率分布的概念频率:将一批数据按照要求分成若干组,各组内数据的个数,叫做该组的频数,每组的频数除以样本容量的商叫做该组的频率,频率反映每组数据在样本中所占比例的大小频率分布:指一个样本数据在各个小范围内所占比例的情况,一般用频率分布直方图反映样本的频率分布(2)频率分布表、频率分布直方图的制作步骤及意义把样本数据整
2、理成频率分布表或频率分布直方图,就可以比较清楚地看出样本点的频率分布,从而就可以估计总体的频率分布2频率分布折线图与总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图(2)总体密度曲线在样本频率分布直方图中,当样本容量逐渐增加,作图时所分的组数增加,_减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线中点组距3茎叶图(1)将所有两位数的十位数字作为_,个位数字作为_,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序)(2)茎叶图的优点与不足优点:
3、一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;不足:当样本数据较多时,茎叶图就显得不太方便茎叶1总体密度曲线及其他图表的联系2茎叶图与频率分布表的关系频率分布表中的分组相当于茎叶图的茎,频率分布表中指定区间(组)的频数相当于茎上叶的数目3用样本估计总体用样本估计总体包括两个方面:(1)用样本的频率分布估计总体的分布(2)用样本的数字特征估计总体的数字特征(下节学习)判断正误(对的打“”,错的打“”)(1)直方图的高表示取某数的频率()(2)直方图的高表示该组上的个体在样本中出现的频率()(3)直方图的高表示取某组上的
4、个体在样本中出现的频数与组距的比值()(4)直方图的高表示取该组上的个体在样本中出现的频率与组距的比值()解析:要注意频率分布直方图的特点在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积 一个容量为 80 的样本中数据的最大值是 140,最小值是 51,组距是 10,则应将样本数据分为()A10 组B9 组C8 组D7 组解析:选 B.极差为 1405189,而组距为 10,故应将样本数据分为 9 组将容量为 100 的样本数据按由小到大排列分成 8 个小组,如表所示,但第 3 组被墨汁污染,则第三组的频率为()组号12345678 频数101314
5、1513129A.0.14B0.12C0.03D0.10解析:选 A.第三组的频数为 100(1013141513129)14.故第三组的频率为 141000.14.在频率分布直方图中,各小长方形的面积表示_,它们的总和是_解析:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于 1.答案:频率 1如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是_,最低分是_解析:由茎叶图可知,样本容量为 25,90 分以上的有 1 人,故优秀率为 125100%4%,最低分为 51 分 答案:4%51探究点 1 频率分布表、频率分布直方图、频率分布折线图的绘制 抽查 100 袋洗
6、衣粉,测量它们的净重如下(单位:g):494 498 493 505 496 492 485 483 508 511495 494 483 485 511 493 505 488 501 491493 509 509 512 484 509 510 495 497 498504 498 483 510 503 497 502 511 497 500493 509 510 493 491 497 515 503 515 518510 514 509 499 493 499 509 492 505 489494 501 509 498 502 500 508 491 509 509499 495
7、493 509 496 509 505 499 486 491492 496 499 508 485 498 496 495 496 505499 505 496 501 510 496 487 511 501 496(1)列出样本的频率分布表;(2)画频率分布直方图及频率分布折线图;(3)估计净重在 494.5506.5 g 之间的频率【解】(1)在样本数据中,最大值是 518,最小值是 483,所以极差为 35,取组距为 4,由于354 834,故要分成 9 组,使分点比数据多一位小数,且把第 1 组的起点稍微减小一点,得分组如下:482.5,486.5),486.5,490.5),490
8、.5,494.5),514.5,518.5 列出频率分布表如下:分组频数频率频率/组距 482.5,486.5)80.080.02 486.5,490.5)30.030.007 5 490.5,494.5)170.170.042 5 494.5,498.5)210.210.052 5 498.5,502.5)140.140.035 502.5,506.5)90.090.022 5 506.5,510.5)190.190.047 5 510.5,514.5)60.060.015 514.5,518.530.030.007 5 合计1001.00(2)频率分布直方图及频率分布折线图如图(3)净重在
9、 494.5506.5 g 之间的频率为 0.210.140.090.44.绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率 为了检测某种产品的质量,抽取了一个容量为 100 的样本,
10、数据的分组情况与频数如下:10.75,10.85),3;10.85,10.95),9;10.95,11.05),13;11.05,11.15),16;11.15,11.25),26;11.25,11.35),20;11.35,11.45),7;11.45,11.55),4;11.55,11.65,2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述图表,估计数据落在10.95,11.35)范围内的可能性是百分之几;(4)数据小于 11.20 的可能性是百分之几解:(1)频率分布表如下:分组频数频率 10.75,10.85)30.03 10.85,10.95)90
11、.09 10.95,11.05)130.13 11.05,11.15)160.16 11.15,11.25)260.26 11.25,11.35)200.20 11.35,11.45)70.07 11.45,11.55)40.04 11.55,11.6520.02 合计1001.00(2)频率分布直方图及频率分布折线图,如图(3)由上述图表可知数据落在10.95,11.35)范围内的频率为 1(0.030.09)(0.070.040.02)0.7575%,即数据落在10.95,11.35)范围内的可能性是 75%.(4)数据小于 11.20 的可能性即数据小于 11.20 的频率,设为 x,则
12、(x0.41)(11.2011.15)(0.670.41)(11.2511.15),所以 x0.410.13,即 x0.54,从而估计数据小于 11.20 的可能性是 54%.探究点 2 频率分布直方图、频率分布折线图的应用(1)(2017高考全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014 年 1 月至 2016年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在 7,8 月D各年 1 月至 6 月的月接待游客量相对于 7 月至 12
13、月,波动性更小,变化比较平稳(2)(2016高考山东卷)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200 名学生中每周的自习时间不少于 22.5 小时的人数是()A56B60C120D140【解析】(1)根据折线图可知,2014 年 8 月到 9 月、2014 年10 月到 11 月等月接待游客量都是减少,所以 A 错误(2)根据频率分布直方图,200 名学生中每周的自习时间不少于22.5 小时的频
14、率为(0.160.080.04)2.50.7,故 200 名学生中每周的自习时间不少于 22.5小时的人数为 2000.7140.【答案】(1)A(2)D(1)频率分布折线图可以在总体分布未知的情况下,近似描述总体中数据分布的大体趋势,当样本容量越大,分组越多,则频率分布折线图越接近总体密度曲线(2)频率分布直方图的应用中的计算问题小长方形的面积组距频率组距频率;各小长方形的面积之和等于 1;频数样本容量频率,此关系式的变形为频数频率样本容量,样本容量频率频数 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右
15、各小长方形面积之比为 24171593,第二小组的频数为 12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,则该校全体高一年级学生的达标率是多少?(3)样本中不达标的学生人数是多少?(4)第三组的频数是多少?解:(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为4241715930.08.又因为第二小组的频率第二小组的频数样本容量,所以样本容量第二小组的频数第二小组的频率 120.08150.(2)由 直 方 图 可 估 计 该 校 高 一 年 级 学 生 的 达 标 率 为1715932417159310
16、0%88%.(3)由(2)知达标率为 88%,样本容量为 150,不达标的学生频率为 10.880.12.所以样本中不达标的学生人数为 1500.1218(人)(4)第三小组的频率为17241715930.34.又因为样本容量为 150,所以第三组的频数为 1500.3451.探究点 3 茎叶图的画法及应用 某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔 30 分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):甲:52 51 49 48 53 48 49乙:60 65 40 35 25 65 60画出茎叶图,并说明哪个车间的产品质量比较稳定【解】茎叶图如图所示(茎为十位上
17、的数字):由图可以看出甲车间的产品质量较集中,而乙车间的产品质量较分散,所以甲车间的产品质量比较稳定绘制茎叶图的注意点(1)绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一(2)茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等 1.如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A甲运动员的成绩好于乙运动员B乙运动员的成绩好于甲运动员C甲、乙两名运动员的成绩没有明显的差别D甲运动员的最低得分为 0 分解析:选 A.从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分是 30 多分,乙运动员的得分除一
18、个 52 分外,也大致对称,平均得分是 20 多分,因此,甲运动员发挥比较稳定,总体得分情况比乙好2从两个班中各随机抽取 10 名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况解:茎叶图如下:由茎叶图可知,乙班的数学成绩较好,而且较稳定1下列关于频率分布折线图的说法正确的是()A频率分布折线图与总体密度曲线无关B频率分布折线图就是总体密度曲线C样本容量很大的频率分布折线图就是总体密度曲线D如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图
19、就会无限接近于总体密度曲线解析:选 D.总体密度曲线通常都是用样本频率分布估计出来的如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线2某厂对一批元件的长度(单位:mm)进行抽样检测,得到如图所示的频率分布直方图若长度在区间90,96)内的元件为合格品,则估计这批元件中合格产品所占的百分比是()A70%B75%C80%D85%解析:选 C.易知在区间90,96)内的直方图的面积 S1(0.027 50.027 50.045 0)20.8,故合格品所占的百分比是 80%.3.为了解某校教师用多媒体进行教学的情况,采用简单随机抽样的
20、方法,从该校 200 名授课教师中抽出 20 名,调查了他们上学期使用多媒体进行教学的次数,调查结果用茎叶图表示如图所示,据此可估计该校 200 名教师中,上学期使用多媒体进行教学的次数在15,25)内的人数为_解析:由茎叶图知抽取的 20 名教师中使用多媒体进行教学的次数在15,25)内的人数为 6,频率为 620,故估计这 200 名教师中,上学期使用多媒体进行教学的次数在15,25)内的人数为 62020060.答案:604从某小学随机抽取 100 名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知 a_若要从身高在120,130),130,140),
21、140,150三组内的学生中,用分层抽样的方法选取 18 人参加一项活动,则从身高在140,150内的学生中选取的人数应为_解析:因为频率分布直方图中各小长方形的面积之和为 1,所以 10(0.0050.035a0.0200.010)1,解得 a0.030.由图可知身高在120,150内的学生人数为 10010(0.0300.0200.010)60,其中身高在140,150内的学生人数为10,所以从身高在140,150内的学生中选取的人数为1860103.答案:0.030 3知识结构深化拓展 1.统计思想之一:用样本数据统计的频率分布表、频率分布直方图、频率分布折线图及茎叶图观察分析,将所得结
22、果用来估计总体的分布深化拓展 2几种表示样本频率分布的图表比较方法优点缺点 频率分布表在数量表示上比较确切不够直观、形象,损失了样本的一些信息,分析数据分布的总体情况不够方便 频率分布直方图能够很容易地表示大量数据,非常直观地表示数据分布的情况,使我们能够看到在频率分布表中看不清楚的数据模式从直方图本身不能得出原始的数据内容,把数据表示成直方图后,原有的数据信息被抹掉了 深化拓展 方法优点缺点 频率分布折线图反映了数据的变化趋势原有的具体数据信息被抹掉了 茎叶图由所有样本数据构成,没有原始信息的损失;便于记录和表示;能够展示数据的分布情况只方便记录两组数据;当样本数据较多时,茎叶图就显得不太方便了本部分内容讲解结束 按ESC键退出全屏播放