1、第二章 统计 2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布 学 习 目 标核 心 素 养 1会用频率分布表,画频率分布直方图表示样本数据(难点)2能通过频率分布表和频率分布直方图对数据做出总体统计(重点)3理解茎叶图的概念,会画茎叶图(重点)1通过频率分布直方图和茎叶图的学习,培养数据分析素养2借助图表中的数据运算,提升数学运算素养.自 主 预 习 探 新 知 1频率分布直方图的画法 2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形 ,就得到了频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的 也在增加,组距减小,相应的频率
2、分布折线图就会越来越接近于一条 ,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比光滑曲线上端的中点组数3茎叶图(1)茎叶图的制作方法(以两位数据为例):将所有两位数的十位数字作为,个位数字作为,茎相同者共用一个茎,茎按从 的顺序从上向下列出小到大茎叶(2)茎叶图的优缺点在样本数据 时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时 ,这对数据的记录和表示都能带来方便但是当样本数据 时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长较少记录较多思考:通过抽样获取的原始数据有何缺点?提示 因为通过抽样获得的原始数据多而且杂乱,
3、无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息1下列关于茎叶图的叙述正确的是()A将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面B茎叶图只可以分析单组数据,不能对两组数据进行比较C茎叶图更不能表示三位数以上的数据D画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出A 由茎叶图的概念可得2一个容量为 80 的样本中,数据的最大值为 152,最小值为 60,组距为 10,应将样本数据分为()A10 组 B9 组C8 组D7 组A 由题意知,15260109.2,故应分成 10 组3200
4、辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在50,60)内的汽车有()A30 辆B40 辆C60 辆D80 辆C 由直方图知,时速在50,60)内的频率为 0.03100.3,故此段内汽车有 2000.360 辆4如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是_,最低分是_.4%51 由茎叶图知,样本容量为 25,90 分以上有 1 人,故优秀率为 125100%4%,最低分为 51 分合 作 探 究 释 疑 难 频率分布直方图的绘制探究问题1要做频率分布表,需要对原始数据做哪些工作?提示 分组、频数累计、计算频数和频率2画频率分布直方图时,如何决定组数与
5、组距?提示 若极差组距为整数,则极差组距组数 若极差组距不为整数,则极差组距 1组数 注意:x表示不大于 x 的最大整数3同一组数据,如果组距不同,得到的频率分布直方图也会不同吗?提示 不同对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响【例 1】某中学从高一年级随机抽取 50 名学生进行智力测验,其得分如下(单位:分):48 64 52 86 71 48 64 41 86 7971 68 82 84 68 64 62 68 81 5790 52 74 73 56 78 47 66 55 6456 88 69 40 73 97 68 56 67 5970 52 79
6、44 55 69 62 58 32 58根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间30,100平均分成 7 个小区间,试列出这 50 名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?思路点拨:按画频率分布直方图的步骤进行绘制 解(1)这次测验成绩的最低分是 32 分,最高分是 97 分(2)根据题意,列出样本的频率分布表如下:分组频数频率 30,40)10.02 40,50)60.12 50,60)120.24 60,70)140.28 70,80)90.18 80,90)6 0.12 90,10
7、020.04 合计501.00频率分布直方图如图所示(3)从频率分布直方图可以看出,这 50 名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这 50 名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布 1(变条件)美国历届总统中,就任时年纪最小的是罗斯福,他于1901 年就任,当时年仅 42 岁;就任时年纪最大的是里根,他于 1981年就任,当时 69 岁下面按时间顺序(从 1789 年的华盛顿到 2009 年的奥巴马,共 44 任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,6
8、5,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图解 以 4 为组距,列表如下:频率分布直方图如下:2(变结论)本例条件不变,若把所给数据去掉一个最高分和一个最低分后分成 5 组,试画出这 48 名学生智力测验成绩的频率分布直方图解 列出频率分布表如下:频率分布直方图如下:绘制频率分布直方图应注意的问题 1组数与样本容量有关,一般地,样本容量越大,所分组数越多.当样本容量不超过 100 时,按数据的多少,常分成 512 组
9、.2在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.3一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,纵轴是频率/组距,而不是频率.频率分布直方图的应用【例 2】为增强市民节能环保意识,我市面向全市征召义务宣传志愿者,现从符合条件的 500 名志愿者中随机抽取 100 名志愿者,他们的年龄情况如下表所示:分组(单位:岁)频数频率 20,25)50.0525,30)0.2030,35)3535,40)300.3040,45100.10合计1001.00(1)频率分布表中的位置应填什么数据?(2)补全如图
10、所示的频率分布直方图,再根据频率分布直方图估计这 500 名志愿者中年龄在30,35)岁的人数解(1)设年龄在25,30)岁的频数为 x,年龄在30,35)岁的频率为 y.法一:根据题意可得 x1000.20,35100y,解得 x20,y0.35,故处应填 20,处应填 0.35.法二:由题意得 5x353010100,0.050.20y0.300.101,解得 x20,y0.35,故处填 20,处填 0.35.(2)由频率分布表知年龄在25,30)岁的频率是 0.20,组距是 5.所以频率组距0.205 0.04.补全频率分布直方图如图所示 根据频率分布直方图估计这 500 名志愿者中年龄
11、在30,35)岁的人数为 5000.35175.频率分布直方图的性质1因为小矩形的面积组距频率组距频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2在频率分布直方图中,各小矩形的面积之和等于 1.3频数相应的频率样本容量.跟进训练1从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 至 350 度之间,频率分布直方图如图所示(1)求直方图中 x 的值;(2)在这些用户中,求用电量落在区间100,250)内的户数解(1)由频率分布直方图知200,250)小组的频率为 1(0.002 40.003 60.006 0
12、0.002 40.001 2)500.22,于是 x0.2250 0.004 4.(2)数据落在100,250)内的频率为(0.003 60.006 00.004 4)500.7,所求户数为 0.710070.茎叶图的绘制及应用 【例 3】某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较思路点拨:题中可以用十位数字为茎,个位数字为叶作茎叶
13、图然后由茎叶图的特点分析两人的成绩 解 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是 98;甲同学的得分情况,也大致对称,中位数是 88.乙同学的成绩比较稳定,总体情况比甲同学好绘制茎叶图的注意点 1绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.2茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等.跟进训练2从甲、乙两个班中各随机选出 15 名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是_,_,从图中看,_班的平均成绩较高96 92 乙
14、 由茎叶图知,甲班最高分是 96 分,乙班的最高分是 92.甲班的成绩集中在 6080 间,乙班的成绩集中在 7090 间,故乙班的平均成绩较高课 堂 小 结 提 素 养 1总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布2总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图1判断下列结论的正误(正确的打“”,错误的打“”)(1)用样本的频率分布可以估计总体分布()(2)频率分布直方图的纵轴表示频率()(3)
15、只有两位的数据能用茎叶图表示()答案(1)(2)(3)2观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在2 700,3 000)内的频率为()A0.1 B0.2 C0.3 D0.4C 由 图 可 得,新 生 儿 体 重 在 2 700,3 000)内 的 频 率 为0.0013000.3.3如图所示的茎叶图表示的是一台自动售货机的销售情况,则茎叶图中 9 表示的销售额为()A9 B49C29D1 349C 观察茎叶图,分清楚茎和叶即可分开茎、叶的竖线左侧仅有一列,表示茎,右侧有多列,表示叶,所以 9 表示的销售额为 29.4某班 50 名同学参加数学测验,成绩的分组及各组的频数如下:40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图解(1)频率分布表如下:分组频数频率 40,50)20.04 50,60)30.06 60,70)100.2 70,80)150.3 80,90)120.24 90,10080.16(2)频率分布直方图如下:点击右图进入 课 时 分 层 作 业 Thank you for watching!