1、第二章 统计22 用样本估计总体22.1 用样本的频率分布估计总体分布内 容 标 准学 科 素 养1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.提升数学运算发展数据分析应用数学建模01 课前 自主预习02 课堂 合作探究03 课后 讨论探究04 课时 跟踪训练基础认识知识点一 频率分布表及频率分布直方图预习教材 P6570,思考并完成以下问题为了了解全市居民日常用水量的整体分布情况,采用抽样调查的方式,获得 100 位居民 2018 年的月均用水量如下表(单位:t):31 2.5 2.0 2.0 1.5
2、1.0 1.6 1.8 1.9 1.634 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.432 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.833 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.132 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.330 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.025 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.326 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.425 2.6 2.3 2.1
3、1.6 1.0 1.0 1.7 0.8 2.428 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2(1)上述 100 个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?提示:最大值是 4.3,最小值是 0.2,数据的变化范围为 0.24.3.(2)样本数据中的最大值和最小值的差称为极差,如果将上述 100 个数据按组距为 0.5进行分组,那么这些数据共分为多少组?提示:(4.30.2)0.58.2.因此可以将数据分为 9 组(3)以组距为 0.5 进行分组,上述 100 个数据共分为 9 组,各组数据的取值范围可以如何设定?提示:0,0.5),0.5
4、,1),1,1.5),4,4.5)(4)如何统计上述 100 个数据在各组中的频率?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?提示:分组频数累计频数频率0,0.5)40.040.5,1)80.081,1.5)正正正150.151.5,2)正正正正丅220.222,2.5)正正正正正250.252.5,3)正正140.143,3.5)正一60.063.5,4)40.044,4.5丅20.02合计1001.00知识梳理 1.用样本估计总体的两种情况(1)用样本的_估计总体分布(2)用样本的_估计总体数字特征频率分布数字特征2频率分布直方图的画法最大值与最小值不小于k的最小整数
5、分组频数累计频数频率合计样本容量1频率/组距各小长方形的面积13频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形_,就得到了频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的_也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条_,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比上端的中点组数光滑曲线知识点二 茎叶图预习教材 P70,思考并完成以下问题某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31
6、,44,36,15,37,25,36,39.(1)你能理解这个图是如何记录这些数据的吗?提示:中间的数字表示得分的十位数,旁边的数字分别表示两个人得分的个位数(2)你能通过该图说明哪个运动员的发挥更稳定吗?提示:从图中看出乙运动员的发挥更稳定.知识梳理 1.茎叶图的制作方法将所有两位数的十位数字作为_,个位数字作为_,茎相同者共用一个茎,茎按_的顺序从上向下列出2茎叶图的优缺点在样本数据_时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时_,这对数据的记录和表示都能带来方便但是当样本数据_时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长
7、茎叶从小到大较少记录较多自我检测1一个容量为 80 的样本中,数据的最大值为 152,最小值为 60,组距为 10,应将样本数据分为()A10 组 B9 组C8 组D7 组解析:由题意可知,15260109.2,故应将数据分为 10 组答案:A2从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析已知不超过 80 分的为 10 人,其累积频率为 0.5,则样本容量是()A20 B40C80 D60解析:样本容量100.520.答案:A3如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90 分以上)是_,最低分是_解析:由茎叶图知,样本容量为 25,90 分以上的有 1 人,故优秀
8、率为 1254%,最低分为 51 分答案:4%51探究一 频率分布直方图的绘制阅读教材 P6567题型:绘制频率分布直方图方法步骤:第一步,求极差;第二步,确定组距与组数;第三步,将数据分组;第四步,列频率分布表;第五步,画频率分布直方图例 1 2019 年高考已经结束,我校为了了解和掌握高考考生的实际答卷情况,随机地取出了 100 名考生的数学成绩,数据如下(单位:分):135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112105 124 87 131 97 102 123 104 104 12810
9、9 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1)列出频率分布表;(2)画出频率分布直方图和折线图解析 100 个数据中,最大值为
10、 135,最小值为 80,极差为 1358055.取组距为5,则组数555 11.(1)频率分布表如下:分组频数频率频率/组距80,85)10.010.00285,90)20.020.00490,95)40.040.00895,100)140.140.028100,105)240.240.048105,110)150.150.030110,115)120.120.024115,120)90.090.018120,125)110.110.022125,130)60.060.012130,13520.020.004合计10010.2注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为
11、它是频率分布直方图的纵坐标(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示方法技巧 1.在列频率分布表时,极差、组距、组数有如下关系:(1)若极差组距为整数,则极差组距组数;(2)若极差组距不为整数,则极差组距的整数部分1组数2组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过 100,按照数据的多少常分为 512 组,一般样本容量越大,所分组数越多跟踪探究 1.某班 50 名同学参加数学测验,成绩的分组及各组的频数如下(单位:分):40,50),2;50,60),3;6
12、0,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表(2)画出频率分布直方图解析:(1)频率分布表如下:分组频数频率40,50)20.0450,60)30.0660,70)100.270,80)150.380,90)120.2490,10080.16(2)频率分布直方图如下:探究二 频率分布直方图的应用例 2(1)某班 50 名学生在一次百米跑测试中,成绩全部介于 13 s 与 19 s 之间,将测试结果按如下方式分成六组:第一组,成绩大于等于 13 s 且小于 14 s;第二组,成绩大于等于 14 s 且小于 15 s;第六组,成绩大于等于
13、18 s 且小于等于 19 s,如图所示是按上述分组方法得到的频率分布直方图设成绩小于 17 s 的学生人数占全班总人数的百分比为 x,成绩大于等于 15 s 且小于 17 s 的学生人数为 y,则从频率分布直方图(如图所示)中分析出 x 和 y 分别为()A0.9,35 B0.9,45C0.1,35 D0.1,45(2)为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为 24171593,第二小组的频数为 12.第二小组的频率是多少?样本容量是多少?若次数在 110 以上(含 110 次
14、)为达标,则该校全体高一年级学生的达标率是多少?解析(1)由频率分布直方图知 x0.340.360.180.020.9,y500.360.340.7,y35.(2)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为4241715930.08.又因为第二小组的频率第二小组的频数样本容量,所以样本容量第二小组的频数第二小组的频率 120.08150.由直方图可估计该校高一年级学生的达标率为17159324171593100%88%.答案(1)A(2)见解析方法技巧 频率分布直方图的意义(1)频率分布直方图以面积的形式反映了数据落在各组内的频率大小(2)在频率分布直
15、方图中,各小矩形的面积之和等于 1.(3)频数相应的频率样本容量跟踪探究 2.某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是()A56 B60C120 D140解析:由频率分布直方图可知每周自习时间不少于 22.5 小时的频率为(0.160.080.04)2.50.7,故每周自习时间不少于 22.5 小时的人数为 0.7200140.故选 D
16、.答案:D探究三 茎叶图例 3 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下(单位:分):甲:95,81,75,91,86,89,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较思路探究 题中可以用十位数字为茎,个位数字为叶作茎叶图然后由茎叶图的特点分析两人的成绩解析 甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是 98;甲同学的得分情况,也大致对称,中位数是 88.乙同
17、学的成绩比较稳定,总体情况比甲同学好方法技巧 1.绘制茎叶图的关键是分清茎和叶,如本题中数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分为“叶”,解题时要根据数据的特点合理选择茎和叶2利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑跟踪探究 3.如图是某年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中 m 为数字 09 中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为 a1,a2,则一定有()Aa1a2Ba2a1Ca1a2Da1,a2 的大小与 m 的值有关解析:根据茎
18、叶图可知,去掉一个最高分和一个最低分后,甲的平均分为 a18054551584,乙的平均分为 a28044647585,故 a2a1.答案:B课后小结1列频率分布直方图的步骤:(1)计算数据中最大值和最小值的差知道了极差就知道了这组数据的变动范围有多大;(2)决定组数和组距组距是指每个小组的两个端点之间的距离;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图2列频率分布直方图的注意事项:(1)组距的选择应力求“取整”,如果极差不利于分组(如不能被组数整除),可适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同)(2)分点数的决定方法是:若数据为整数,则分点数据减去
19、0.5;若数据是小数点后一位的数,则分点减去 0.05,以此类推素养培优频率分布直方图中忽视纵轴的意义致误中小学生的视力状况受到社会的广泛关注,某市有关部门从全市 6 万名高一学生中随机抽取了 400 名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制 成 频 率 分 布 直 方 图,如 图 所 示 从 左 至 右 五 个 小 组 的 频 率 之 比 依 次 是5712106,则全市高一学生视力在3.95,4.25)范围内的学生人数约有_易错分析 虚线处对频率分布直方图理解不正确,将纵轴上的 0.5 误认为是第五小组的频率,从而导致答案不正确自我纠正 由图知,第五小组的频率为 0.50.30.15,所以第一小组的频率为0.15560.125,所以全市 6 万名高一学生中视力在3.95,4.25)范围内的学生约有 60 0000.1257 500(人)答案:7 500 人课时 跟踪训练