1、2.2用样本估计总体2.2.1用样本的频率分布估计总体分布学 习 目 标核 心 素 养1会用频率分布表,画频率分布直方图表示样本数据(难点)2能通过频率分布表和频率分布直方图对数据做出总体统计(重点)3理解茎叶图的概念,会画茎叶图(重点)1通过频率分布直方图和茎叶图的学习,培养数据分析素养2借助图表中的数据运算,提升数学运算素养.1频率分布直方图的画法2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计
2、中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比3茎叶图(1)茎叶图的制作方法(以两位数据为例):将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出(2)茎叶图的优缺点在样本数据较少时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长思考:通过抽样获取的原始数据有何缺点?提示因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息1下
3、列关于茎叶图的叙述正确的是()A将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面B茎叶图只可以分析单组数据,不能对两组数据进行比较C茎叶图更不能表示三位数以上的数据D画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出A由茎叶图的概念可得2一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为()A10组B9组C8组D7组A由题意知,9.2,故应分成10组3200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在50,60)内的汽车有()A30辆B40辆C60辆D8
4、0辆C由直方图知,时速在50,60)内的频率为0.03100.3,故此段内汽车有2000.360辆4如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是_,最低分是_.4%51由茎叶图知,样本容量为25,90分以上有1人,故优秀率为100%4%,最低分为51分频率分布直方图的绘制探究问题1要做频率分布表,需要对原始数据做哪些工作?提示分组、频数累计、计算频数和频率2画频率分布直方图时,如何决定组数与组距?提示若为整数,则组数若不为整数,则1组数注意:x表示不大于x的最大整数3同一组数据,如果组距不同,得到的频率分布直方图也会不同吗?提示不同对于同一组数据分析时,要选好组距和组数
5、,不同的组距与组数对结果有一定的影响【例1】某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):4864528671486441867971688284686462688157905274735678476655645688694073976856675970527944556962583258根据上面的数据,回答下列问题:(1)这次测验成绩的最高分和最低分分别是多少?(2)将区间30,100平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?思路点拨:按画频率分布直方图的步骤进行绘制解(1)这
6、次测验成绩的最低分是32分,最高分是97分(2)根据题意,列出样本的频率分布表如下:分组频数频率30,40)10.0240,50)60.1250,60) 120.2460,70)140.2870,80) 90.1880,90)6 0.1290,10020.04合计501.00频率分布直方图如图所示(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布1(变条件)美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于
7、1981年就任,当时69岁下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图解以4为组距,列表如下:频率分布直方图如下:2(变结论)本例条件不变,若把所给数据去掉一个最高分和一个最低分后分成5组,试画出这48名学生智力测验成绩的频率分布直方
8、图解列出频率分布表如下:频率分布直方图如下:绘制频率分布直方图应注意的问题(1)组数与样本容量有关,一般地,样本容量越大,所分组数越多.当样本容量不超过100时,按数据的多少,常分成512组.(2)在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(3)一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,纵轴是频率/组距,而不是频率.频率分布直方图的应用【例2】为增强市民节能环保意识,我市面向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:分组(单位:
9、岁)频数频率20,25)50.0525,30)0.2030,35)3535,40)300.3040,45100.10合计1001.00(1)频率分布表中的位置应填什么数据?(2)补全如图所示的频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在30,35)岁的人数解(1)设年龄在25,30)岁的频数为x,年龄在30,35)岁的频率为y.法一:根据题意可得0.20,y,解得x20,y0.35,故处应填20,处应填0.35.法二:由题意得5x353010100,0.050.20y0.300.101,解得x20,y0.35,故处填20,处填0.35.(2)由频率分布表知年龄在25,30)
10、岁的频率是0.20,组距是5.所以0.04.补全频率分布直方图如图所示根据频率分布直方图估计这500名志愿者中年龄在30,35)岁的人数为5000.35175.频率分布直方图的性质(1)因为小矩形的面积组距频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)样本容量.1从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)求直方图中x的值;(2)在这些用户中,求用电量落在区间100,250)内的户数解(1)由频率分布直方图知
11、200,250)小组的频率为1(0.002 40.003 60.006 00.002 40.001 2)500.22,于是x0.004 4.(2)数据落在100,250)内的频率为(0.003 60.006 00.004 4)500.7,所求户数为0.710070.茎叶图的绘制及应用【例3】某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较
12、思路点拨:题中可以用十位数字为茎,个位数字为叶作茎叶图然后由茎叶图的特点分析两人的成绩解甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好绘制茎叶图的注意点(1)绘制茎叶图时需注意“叶”的位置的数字位数只有一位,而“茎”的位置的数字位数一般不需要统一.(2)茎叶图可用于确定数据的中位数,判断数据大致集中在哪个茎,是否关于该茎对称,是否分布均匀等.2从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩分别是_,_,从图
13、中看,_班的平均成绩较高9692乙由茎叶图知,甲班最高分是96分,乙班的最高分是92.甲班的成绩集中在6080间,乙班的成绩集中在7090间,故乙班的平均成绩较高1总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布2总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图1判断下列结论的正误(正确的打“”,错误的打“”)(1)用样本的频率分布可以估计总体分布()(2)频率分布直方图的纵轴表示频率()(3)只有两位的
14、数据能用茎叶图表示()答案(1)(2)(3)2观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在2 700,3 000)内的频率为()A0.1B0.2C0.3D0.4C由图可得,新生儿体重在2 700,3 000)内的频率为0.0013000.3.3如图所示的茎叶图表示的是一台自动售货机的销售情况,则茎叶图中9表示的销售额为()A9B49C29D1 349C观察茎叶图,分清楚茎和叶即可分开茎、叶的竖线左侧仅有一列,表示茎,右侧有多列,表示叶,所以9表示的销售额为29.4某班50名同学参加数学测验,成绩的分组及各组的频数如下:40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图解(1)频率分布表如下:分组频数频率40,50)20.0450,60)30.0660,70)100.270,80)150.380,90)120.2490,10080.16(2)频率分布直方图如下: