1、-1-2.2 用样本估计总体-2-2.2.1 用样本的频率分布估计总体分布-3-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 1.了解分析数据的方法,知道估计总体频率分布的方法.2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图.3.理解频率分布直方图和茎叶图及其应用.-4-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 1.分析数据的方法(1)借助于图形.用图将各个数
2、据画出来,作图可以达到两个目的,一是从数据中提取信息;二是利用图形传递信息.(2)借助于表格.用紧凑的表格改变数据的排列方式,通过改变数据的构成形式,为我们提供解释数据的新方式.2.频率分布直方图(1)绘制步骤:求极差,即一组数据中最大值与最小值的差.决定组距与组数.组距与组数的确定没有固定的标准.一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分为512组.-5-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 将数据分组:按
3、组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.列频率分布表.一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频数合计应是样本容量,频率合计是1.画频率分布直方图.画图时,应以横轴表示样本数据,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.(2)意义:在频率分布直方图中,每个小长方形的面积表示相应组的频率,所有小长方形的面积的总和等于1.(3)频率分布的估计:频率分布是指各个小组数据在样本容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.-6-
4、2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 归纳总结频率分布直方图的特征:直观、形象地反映了样本的分布规律,可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.-7-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航【做一做1】如图所示是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空.(1)样
5、本数据落在5,9)内的频率是 ;(2)样本数据落在9,13)内的频数是 .答案:(1)0.32(2)72-8-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 3.频率分布折线图和总体密度曲线(1)类似于频数分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小
6、,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.归纳总结频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.-9-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.
7、频率分布折线图是随样本容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线.【做一做2】对于频率分布折线图与总体密度曲线的关系,下列说法中正确的是()A.频率分布折线图与总体密度曲线无关 B.频率分布折线图就是总体密度曲线 C.样本容量很大的频率分布折线图就是总体密度曲线 D.如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线,即为总体密度曲线 答案:D-10-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 4.茎叶图(1)
8、制作方法:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).(2)优缺点:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.归纳总结茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.-11-2.2.1 用样本的频
9、率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航【做一做3-1】没有信息的损失,所有的原始数据都可以从图中得到的统计图是()A.总体密度曲线B.茎叶图 C.频率分布折线图 D.频率分布直方图 答案:B【做一做3-2】如图是12个学生某次测试分数的茎叶图,由图可知,这些分数的最低分与最高分之和为 .答案:147-12-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 1.理解频率分布直方图 剖析:(1)频率分布直
10、方图中,每个小长方形的面积等于样本中数据落在该组的频率,也就是样本中数据落在该组的百分比.(2)频率分布直方图中纵轴表示频率组距,频率=频数样本容量,横轴表示样本数据.(3)频率分布直方图中各小长方形的面积和等于1.(4)频率分布指的是一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.(5)频率分布直方图能够把大量数据的分布情况直观地表现出来,但是在频率分布直方图中我们读不出原始的数据.也就是说,在反映样本的频率分布方面,频率分布表能确切地反映相关数据,频率分布直方图能直观地反映相关数据的分布规律,它们起着相互补充的作用.-13-2.2.1 用样本的频率分布估计
11、总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 2.频率分布表、频率分布直方图、频率分布折线图和茎叶图的优缺点比较 剖析:如下表:优点 缺点 频率分布表 表示数量较确切 分析数据分布的总体态势不方便 频率分布直方图 表示数据分布情况非常直观 原有的具体数据信息被抹掉了 频率分布折线图 能反映数据的变化趋势 不能显示原有数据信息 茎叶图 一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况 样本数据较多或数据位数较多时,不方便表示数据 -14-2.2.1 用样本的频率分布估计总体分布 Z
12、HISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 频率分布直方图的绘制与应用【例1】一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5
13、.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3-15-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJ
14、UJIAO重难聚焦 目标导航 题型一 题型二 题型三 根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在5.75,6.05)cm之间的麦穗在这批麦穗中所占的百分比.分析:依据步骤画出频率分布直方图;用样本中的百分比(即频率)来估计长度在5.75,6.05)cm之间的麦穗在这批麦穗中所占的百分比.解:步骤是:(1)计算极差,7.4-4.0=3.4(cm).(2)决定组距与组数.若取组距为0.3 cm,由于需分成12组,组数合适.于是取定组距为0.3 cm,组数为12.(3)将数据分组.使分点比数据多一位小数,并且把第1小组的起点稍微减小一点.则所分的12个小组可以是3.95,4.25
15、),4.25,4.55),4.55,4.85),7.25,7.55.3.40.3=11 13,-16-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三(4)列频率分布表.对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示:分组 频数累计 频数 频率 3.95,4.25)1 0.01 4.25,4.55)1 0.01 4.55,4.85)2 0.02 4.85,5.15)5 0.05 5.15,5.45)11 0.11 5.45,5.75)15 0.15
16、 5.75,6.05)28 0.28 6.05,6.35)13 0.13 6.35,6.65)11 0.11 -17-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 分组 频数累计 频数 频率 6.65,6.95)10 0.10 6.95,7.25)2 0.02 7.25,7.55 1 0.01 合计 100 1.00 -18-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚
17、焦 目标导航 题型一 题型二 题型三(5)画频率分布直方图,如图.从表中看到,样本数据落在5.75,6.05)之间的频率是0.28,于是可以估计,在这块地里,长度在5.75,6.05)cm之间的麦穗约占28%.反思本题画频率分布直方图时,小长方形的高易错用该组的频率的大小来表示.其原因是不清楚频率分布直方图纵轴的意义.由于画频率分布直方图的步骤比较烦琐,因此在实际操作的过程中要有足够的耐心.-19-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三【变式训练1】为了检测
18、某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:10.75,10.85),3;10.85,10.95),9;10.95,11.05),13;11.05,11.15),16;11.15,11.25),26;11.25,11.35),20;11.35,11.45),7;11.45,11.55),4;11.55,11.65,2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述图表,估计数据落在10.95,11.35)范围内的可能性是百分之几;(4)估计数据小于11.20的可能性是百分之几.-20-2.2.1 用样本的频率分布估计总体分布 ZHI
19、SHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 解:(1)频率分布表如下:分组 频数 频率 10.75,10.85)3 0.03 10.85,10.95)9 0.09 10.95,11.05)13 0.13 11.05,11.15)16 0.16 11.15,11.25)26 0.26 11.25,11.35)20 0.20 11.35,11.45)7 0.07 11.45,11.55)4 0.04 11.55,11.65 2 0.02 合计 100 1.00 -21-2.2.1 用样本的频率分布估计总体分布 Z
20、HISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三(2)频率分布直方图及频率分布折线图如图:(3)由上述图表可知数据落在10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x-0.41)(11.20-11.15)=(0.67-0.41)(11.25-11.15),所以x-0.41=0.13,即x=0.54,从而估计数据小于11.20的可能性是
21、54%.-22-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 茎叶图的绘制与应用【例2】某中学高一(2)班甲、乙两名同学自进入高中以来每次数学考试成绩情况如下:甲的得分:95,75,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图.请根据茎叶图对两人的数学成绩进行比较.分析:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每次数学
22、考试成绩的个位数.-23-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 解:甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,且集中在90分左右;甲同学的得分情况除一个特殊得分外,也大致对称,且集中在80分左右.因此乙同学发挥比较稳定,且总体得分情况比甲同学好.-24-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型
23、一 题型二 题型三 反思用茎叶图表示数据的特点如下:(1)用茎叶图表示数据有两个突出的优点,一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,用3|3 8 9就表示了33,38,39这3个数据,方便记录与表示.(2)茎叶图在样本数据较少,较为集中且位数不多时比较适用.因为它较好地保留了原始数据,所以可以帮助分析样本数据的大致频率分布.-25-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三【变式训练2】在某高中篮球联赛
24、中,甲、乙两名运动员的得分如下(单位:分):甲的得分:14,17,25,26,30,31,35,37,38,39,44,48,51,53,54;乙的得分:6,9,15,17,18,21,27,28,33,35,38,40,44,46,56.(1)用茎叶图表示上面的样本数据;(2)分析甲、乙两名运动员中哪一位发挥得更加稳定.-26-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 解:(1)茎叶图如图所示:(2)从茎叶图中可以看出,甲运动员的得分大致对称,乙运动员的得分
25、也大致对称,但甲运动员的得分更集中于峰值附近,这说明甲运动员发挥得更加稳定.-27-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 易错辨析 易错点:不能正确理解频率分布直方图中纵轴的意义【例3】有同型号的汽车100辆,为了了解这种汽车的耗油情况,现从中随机抽取10辆在同一条件下进行耗油1 L所行驶路程的试验,得到的数据(单位:km)频率分布表如下:试画出频率分布直方图.分组 频数 频率 12.45,12.95)2 0.2 12.95,13.45)3 0.3 13.
26、45,13.95)4 0.4 13.95,14.45 1 0.1 合计 10 1.0 -28-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 错解:频率分布直方图如图所示:错因分析:频率分布直方图画错了.事实上,这里纵轴的单位是频率组距,不是频率.例如,当数据在12.45,12.95)时,频率组距=0.20.5=0.4,故图中第一个矩形的高度应为0.4 个单位,而非 0.2 个单位.-29-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 D
27、IANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 正解:频率分布直方图如图所示:反思1.注重对图形的观察.图表试题解题三个步骤:一观、二识、三解,做到观图要细、识图要全、解图要准.2.重视对性质的理解和应用.在频率分布直方图中,小长方形的高=频率组距,小长方形的面积=频率组距 组距=频率.-30-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三【变式训练3】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17.518岁之间的男生体重(单位:kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在56.5,64.5)的学生人数是()A.20 B.30 C.40D.50-31-2.2.1 用样本的频率分布估计总体分布 ZHISHISHULI知识梳理 DIANLITOUXI典例透析 ZHONGNANJUJIAO重难聚焦 目标导航 题型一 题型二 题型三 解析:体重在56.5,64.5)的频率为(0.03+0.052+0.07)2=0.4,学生人数为0.4100=40.答案:C