1、新课引入在前面我们学习了如何收集样本数据,但仅根据原始数据,仍无法作出判断。因此必须通过图、表或计算来分析样本数据,再对总体作出合理的判断,这就是我们本节课开始要学习的用样本估计总体。主要学习用样本的频率分布估计总体分布和用样本的数字特征估计总体的数字特征。我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?一.用样本的频率分
2、布估计总体分布诱思探究1采用抽样调查的方式获得样本数据分析样本数据来估计全市居民用水量的分布情况思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:(课本第66页)答:最大值是4.3t,最小值是0.2t,其他在0.24.3t之间。除了以上信息外,很难发现这100位居民的用水量的其他信息,因此要对数据进行整理与分析。分析数据的基本方法是画图或用表格改变数据的排列方式。(一)频率分布直方图1.频率分布的概念:是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布诱思探究2我们如何画频率分布直方图?第一步:求极差:
3、(数据组中最大值与最小值的差距)最大值=4.3 最小值=0.2 所以极差=4.3-0.2=4.1第二步:决定组距与组数:(注意取整)当样本容量不超过100时,按照数据的多少,常分成512组.为方便组距的选择应力求“取整”.本题如果组距为0.5(t).则第三步:将数据分组:(给出组的界限)所以将数据分成9组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共9组.分组频数累计频数频率0,0.5)40.040.5,1)80.081,1.5)150.151.5,2)220.222,2.5)250.252.5,3)140.143,3.5)60.063.5,4)40.044,4.520.02
4、合计1001.00第四步:列频率分布表.频率=频数/样本容量频率/组距月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.55.画频率分布直方图小长方形的面积频率各小长方形的面积之和等于1同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和0.1为组距重新作图,然后谈谈你对图的印象。诱思探究3(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断)频率/组距
5、月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.5诱思探究3通过频率分布直方图你可以发现什么?月均用水量在2,2.5)内的居民最多,在1.5,2)内次之,大部分居民的月均用水量在1,3)之间。频率/组距月平均用水量/t0.500.400.300.200.10 00.5 1 1.5 2 2.5 3 3.5 4 4.5诱思探究4观察直方图发现居民用量的分布有何特点?居民用水量的分布呈“单峰状”,有一定的对称性,说明大部分居民的月均用水量集中在一个中间值附近,只有少数居民的用水量很多或很少。诱思探究5你认为频率分布直方图有什么优点与缺点
6、?诱思探究6你认为频率分布表与频率分布直方图的区别?频率分布表列出的是在各个不同区间内取值的频率。频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率。优点:能够很容易表示大量数据,非常直观的表明分布形状,使我们能够看到在分布表中看不清楚的一些数据模式。缺点:虽可以大致估计出总体的分布情况,但不能保留原来的数据信息,在精确度要求较高的情况下不适用。诱思探究61.如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗?由表和图可看出,月用水量在3t以上的居民所占的比例为6+4+2=12,即大约有12的
7、居民用水量在3t以上,88的居民用水量在3t以下。因此,居民用水量标准定为3t是一个可以考虑的标准。2.你认为3t这个标准一定可以保证85以上的居民用水不超标吗?如果不一定,哪些环节可能会导致结论的误差?答:不一定。在抽取100位居民用水量时,不一定有很强的代表性。下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).课堂练习区间界限122,126)126,130)130,134)134,138)138,142)人数58102233区间界限142,146)146,150)150,154)154,158)人数201165(1)列出样本频率分布表;(2)画出频率分布直方图
8、;(3)估计身高小于134 cm的人数占总人数的百分比解:(1)样本频率分布表如下:分组频数频率122,126)50.04126,130)80.07130,134)100.08134,138)220.18138,142)330.28142,146)200.17146,150)110.09150,154)60.05154,158)50.04合计1201(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.040.070.080.19,所以我们估计身高小于134 cm的人数占总人数的19%.课堂小结1频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布2频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况通过作图既可以从数据中提取信息,又可以利用图形传递信息3样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况课外作业课本第81页A组2