1、庖丁巧解牛知识巧学 一、关于频率分布直方图的概念 由于频率分布表数字较多,阅读困难,为了将频率分布表中的结果直观形象地表示出来,我们通常画频率分布直方图.画图时,应以横轴表示分组,纵轴表示频率与组距的比值.以每个组距为底,以各频率除以组距的商为高,分别画成矩形,这样得到的直方图就是频率分布直方图.二、关于频率分布直方图的绘制方法 频率分布直方图是在频率分布表的基础上绘制而成的,它的前期工作就是准确列出频率分布表,然后在平面直角坐标系中画出频率分布直方图,具体步骤如下:(1)求极差,即计算最大值与最小值的差.(2)决定组距和组数. 组距与组数的确定没有固定标准,需要尝试、选择,力求有合适的组数,
2、以能把数据的规律较清楚地呈现为准.太多或太少都不好,不利对数据规律的发现.组数应与样本的容量有关,样本容量越大组数越多. (3)决定分点,将数据分组.分组时,通常规定分组的区间是“左闭右开”的,避免数据被重复计算.(4)列频率分布表.一般分“分组”“频数”“频率”三列,最后一行是“合计”.注意频数的合计应是样本容量,频率合计应是1.(5)画频率分布直方图. 建立直角坐标系,图中横轴为分组,图中的纵轴表示“频率/组距”.各组数据以小长方形表示,其中,小长方形的宽为组距,小长方形的高=,频率=组距=小长方体的面积.各小长方形的面积总和为1. 由此可以看出,直方图中的各小长方形的面积表示相应的各组的
3、频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小. 误区警示 直方图中小长方形的高并不表示各组数据的频率,而是频率与组距之比,小长方形的面积才是各组数据的频率. 辨析比较 频率分布表在数量表示上比较确切,但不够直观、形象,分析数据的总体态势不太方便,频率分布直方图形象、直观,与频率分布表相比较,频率直方图能直观地表明数据的分布形状,但原始数据不能在图中表示,说明直方图丢失了一些信息.从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.三、频率分布折线图与总体密度曲线1.频率分布折线图 把频率分布直方图各个长方形上边的中点用连线连接起来
4、,就得到频率分布折线图.为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以折线图在横轴上的左右两个端点没有实际意义.2.总体密度曲线 如果样本容量越大,那么所分组数就越多,图中表示的频率分布就越接近总体在各小组内所取值的个数与总数比值的大小,如果样本容量不断增大,那么分组的组距就不断缩小,频率分布直方图就越来越接近总体的分布,频率分布折线图就变成了一条光滑曲线y=f(x),这条光滑曲线就叫总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内的取值规律,它能给我们提供更加精细的信息,是研究个体分布规律的重要依据.典题热题知识点一 有关频率分布直方图的基本概念例1 已知图2-2-1
5、是容量为100的样本的频率分布直方图,试根据图形中的数据填空:图2-2-1(1)样本数据落在10,14内的频率是_;(2)样本数据落在6,10内的频数是_;(3)样本数据落在2,6内的频率是_;(4)样本数据落在14,18内的频率是_.思路解析:在直方图里用面积表示频率.(1)0.094=0.36.(2)0.084=0.32,0.32100=32.(3)0.024=0.08.(4)1-0.36-0.32-0.08=0.24.答案:(1)0.36 (2)32 (3)0.08 (4)0.24 误区警示 本题应注意两点:(1)直方图是用面积表示频率;在直方图中,所有矩形的面积之和等于1.(2)频率分
6、布条形图:与直方图不同的是纵轴表示的是频率.例2 连续抛掷一个骰子120次,得到1,2,3,4,5,6点的次数各为18,19,21,22,20,20.(1)试列出样本的频率分布表;(2)列出频率分布条形图;(3)估计抛掷不足4点的机率.思路分析:由于取值可按一定次序一一列出,可以用频率分布表或频率分布条形图分析样本.解:(1)频率分布表如下:点数频数频率1180.152190.1583210.1754220.1835200.1676200.167合计1201.000(2)频率分布条形图如图2-2-2.图2-2-2(3)抛掷点数不足4点的机率是0.15+0.158+0.175=0.483. 巧解
7、提示 (1)频率分布条形图是用条形高度来表示各个值的频率的图形.(2)本例中总体的不同取值很少,可一一列举,通常称离散型总体.知识点二 绘制频率分布条形图例3 为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁18岁的男生的体重情况,结果如下:(单位:kg)56.569.56561.564.566.56464.57658.57273.556677057.565.56871756268.562.56659.563.564.567.57368557266.574636055.57064.5586470.55762.5656971.573625876716663.55659.
8、563.5657074.568.56455.572.566.5687657.56071.55769.57464.55961.5676863.5585965.562.569.57264.575.568.5646265.558.567.570.5656666.5706359.5试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计.思路分析:按照样本的频率分布直方图的制作方法和步骤.解:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差. 在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距
9、与组数. 如果将组距定为2,那么由212=10.5得组数为11,这个组数是合适的.于是组距为2,组数为11.(3)决定分点. 根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是54.5,56.5),56.5,58.5),74.5,76.5).(4)列频率分布表.频率分布表分组频数频率54.5,56.5)20.0256.5,58.5)60.0658.5,60.5)100.1060.5,62.5)100.1062.5,64.5)140.1464.5,66.5)
10、160.1666.5,68.5)130.1368.5,70.5)110.1170.5,72.5)80.0872.5,74.5)70.0774.5,76.5)30.03合计1001.00(5)绘制频率分布直方图.频率分布直方图如图2-2-3所示.图2-2-3 由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在64.5,66.5) kg的学生最多,约占学生总数的16%;体重小于58.5
11、 kg的学生较少,约占8%等等. 方法归纳 1.一般地,列频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.2.一般地,画频率分布直方图方法如下: 把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一矩形,它的高等于该组的频率/组距,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成了频率分布直方图.问题探究思维发散探究 问题 我们在生活中经常用到频率分布表、频率分布直方图、频数分布直方图、频率折线图等等,请结合如下的数据说明它们各自有什么样的
12、特点和联系.从规定尺寸为25.40 mm的一堆产品中任取100件,测得它们的实际尺寸如下:25.3925.3625.3425.4225.4525.3825.3925.4225.4725.3525.4125.4325.4425.4825.4525.4325.4625.4025.5125.4525.4025.3925.4125.3625.3825.3125.5625.4325.4025.3825.3725.4425.3325.4625.4025.4925.3425.4225.5025.3725.3525.3225.4525.4025.2725.4325.5425.3925.4525.4325.40
13、25.4325.4425.4125.5325.3725.3825.2425.4425.4025.3625.4225.3925.4625.3825.3525.3125.3425.4025.3625.4125.3225.3825.4225.4025.3325.3725.4125.4925.3525.4725.3425.3025.3925.3625.4625.2925.4025.3725.3325.4025.3525.4125.3725.4725.3925.4225.4725.3825.39 探究思路:这些方法都可以表示样本的分布情况,它们各有各的优点,我们就可以结合实例分别绘制这些图表来体会它们之
14、间的区别与联系. 探究过程:方法一:绘制频率分布表频数指出现的次数,频率指出现的次数与样本容量的比值.这个图就是频率分布表,它能直观地体现出样本中数量指标在某一个区间内的个体出现的次数及相应的频率.用这种方法来描述样本的分布,相对来说数据比较准确.分组频数频率25.235,25.265)10.0125.265,25.295)20.0225.295,25.325)50.0525.325,25.355)120.1225.355,25.385)180.1825.385,25.415)250.2525.415,25.445)160.1625.445,25.475)130.1325.475,25.505
15、)40.0425.505,25.535)20.0225.535,25.565)20.02合计1001.00方法二:频数分布直方图图2-2-4就是频数分布直方图,事实上它是把频率分布表中的一部分(频数那一部分)画出了直方图而已,它的横轴是产品尺寸(也就是某一指标),纵轴是出现的次数即频数.这种方法将枯燥的数据形象化地表现为图形,其最大的特点就是直观,可以很容易发现数据的整体趋势.图2-2-4方法三:频率分布直方图图2-2-5就是频率分布图,从作图的过程可以知道在图2-2-4中,每个小矩形的宽度为Vxi(分组的宽度),高为(其中fi为第i个区间范围内的频率),小矩形的面积恰为相应的频率fi,通常我
16、们称这样的图形为频率分布直方图,图的纵坐标为频率与组距的比值,横轴为研究对象的某一指标(在本图中指的是产品尺寸). 从图2-2-5中可以得到产品的尺寸落在各个尺寸区间的频率的大小,这个频率的值就是该产品尺寸区间所对应的频率直方图的面积,图2-2-5中所有小矩形的面积之和,也就是产品尺寸落在各个尺寸区间内的频率之和,等于1.由刚才分析可知,在样本的频率分布图中,随着样本容量的不断扩大,其分布越来越接近总体分布,当样本容量无限加大,而组距无限缩小时,频率分布直方图的上方将演变成一条光滑的曲线.图2-2-5 它与频数分布直方图的区别在于纵坐标的意义不同,在频数分布直方图中,纵坐标表示的是频率,而在频率分布直方图中,纵坐标表示的是频率与组距的比值,这样就使得每个小矩形的面积正好等于相应组的频率,应用起来很方便.方法四:频率折线图 在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连结各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.不难发现,折线与横轴所围成的面积也是1,因此,当样本容量比较大时,我们还可以用频率折线图来估计总体的分布情况,如图2-2-6.图2-2-6