1、庖丁巧解牛知识巧学 一、样本的频率分布概念 当总体很大或不便获得总体的频率时,可以用样本的频率分布估计总体的频率分布.根据所抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值情况),就叫做样本的频率分布.二、样本频率分布表的编制方法 为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,这样的表就叫样本频率分布表.编制频率分布表的步骤:(1)求极差(也称求全距,即一组数据的最大值与最小值的差).(2)决定组距与组数(组距的选择应力求“取整”,如果极差不利于取整即不能被组数整除,可适当增大极差,如在左右各增加适当的
2、范围).(3)决定分点,将数据分组(分组时常对各组数值取左闭右开区间,最后一组取闭区间).(4)登记频数、计算频率列出频率分布表(频率=频数/样本容量). 联想发散 组距和组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况.分组的组数与样本容量有关,一般样本容量越大,所分组数越多.根据样本容量的大小,通常将数据分成512组.组数的“取舍”不依据四舍五入,而是当不是整数时,组数=+1. 组距为1.0,极差为4.1,则组数=4.1,也就是说组数为5. 如果数据比较多,人工无法迅速处理时,在求极差和计算频数时可借助于
3、计算机很方便地进行.频率分布表排除了抽样造成的误差,精确地反映了总体取值的频率分布规律(总体分布).三、样本频率分布与总体分布的关系 1.样本中某数据的频数和样本容量的比,就是该数据的频率.所有数据的频率分布变化规律叫做样本频率分布. 2.总体取值的可能性分布规律叫做总体可能性分布,简称总体分布,由于总体取值分布通常不易知道,因此往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布. 3.样本频率分布是随着样本容量的增大更加接近总体分布,也就是说,样本的容量越大,这种估计就越精确. 4.对于样本,只读频率,不能跟总体的可能性混淆,若样本的容量越大,则频率越接近于可能性.四、随机变量与总体
4、分布的联系 1.学习有关总体分布的知识,要注意把总体分布的概念与随机变量联系起来.比如,对于多次重复抛掷某一硬币的实验来说,每次抛掷硬币的结果,既可以看成是从很多这种试验结果组成的总体中抽取的一个个体值,还可以看成是在同一随机试验下相应的随机变量所取的一个值. 2.将总体与随机变量沟通后,总体分布也就是相应的随机变量的可能性分布,这样我们就可以利用可能性的理论来研究统计问题,由此可以看到可能性论与统计学之间的有机联系.典题热题知识点一 样本的频率分布概念例1 一个容量为n的样本分成若干组,已知某组的频数和频率分别为30和0.25,则n等于( )A.750 B.120 C.240 D.150思路
5、解析:某一组的频率等于该组的频数与样本容量的比.由于30/n=0.25,所以n=120.答案:B 方法归纳 本题考查各组频率的计算方法,以便制作出频率分布表.例2 一个容量为20的样本数据,分组后组距与频数如下:10,20)2个,20,30) 3个,30,40) 4个,40,50) 5个,50,60) 4个,60,70) 2个,则样本在区间(-,50)上的频率为( )A.5% B.25% C.50% D.70%思路解析:小于50的频数共有14个,因此频率为14/20=70%.答案:D 方法归纳 根据总体分布的估计中的频率分布表,可以得出样本数据小于某一值的频率叫做累积频率.频率分布与累积频率分
6、布从不同的角度反映了一组数据的分布情况,起着相互补充的作用.知识点二 样本频率分布表的编制方法例3 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm):区间界限122,126)126,130)130,134)134,138)138,142)人数58102233区间界限142,146)146,150)150,154)154,158)人数201165(1)列出样本频率分布表;(2)估计身高小于134 cm的人数占总人数的百分比.思路分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:分组频数频率122,126)50.04126,130)
7、80.07130,134)100.08134,138)220.18138,142)330.28142,146)200.17146,150)110.09150,154)60.05154,158)50.04合计1201(2)由样本频率分布表可知身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%. 方法归纳 累积频率分布反映了一组数据在某一个范围上的分布情况,对考查总体分布起着补充的作用,在实际应用中是重要的一个考查项目.问题探究交流讨论探究 问题 用样本估计总体时会有误差吗?如果有,怎样尽量减少误差呢? 探究过程:学
8、生甲:我觉得用样本估计总体的时候,由于样本毕竟不是总体,所以用样本来估计总体一般来说是有误差的,区别只是误差的大小而已.当样本的选取合理、具有代表性的时候误差就很小. 学生乙:结合实例说明用样本估计总体时会有误差,如在全国范围内的民意测验中,如果民意测验者走进大学校园里去访问1 000名大学生,对他们进行民意调查,他们所组成的样本将不会公平地代表全国的民意,这是因为大学生选民的比例很小,而且是一个有倾向性的团体,不能代表全体选民,这样的不公平就使得样本估计总体的误差比较大,这就是样本的选取不合理造成的. 学生丙:为了减少误差,在条件允许的情况下,适当地增大样本容量也是一个提高结果准确性的不错的办法. 探究结论:用样本估计总体时会有误差,为了减少误差,除了计算要求准确外,最关键的是样本的选取一定要合理,让它能最大程度地代表总体.