1、2.2 用样本估计总体第三课时 问题提出1.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?问题提出1.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?频率分布直方图、频率分布表、频率分布折线图、茎叶图问题提出2.美国 NBA 在 20062007 年度赛季中,甲、乙两名篮球运动员在随机抽取的 12 场比赛中的得分情况如下:甲运动员得分:12,15,20,25,31,30,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,39.问题
2、提出甲运动员得分:12,15,20,25,31,30,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,39.问题提出甲运动员得分:12,15,20,25,31,30,36,36,37,39,44,49.乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,39.如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征估计总体的数字特征.知识探究(一):众数、中位数和平均数思考 1:以上两组样本数据如何
3、求它们的众数、中位数和平均数?知识探究(一):众数、中位数和平均数思考 2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(一):众数、中位数和平均数思考 2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?月均用水量/t频率组距0.50.40.30.20.10
4、.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(一):众数、中位数和平均数思考 2:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O取最高矩形下端中点的横坐标2.25 作为众数.知识探究(一):众数
5、、中位数和平均数思考 3:中位数左右两侧的直方图的面积应有什么关系?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(一):众数、中位数和平均数思考 4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是 0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.
6、5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(一):众数、中位数和平均数思考 4:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是 0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02.由此估计总体的中位数是什么?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5
7、 4 4.5 O0.50.040.080.150.22=0.01,0.010.5=0.02,中位数是 2.02.知识探究(一):众数、中位数和平均数思考 5:平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O知识探究(一):众数、中位数和平均数思考 5:平均数是频率分布直方图的“重心”,从直方图估计总体在各组数据内的平均数分别为多少?月均用水量/
8、t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O月均用水量/t频率组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.知识探究(一):众数、中位数和平均数思考 6:将频率分布直方图中每个小矩形的 面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数.由此估计总体的平均数是什么?知识探究(一):众数、中位数和平均数思考 6:将频率分布直方图中每个小矩形的 面积与小矩形底边中点的横坐标之积相加,就是样本数据的估
9、值平均数.由此估计总体的平均数是什么?0.250.04+0.750.08+1.250.15 +1.750.22+2.250.25+2.750.14 +3.25 0.06+3.750.04+4.250.02 =2.02(t).平均数是 2.02.知识探究(一):众数、中位数和平均数思考 7:从居民月均用水量样本数据可知,该样本的众数是 2.3,中位数是 2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?知识探究(一):众数、中位数和平均数思考 7:从居民月均用水量样本数据可知,该样本的众数是 2.3,中位数是 2.0,平均数是1.973,这与我们从样本
10、频率分布直方图得出的结论有偏差,你能解释一下原因吗?频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.知识探究(一):众数、中位数和平均数思考 7:从居民月均用水量样本数据可知,该样本的众数是 2.3,中位数是 2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关.注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征.知识探究(一):众数、中位数和平均数思考 8(1)一组数据的中位数一般不受少数几个
11、极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?知识探究(一):众数、中位数和平均数思考 8(1)一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.知识探究(一):众数、中位数和平均数思考 8(2)样本数据的平均数大于(或小于)中位数说明什么问题?知识探究(一):众数、中位数和平均数思考 8(2)样本数据的平均数大于(或小于)中位数说明什么问题?平均数大于(或小于)中位数,说明样本数据中存在许
12、多较大(或较小)的极端值.知识探究(一):众数、中位数和平均数思考 8(2)样本数据的平均数大于(或小于)中位数说明什么问题?平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.思考 8(3)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?知识探究(一):众数、中位数和平均数思考 8(2)样本数据的平均数大于(或小于)中位数说明什么问题?平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.思考 8(3)你怎样理解“我们单位的收入水平比别的单位高”这句话的含义?这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位
13、数或平均数.样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.思考 1:在一次射击选拔赛中,甲、乙两名运动员各射击 10 次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7甲、乙两人本
14、次射击的平均成绩分别为多少环?知识探究(二):标准差思考 1:在一次射击选拔赛中,甲、乙两名运动员各射击 10 次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7甲、乙两人本次射击的平均成绩分别为多少环?77乙甲,xx知识探究(二):标准差思考 2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.14 5 6 7 8 9 10 O(甲)频率0.40.30.20.14 5 6 7 8 9 10 O(甲)环数频率0.40.30.20.14 5 6 7 8 9 10 O(
15、乙)环数频率0.40.30.20.14 5 6 7 8 9 10 O(乙)知识探究(二):标准差思考 2:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?环数频率0.40.30.20.14 5 6 7 8 9 10 O(甲)频率0.40.30.20.14 5 6 7 8 9 10 O(甲)环数频率0.40.30.20.14 5 6 7 8 9 10 O(乙)环数频率0.40.30.20.14 5 6 7 8 9 10 O(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定.知识探究(二):标准差思考 3:对于样本数据 x1,x2,xn,设想通过各
16、数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?知识探究(二):标准差思考 3:对于样本数据 x1,x2,xn,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?知识探究(二):标准差12|nxxxxxxn思考 4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用 s 表示.假设样本数据 x1,x2,xn 的平均数为,则标准差的计算公式是:x知识探究(二):标准差思考 4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用 s 表示.假设样本数据 x1,x2,xn 的平均数为,则标准差的计算公式是:x知识探究
17、(二):标准差思考 4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用 s 表示.假设样本数据 x1,x2,xn 的平均数为,则标准差的计算公式是:x那么标准差的取值范围是什么?标准差为 0的样本数据有何特点?知识探究(二):标准差22212()()()nxxxxxxsn思考 4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用 s 表示.假设样本数据 x1,x2,xn 的平均数为,则标准差的计算公式是:x那么标准差的取值范围是什么?标准差为 0的样本数据有何特点?s0,标准差为 0 的样本数据都相等.知识探究(二):标准差22212()()()nxxxxxxsn思考
18、 5:对于一个容量为 2 的样本:x1,x2(x1x2),则在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?221221xxsxxx,知识探究(二):标准差思考 5:对于一个容量为 2 的样本:x1,x2(x1x2),则在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?221221xxsxxx,标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.知识探究(二):标准差知识迁移计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.甲:7 8 7 9 5 4 9 10 7 4乙:9
19、5 7 8 7 6 8 6 7 7知识迁移计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性.甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7s 甲=2,s 乙=1.095.课堂小结1.用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.课堂小结1.用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.2.平均数对数据有“取齐”的作用,代表一组数据的平均水平.课堂小结1.用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.2.平均数对数据有“取齐”的作用,代表一组数据的平均水平.3.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.作业:习案作业二十、作业二十一