1、第四节 用样本估计总体1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想5会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.1频率分布表编制频率分布表的方法步骤为:求极差;决定组距与组数决定分点,将数据分组登记频数,计算频率,列出频率分布表2频率分布直方图在频率分布直方图中,各小矩形的面积表示相应各组的在频
2、率分布直方图中,各小矩形的面积之和等于1.3茎叶图茎是指,叶是在样本数据较少时,用茎叶图表示数据的效果较好频率中间的一列数从茎的旁边生长出来的数4众数,中位数,平均数在样本数据中,出现次数最多的那些数据叫众数在样本数据中,将数据按从大到小排列,位于的 数据为中位数如果数据的个数为偶数,就取中间两个数据的数作为中位数在样本数据中,将所有数据加在一起,并除以数据的总个数,所得到的数叫平均数中间平均5标准差、方差用公式 s1nx1 x 2x2 x 2xn x 2来计算标准差用公式 s21n(x1 x)2(x2 x)2(xn x)2来计算方差1下列关于频率分布直方图的说法中正确的是()A直方图的高表示
3、某数的频率B直方图的高表示该组上的个体在样本中出现的频率C直方图的高表示该组上的个体数与组距的比值D直方图的高表示该组上的个体在样本中出现的频率与组距的比值解析:本题考查了频率分布直方图的画法及几何意义每一个小长方形的面积是落在该部分的样本的频率因此,直方图中的高应为频率组距.在该细节上同学们务必弄清楚,不能错误地认为纵坐标就是频率答案:D 2为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如右图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是()A32 B27C24D33解析:80100 间
4、两个长方形高占总体的比例:562356311120即为频数之比 x601120.x33.故选 D.答案:D 3某工厂对一批产品进行了抽样检测下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重 的 范 围 是 96,106,样 本 数 据 分 组 为 96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A90B75C60D45解析:样本中产品净重小于100克的频率为(0.0500.100)20.3,频数为 36.样本总数为360.3
5、120.样本中净重大于或等于 98 克并且小于 104 克的产品的频率为(0.1000.1500.125)20.75,样本中净重大于或等于 98 克并且小于 104 克的产品的个数为1200.7590.答案:A 4某校甲、乙两个班各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:则以上两组数据的方差中较小的一个为s2_.学生1号2号3号4号5号甲班67787乙班67679解析:甲:平均数:6778757,方差为:6723772872525.乙:平均数:6767957,方差为:26722772972565.方差较小的为25.答案:252频率分布直方图中各小长方形
6、的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比 频率分布直方图反映样本的频率分布:1频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率组距频率组距.热点之一 用样本的频率分布估计总体的频率分布3频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观4众数为最高矩形中点的横坐标5中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标例1 为了了解某校初中毕业男生的体能状况,从该校初中毕业班学生中抽取若干名男生进行铅球测试,把所得数据(精确到0.1米)进行整理后,分成6组画出频率分布直方图的一部分(如下图),已 知 从
7、 左 到 右 前 5 个 小 组 的 频 率 分 别 为 0.04,0.10,0.14,0.28,0.30.第6小组的频数是7.(1)请将频率分布直方图补充完整;(2)该校参加这次铅球测试的男生有多少人?(3)若成绩在8.0米以上(含8.0米)的为合格,试求这次铅球测试的成绩的合格率;(4)在这次测试中,你能确定该校参加测试的男生铅球成绩的众数和中位数各落在哪个小组内吗?思路探究 根据频率分布直方图的含义可求课堂记录(1)由频率分布直方图的意义知,各小组频率之和为1,故第6小组的频率为1(0.040.100.140.280.30)0.14.易知第6小组与第3小组的频率相等,故两个小长方形等高,
8、图略(2)由(1)知,第 6 小组的频率是 0.14,又因为第 6 小组的频数是 7,现设参加这次测试的男生有 x 人,根据频率定义,得7x0.14,即 x50(人)(3)由图可知,第 4、5、6 小组成绩在 8.0 米以上,其频率之和为 0.280.300.140.72.故合格率为 72%.(4)能确定中位数落在第 4 小组,而众数落在第 5 小组即时训练 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计请你根据尚未完成的频率分布表和频率分布直方图,
9、解答下列问题:分组频数频率50.5,60.5)40.0860.5,70.5)0.1670.5,80.5)1080.5,90.5)160.3290.5,100.5合计50(1)填充频率分布表中的空格(将答案直接填在表格内);(2)补全频率分布直方图;(3)若成绩在75.5,85.5)分的学生可以获得二等奖,问获得二等奖的学生约有多少人?解:(1)分组频数频率50.5,60.5)40.0860.5,70.5)80.1670.5,80.5)100.2080.5,90.5)160.3290.5,100.5120.24合计501.00(2)频率分布直方图如图所示:(3)成绩在75.5,80.5)分的学生
10、占70.5,80.5)分的学生的 510,因为成绩在70.5,80.5)分的学生的频率为 0.20.所以成绩在75.580.5)分的学生的频率为 0.10.成绩在80.5,85.5)分的学生占80.5,90.5)分的学生的 510,因为成绩在80.5,90.5)分的学生的频率为0.32,所以成绩在80.585.5)分的学生的频率为0.16.所以成绩在75.5,85.5)分的学生的频率为0.26,由于有900名学生参加了这次竞赛,所以该校获得二等奖的学生约有026900234(人)热点之二 茎叶图1运用茎叶图表示样本数据,有两大突出优点:(1)统计图上没有原始信息的损失,所有数据信息都可以从茎叶
11、图中得到;(2)茎叶图可以随时记录,方便表示与比较2一般制作茎叶图的方法是:将所有两位数的十位数字作“茎”,个位数字作“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出,共茎的叶按从大到小(或从小到大)的顺序同行列出例2 某公司甲、乙两名职员,自进入公司以来的阶段考核成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人考核成绩的茎叶图,请根据茎叶图对两人的成绩进行比较课堂记录 甲、乙两人考核成绩的茎叶图如下图所示从这个茎叶图上可看出,乙的得分情况是大
12、致对称的,中位数是98;甲的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙成绩比较稳定,总体得分情况比甲好思维拓展 本题考查茎叶图的实际应用只对两个对象的优劣作出判断的题目,只要在茎叶图上判断出数据的平均数的高低和数据的对称性即可,一般不需要具体计算即时训练 某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如下图所示,则这组数据的中位数是_;众数是_;平均数是_.解析:由于中位数是把样本数据按照由小到大的顺序排列起来,处在中间位置的一个(或是最中间两个数的平均数),故从茎叶图可以看出中位数是23;而众数是样本数据中出现次数最多的数,故众数也是23.平均数为21.45.故填23;2
13、3;21.45.答案:23;23;21.45热点之三 用样本的数字特征估计总体的数字特征1平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小2平均数、方差的公式推广(1)若数据 x1,x2,xn 的平均数为 x,那么 mx1a,mx2a,mx3a,mxna 的平均数是 m x a.(2)数据 x1,x2,xn 的方差为 s2.s21n(x12x22xn2)n x 2;数据 x1a,x2a,xna 的方差也为 s2;数据 ax1,ax2,axn 的方差为 a2s2.例3 甲、乙二人参加某体育项
14、目训练,近期的五次测试成绩得分情况如下图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价思路探究(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价课堂记录(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分x 甲1013121416513,x 乙1314121214513,s 甲 215(1013)2(1313)2(1213)2(1413)2(1613)24,s 乙 215(1313)2(1413)2(1213)2(1213
15、)2(1413)20.8.(2)由s甲2s乙2可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高思维拓展 运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定不要误以为方差越大越好,此题易误判为甲的成绩较稳定即时训练在一次每题5分,共12题的测试中,某班50位同学,得50分的频率是0.5,得55分的频率是0.4,得60分的频率是0.1,则 该 班 同 学 本 次 测 试 的 平 均 分 是 _,方 差 是_解 析:平 均 分 为 0.550 0.455 0.160 53.方 差 是0.590.4
16、40.14911.故填53;11.答案:53;11从近年的高考试题来看,频率分布表、频率分布直方图、茎叶图、标准差、方差、平均数是考查的热点,题型既有选择题、填空题,又有解答题,客观题考查的知识点较单一,主观题考查得较为全面,常常和概率、方差、平均数等知识结合在一起,考查学生应用知识解决问题的能力例4(2010陕西高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如下:(1)估计该校男生的人数;(2)估计该校学生身高在170185 cm之间的概率;(3)从样本中身高在180190 cm之间的男生中任选2人,求至少有1人身高在185190
17、cm之间的概率解(1)样本中男生人数为40,由分层抽样比例为10%估计全校男生人数为400.(3)样本中身高在180185 cm之间的男生有4人,设其编号为,样本中身高在185190 cm之间的男生有2人,设其编号为,.(2)由统计图知,样本中身高在 170185 cm 之间的学生有 141343135 人,样本容量为 70,所以样本中学生身高在 170185 cm之间的频率 f35700.5,故由 f 估计该校学生身高在 170185 cm 之间的概率 p10.5.从上述6人中任取2人的树状图为:故从样本中身高在 180190 cm 之间的男生中任选 2 人的所有可能结果数为 15,至少有
18、1 人身高在 185190 cm 之间的可能结果数为 9,因此,所求概率 p2 91535.1(2010山东高考)在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A92,2 B92,2.8 C93,2 D93,2.8解析:去掉一个最高分 95 分与一个最低分 89 分后,所得的 5 个数分别为 90、90、93、94、93,所以 x 909093949354605 92,s2290922293922949225145 2.8,故选 B.答案:B2(2010福建高考)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B91.5和92C91和91.5D92和92答案:A解析:中位数为12(9192)91.5;平均数为18(8789909192939496)91.5.