1、第十一章 统计与统计案例 第56节 用样本估计总体考纲呈现 1了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,并体会它们各自的特点 2理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征,并作出合理的解释 3会用样本的频率分布估计总体分布,用样本的数字特征估计总体的数字特征 4会用随机抽样的基本方法和样本估计总体的思想解决实际问题.诊断型微题组 课前预习诊断双基1作频率分布直方图的步骤(1)求极差(即一组数据中与的差)(2)决定与.(3)将数据.(4)列.(5)画.最大值最小值组距组数分组频率分布表频率分布直方图2频率分布折线
2、图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的增加,减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 中点组数组距3茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数 4标准差和方差(1)标准差是样本数据到平均数的一种.(2)标准差:s.(3)方差:s2(xn是样本数据,n是样本容量,x 是样本平均数)平均距离1nx1 x 2x2 x 2xn x 21n(x1 x)2(x2 x)2(xn x)2【知识拓展】1
3、频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距.频率组距频率组距.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观 2平均数、方差的公式推广(1)若数据x1,x2,xn的平均数为 x,那么mx1a,mx2a,mx3a,mxna的平均数是m x a.(2)数据x1,x2,xn的方差为s2.数据x1a,x2a,xna的方差也为s2.数据ax1,ax2,axn的方差为a2s2.1在使用茎叶图时,一定要注意
4、看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义 2利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和 1(2018湖南衡阳校级模拟)一个容量为20的样本数据,分组后,组距与频数如下,组距(10,20(20,30(30,40(40,50(50,60(60,70 频数234542 则样本在(10,50上的频率为()A.120 B 14 C 12 D 710
5、【答案】D【解析】根据题意,样本在(10,50上的频数为234514,所求的频率为 1420 710.故选D.2(2018 江西模拟)甲、乙两位歌手在“中国好声音”选拔赛中,5 位评委评分情况如茎叶图所示,记甲、乙两人的平均得分分别为 x 甲,x 乙,则下列判断正确的是()A.x 甲 x 乙,甲比乙成绩稳定 B.x 甲 x 乙,乙比甲成绩稳定 C.x 甲 x 乙,甲比乙成绩稳定 D.x 甲 x 乙,乙比甲成绩稳定【答案】B【解析】由茎叶图知,甲的得分情况为77,76,88,90,94;乙的得分情况为75,88,86,88,93,因此可知甲的平均分为 x 甲 15(7776889094)85,乙
6、的平均分为 x 乙 15(7586888893)86,故可知 x 甲 x 乙,排除C,D,同时根据茎叶图数据的分布情况可知,乙的数据主要集中在86左右,甲的数据比较分散,乙比甲更为集中,故乙比甲成绩稳定,故选B.3(必修3P100A组T1改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A4B8C12D16【答案】B【解析】由频数频率样本容量得,频数0.25328.故该组的频数为8.4(教材习题改编)甲乙两台机床同时生产一种零件,10天中,两台机床每天产出的次品数分别是:甲 0 1 0 2 2 0 3 1 2 4 乙 2 3 1 1 0 2 1 1 0 1 则机床
7、性能较好的为_【答案】乙【解析】x 甲1.5,x 乙1.2,s2甲1.65,s2乙0.76,s2甲s2乙,乙机床性能较好.形成型微题组 归纳演绎形成方法 茎叶图的应用(2018江西南昌一模)如图,茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则xy的值为_【答案】13 【解析】由茎叶图及已知得x5,又乙组数据的平均数为16.8,91510y1824516.8,解得y8,因此xy13.微技探究 茎叶图的优缺点 由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看
8、到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐 1.(2018四川内江四模)如图的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为()A.310 B 710 C 35 D 45 【答案】D【解析】由已知中的茎叶图得,甲的平均成绩为 15(8889909192)90;设污损的数字为x,则乙的平均成绩为 15(8383879990 x)88.4 x5,当x9,甲的平均成绩乙的平均成绩,即乙的平均成绩超过甲的平均成绩的概率为 110,当x8,甲的平均成绩乙的平均成绩,即乙的平均成绩等于甲的平均成
9、绩的概率为 110,所以,甲的平均成绩超过乙的平均成绩的概率为1 110 110 45.故选D.2.(2019 河南郑州质检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的 m,n 的比值mn _.【答案】38【解析】由茎叶图可知甲的数据为27,30m,39,乙的数据为20n,32,34,38.由此可知乙的中位数是33,所以甲的中位数也是33.所以m3.由此可以得出甲的平均数为33,所以乙的平均数也是33.所以有20n323438433.所以n8.所以mn38.频率分布直方图的绘制与应用命题角度1 利用频率分布直方图求频率或频数(2018江苏泰州模拟)对一批产品的长
10、度(单位:毫米)进行抽样检测,样本容量为200,下图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间25,30)的为一等品,在区间20,25)和30,35)的为二等品,其余均为三等品,则该样本三等品的件数为()A5B7 C10D50【答案】D【解析】根据题中的频率分布直方图可知,三等品的频率为1(0.050 00.062 50.037 5)50.25,因此该样本中三等品的件数为2000.2550.故选D.命题角度2 利用频率分布直方图估计总体 (2018广州模拟)学校为了解学生在课外读物方面的支出情况,抽取了n位同学进行调查,结果显示这些同学的支出都在10,50)(单位:元)内,其
11、中支出在30,50)(单位:元)内的同学有67人,其频率分布直方图如图所示,则n的值为()A100B120 C130D390【答案】A【解析】支出在30,50)内的同学的频率为1(0.010.023)100.67,n 670.67100.故选A.微技探究 1准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆 2在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布 (2017北京,17)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层
12、抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等试估计总体中男生和女生人数的比例【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.020.04)100.6,所以样本中分数小于70的频率为10.60.4.所以从总体的400名学生中随机抽取一人,其分数小
13、于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.010.020.040.02)100.9,分数在区间40,50)内的人数为1001000.955.所以总体中分数在区间40,50)内的人数估计为400 510020.(3)由题意可知,样本中分数不小于70的学生人数为(0.020.04)1010060,所以样本中分数不小于70的男生人数为601230.所以样本中的男生人数为30260,女生人数为1006040,男生和女生人数的比例为604032.所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.用样本的数字特征估计总体的数字特征1(2018黑龙江哈尔滨四校统考
14、)有一个样本容量为10的样本,其中所有数据组成一个公差不为0的等差数列an若a38,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A13,12B13,13 C12,13D13,14【答案】B【解析】设等差数列an的公差为d(d0),a38,a1a7a23 64,(82d)(84d)64,(4d)(2d)8,2dd20,又d0,故d2,故样本数据为4,6,8,10,12,14,16,18,20,22,平均数为S101042251013,中位数为1214213.2(2018长春模拟)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第
15、5次 甲8791908993 乙8990918892 则成绩较为稳定(方差较小)的那位运动员成绩的方差为_【答案】2【解析】x 甲15(8791908993)90,x 乙15(8990918892)90,s2甲15(8790)2(9190)2(9090)2(8990)2(9390)24,s2乙 15(89 90)2(9090)2(9190)2(88 90)2(9290)22.s2甲s2乙,故填2.微技探究 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小 1.(2018湖南衡阳模拟)下图
16、是某大学自主招生面试环节中七位评委为某考生打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为()A85,84B84,85C86,84D84,86【答案】A【解析】由题图可知,去掉一个最高分和一个最低分后,所剩数据为84,84,84,86,87,所以平均数为 8484848687585,众数为84.2.(2018河南郑州模拟)一个样本a,3,5,7的平均数是b,且a,b是方程x25x40的两个实数根,则这个样本的方差是()A3B4C5D6【答案】C【解析】因为x25x40的两个实数根分别为1,4,所以有a1,b4或a4,b1.又a,3,5,7的平均数是b,所以a357
17、4b,所以a154b,所以a1,b4符合题意,则方差s25.目标型微题组 瞄准高考使命必达1(2016山东,3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A56B60C120 D140【答案】D【解析】由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.160.080.04)2.50.7,则每周自习时间不少于22.5小时的人数为0.7
18、200140.2(2015重庆,3)重庆市2013年各月的平均气温()数据的茎叶图如下:则这组数据的中位数是()A19B20 C21.5D23【答案】B【解析】由茎叶图知,平均气温在20 以下的有5个月,在20 以上的也有5个月,恰好是20 的有2个月,由中位数的定义知,这组数据的中位数是20.选B.3(2018 江苏,3)已知 5 位裁判给某运动员打出的分数的茎叶图如图所示,那么这 5 位裁判打出的分数的平均数为_【答案】90【解析】这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为8989909191590.4(2016江苏,4)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_【答案】0.1【解析】x 4.74.85.15.45.555.1,则该组数据的方差 s24.75.124.85.125.15.125.45.125.55.1250.1.