1、基础诊断考点突破课堂总结第2讲 统计图表、数据的数字特征、用样本估计总体 基础诊断考点突破课堂总结最新考纲 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.基础诊断考点突破课堂总结知 识 梳 理 1.频率分布直方图(1)频率分布表的画法:第
2、一步:求_,决定组数和组距,组距_;第二步:_,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.极差极差组数分组基础诊断考点突破课堂总结(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示_,每个小矩形的面积表示样本落在该组内的_.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.频率组距频率基础诊断考点突破课堂总结3.样本的数字特征 数字特征 定义 众数 在一组数据中,出现次数_的数据叫做这组数据的众数 中位数 将一组数据按大小依次排列,把处在_位置的一个数据(
3、或最中间两个数据的_)叫做这组数据的中位数 在频率分布直方图中,中位数左边和右边的直方图的面积_ 最多最中间平均数相等基础诊断考点突破课堂总结平均数 样本数据的算术平均数,即 _ 方差 s2_,其中s为标准差 x1x2xnn1n(x1x)2(x2x)2(xnx)2x基础诊断考点突破课堂总结诊 断 自 测 1.判断正误(在括号内打“”或“”)精彩PPT展示(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.()(2)一组数据的方差越大,说明这组数据越集中.()(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.()(4)茎叶图一般左侧的叶按从大到小的顺序写,右
4、侧的叶按从小到大的顺序写,相同的数据可以只记一次.()基础诊断考点突破课堂总结解析(2)错误.方差越大,这种数据越离散.(4)错误.相同的数据叶要重复记录,故(4)错误.答案(1)(2)(3)(4)基础诊断考点突破课堂总结2.(教材改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92 C.91和91.5D.92和92 基础诊断考点突破课堂总结解析 这组数据由小到大排列为 87,89,90,91,92,93,94,96,中位数是9192291.5,平均数x8789909192939496891.5.答案 A 基础
5、诊断考点突破课堂总结3.在样本的频率分布直方图中,共有 7 个小长方形,若中间一个小长方形的面积等于其他 6 个小长方形的面积的和的14,且样本容量为 80,则中间一组的频数为()A.0.25 B.0.5C.20 D.16解析 设中间一组的频数为 x,依题意有 x8014(1 x80),解得 x16.答案 D 基础诊断考点突破课堂总结4.(2016江苏卷)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_.解析 易求x15(4.74.85.15.45.5)5.1,方差 s215(0.4)2(0.3)2020.320.420.1.答案 0.1 基础诊断考点突破课堂总结5.(
6、2017合肥调研)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为_.基础诊断考点突破课堂总结解析 全体志愿者共有:20(0.240.16)150(人),所以第三组有志愿者:0.3615018(人),第三组中没有疗效的有 6 人,有疗效的有 18612(人).答案 12 基础诊断考点突破课堂总结考点一
7、茎叶图及其应用【例1】(2014全国卷)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:基础诊断考点突破课堂总结(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,2
8、6 位的是 66,68,故样本中位数为6668267,所以该市的市民对乙部门评分的中位数的估计值是 67.基础诊断考点突破课堂总结(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于90 的比率分别为 5500.1,8500.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.基础诊断考点突破课堂总结规律方法(1)茎叶图的优点
9、是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.(2)作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.基础诊断考点突破课堂总结【训练1】以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则xy的值为_.基础诊断考点突破课堂总结解析 由茎叶图及已知得 x5,又乙组数据的平均数为 16.8,即9151
10、0y1824516.8,解得 y8,因此 xy13.答案 13 基础诊断考点突破课堂总结考点二 频率分布直方图(多维探究)命题角度一 用频率分布直方图求频率、频数【例21】(2016山东卷)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140 基础诊断考点突破课堂总结解析 由频率分布直方图可知每周自习时间不少于22.5
11、小时的频率为(0.160.080.04)2.50.7,则每周自习时间不少于22.5小时的人数为0.7200140.答案 D基础诊断考点突破课堂总结命题角度二 用频率分布直方图估计总体【例22】(2016四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.基础诊断考点突破课堂总结(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位
12、数.解(1)由频率分布直方图可知:月均用水量在0,0.5)内的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1(0.040.080.210.250.060.040.02)0.5a0.5a,解得a0.30.基础诊断考点突破课堂总结(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.060.040.020.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.1236 000.(3)设中位数为x
13、吨.因为前5组的频率之和为0.040.080.150.210.250.730.5.又前4组的频率之和为0.040.080.150.210.480.5.所以2x2.5.由0.50(x2)0.50.48,解得x2.04.故可估计居民月均用水量的中位数为2.04吨.基础诊断考点突破课堂总结规律方法(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.而利用频率分布直方图可以估计总体分布.基础诊断考点突破课堂总结【训练2】(
14、2017佛山质检)某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图.基础诊断考点突破课堂总结(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在220,240)内的用户中应抽取多少户?解(1)由(0.0020.009 50.0110.012 5x0.0050.002 5)201,得x0.00
15、7 5,直方图中x的值为0.007 5.基础诊断考点突破课堂总结(2)月平均用电量的众数是2202402230.(0.0020.009 50.011)200.45x乙,s2甲s2乙,所以甲组的研发水平优于乙组.基础诊断考点突破课堂总结(2)记 E恰有一组研发成功.在所抽得的 15 个结果中,恰有一组研发成功的结果是(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),(a,b),共 7 个.因此事件 E 发生的频率为 715.用频率估计概率,即得所求概率为 P(E)715.基础诊断考点突破课堂总结规律方法(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕
16、平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择.基础诊断考点突破课堂总结【训练3】(2015山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:基础诊断考点突破课堂总结甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温
17、的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.B.C.D.基础诊断考点突破课堂总结解析 甲地 5 天的气温为:26,28,29,31,31,其平均数为x甲2628293131529;方差为 s2甲15(2629)2(2829)2(2929)2(3129)2(3129)23.6;标准差为 s 甲 3.6.乙地 5 天的气温为:28,29,30,31,32,其平均数为x乙2829303132530;基础诊断考点突破课堂总结方差为s2乙15(2830)2(2930)2(3030)2(3130)2(3230)22;标准差为 s 乙 2.x甲s 乙.答案 B 基
18、础诊断考点突破课堂总结思想方法 1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.基础诊断考点突破课堂总结2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.3.茎叶图、频率分布表和频率分布直方图都可直观描述样本数据的分布规律.基础诊断考点突破课堂总结易错防范 1.在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.基础诊断考点突破课堂总结3.直方图与条形图不要搞混 频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.