1、第九章概率、统计与统计案例第六节 统计图表、用样本估计总体基础梳理1常用统计图表(1)频率分布表的画法:第一步:求_,决定组数和组距,组距_;第二步:_,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表极差 极差组数分组 (2)频率分布直方图:反映样本频率分布的直方图如图:横轴表示样本数据,纵轴表示_,每个小矩形的面积表示样本落在该组内的_频率组距频率 (3)茎叶图的画法:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按_次序排成一列,写在左(右)侧;第三步:将各个数据的叶依次写在其茎的右(左)侧大小 2样
2、本的数字特征(1)众数、中位数、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按_排列,处在_位置的一个数据(或两个数据的平均数)是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点大小顺序 最中间 数字特征定义与求法优点与缺点平均数如果有 n 个数据 x1,x2,xn,那么这 n 个数的平均数x_平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠
3、性降低1n(x1x2xn)(2)标准差、方差标准差:表示样本数据到平均数的一种平均距离,一般用 s 表示,s1n(x1x)2(x2x)2(xnx)2.方差:标准差的平方 s2 叫作方差s2_,其中 xi(i1,2,3,n)是样本数据,n是样本容量,x是样本平均数1n(x1x)2(x2x)2(xnx)21频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)中位数的估计值的左边和右边的小矩形的面积和是相等的2平均数、方差的公式推广(1)若数据 x1,x2,xn 的平均数为x,则 mx1a
4、,mx2a,mx3a,mxna的平均数是 mxa.(2)若数据 x1,x2,xn 的方差为 s2,则数据 ax1b,ax2b,axnb 的方差为 a2s2.四基自测1(基础点:频率分布表)某便利店记录了 100 天某商品的日需求量(单位:件),整理得下表:日需求量 n/件1415161820频率0.10.20.30.20.2试估计该商品日平均需求量为()A16 件 B16.2 件C16.6 件D16.8 件答案:D2(基础点:平均数与方差)甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x甲,x乙,则下列结论正确的是()A.x甲x乙;乙比甲得分稳定B.x
5、甲x乙;甲比乙得分稳定C.x甲x乙;乙比甲得分稳定D.x甲x乙;甲比乙得分稳定答案:A3(基础点:样本方差的计算)已知一个样本中的数据为 1,2,3,4,5,则该样本的方差为()A1 B2C3 D4答案:B4(基础点:频率分布直方图)某校 100 名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100,则图中 a 的值为_答案:0.005考点一 简单统计图表的应用挖掘 图与表的统计意义/自主练透例(1)(2018高考全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济
6、收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析 设新农村建设前,农村的经济收入为 a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%2a74%a增加A 错其他收入4%a5%2a10%a增加一倍以上B 对养殖收入30%a30%2a60%a增加了一倍C 对养殖收入第三产业收入(3
7、0%6%)a36%a(30%28%)2a116%a超过经济收入 2a 的一半D 对故选 A.答案 A(2)(2017高考全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014 年 1 月至 2016 年 12 月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在 7,8 月D各年 1 月至 6 月的月接待游客量相对于 7 月至 12 月,波动性更小,变化比较平稳解析 根据折线图可知,2014 年 8 月到 9 月、2014 年 10 月到 11 月等月接
8、待游客量都是减少,所以 A 错误答案 A(3)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中 A 点表示十月的平均最高气温约为 15,B 点表示四月的平均最低气温约为 5 .下面叙述不正确的是()A各月的平均最低气温都在 0 以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于 20 的月份有 5 个解析 由题图可知,0 在虚线圈内,所以各月的平均最低气温都在 0 以上,A正确;易知 B,C 正确;平均最高气温高于 20 的月份有 3 个,分别为六月、七月、八月,D 错误故选 D.答案 D破题技法 根据统计图
9、表(或图像)分析其意义时(1)明确图表(图像)中各数字的意义及作用(2)分析数字或图像的变化趋势对实际结果的影响(3)经常用到的有扇形图、条形图、频率分布直方图、茎叶图、频数(频率)折线图、等势线图等考点二 频率分布直方图及综合应用挖掘 1 作频率分布直方图/自主练透例 1(2018高考全国卷)某家庭记录了未使用节水龙头 50 天的日用水量数据(单位:m3)和使用了节水龙头 50 天的日用水量数据,得到频数分布表如下:未使用节水龙头 50 天的日用水量频数分布表日用水量 0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数132492
10、65使用了节水龙头 50 天的日用水量频数分布表日用水量 0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151310165(1)在下图中作出使用了节水龙头 50 天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于 0.35 m3 的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按 365 天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)如图所示(2)根据以上数据,该家庭使用节水龙头后 50 天日用水量小于 0.35 m3 的频率为0.20.110.12.60.120.050.48,因
11、此该家庭使用节水龙头后,日用水量小于 0.35 m3 的概率的估计值为 0.48.(3)该家庭未使用节水龙头 50 天日用水量的平均数为x1 150(0.0510.1530.2520.3540.4590.55260.655)0.48.该家庭使用了节水龙头后 50 天日用水量的平均数为x2 150(0.0510.1550.25130.35100.45160.555)0.35.估计使用节水龙头后,一年可节省水(0.480.35)36547.45(m3)破题技法 频率、频数、样本容量的计算方法(1)fixixifi.(2)频数样本容量频率,频数频率样本容量,样本容量频率频数挖掘 2 应用频率分布直方
12、图估计总体/互动探究例 2(1)(2020山西四校联考)某学校组织学生参加数学测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100若低于60 分的人数是 15,则该班的学生人数是()A45 B50 C55 D60解析 20,40),40,60)的频率和为(0.0050.01)200.3,该班的学生人数是150.350.故选 B.答案 B(2)(2019高考全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液每只小鼠
13、给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C)的估计值为 0.70.求乙离子残留百分比直方图中 a,b 的值;分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解析 由已知得 0.70a0.200.15,故 a0.35,b10.050.150.700.10.甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平均值的估计值为30.0540
14、.1050.1560.3570.2080.156.00.破题技法 利用频率分布直方图估计样本的数字特征的思路(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高矩形的底边中点的横坐标考点三 茎叶图及应用挖掘 1 茎叶图与样本数字特征/自主练透例 1(1)(2020湖北孝感模拟)某校高三年级 10 个班参加合唱比赛得分的茎叶图如图所示,若这组数据的平均数是 20,则1a9b的最小值为()12359723a58bA.1
15、B.32C2 D.52解析 根据茎叶图知,这组数据的平均数是 110121315191723(20a)2528(20b)20,ab8,1a9b181a9b(ab)18199ab ba 181029ab ba 2,当且仅当 b3a6 时取“”,1a9b的最小值为 2.故选 C.答案 C(2)(2020河北石家庄教学质量检测)某学校 A、B 两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差A 班兴趣小组的平均成绩高于 B 班兴趣小组的平均成绩;B 班兴趣小组的平均成绩高于 A 班兴趣小组的平均成绩;A 班兴趣小组成绩的标准差大于 B 班兴趣小组成绩
16、的标准差;B 班兴趣小组成绩的标准差大于 A 班兴趣小组成绩的标准差其中正确结论的编号为()ABCD解析 A 班兴趣小组的平均成绩为53626492951578,其方差为 115(5378)2(6278)2(9578)2121.6,则其标准差为 121.611.03;B 班兴趣小组的平均成绩为454851911566,其方差为 115(4566)2(4866)2(9166)2175.2,则其标准差为 169.213.24.故选 A.答案 A破题技法 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”
17、的位置上的数据挖掘 2 用茎叶图进行总体估计/互动探究例 2(2020唐山高三年级摸底考试)某厂分别用甲、乙两种工艺生产同一种零件,尺寸在223,228内(单位:mm)的零件为一等品,其余为二等品在两种工艺生产的零件中,各随机抽取 10 个,其尺寸的茎叶图如图所示:(1)分别计算抽取的两种工艺生产的零件尺寸的平均数;(2)已知甲工艺每天可生产 300 个零件,乙工艺每天可生产 280 个零件,一等品利润为 30 元/个,二等品利润为 20 元/个,视频率为概率,试根据抽样数据判断采用哪种工艺生产该零件每天获得的利润更高?解析(1)x甲 110(2172182222252262272282312
18、33234)226.1;x乙 110(218219221224224225226228230232)224.7.(2)由抽取的样本可知,应用甲工艺生产的零件为一等品的概率为25,二等品的概率为35,故采用甲工艺生产该零件每天获得的利润为w 甲300253030035207 200(元);应用乙工艺生产的零件为一等品、二等品的概率均为12,故采用乙工艺生产该零件每天获得的利润为w 乙280123028012207 000(元)因为 w 甲w 乙,所以采用甲工艺生产该零件每天获得的利润更高破题技法 茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据,通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等课时规范练