1、第六节统计图表、用样本估计总体授课提示:对应学生用书第184页基础梳理1常用统计图表(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:反映样本频率分布的直方图如图:横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率(3)茎叶图的画法:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列,写在左(右)侧;第三步:将各个数据的叶依次写在其茎的右(左)侧2样本的数字特征(1)众数、中位数、
2、平均数数字特征定义与求法优点与缺点众数一组数据中重复出现次数最多的数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按大小顺序排列,处在最中间位置的一个数据(或两个数据的平均数)是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点续表数字特征定义与求法优点与缺点平均数如果有n个数据x1,x2,xn,那么这n个数的平均数(x1x2xn)平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低(2)标准差、方差标准差:表
3、示样本数据到平均数的一种平均距离,一般用s表示,s .方差:标准差的平方s2叫作方差s2(x1)2(x2)2(xn)2,其中xi(i1,2,3,n)是样本数据,n是样本容量,是样本平均数1频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)中位数的估计值的左边和右边的小矩形的面积和是相等的2平均数、方差的公式推广(1)若数据x1,x2,xn的平均数为,则mx1a,mx2a,mx3a,mxna的平均数是ma.(2)若数据x1,x2,xn的方差为s2,则数据ax1b,ax2b,axnb的
4、方差为a2s2.四基自测1(基础点:频率分布表)某便利店记录了100天某商品的日需求量(单位:件),整理得下表:日需求量n/件1415161820频率0.10.20.30.20.2试估计该商品日平均需求量为()A16件B16.2件C16.6件 D16.8件答案:D2(基础点:平均数与方差)甲、乙两名篮球运动员5场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为甲,乙,则下列结论正确的是()A.甲乙;乙比甲得分稳定B.甲乙;甲比乙得分稳定C.甲乙;乙比甲得分稳定D.甲乙;甲比乙得分稳定答案:A3(基础点:样本方差的计算)已知一个样本中的数据为1,2,3,4,5,则该样本的方差为()A
5、1 B2C3 D4答案:B4(基础点:频率分布直方图)某校100名学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:50,60),60,70),70,80),80,90),90,100,则图中a的值为_答案:0.005授课提示:对应学生用书第186页考点一简单统计图表的应用挖掘图与表的统计意义/ 自主练透例(1)(2018高考全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增
6、加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a37%2a74%a增加A错其他收入4%a5%2a10%a增加一倍以上B对养殖收入30%a30%2a60%a增加了一倍C对养殖收入第三产业收入(30%6%)a36%a(30%28%)2a116%a超过经济收入2a的一半D对故选A.答案A(2)(2017高考全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,
7、收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是()A月接待游客量逐月增加B年接待游客量逐年增加C各年的月接待游客量高峰期大致在7,8月D各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A错误答案A(3)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .下面叙述不正确的是()A各月的
8、平均最低气温都在0 以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于20 的月份有5个解析由题图可知,0 在虚线圈内,所以各月的平均最低气温都在0 以上,A正确;易知B,C正确;平均最高气温高于20 的月份有3个,分别为六月、七月、八月,D错误故选D.答案D破题技法根据统计图表(或图像)分析其意义时(1)明确图表(图像)中各数字的意义及作用(2)分析数字或图像的变化趋势对实际结果的影响(3)经常用到的有扇形图、条形图、频率分布直方图、茎叶图、频数(频率)折线图、等势线图等考点二频率分布直方图及综合应用挖掘1作频率分布直方图/ 自主练透例1(2018高
9、考全国卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151310165(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率
10、;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解析(1)如图所示(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.20.110.12.60.120.050.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1(0.0510.1530.2520.3540.4590.55260.655)0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2(0.0510.1550.25130.35100.45160
11、.555)0.35.估计使用节水龙头后,一年可节省水(0.480.35)36547.45(m3)破题技法频率、频数、样本容量的计算方法(1)xifi.(2)频率,样本容量,样本容量频率频数挖掘2应用频率分布直方图估计总体/ 互动探究例2(1)(2020山西四校联考)某学校组织学生参加数学测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()A45B50C55D60解析20,40),40,60)的频率和为(0.0050.01)200.3,该班的学生人数是50.故选B.答案B(2)(2019高考全国
12、卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.求乙离子残留百分比直方图中a,b的值;分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解析由已知得0.70a0.200.15,故a0.35,b10.050.150.700.10.甲离子
13、残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.破题技法利用频率分布直方图估计样本的数字特征的思路(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)众数:在频率分布直方图中,众数是最高矩形的底边中点的横坐标考点三茎叶图及应用挖掘1茎叶图与样本数字特征/ 自主练透例1(1)(2020湖北孝感模拟)某校
14、高三年级10个班参加合唱比赛得分的茎叶图如图所示,若这组数据的平均数是20,则的最小值为()12359723a58bA.1B.C2 D.解析根据茎叶图知,这组数据的平均数是121315191723(20a)2528(20b)20,ab8,(ab)2,当且仅当b3a6时取“”,的最小值为2.故选C.答案C(2)(2020河北石家庄教学质量检测)某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;A班兴趣小组成绩的标准差大于B班兴趣小组成绩的
15、标准差;B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差其中正确结论的编号为()A BC D解析A班兴趣小组的平均成绩为78,其方差为(5378)2(6278)2(9578)2121.6,则其标准差为11.03;B班兴趣小组的平均成绩为66,其方差为(4566)2(4866)2(9166)2175.2,则其标准差为13.24.故选A.答案A破题技法茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据挖掘2用茎叶图进行总体估计/ 互动探究例2(2020唐山高三年级摸底考试)某厂分别用甲
16、、乙两种工艺生产同一种零件,尺寸在223,228内(单位:mm)的零件为一等品,其余为二等品在两种工艺生产的零件中,各随机抽取10个,其尺寸的茎叶图如图所示:(1)分别计算抽取的两种工艺生产的零件尺寸的平均数;(2)已知甲工艺每天可生产300个零件,乙工艺每天可生产280个零件,一等品利润为30元/个,二等品利润为20元/个,视频率为概率,试根据抽样数据判断采用哪种工艺生产该零件每天获得的利润更高?解析(1)甲(217218222225226227228231233234)226.1;乙(218219221224224225226228230232)224.7.(2)由抽取的样本可知,应用甲工艺生产的零件为一等品的概率为,二等品的概率为,故采用甲工艺生产该零件每天获得的利润为w甲30030300207 200(元);应用乙工艺生产的零件为一等品、二等品的概率均为,故采用乙工艺生产该零件每天获得的利润为w乙28030280207 000(元)因为w甲w乙,所以采用甲工艺生产该零件每天获得的利润更高破题技法茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据,通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等