1、第二节用样本估计总体热点命题分析学科核心素养从近五年高考来看,主要考查利用频率分布直方图、茎叶图、样本的数字特征估计总体,各种题型都有,难度中档偏下.本节主要通过用样本估计总体提升数据分析与数学运算及直观想象核心素养.授课提示:对应学生用书第218页知识点一频率分布直方图、茎叶图1作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图2频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的
2、组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线3茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便 温馨提醒 频率分布直方图与众数、中位数与平均数的关系(1)最高的小长方形底边中点的横坐标即是众数的估计值(2)中位数左边和右边的小长方形的面积和是相等的(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和1学校为了解学生在课外读物方面的支出情况,抽取了n位同学进行调查,结果显示这些同学的支出都在10,50(单位:元)之间,其频率分布直方图如
3、图所示,其中支出在10,30)(单位:元)内的同学有33人,则支出在40,50(单位:元)内的同学人数为()A100B120C30D300答案:C2在如图所示的茎叶图所示的数据中,众数和中位数分别是()A23,26B31,26C24,30D26,30答案:B3(2021衡水中学五调)某“跑团”为了解团队每月跑步的平均里程,收集并整理了2020年1月至2020年11月期间“跑团”每月跑步的平均里程(单位:千米)的数据,绘制了下面的折线图根据折线图,下列结论正确的是()A月跑步平均里程的中位数为6月份对应的平均里程数B月跑步平均里程逐月增加C月跑步平均里程高峰期大致在8月和9月D1月至5月的月跑步
4、平均里程相对于6月至11月,波动性更小,变化比较平稳答案:D知识点二样本的数字特征1众数、中位数、平均数数字特征概念优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使它无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点续表数字特征概念优点与缺点平均数如果有n个数据x1,x2,xn,那么这n个数的平均数平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息
5、,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s .(2)方差:标准差的平方s2s2(x1)2(x2)2(xn)2,其中xi(i1,2,3,n)是样本数据,n是样本容量,是样本平均数 温馨提醒 1众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量2平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”1已知样本数据3,5,7,4,6,则该样本标准差为()A1BC.D2答案:B2(易错题)10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,
6、17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有()Aabc BbcaCcab Dcba答案:D授课提示:对应学生用书第220页题型一统计图表的应用自主探究1(多选题)新冠肺炎疫情的出现警示我们,人类不文明的行为为各种致病细菌和病毒提供了传播途径,成为现代文明生活的致命软肋,对人类的健康和生命构成了严重威胁首都文明工程基金会和文明杂志社倡议启动新时代文明工程:呼吁社会公益组织、新媒体和企业机构携手“餐桌革命公筷行动”!某机构调查了某地区部分居民疫情前后对餐桌革命(公筷公勺、分餐制)的支持情况,得到如下统计图,则下列说法正确的是()A疫情后仅支持公筷公勺和仅支持分餐的居民
7、均增多B疫情前后仅支持公筷公勺的居民均多于仅支持分餐的居民C疫情后,不支持餐桌革命的比例下降幅度低于支持餐桌革命的上升幅度D疫情后,人们的健康饮食意识明显提高解析:由饼图可知,疫情后仅支持公筷公勺和仅支持分餐的比例分别上升至10%,7%,故A正确;疫情前后,仅支持公筷公勺的比例分别为8%,10%,仅支持分餐的比例分别为5%,7%,故B正确;疫情后,不支持餐桌革命的比例下降了42%,支持餐桌革命的比例上升了38%,故C错误;由题图易得,人们的健康饮食意识明显提高,故D正确答案:ABD2(2021珠海摸底)某班级在一次数学竞赛中设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖20
8、元、二等奖10元、三等奖5元、参与奖2元,获奖人数的分配情况如图所示,则以下说法不正确的是()A获得参与奖的人数最多B各个奖项中三等奖的总费用最高C购买奖品的平均费用为9.25元D购买奖品的费用的中位数为2元答案:C利用折线图、饼图分析问题的关键是结合图形,弄清图中数据,读准问题要求题型二频率分布直方图合作探究例(2021四川五校联考)随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养为导向,学习评价更关注学科核心素养的形成和发展为此,某市于2020年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科素养,从所有参赛学生中随机抽取1 000名学生的成绩(
9、单位:分)作为样本进行估计,将抽取的成绩整理后分成五组,依次记为50,60),60,70),70,80),80,90),90,100,并绘制成如图所示的频率分布直方图(1)请补全频率分布直方图,并估计这1 000名学生成绩的平均数(同一组数据用该组区间的中点值作代表);(2)该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为79分,请你判断该学生能否被授予“数学学科素养优秀标兵”称号解析(1)成绩在60,70)的频率为1(0.300.150.100.05)0.40,补全的频率分布直方图如图:样本的平均数550.30650.40750.1
10、5850.10950.0567.(2)因为0.18,所以由频率分布直方图可以估计获得“数学学科素养优秀标兵”称号学生的最低成绩为8078(分)因为7978,所以该同学能被授予“数学学科素养优秀标兵”称号由频率分布直方图进行相关计算时,需掌握的两个关系式(1)组距频率(2)频率,此关系式的变形为样本容量,样本容量频率频数对点训练(2020高考天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内的个数为(
11、)A10 B18C20 D36解析:由题知5.43,5.45)与5.45,5.47)所对应的小矩形的高分别为6.25,5.00,所以5.43,5.47)的频率为(6.255.00)0.020.225,所以直径落在区间5.43,5.47)内的个数为800.22518.答案:B题型三样本的数字特征及应用合作探究例(2019高考全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计
12、这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)附:8.602.解析(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为0.21.产值负增长的企业频率为0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)(0.1020.10240.30530.50140.707)0.30,s2i(yi)2(0.40)22(0.20)22402530.202140.40270.
13、029 6,s0.020.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.利用样本的数字特征解决优化决策问题(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征题组突破1(2020高考全国卷)设一组样本数据x1,x2,xn的方差为0.01,则数据10x1,10x2,10xn的方差为()A0.01B0.1C1D10答案:C2为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最
14、近五场比赛的得分,制成如图所示的茎叶图有下列结论:甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;从最近五场比赛的得分看,乙比甲更稳定;从最近五场比赛的得分看,甲比乙更稳定其中所有正确结论的编号为()AB C D解析:对于,甲得分的中位数为29,乙得分的中位数为30,错误;对于,甲得分的平均数为(2528293132)29,乙得分的平均数为(2829303132)30,正确;对于,甲得分的方差为(2529)2(2829)2(2929)2(3129)2(3229)2(161049)6,乙得分的方差为(2830)2(2930)2(
15、3030)2(3130)2(3230)2(41014)2,所以乙比甲更稳定,正确,错误所以正确结论的编号为.答案:C用样本估计总体应用中的核心素养直观想象、数据分析用样本估计总体的创新问题例(2021惠州市一调)某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元该大学生通过查询资料得到开学季市场需求量的频率分布直方图,如图所示该大学生为这个开学季购进了160盒该产品,以x(单位:盒,100x200)表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润(1)根据直方图估计这个开学季内市场需求量x的
16、众数和平均数;(2)将y表示为x的函数;(3)根据直方图估计利润y不少于4 000元的概率解析(1)由题中频率分布直方图得,这个开学季内市场需求量x的众数是150盒,需求量在100,120)内的频率为0.005 0200.1,需求量在120,140)内的频率为0.010 0200.2,需求量在140,160)内的频率为0.015 0200.3,需求量在160,180)内的频率为0.012 5200.25,需求量在180,200内的频率为0.007 5200.15.则平均数1100.11300.21500.31700.251900.15153(盒)(2)因为每售出1盒该产品获得的利润为30元,未
17、售出的产品,每盒亏损10元,所以当100x160时,y30x10(160x)40x1 600;当160x200时,y160304 800.所以y(3)因为利润y不少于4 000元,所以当100x160时,由40x1 6004 000,解得140x160;当160x200时,y4 8004 000恒成立,所以140x200时,利润y不少于4 000元故由(1)知利润y不少于4 000元的概率P10.10.20.7.用样本估计总体常与函数、不等式、概率求法等交汇考查,处理时需注意读图数据的准确性及交汇点的应用对点训练如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在30,35),35,40),40,45的网民人数成递减的等差数列,则年龄在35,40)的网民出现的频率为()A0.04B0.06C0.2D0.3答案:C