1、11.4抽样方法与总体分布的估计探考情 悟真题【考情探究】考点内容解读5年考情预测热度考题示例考向关联考点1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2017江苏,3,5分 分层抽样2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表、会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解
2、用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2019课标,5,5分样本数字特征2019课标,17,12分 频率分布直方图及样本的数字特征2018课标,3,5分 统计图中的扇形图2018课标,18,12分茎叶图的应用独立性检验2018课标,18,12分 折线图的应用变量间的相关关系2017课标,19,12分样本平均数和标准差的应用正态分布2017课标,18,12分利用频率分布直方图求中位数的估计值独立性检验分析解读对于随机抽样,主要考查三种抽样方法,尤其是分层抽样和系统抽样,一般以选择题或填空题的形式出现;对于用样本估计总体,主要考查利用频率分布直
3、方图、茎叶图、样本的数字特征估计总体,若单独命题,一般以选择题或填空题的形式出现,分值约为5分,属容易题;也常出现在解答题中,分值约为12分,属中档题.考查学生的数据分析能力和逻辑推理能力.破考点 练考向【考点集训】考点一随机抽样1.(2020届云南名校10月高考适应性月考,3)某学校为了解1 000名新生的近视情况,将这些学生编号为000,001,002,999,从这些新生中用系统抽样的方法抽取100名学生进行检查,若036号学生被抽到,则下面4名学生中被抽到的是()A.008号学生B.200号学生C.616号学生D.815号学生答案C2.(2019河南新乡模拟,4)某机构对青年观众是否喜欢
4、跨年晚会进行了调查,人数如下表所示:不喜欢喜欢男性青年观众3010女性青年观众3050现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男性青年观众中抽取了6人,则n=()A.12B.16C.24D.32答案C3.(2019江西吉安一模,4)总体由编号为00,01,02,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为()附:第6行至第9行的随机数表如下:2635 7900 3370 9160 1620 3882 7757 49503211 4919
5、 7306 4916 7677 8733 9974 67322748 6198 7164 4148 7086 2888 8519 16207477 0111 1630 2404 2979 7991 9683 5125A.3B.16C.38D.20答案D考点二用样本估计总体1.(2020届四川双流中学10月月考,4)一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在20,60)上的频率为0.8,则估计样本40,60)内的数据个数为()分组10,20)20,30)30,40)频数345A.14B.15C.16D.17答案B2.(2018广东茂名五大联盟学校3月联考,2)甲、乙
6、两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数相同的是()A.极差B.方差C.平均数D.中位数答案C3.(2020届河南洛阳尖子生第一次联合考试,13)已知样本x1,x2,x2 019的平均数和方差分别是1和4,若yi=axi+b(i=1,2,2 019)的平均数和方差也是1和4,则ab=.答案1炼技法 提能力【方法集训】方法1抽样方法的应用1.(2019江西上饶二模,4)某学校为响应“平安出行号召”,拟从2 019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2 000名再按照系统抽样的方法抽取,则每名学生入选的概率(
7、)A.不全相等B.均不相等C.都相等,且为140D.都相等,且为502 019答案D2.(2020届陕西百校联盟TOP20 9月联考,15)为了了解某公司800名党员“学习强国”的完成情况,公司党委书记将这800名党员编号为1,2,3,800,并用系统抽样的方法随机抽取50人做调查.若第3组中40号被抽到,则第9组中被抽到的号码是.答案136方法2频率分布直方图的应用1.(2019河北示范性高中4月模拟,10)某学校对100间学生公寓的卫生情况进行综合评比,依考核分数分为A,B,C,D四个等级,其中分数在60,70)为D等级;分数在70,80)为C等级;分数在80,90)为B等级;分数在90,
8、100为A等级,考核评估后,得其频率分布折线图如图所示,估计这100间学生公寓评估得分的平均数是()A.80.25B.80.45C.80.5D.80.65答案C2.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的13,则该组的频数为.答案50方法3样本的数字特征及其应用1.(2019江西临川第一中学等九校3月联考,3)某兄弟俩都推销某一小家电,现抽取他们其中8天的销售量(单位:台),得到的茎叶图如图所示,已知弟弟的销售量的平均数为34,哥哥的销售量的中位数比弟弟的销售量的众数大
9、2,则x+y的值为()A.5B.13C.15D.20答案B2.(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s22C.x4,s24,s22答案A【五年高考】A组统一命题课标卷题组1.(2019课标,3,5分)西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共有80位,阅读过西游记且阅读过红楼梦的学生共有60位,则该校阅读过西游记的学生人数与该校学生总数
10、比值的估计值为()A.0.5B.0.6C.0.7D.0.8答案C2.(2019课标,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A3.(2018课标,3,5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增
11、加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A4.(2017课标,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案A5.(2019课标,17,12分)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将
12、200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解析本题主要考查频率分布直方图的含义,以及用频率分布直方图估计样本的数字特征,通过实际问题的应用考查学生的运算求解能力,考查了数学运算的核心
13、素养,体现了应用意识.(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为20.15+30.20+40.30+50.20+60.10+70.05=4.05.乙离子残留百分比的平均值的估计值为30.05+40.10+50.15+60.35+70.20+80.15=6.00.方法总结由频率分布直方图估计样本的数字特征:(xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积)平均数x=x1S1+x2S2+xiSi+xnSn;方差s2=(x1-x)2S1+(x2-x)2S2+(xn-x)2S
14、n;中位数:从左到右(或从右到左)小矩形面积之和等于0.5时对应点的横坐标;众数:最高小矩形底边中点的横坐标.B组自主命题省(区、市)卷题组考点一随机抽样1.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.答案182.(2015湖南,13,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是
15、.答案4考点二用样本估计总体1.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140答案D2.(2015安徽,6,5分)若样本数据x1,x2,x10的标准差为8,则数据2x1-1,2x2-1,2x10-1的标准差为()A.8B.15C.16D.32答案C3.(2018江苏,3,5分)已知5位裁
16、判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.8999011答案90C组教师专用题组1.(2015湖北,2,5分)我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为()A.134石B.169石C.338石D.1 365石答案B2.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.167B.137C.123D.93答案B3.(2015课标,3,5分)根据下面给出的2004年至2013年我国
17、二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是() A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案D4.(2015重庆,3,5分)重庆市2013年各月的平均气温()数据的茎叶图如下:0891258200338312则这组数据的中位数是()A.19B.20C.21.5D.23答案B5.(2013课标,3,5分)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的
18、视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是()A.简单随机抽样B.按性别分层抽样C.按学段分层抽样D.系统抽样答案C6.(2016江苏,4,5分)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.答案0.17.(2015江苏,2,5分)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.答案68.(2015课标,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区
19、:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B地区456789(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”.假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解析(1)两地区用户满意度评分的茎叶图如下:A地区B地
20、区4683513646426245568864373346992865183217552913通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”;CA2表示事件:“A地区用户的满意度等级为非常满意”;CB1表示事件:“B地区用户的满意度等级为不满意”;CB2表示事件:“B地区用户的满意度等级为满意”,则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=CB1CA1CB2CA2.P(C)=P(CB1CA1CB2CA2)=P(C
21、B1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2).由所给数据得CA1,CA2,CB1,CB2发生的频率分别为1620,420,1020,820,故P(CA1)=1620,P(CA2)=420,P(CB1)=1020,P(CB2)=820,P(C)=10201620+820420=0.48.思路分析(1)将A、B地区数据逐一填入茎叶图,然后通过茎叶图作比较.(2)设出事件且指明事件间的关系,利用相应概率公式得结论.【三年模拟】一、选择题(每小题5分,共30分)1.(2020届四川双流中学10月月考,3)某调研机构随机调查了2019年某地区n名业主物业费的缴费情
22、况,发现缴费金额(单位:万元)都在区间0.5,1.1内,其频率分布直方图如图所示,若第五组的频数为32,则样本容量n=()A.200B.400C.800D.1 600答案B2.(2020届陕西汉中第四次质量检测,5)如果一组数中的每个数都减去同一个非零常数,则这一组数的()A.平均数不变,方差不变B.平均数改变,方差改变C.平均数不变,方差改变D.平均数改变,方差不变答案D3.(2019湖北武汉4月调研,4)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图
23、中信息,可知本次抽查的学生中A类人数是()A.30B.40C.42D.48答案A4.(2020届重庆巴蜀中学高考适应性月考一,4)空气质量指数AQI是反映空气质量状况的指数,AQI越小,表明空气质量越好,如下表:AQI指数值05051100101150151200201300300空气质量优良轻度污染中度污染重度污染严重污染下图是某城市5月1日5月20日AQI指数变化的趋势,则下列说法正确的是()A.这20天中AQI指数值的中位数略高于200B.这20天中的重度污染及以上的天数占110C.该城市5月前半个月的空气质量越来越好D.该城市5月上旬的空气质量比中旬的空气质量好答案D5.(2020届江
24、西抚州临川一中第一次联合考试,7)某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36、36、37、37、40、43、43、44、44,若用样本估计总体,年龄在(x-s,x+s)内的人数占公司人数的百分比是()(其中x是平均数,s为标准差,结果精确到1%)A.14%B.25%C.56%D.67%答案C6.(2019广东江门第一次模拟,7)已知a1,a2,a3,a4,a5成等差数列,且公差是5,则这组数据的标准差为()A.50B.52C.100D.10答案B二、解答题(共15分)7.(2020届四川石室中学高三开学考试,17)某高校在2016年的自
25、主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下.组号分组频数频率第1组160,165)50.050第2组165,170)n0.350第3组170,175)30p第4组175,180)200.200第5组180,185)100.100合计1001.000(1)求频率分布表中n,p的值,补全频率分布直方图,并估计该组数据的中位数(保留1位小数);(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?(3)在(2)的前提下,学校决定从6名学生中随机抽取2名
26、学生接受甲考官的面试,求第4组至少有1名学生被甲考官面试的概率.解析本题考查样本数据的中位数、分层抽样及古典概型的概率计算,属基础题.(1)由频率分布表可知:5+n+30+20+10=100,0.050+0.350+p+0.200+0.100=1.000,n=35,p=0.300,补全频率分布直方图如图.中位数为170+0.10.06171.7,即中位数的估计值为171.7.(2)由题意可知笔试成绩高的第3、4、5组的人数之比为321,现用分层抽样的方法选6名学生,故第3、4、5组每组各抽取学生的人数为3、2、1.(3)由(2)可知第3、4、5组每组各抽取学生的人数为3、2、1,记第3组的3名
27、学生为c1,c2,c3,第4组的2名学生为d1,d2,第5组的1名学生为e,且“第4组至少有1名学生被甲考官面试”为事件A.则所有的基本事件有(c1,c2),(c1,c3),(c1,d1),(c1,d2),(c1,e),(c2,c3),(c2,d1),(c2,d2),(c2,e),(c3,d1),(c3,d2),(c3,e),(d1,d2),(d1,e),(d2,e),共15种.事件A包括:(c1,d1),(c1,d2),(c2,d1),(c2,d2),(c3,d1),(c3,d2),(d1,d2),(d1,e),(d2,e),共9种.P(A)=915=35.故第4组至少有1名学生被甲考官面试的概率为35.