1、11.4抽样方法与总体分布的估计基础篇【基础集训】考点一随机抽样1.在简单随机抽样中,某一个个体被抽到的可能性()A.与第n次有关,第一次可能性最大B.与第n次有关,第一次可能性最小C.与第n次无关,与抽取的第几个样本有关D.与第n次无关,每次可能性相等答案D2.某单位员工按年龄分为A,B,C三组,其人数之比为541,现用分层抽样的方法从总体中抽取一个容量为20的样本,已知C组中甲、乙二人均被抽到的概率是145,则该单位员工总数为()A.110B.100C.900D.800答案B3.福利彩票“双色球”中红球的号码可以从01,02,03,32,33这33个两位号码中选取,小明利用如下所示的随机数
2、表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据(相同号码数只算一次),则第四个被选中的红色球的号码为()81472368639317901269868162935060913375856139850632359246225410027849821886704805468815192049A.12B.33C.06D.16答案C4.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案10考点二用样本估计总体5.(多选题)“科技引领,
3、布局未来”科技研发是企业发展的驱动力量.20072018年,某企业连续12年累计研发投入达4100亿元,我们将研发投入与经营投入的比值记为研发投入占营收比,这12年间的研发投入(单位:十亿元)用图中的条形图表示,研发投入占营收比用图中的折线图表示.根据折线图和条形图,下列结论正确的有()A.2012年至2013年研发投入占营收比增量相比2017年至2018年研发投入占营收比增量大B.2013年至2014年研发投入增量相比2015年至2016年研发投入增量小C.该企业连续12年来研发投入逐年增加D.该企业连续12年来研发投入占营收比逐年增加答案ABC6.甲、乙两组数据如茎叶图所示,则甲、乙两组数
4、据的平均数、方差、极差及中位数相同的是()A.极差B.方差C.平均数D.中位数答案C7.为比较甲、乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:)制成如图所示的茎叶图,已知甲地该月5天11时的平均气温比乙地该月5天11时的平均气温高1,则甲地该月5天11时的气温数据的标准差为()甲乙9826892m0311A.2B.2C.10D.10答案B8.某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量指标值大于或等于100的产品为优质产品.现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值(都在区间90,11
5、0内),将这些数据分成4组:90,95),95,100),100,105),105,110,得到如下两幅频率分布直方图:已知这两种配方生产的产品利润y(单位:百元)与其质量指标值t的关系式为y=-1,t95,0,95t100,1,100t105,2,t105.若以上面数据的频率作为概率,分别从用A配方和B配方生产的产品中随机抽取一件,且抽取这两件产品相互独立,则抽得的这两件产品利润之和为0的概率为()A.0.125B.0.195C.0.215D.0.235答案B9.某高二(1)班一次阶段性考试数学成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息,可确定被抽测的人数及分数在90,100内
6、的人数分别为()A.20,2B.24,4C.25,2D.25,4答案C10.若数据x1,x2,x3,xn的平均数x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,3xn+1的平均数和方差分别为()A.5,2B.16,2C.16,18D.16,9答案C教师专用题组【基础集训】考点一随机抽样1.(2020云南名校10月高考适应性月考,3)某学校为了解1000名新生的近视情况,将这些学生编号为000,001,002,999,从这些新生中用系统抽样的方法抽取100名学生进行检查,若036号学生被抽到,则下面4名学生中被抽到的是()A.008号学生B.200号学生C.616号学生D.815
7、号学生答案C由题意得抽样间隔为1000100=10,因为036号学生被抽到,所以被抽中的初始编号为006号,之后被抽到的编号均是10的整数倍与6的和,故选C.2.(2019河南新乡模拟,4)某机构对青年观众是否喜欢跨年晚会进行了调查,人数如下表所示:不喜欢喜欢男性青年观众3010女性青年观众3050现要在所有参与调查的人中用分层抽样的方法抽取n人做进一步的调研,若在“不喜欢”的男性青年观众中抽取了6人,则n=()A.12B.16C.24D.32答案C由分层抽样的性质得630=n30+30+10+50,解得n=24.故选C.3.利用系统抽样法从编号分别为1,2,3,80的80件不同产品中抽取一个
8、容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为()A.73B.78C.77D.76答案B样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)5=78.(类似于等差数列中的第16项的求法)考点二用样本估计总体1.(2020四川双流中学10月月考,4)一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在20,60)上的频率为0.8,则估计样本40,60)内的数据个数为()分组10,20)20,30)30,40)频数345A.14B.15C.16D.17答案B本题考查频数的求法,涉及频率分布表等基础知识,考查推理论证
9、能力、运算求解能力,考查化归与转化思想,函数与方程思想,属于基础题.由于一个频数分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在20,60)上的频率为0.8,所以样本中数据在20,60)上的频数为300.8=24,故估计样本在40,60)内的数据个数为24-4-5=15.故选B.2.(2018河北承德期末,3)某城市收集并整理了该市2017年1月份至10月份各月最低气温与最高气温(单位:)的数据,绘制了下面的折线图.已知该城市各月的最低气温与最高气温具有较好的线性关系,根据折线图,下列结论错误的是()A.最低气温与最高气温为正相关B.10月的最高气温不低于5月的最高气温C.月温
10、差(最高气温减最低气温)的最大值出现在1月D.最低气温低于0的月份有4个答案D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0的月份有3个,故D错误.故选D.3.(2018安徽马鞍山第一次教学质量检测,13)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的13,则该组的频数为.答案50解析设除中间一个小矩形外的(n-1)个小矩形面积的和为S,则中间一个小矩形面积为13S,S+13S=
11、1,解得S=34,中间一个小矩形的面积等于13S=14,故该组的频数为20014=50.4.(2020河南洛阳尖子生第一次联合考试,13)已知样本x1,x2,x2019的平均数和方差分别是1和4,若yi=axi+b(i=1,2,2019)的平均数和方差也是1和4,则ab=.答案1解析因为x1,x2,x2019的平均数为1,所以yi=axi+b(i=1,2,2019)的平均数为a1+b=1.因为x1,x2,x2019的方差为4,所以yi=axi+b(i=1,2,2019)的方差为4a2=4.所以a2=1,a+b=1,解得a=1,b=0或a=-1,b=2,所以ab=1.导师点睛本题考查平均数与方差
12、的线性变换,难度一般.已知x1,x2,xn的平均数与方差为A与B,那么yi=axi+b(i=1,2,n)的平均数与方差为aA+b与a2B.综合篇【综合集训】考法一频率分布直方图的应用1.(2020福建毕业班质量检查测试)某市为了解居民用水情况,通过抽样得到部分家庭月均用水量的数据,制出频率分布直方图(如图).若以频率代替概率,从该市随机抽取5个家庭,则月均用水量在812吨的家庭个数X的数学期望为()A.3.6B.3C.1.6D.1.5答案B2.(2020广东广州阶段训练)某企业质量检验员为了检测生产线上零件的情况,从生产线上随机抽取了80个零件进行测量,根据所测量的零件尺寸(单位:mm),得到
13、如下的频率分布直方图.(1)根据频率分布直方图,求这80个零件尺寸的中位数(结果精确到0.01);(2)已知尺寸在63.0,64.5)内的零件为一等品,否则为二等品,将这80个零件尺寸的样本频率视为概率,从生产线上随机抽取1个零件,试估计所抽取的零件是二等品的概率.3.(2019安徽六安第二中学联考,19)每年5月到7月是芒果的成熟季节.某大学校内种植了很多食用芒果树.据该校后勤处负责人介绍,他们校内的芒果种植过程中没有使用过农药,也没有路边那种绿化芒的污染,可以放心食用.2018年该校的芒果也迎来了大丰收.6月25日,该校南北校区集中采摘芒果,并将采摘到的芒果免费派送给学校师生.现随机从一些
14、芒果树上摘下100个芒果,其质量分布在100,150),150,200),200,250),250,300),300,350),350,400)(单位:克)内,经统计得频率分布直方图如图所示.(1)现按分层抽样从质量在250,300),300,350)内的芒果中随机抽取9个,再从这9个中随机抽取3个,记随机变量X表示质量在300,350)内的芒果个数,求X的分布列及数学期望;(2)以各组数据的中间数代表这组数据的平均值,将频率视为概率,假如你是经销商去收购芒果,该校当时还未摘下的芒果大约还有10000个,现提供如下两种收购方案:A:所有芒果以10元/千克收购;B:对质量低于250克的芒果以2元
15、/个收购,高于或等于250克的以3元/个收购.通过计算确定你会选择哪种方案.4.(2020山东潍坊临朐综合模拟,20)“过元宵节,吃元宵”是我国过元宵节的一大习俗.2019年元宵节前夕,北方一城市某质检部门随机抽取了100包某种品牌的元宵,检测其某项质量指标值,所得频率分布直方图如下:(1)求所抽取的100包元宵该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,元宵的该项质量指标值Z服从正态分布N(,2),利用该正态分布求Z落在(14.55,38.45内的概率;将频率视为概率,若某人从某超市购买了4包这种品牌的元宵,记这4包元宵中这种质量指标值位于(
16、10,30)内的包数为X,求X的分布列和均值.附:计算得所抽查的这100包元宵的质量指标值的标准差11.95;若N(,2),则P(-+)=0.6826,P(-2+2)=0.9544.考法二样本的数字特征及其应用5.(2019上海浦东期中教学质量检测(二模),10)已知6个正整数,它们的平均数是5,中位数是4,唯一众数是3,则这6个数方差的最大值为.(精确到小数点后一位)答案12.36.(2020河北邯郸空中课堂备考检测)某小型水库的管理部门为研究库区水量的变化情况,决定安排两个小组在同一年中各自进行观察研究.其中一个小组研究水源涵养情况,他们通过观察入库的若干小溪和降雨量等因素,随机记录了10
17、0天的日入库水量数据(单位:千立方米),得到下面的条形图(如图甲),另一小组研究由于放水、蒸发或渗漏造成的水量消失情况,他们通过观察与水库相连的特殊小泥塘的水面下降情况来研究库区水的整体消失量,随机记录了100天的库区日消失水量数据(单位:千立方米),并将观测数据整理成频率分布直方图(如图乙).图甲图乙(1)据此估计这一年中日消失水量的平均值;(2)以频率作为概率,试解决如下问题:分别估计日流入水量不少于20千立方米和日消失水量不多于20千立方米的概率;试估计经过一年后,该水库的水量是增加了还是减少了,变化的量是多少?(一年按365天计算)教师专用题组【综合集训】考法一频率分布直方图的应用1.
18、(2018陕西榆林第二中学模拟,13)某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在30,40)的同学比支出的钱数在10,20)的同学多26人,则n的值为.答案100解析由频率分布直方图可得支出的钱数在30,40)的同学有0.03810n=0.38n个,支出的钱数在10,20)的同学有0.01210n=0.12n个,又支出的钱数在30,40)的同学比支出的钱数在10,20)的同学多26人,所以0.38n-0.12n=0.26n=26,n=100.2.(2018江西新余二模,18)“一带一路”是“丝绸之路经济带”和“21世纪海上
19、丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:20,25),第二组:25,30),第三组:30,35),第四组:35,40),第五组:40,45),得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户,五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为15组,从这5个按年龄分的组和5个按职业分的组中每组
20、各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中15组的成绩分别为93,96,97,94,90,职业组中15组的成绩分别为93,98,94,95,90.(i)分别求5个年龄组和5个职业组成绩的平均数和方差;(ii)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解析(1)根据频率分布直方图得第一组的频率为0.015=0.05,6x=0.05,x=120.(2)设中位数为a,则0.015+0.075+(a-30)0.06=0.5,a=95332,则中位数为32.(3)(i)5个年龄组成绩的平均数为x1=15(93+96+97+94+90)=94,方差为
21、s12=15(-1)2+22+32+02+(-4)2=6.5个职业组成绩的平均数为x2=15(93+98+94+95+90)=94,方差为s22=15(-1)2+42+02+12+(-4)2=6.8.(ii)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定.(感想合理即可)考法二样本的数字特征及其应用1. (2017广东广雅中学、江西南昌二中联考,4)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段性考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是()甲组乙组87964883n85m29225A.10B.1
22、1C.12D.13答案C甲组学生成绩的平均数是88,由茎叶图可知78+86+84+88+95+90+m+92=887,m=3,乙组学生成绩的中位数是89,n=9,m+n=12.故选C.2.(2018湖南衡阳二模,4)已知样本x1,x2,xn的平均数为x,样本y1,y2,ym的平均数为y(xy),若样本x1,x2,xn,y1,y2,ym的平均数z=ax+(1-a)y,其中0a12,则n,m(n,mN*)的大小关系为()A.n=mB.nmC.nm答案C由题意得z=1n+m(nx+my)=nn+mx+1-nn+my,a=nn+m,0a12,0nn+m12,又n,mN*,2nn+m,nm.故选C.3.
23、(2018山东济南一模,3)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s22C.x4,s24,s22答案A某7个数的平均数为4,这7个数的和为47=28.加入一个新数据4,x=28+48=4.又这7个数的方差为2,且加入一个新数据4,这8个数的方差s2=72+(4-4)28=742,故选A.4.(2018河北石家庄教学质量检测(二),9)某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.B.C.D.答案AA班兴趣小组的平均成绩为53+62+64+92+9515=78,其方差为115(53-78)2+(62-78)2+(95-78)2=121.6,则其标准差为121.611.03;B班兴趣小组的平均成绩为45+48+51+9115=66,其方差为115(45-66)2+(48-66)2+(91-66)2=175.2,则其标准差为175.213.23.故选A.