1、第二节随机抽样命题分析预测学科核心素养对于随机抽样,主要考查三种抽样方法,尤其是分层抽样和系统抽样,一般以选择题和填空题的形式出现本节通过三种抽样方法,考查考生的数据分析、逻辑推理核心素养授课提示:对应学生用书第237页知识点一简单随机抽样、分层抽样1简单随机抽样(1)抽取方式:逐个不放回抽取;(2)每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法2分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时,往往选用分层抽样
2、温馨提醒 1分层抽样中,易忽视每层抽取的个体的比例是相同的,即2不论哪种抽样方法,总体中的每一个个体入样的概率是相同的1一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A2B3C5 D13解析:202答案:A2利用简单随机抽样,从n个个体中抽取一个容量为10的样本若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为()A BC D解析:根据题意,解得n28故每个个体被抽到的概率为答案:C3(2021东
3、北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为357,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n()A54 B90C45 D126解析:依题意得n18,解得n90,即样本容量为90答案:B知识点二系统抽样系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段当(n是样本容量)是整数时,取k;(3)在第1段用简单随机抽样确定第一个个体编号l(lk);(4)按照一定的规则抽取样本通常是将l加上间隔k得到第2个个体编号(lk),再加k得到第3个个体编号(l2k),依次进行下去,直到获取整
4、个样本 温馨提醒 系统抽样中,易忽视抽取的样本数也就是分段的段数,当不是整数时,注意剔除,剔除的个体是随机的,各段入样的个体编号成等差数列1在一次游戏中,获奖者可以得到5件不同的奖品,这些奖品要从由150编号的50种不同奖品中随机抽取确定,用系统抽样的方法为某位获奖者确定5件奖品的编号可以为()A5,15,25,35,45 B1,3,5,7,9C11,22,33,44,50 D12,15,19,23,28解析:150编号依次分成5组,在第一组随机抽取一个号码,其他组依次加10即可,选项A符合要求答案:A2(易错题)某次考试结束后,从考号为11 000的1 000份试卷中,采用系统抽样法抽取50
5、份试卷进行试评,则在考号区间850,949之中被抽到的试卷份数()A一定是5 B可能是4C可能是10 D不能具体确定解析:样本间隔为1 0005020,考号在区间850,949的个数为9498501100,100205,所以在考号区间850,949之中被抽到的试卷份数一定是5答案:A授课提示:对应学生用书第238页题型一简单随机抽样1下列抽样试验中,适合用抽签法的有()A从某厂生产的5 000件产品中抽取600件进行质量检验B从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D从某厂生产的5 000件产品中抽取10件进行质量
6、检验解析:A,D中的总体中个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法答案:B2总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A08B07C02 D01解析:由题意知前5个个体的编号为08,02,14,07,01答案:D3“七乐彩”的中奖号码是从分别标有1,2,30的30个小球中逐个不放回地摇出7个
7、小球来按规则确定中奖情况,这种从30个号码中选7个号码的抽样方法是()A系统抽样法 B抽签法C随机数法 D其他抽样方法解析:30个小球相当于号签,搅拌均匀后逐个不放回地抽取,是典型的抽签法答案:B简单随机抽样的特点(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取只有四个特点都满足的抽样才是简单随机抽样题型二系统抽样 1(2019高考全国卷)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验若46号学生被抽到,则下面4名学生中被抽到的是()A8号学生B200号学生C616号学生 D
8、815号学生解析:根据题意,系统抽样是等距抽样,所以抽样间隔为10因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616答案:C2(2020贵州凯里一中检测)利用系统抽样法从编号分别为1,2,3,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽的产品的最大编号为()A73 B78C77 D76解析:样本的分段间隔为5,所以13号在第三组,则最大的编号为13(163)578答案:B3从编号为1,2,59,60的60个产品中,用系统抽样的方法抽取一个样本,已知样本中最大的两个编号为51,57,则第一个入样的编号为_解析:由最大的两
9、个编号为51,57,知分段间隔为57516,即共抽取了10个产品,设第一个入样的编号为x,则x(101)657,解得x3答案:3题型三分层抽样例(1)(2021河南名校联考)九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何”其意为:今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱,则丙应出钱(所得结果四舍五入,保留整数)(2)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)篮球组书画组乐器组高一4530a高二15
10、1020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为_解析(1)按照钱的多少按比例出钱,所以丙应该出钱为10017(2)由分层抽样得,解得a30答案(1)17(2)30分层抽样中的计算问题分层抽样满足“”,即“或n1n2nN1N2N”,据此在已知每层间的个体数量或数量比、样本容量、总体数量中的两个时,就可以求出第三个题组突破1某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 8
11、00青年教师1 600合计4 300A90B100C180 D300解析:设该样本中的老年教师人数为x,由题意及分层抽样的特点得,故x180答案:C2甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件解析:由题设,抽样比为设甲设备生产的产品为x件,则50,所以x3 000故乙设备生产的产品总数为4 8003 0001 800答案:1 800抽样方法中的核心素养数据分析、数学运算分层抽样的创新应用例(2021湖南四校摸底调研)某家电公司销售部门共有200名销售员,每年部门对每名销售员
12、都有1 400万元的年度销售任务已知这200名销售员去年的销售额都在区间2,22(单位:百万元)内,现将其分成5组,第1组、第2组、第3组、第4组、第5组对应的区间分别为2,6),6,10),10,14),14,18),18,22,并绘制出如下的频率分布直方图(1)求a的值,并计算完成年度任务的人数;(2)用分层抽样的方法从这200名销售员中抽取容量为25的样本,求这5组分别应抽取的人数;(3)现从(2)中完成年度任务的销售员中随机选取2名,奖励海南三亚三日游,求获得此奖励的2名销售员在同一组的概率解析(1)(0020080092a)41,a003,完成年度任务的人数为2003420048(2
13、)第1组应抽取的人数为0024252,第2组应抽取的人数为0084258,第3组应抽取的人数为0094259,第4组应抽取的人数为0034253,第5组应抽取的人数为0034253,(3)在(2)中完成年度任务的销售员中,第4组有3人,记这3人分别为A1,A2,A3;第5组有3人,记这3人分别为B1,B2,B3从这6人中随机选取2名,所有的基本事件为A1A2,A1A3,A1B1,A1B2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3,共有15个基本事件,获得此奖励的2名销售员在同一组所包含的基本事件有6个,故所求概率P解决分层抽样
14、与样本数据分析问题的注意点(1)弄清分层抽样问题中每层的数据(2)求解概率时注意概率类型的判断对点训练(2021重庆九校联盟模拟)某社区为了解该社区退休老人每天的平均户外活动时间,从该社会退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:时),活动时间按照0,05),05,1),4,45分成9组,制成样本的频率分布直方图如图所示(1)求图中a的值;(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;(3)在1,15),15,2)这两组中采用分层抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率解析:(1)由频率分布直方图,可知
15、平均户外活动时间在0,05)内的频率为00805004同理,平均户外活动时间在05,1),15,2),2,25),3,35),35,4),4,45内的频率分别为008,020,025,007,004,002,由1(004008020025007004002)05a05a,解得a030(2)设中位数为m时因为前5组的频率之和为00400801502002507205,而前4组的频率之和为00400801502004705,所以2m25所以050(m2)05047,解得m206故可估计该社区退休老人每人每天的平均户外活动时间的中位数为206时(3)由题意得平均户外活动时间在1,15),15,2)内的人数分别为15,20,按分层抽样的方法在1,15),15,2)内分别抽取3人、4人,再从7人中随机抽取2人,共有21种方法,抽取的两人恰好都在同一个组有9种方法,故抽取的2人恰好在同一个组的概率P