1、第十一章 算法初步、统计、统计案例 第二节 随机抽样最新考纲考情索引核心素养1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单的实际问题.2018全国卷,T142018天津卷,T152017江苏卷,T31.数据分析2.数学运算1简单随机抽样(1)定义:设一个总体含有 N 个个体,从中_地抽取 n 个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都_,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:_和随机数法逐个不放回相等抽签法2系统抽样的步骤假设要从容量为 N
2、的总体中抽取容量为 n 的样本(1)先将总体的 N 个个体_(2)确定_,对编号进行_,当Nn是整数时,取 kNn,当Nn不是整数时,随机从总体中剔除余数,再取 kNn(N为从总体中剔除余数后的总数)编号分段间隔 k分段(3)在第 1 段用_确定第一个个体编号 l(lk)(4)按照一定的规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体编号_,再加 k 得到第 3 个个体编号_,依次进行下去,直到获取整个样本简单随机抽样lkl2k3分层抽样(1)定义:在抽样时,将总体_的层,然后按照_,从各层独立地抽取一定数量的个数,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样(2)应用
3、范围:当总体是由_组成时,往往选用分层抽样分成互不交叉一定的比例差异明显的几个部分1随机数法编号要求:应保证各号数的位数相同,而抽签法则无限制2三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为 n,总体容量为 N,每个个体被抽到的概率是nN.3系统抽样抽取的个体编号从小到大成等差数列1概念思辨判断下列结论的正误(正确的打“”,错误的打“”)(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关()(2)系统抽样在起始部分抽样时采用简单随机抽样()(3)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的
4、样本,需要剔除 2 个学生,这样对被剔除者不公平()(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关()答案:(1)(2)(3)(4)2教材衍化(1)(人 A 必修 3P100A 组 T1 改编)在“世界读书日”前夕,为了了解某地 5 000 名居民某天的阅读时间,从中抽取了 200 名居民的阅读时间进行统计分析在这个问题中,5 000 名居民的阅读时间的全体是()A总体 B个体C样本的容量D从总体中抽取的一个样本(2)(人 A 必修 3P64A 组 T5 改编)一个总体分为 A,B两层,用分层抽样方法从总体中抽取一个容量为 10 的样本已知 B 层中每个个体被抽到的概率都为 112,
5、则总体中的个体数为()A40 B60 C80 D120解析:(1)从 5 000 名居民某天的阅读时间中抽取 200名居民的阅读时间,样本容量是 200,抽取的 200 名居民的阅读时间是一个样本,每名居民的阅读时间就是一个个体,5 000 名居民的阅读时间的全体是总体(2)因为用分层抽样方法从总体中抽取一个容量为 10的样本由 B 层中每个个体被抽到的概率都为 112,知道在抽样过程中每个个体被抽到的概率是 112,所以总体中的个体数为 10/112120.故选 D.答案:(1)A(2)D3典题体验(1)(2019永州模拟)现从已编号(150)的50位同学中随机抽取 5 位以了解他们的数学学
6、习状况,用选取的号码间隔一样的系统抽样方法确定所选取的 5 位同学的编号可能是()A5,10,15,20,25 B3,13,23,33,43C1,2,3,4,5 D2,10,18,26,34(2)(2018全国卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_(3)(2017江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产
7、品中抽取_件解析:(1)抽样间隔为505 10,故选 B.(2)因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样(3)因为样本容量总体个数60200400300100 350,所以应从丙种型号的产品中抽取 35030018(件)答案:(1)B(2)分层抽样(3)18考点 1 简单随机抽样(自主演练)【例 1】下列抽取样本的方式属于简单随机抽样的个数为()盒子里共有 80 个零件,从中选出 5 个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里从 20 件玩具中一次性抽取 3 件进行质量检验某班有 56 名同学,指定个子最高
8、的 5 名同学参加学校组织的篮球赛A0 B1 C2 D3解析:中都不是简单随机抽样,这是因为:是放回抽样,中是“一次性”抽取,而不是“逐个”抽取,中“指定个子最高的 5 名同学”,不存在随机性,不是等可能抽样答案:A【例 2】总体由编号为 01,02,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B07 C02
9、D01解析:由随机数表法的随机抽样的过程可知选出的 5个个体是 08,02,14,07,01,所以第 5 个个体的编号是 01.答案:D【例 3】我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送来米 1 534 石,验得米内夹谷,抽样取米一把,数得 254 粒内夹谷 28 粒,则这批米内夹谷约为()A134 石B169 石C338 石D1 365 石解析:设 1 534 石米内夹谷 x 石,则由题意知x1 53428254,解得 x169.故这批米内夹谷约为 169 石答案:B1简单随机抽样的特点抽取的个体数较少逐个抽取不放回抽取等可能抽取只有四个特点都满足的抽样才是简单随机抽样
10、2抽签法与随机数表法的适用情况抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀一般地,当总体容量和样本容量都较小时可用抽签法考点 2 系统抽样(典例迁移)【例 1】(2019石家庄二中月考)某校为了解 1 000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取 40 名同学进行检查,将学生从 11 000 进行编号,现已知第 18 组抽取的号码为 443,则第一组用简单随机抽样抽取的号码为()A16 B17 C18 D19解析:因为从 1 000 名学生中抽取一个容量为 40 的样本,
11、所以系统抽样的分段间隔为1 00040 25,设第一组随机抽取的号码为 x,则抽取的第 18 组的号码为 x1725443,所以 x18.故选 C.答案:C【例 2】(经典母题)某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查,将 840 人按 1,2,840 随机编号,则抽取的 42 人中,编号落入区间481,720的人数为()A11 B12 C13 D14解析:由84042 20,即每 20 人抽取 1 人,所以抽取编号落入区间481,720的人数为7204802024020 12.答案:B结论迁移 若例 2 中条件不变,若号码“5”被抽到,那么号码“55”_被抽到(填
12、“能”或“不能”)解析:若 55 被抽到,则 55520n,n2.5,n 不是整数故不能被抽到答案:不能结论迁移 若例 2 中条件不变,若在编号为481,720中抽取 8 人,则样本容量为_解析:因为在编号481,720中共有 720480240 人,又在481,720中抽取 8 人,所以抽样比应为 2408301,又因为单位职工共有840 人,所以应抽取的样本容量为84030 28.答案:281如果总体容量 N 能被样本容量 n 整除,则抽样间隔为 kNn,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样,特别注意,每个个体被抽到的机会均是nN.2系统抽样中依次抽取的样本对应的号码就
13、是一个等差数列,首项就是第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码变式训练采用系统抽样方法从 1 000 人中抽取 50 人做问卷调查,将他们随机编号 1,2,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为 8.若抽到的 50人中,编号落入区间1,400的人做问卷 A,编号落入区间401,750的人做问卷 B,其余的人做问卷 C,则抽到的人中,做问卷 C 的人数为()A12 B13 C14 D15解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为 8,公差 d1 00050 20 的等差数列an,所以通项
14、公式 an820(n1)20n12,令 75120n121 000,得76320 n2535,又因为 nN*,所以 39n50,所以做问卷 C 的共有 12 人,故选 A.答案:A考点 3 分层抽样(讲练互动)【例 1】(2019安徽安庆一中、山西太原五中等五省六校K12 联盟联考)某中学有高中生 960 人,初中生 480 人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为 n 的样本,其中高中生有24 人,那么 n 等于 ()A12 B18 C24 D36解析:根据分层抽样方法知n960480 24960,解得 n36.答案:D【例 2】(2019南昌一模)某校为了解学
15、生学习的情况,采用分层抽样的方法从高一 1 000 人、高二 1 200 人、高三 n 人中,抽取 81 人进行问卷调查已知高二被抽取的人数为 30,那么 n()A860 B720 C1 020 D1 040解 析:由 分 层 抽 样 的 特 点 可 得301 200 811 0001 200n,解得 n1 040,故选 D.答案:D进行分层抽样的相关计算时,常用到的两种关系1.样本容量n总体的个数N该层抽取的个体数该层的个体总数.2总体中某两层的个体数之比等于样本中这两层抽取的个体数之比变式训练1某校高中生共有 900 人,其中高一年级 300 人,高二年级 200 人,高三年级 400 人
16、,现分层抽取容量为45 的样本,那么高一、高二、高三年级抽取的人数分别为()A15,10,20 B10,5,30C15,15,15 D15,5,25解析:三个年级抽取的人数分别为3009004515,2009004510,4009004520.故选 A.答案:A2某企业三月中旬生产 A、B、C 三种产品共 3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1 300样本容量(件)130由于不小心,表格中 A、C 产品的有关数据已被污染看不清楚,统计员记得 A 产品的样本容量比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是_件解析:设样本容量为 x,则x3 0001 300130,所以 x300.所以 A 产品和 C 产品在样本中共有 300130170(件)设 C 产品的样本容量为 y,则 yy10170,所以 y80.所以 C 产品的数量为3 000300 80800(件)答案:800