1、1抽样调查(1)抽样调查通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查(2)总体和样本调查对象的全体称为总体,被抽取的一部分称为样本(3)抽样调查与普查相比有很多优点,最突出的有两点:迅速、及时;节约人力、物力和财力2简单随机抽样(1)简单随机抽样时,要保证每个个体被抽到的概率相同(2)通常采用的简单随机抽样的方法:抽签法和随机数法3分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本这种抽样方法通常叫作分层抽样,有时也称为类型抽样(2)分层抽样的应用范围
2、:当总体是由差异明显的几个部分组成时,往往选用分层抽样4系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本这种抽样方法有时也叫等距抽样或机械抽样【思考辨析】判断下列结论是否正确(请在括号中打“”或“”)(1)简单随机抽样是一种不放回抽样()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关()(3)抽签法中,先抽的人抽中的可能性大()(4)系统抽样在第1段抽样时采用简单随机抽样()(5)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()(6)分层抽
3、样中,每个个体被抽到的可能性与层数及分层有关()1(教材改编)某公司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A33,34,33 B25,56,19C20,40,30 D30,50,20答案B解析因为12528095255619,所以抽取人数分别为25,56,19.2(2015四川)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法 B系统抽样法C分层抽样
4、法 D随机数法答案C解析根据年级不同产生差异及按人数比例抽取易知应为分层抽样法3(1)某学校为了了解2016年高考数学学科的考试成绩,在高考后对1 200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本(2)从10名家长中抽取3名参加座谈会.简单随机抽样法.系统抽样法.分层抽样法问题与方法配对正确的是()A(1),(2) B(1),(2)C(1),(2) D(1),(2)答案A解析通过分析可知,对于(1),应采用分层抽样法,对于(2),应采用简单随机抽样法4某工厂平均每天生产某种机器零件大约10 000件,要求产品检验员每天抽
5、取50件零件,检查其质量状况,采用系统抽样方法抽取,若抽取的第一组中的号码为0010,则第三组抽取的号码为_答案0410解析分段间隔数为200,则第三组抽取的号码为001022000410.5某学校高一,高二,高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生答案15解析设应从高二年级抽取x名学生,则x50310,解得x15.题型一简单随机抽样例1(1)以下抽样方法是简单随机抽样的是()A在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B某车间包装一种产品,在自
6、动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D用抽签方法从10件产品中选取3件进行质量检验(2)总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B07 C02 D01答案(1)D(2)D解析(1)选项A、B不是简单随机抽
7、样,因为抽取的个体间的间隔是固定的;选项C不是简单随机抽样,因为总体的个体有明显的层次;选项D是简单随机抽样(2)由题意知前5个个体的编号为08,02,14,07,01.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀一般地,当总体容量和样本容量都较小时可用抽签法(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去(1)下列抽样试验中,适合用抽签法的有()A从某厂生产的5 000件产品中抽取600件进行质量检验B从
8、某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D从某厂生产的5 000件产品中抽取10件进行质量检验(2)下列抽取样本的方式不属于简单随机抽样的有_从无限多个个体中抽取100个个体作为样本盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里从20件玩具中一次性抽取3件进行质量检验某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛答案(1)B(2)解析(1)A,D中的总体个体数较多,不适宜抽签法,C中甲、乙两厂的产品质量有区别,也不适宜抽签法,故选B.(
9、2)不是简单随机抽样不是简单随机抽样由于它是放回抽样不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取不是简单随机抽样因为指定个子最高的5名同学是56名中特指的,不存在随机性,不是等可能抽样题型二系统抽样例2(1)(2015湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是()A3 B4 C5 D6(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人
10、数为()A11 B12 C13 D14答案(1)B(2)B解析(1)由题意知,将135号分成7组,每组5名运动员,成绩落在区间139,151的运动员共有4组,故由系统抽样法知,共抽取4名故选B.(2)由20,即每20人抽取1人,所以抽取编号落在区间481,720的人数为12.引申探究1本例(2)中条件不变,若第三组抽得的号码为44,则在第八组中抽得的号码是_答案144解析在第八组中抽得的号码为(83)2044144.2本例(2)中条件不变,若在编号为481,720中抽取8人,则样本容量为_答案28解析因为在编号481,720中共有720480240(人),又在481,720中抽取8人,所以抽样
11、比应为2408301,又因为单位职工共有840人,所以应抽取的样本容量为28.思维升华(1)系统抽样适用的条件是总体容量较大,样本容量也较大(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定(1)(2016马鞍山模拟)高三(1)班有学生52人,现将所有学生随机编号,用系统抽样方法,抽取一个容量为4的样本,已知5号、31号、44号学生在样本中,则样本中还有一个学生的编号是()A8 B13 C15 D18(2)(2016烟台模拟)采用系统抽样方法从960人中抽取32人
12、做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A7 B9 C10 D15答案(1)D(2)C解析(1)分段间隔为13,故还有一个学生的编号为51318,故选D.(2)由系统抽样的特点知:抽取号码的间隔为30,抽取的号码依次为9,39,69,939.落入区间451,750的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729459(n1)30,解得n10.所以
13、做问卷B的有10人题型三分层抽样命题点1求总体或样本容量例3(1)(2016东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为357,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n等于()A54 B90 C45 D126(2)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为_件答案(1)B(2)1 800解析(1)依题意得n18,解得n90,即样本容量为90.(2)分层抽样中各层的抽样比相同样本中甲设备生产的产品有50件,则乙设备生产的产品有
14、30件在4 800件产品中,甲、乙设备生产的产品总数比为53,所以乙设备生产的产品的总数为1 800件命题点2求某层入样的个体数例4(1)(2015北京)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()类别人数老年教师900中年教师1 800青年教师1 600合计4 300A.90 B100 C180 D300(2)(2015福建)某校高一年级有900名学生,其中女生400名按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_答案(1)C(2)25解析(1)由题意
15、抽样比为,该样本中的老年教师人数为900180.(2)由题意知,男生共有500名,根据分层抽样的特点,在容量为45的样本中男生应抽取的人数为4525.思维升华分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况(1)已知某地区中小学生人数和近视情况分别如图和图所示为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为_(2)某公司共有1 000名员工,下设若干部
16、门,现采用分层抽样方法,从全体员工中抽取一个样本容量为80的样本,已告知广告部门被抽取了4个员工,则广告部门的员工人数为_答案(1)200,20(2)50解析(1)该地区中小学生总人数为3 5002 0004 50010 000,则样本容量为10 0002%200,其中抽取的高中生近视人数为2 0002%50%20.(2)设广告部门的员工人数为x,则由分层抽样,得,解得x50.五审图表找规律典例(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共计老年40404080200中年80120160240600青年401
17、602807201 200共计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况(观察图表中的人数分类统计情况)样本人群应受年龄影响(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样要开一个25人的座谈会(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样要
18、抽20人调查对广州亚运会举办情况的了解(可认为亚运会是大众体育盛会,一个单位人员对情况了解相当)将单位人员看作一个整体(从表中数据看总人数为2 000)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层,用分层抽样法抽取,1分抽取比例为.2分故老年人、中年人、青年人各抽取4人、12人、24人4分(2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,5分抽取比例为,6分故管理、技术开发、营销、生产各部门抽取2人、4人、6人、13人8分(3)用系统抽样,对全部2 000人随机编号,号码从00012000,每100号分为一组,从第一组中用简单随机抽样抽取一个号码,然后将这个号码分别加
19、100,200,1 900,共20人组成一个样本12分1某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于()A9 B10 C12 D13答案D解析,n13.2(2017榆林质检)打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体抽取一个13张的样本这种抽样方法是()A系统抽样 B分层抽样C简单随机抽样 D非以上三种抽样方法答案A解析符合系统抽样的特点,故选A.3对一个容量为N的总体抽取容
20、量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()Ap1p2p3 Bp2p3p1Cp1p3p2 Dp1p2p3答案D解析由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1p2p3.4(2016湖南衡阳联考)用系统抽样法从160名学生中抽取容量为20的样本,将160名学生随机地从1160进行编号,并按编号顺序平均分成20组(18号,916号,153160号),若按等距的规则从第16组抽出的号码为126,则第1组中用抽签法确定的号码是()A6 B7 C5 D4答案A解析第1组中用抽签法确定的号码是12615
21、86.5某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270,使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,2505,9,100,107,111,121,180,195,200,26511,38,65,92,119,146,173,200,227,25430,57,84,111,138,16
22、5,192,219,246,270关于上述样本的下列结论中,正确的是()A、都不能为系统抽样 B、都不能为分层抽样C、都可能为系统抽样 D、都可能为分层抽样答案D解析因为可以为系统抽样,所以选项A不对;因为可以为分层抽样,所以选项B不对;因为不为系统抽样,所以选项C不对,故选D.6将参加夏令营的600名学生编号为001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为()A26,16,8 B25,17,8C25,16,9 D2
23、4,17,9答案B解析由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN)组抽中的号码是312(k1)令312(k1)300,得k,因此第营区被抽中的人数是25;令300312(k1)495得k42,因此第营区被抽中的人数是422517.故选B.7(2016山西大同一中月考)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A., B.,C., D.,答案A解析在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的
24、可能性与“第二次被抽到”的可能性均为,故选A.8(2016天津质检)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_名学生答案60解析设应从一年级本科生中抽取x名学生,则,解得x60.9(2017潍坊质量预测)某高中在校学生有2 000人为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:高一年级高二年级高三年级跑步Abc登山Xyz其中abc
25、235,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级参与跑步的学生中应抽取的人数为_答案36解析根据题意,可知样本中参与跑步的人数为200120,所以从高二年级参与跑步的学生中应抽取的人数为12036.10一个总体中有90个个体,随机编号0,1,2,89,以从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同,若m8,则在第8组中抽取的号码是_答案76解析由题意知m8,k8,则mk16,也就
26、是第8组抽取的号码个位数字为6,十位数字为817,故抽取的号码为76.11200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1200编号,分为40组,分别为15,610,196200,第5组抽取号码为22,第8组抽取号码为_若采用分层抽样,40岁以下年龄段应抽取_人答案3720解析将1200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为223537;由已知条件200名职工中40岁以下的职工人数为20050%100,设在40岁以下年龄段中应抽取x人,则,解得x20.12某校共有学生2 000名,各年级男、女学生人数如下表已知在全校
27、学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为_.一年级二年级三年级女生373xy男生377370z答案16解析依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000373377380370500,即总体中各个年级的人数比为332,故用分层抽样法应在三年级抽取的学生人数为6416.13某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求
28、n.解总体容量为6121836.当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为6,技术员人数为12,技工人数为18,所以n应是6的倍数,36的约数,即n6,12,18.当样本容量为(n1)时,总体容量是35人,系统抽样的间隔为,因为必须是整数,所以n只能取6.即样本容量n6.14.某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下3550岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在3550岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求
29、至少有1人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,50岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x,y的值解(1)用分层抽样的方法在3550岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,解得m3.抽取的样本中有研究生2人,本科生3人,分别记作S1,S2;B1,B2,B3.从中任取2人的所有等可能基本事件共有10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),从中任取2人,至少有1人学历为研究生的概率为.(2)由题意,得,解得N78,3550岁中被抽取的人数为78481020, 解得x40,y5,即x,y的值分别为40,5.