1、第一节 抽样方法基础梳理1.简单随机抽样(1)定义:一般地,从个体数为N的总体中 取出n个个体作为样本(nN),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样;(2)最常用的简单随机抽样的方法:和 .2.系统抽样(1)定义:将总体 分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样.逐个不放回地抽签法随机数表法平均(2)假设要从容量为N的总体中抽取容量为n的样本,系统抽样的步骤为:采用随机的方式将总体中的N个个体 ;将编号按 分段,当Nn是整数时,取k=Nn;当Nn不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N能被
2、n整除,这时取k=Nn,并将剩下的总体重新编号;在第一段中用 确定起始的个体编号l;按照一定的规则抽取样本,通常将编号为 的个体抽出.编号间隔k 简单随机抽样l,l+k,l+2k,l+(n-1)k 3.分层抽样(1)定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样.(2)应用范围:当总体是由 组成时,往往选用分层抽样.4.三种抽样方法比较 差异明显的几个部分类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中每个个体被抽到的可能
3、性相同 从总体中 抽取 总体中的个体个数较少 系统抽样 将总体 分成几部分,按一定的规则分别在各部分中抽取 在起始部分抽样时,采用 抽样 总体中的个体个数较多 分层抽样 将总体分成几层,按各层个体数之比分层进行抽取 各层抽样时采用 抽样或系统抽样 总体由差异明显的几部分组成 逐个平均简单随机简单随机典例分析题型一 简单随机抽样【例1】某车间工人加工一种轴100件,为了解这种轴的直径,要从中抽取10件在同一条件下测量,请设计一种抽样方案.分析 考虑到总体中个体数较少,利用抽签法或随机数表法可容易获取样本,须按这两种抽样方法的操作步骤进行.解 方法一(抽签法):将100件轴编号为1,2,,100,
4、并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,与这10个号签号码相同的轴的直径即为所要抽取的样本.方法二(随机数表法):将100件轴编号为00,01,,99,在随机数表(见教材附表)中选定一个起始位置,如从第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10个号码对应的轴的直径即为所要抽取的样本.学后反思 (1)一个抽样试验能否用抽签法,关键要看:制签是否方便;号签是否容易被搅匀.一般地,总体容量和样本容量都较小时,可用抽签法.(2)随机数表法的步骤:将总体中的个体编号(每个号码位数一
5、致);在随机数表中任选一个数作为开始;从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;根据选定的号码抽取样本.1.某大学为了支援我国西部教育事业,决定从2009年应届毕业生报名的1 800名志愿者中,选取6人组成志愿小组,请用抽签法或随机数表法设计抽样方案.举一反三解析:因为总体数较大,若选用抽签法制号签太麻烦,故可选用随机数表法.第一步,先将1 800名志愿者编号,可以编为0 001,0 002,0 003,1 800;第二步,在随机数表中任选一个数,如第2行第5列的数2;第三步,从选定的数开始向右读,
6、依次可得0 736,0 751,0 732,1 355,1 410,1 256为样本的6个号码,这样我们就得到了一个容量为6的样本.题型二 系统抽样【例2】从某厂生产的905辆家用轿车中随机抽取90辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程.分析 由于总体容量较大,因此,采用系统抽样法进行抽样.又因总体容量不能被样本容量整除,需先剔除5辆家用轿车,使得总体容量能被样本容量整除,取k=10.然后利用系统抽样的方法进行抽样.90900解 可用系统抽样法进行抽样,抽样步骤如下:第一步,将905辆轿车用随机方式编号;第二步,从总体中剔除5辆(剔除法可用随机数表法),将剩下的900辆轿车
7、重新编号(分别为001,002,900)并分成90段;第三步,在第一段001,002,010这10个编号中用简单随机抽样法抽出一个作为起始号码(如006);第四步,把起始号码依次加间隔10,可获得样本.学后反思 在利用系统抽样时,经常遇到总体容量不能被样本容量整除的情况,则可以先从总体中随机地剔除一些个体,使得总体中剩余的个体数能被样本容量整除.举一反三2.某校高三年级共402名学生,为了对某次考试的成绩进行质量分析,打算从中抽取40人的成绩做样本.试设计用系统抽样的方法进行抽样的过程.解析:用系统抽样的方法抽取样本的步骤:将402名学生进行编号,号码分别为000,001,002,401;使用
8、随机数表法从中剔除两个学生,对剩下的400名学生进行重新编号,号码分别为000,001,002,399;将000009视为第一组,010019视为第二组,390399视为第四十组;在第一组中用简单随机抽样的方法确定所抽取的号码,如l号;分别将第一组、第二组、第三组、第四十组中的号码为l,10+l,20+l,390+l的学生的成绩取出.题型三 分层抽样【例3】某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的 ,且该组中,青年人占50%,中年人占40%,老年
9、人占10%.为了解各组不同的年龄层次的职工对本次活动的满意程度,现从参加活动的全体职工中抽取一个容量为200的样本.(1)在游泳组中,试确定青年人、中年人、老年人分别所占的比例;(2)在游泳组中,试确定青年人、中年人、老年人分别应抽取的人数.分析 因本题中已给出了青年人、中年人和老年人三类,如何分配他们之间的比例和他们各自的人数是解决本题的关键.41解 采用分层抽样的方法.(1)设登山组人数为x,在游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有 =47.5%,=10%,解得b=50%,c=10%.故a=100%-50%-10%=40%,即在游泳组中,青年人、中年人、老年人各占比
10、例分别为40%、50%、10%.(2)在游泳组中,抽取的青年人人数为2003440%=60(人);抽取的中年人人数为2003450%=75(人);抽取的老年人人数为2003410%=15(人).4x3xb40 x00 4x3xc40 x00 学后反思 分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中对于分多少层、如何分层要视具体情况而定.总的原则是,层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同;(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.3.
11、某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除一个个体.求样本容量n.举一反三解析:总体容量为6+12+18=36(人).当样本容量为n时,由题意知,系统抽样的间隔为 ,分层抽样的比例是 ,抽取工程师 6=(人),抽取技术员 12=(人),抽取技工 18=(人).所以n应是6的倍数,36的约数,即n=6,12,18,36.当样本容量为(n+1)时,总体容量是35人,系统抽样的间隔为 .因为 必须是整数,所以n只能取6,即样本容量n=6.n3636n3
12、6n36n36n6n2n3n1n351n35题型四 抽样方法的综合应用【例4】(14分)为了考察某校的教学水平,将抽查这个学校高三年级的部分学生本年度的考试成绩.为了全面反映实际情况,采取以下三种方式进行抽查(已知该校高三年级共有20个 班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生的人数相同):从高三年级20个班中任意抽取一个班,再从该班中任意抽取20名学生,考察他们的学习成绩;每个班抽取1人,共计20人,考察这20名学生的成绩;把学生按成绩分成优秀、良好、普通三个级别,从其中共抽取100名学生进行考察(已知该校高三学生共1000人,若按成绩分,其中优秀生共150人,良好生
13、共600人,普通生共250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式的总体、个体、样本分别是什么?每一种抽取方式抽取的样本中,样本容量分别是多少?(2)上面三种抽取方式各自采用的是何种抽取样本的方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.分析 本题主要考查基本概念和三种抽样方法的联系与区别,准确把握三种抽样方法的概念与特点是解此题的关键;另外要注意叙述的完整性和条理性.解 (1)这三种抽取方式的总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二
14、种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式的样本为所抽取的100名学生本年度的考试成绩,样本容量为100.4(2)三种抽取方式中,第一种采用的是简单随机抽样法;第二种采用的是系统抽样法和简单随机抽样法;第三种采用的是分层抽样法和简单随机抽样法.7(3)第一种方式抽样的步骤:第一步,用抽签法在这20个班中任意抽取一个班;第二步,从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.9 第二种方式抽样的步骤:第一步,用简单随机抽样法从第一个班中任意抽取一名学生,记其学号为a;第二步,在其余的19个班中,选取学号为a的学生,加上第一个班中的一名
15、学生,共计20人.11 第三种方式抽样的步骤:第一步,分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次;第二步,确定各个层次抽取的人数.因为样本容量与总体的个数之比为1001000=110,所以在每个层次中抽取的个体数依次为 即15,60,25;第三步,按层次分别抽取.在优秀生中用简单随机抽样法抽15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.14,10250,10600,10150学后反思 本题关键是灵活运用统计初步中的一些基本概念和方法,对照简单随机抽样,系统抽样,分层抽样概念得
16、出抽样过程.设计抽样方法时,一方面要使样本具有良好的代表性,就需将总体“搅拌均匀”,使每个个体有同样机会被抽中;另一方面应使抽样过程简便易行.举一反三 4.判断下面这几个抽样调查选取样本的方法是否合适.(1)一啤酒厂为了解其产品的质量情况,在其生产流水线上每隔1 000瓶选取一瓶检验其质量;(2)一手表厂欲了解611岁少年儿童带手表的比例,周末来到一家业余艺术学校调查200名在那里学习的学生;(3)为调查全校学生对购买正版书籍、唱片和软件的支持率,用简单随机抽样方法在全校所有的班级中抽取8个班级,调查这8个班级中所有学生对购买正版书籍、唱片和软件的支持率;(4)为调查一个省的环境污染情况,调查
17、省会城市的环境污染情况.解析:(1)合适;(2)不合适,这所学校的200名学生不能代表全部的611岁儿童;(3)合适;(4)不合适,调查的城市为省会,不满足随机抽样的随机性和机会均等性原理.易错警示【例】下列抽取样本的方式是否属于简单随机抽样?并说明理由.(1)从无限多个个体中抽取100个个体作样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检查,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子中.错解 (1)是简单随机抽样,因为样本是随机任意抽取的.(2)是简单随机抽样,因为就是从80个零件中任取5个零件的抽样.错解分析 上述两问题不具有简单随机抽样的特点:不放回,
18、有限性.正解 (1)不是简单随机抽样,由于被抽取样本的总体的个数不是有限的而是无限的.(2)不是简单随机抽样,由于它是放回抽样,而简单随机抽样的前提是不放回抽样.考点演练10.(2009北京海淀区模拟)某行业主管部门所属的企业有800家,按企业固定资产规模分为大、中、小型企业,大、中、小型企业分别有80家、320家和400家,该行业主管部门要对所属企业的第一季度生产状况进行分层抽样调查,共抽查100家企业.求其中大型企业所抽家数.解析:由题意知,抽取的比例为 ,故大型企业应抽查 80 =10(家).181811.某校高中三年级有253名学生,为了解他们的身体状况,准备按15的比例抽取一个样本,
19、试写出用系统抽样法进行抽样的过程.解析:第一步,计算要抽取的个体数:,所以先从253个个体中随机剔除3个;第二步,把剩下的250名学生随机编号为:1,2,,250,然后分组为15,610,246250;第三步,在15之间任选一个号,记为i(1i5),然后依次在第N组选取i+(N-1)5号(2N50).这样就得到所需的样本.12.(创新题)质监总局最近对主要城市供应液态奶进行三聚氰胺抽样检测,抽检样品从北京、上海、天津、重庆、哈尔滨、长春、沈阳、大连、济南、南京、杭州、福州、合肥、武汉、郑州、长沙、深圳、西安等19个大城市中随机抽取5个.(1)采取什么抽取样本方法?(2)三鹿牌婴幼儿奶粉事件发生
20、后,某镇质监局迅速组织对分销点的清查工作,查封三鹿牌婴幼儿奶粉2 156包,对其产品现场抽取50包进行检测.请你帮他们确定抽取样本的方法.(3)奶粉事件发生后,质监局对本县生产销售的乳制品包括灭菌乳4 600件、巴氏杀菌乳3 200件和酸牛乳5 100件从中抽取100件进行三聚氰胺抽样检测.请你提供一个抽样方法.53505253 解析:(1)抽签法:第一步:将19个城市编号,编号为1,2,3,19;第二步:将19个号码分别写在19张外形完全相同的纸条上,并揉成团,制成号签;第三步:将19个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取5个号签,并记录上面的编号;第五步:所得号码
21、对应的城市组成样本.(2)系统抽样:第一步:将2 156包奶粉用随机方式编号;第二步:从总体中剔除6包(剔除方法可用随机数表法),将剩下的2 150包重新编号(分别为0001,0002,2150),并分成50段;第三步:在第一段0001,0002,0043这43个编号中用简单随机抽样法抽出一个(如0005)作为起始号码;第四步:将编号为0005,0048,0091,2112的个体抽出,组成样本.(3)分层抽样:第一步:明确 总体数有4 600+3 200+5 100=12 900(件),及 灭菌乳、巴氏杀菌乳和酸牛乳各抽的件数.灭菌乳应抽(4 60012 900)10036(件),巴氏杀菌乳应抽(3 20012 900)10025(件),酸牛乳应抽(5 10012 900)10039(件).第二步:用系统抽样的方法分别从灭菌乳、巴氏杀菌乳和酸牛乳中各抽36件、25件、39件.这样便得到了所要抽取的样本.