1、2.1 随机抽样2.1.1 简单随机抽样1.抽签法例:某单位对口支援西部开发,现从报名的18名志愿者中选取6人组成志愿小组到西藏工作3年,请用抽签法设计抽样方案。第一步:将18名志愿者编号,号码是01,02,18;第二步:将号码分别写在一张纸上,制成号签;第三步:将得到的号签放入一个容器中,并充分搅匀;第四步:从容器中逐个不放回地依次抽取6个号签,并记录上面的编号;第五步:所得的号码对应的志愿者就是支援小组的成员。2.随机数法例:从800袋牛奶中抽取60袋进行质量检查,利用随机数法设计抽样方案。第一步:将800袋牛奶编号,号码是000,001,799;第二步:在随机数表中任选一个数作为开始,例
2、如选出第8行第7列的数“7”;第三步:从数“7”开始,向右读,得到一个三位数785,由于785799,将它去掉,按照这种方法继续向右读,又取出567,199,507,依次下去,直到样本的60个号码全部取出;第四步:以上号码对应的60袋牛奶就是要抽取的对象。用随机数法抽取样本的步骤:将总体中的所有个体编号(每个号码位数一致);在随机数表中选定开始的数字(确定行数列数);从选定的数开始按一定方向读数,若得到的号码大于总体编号或与前面所取出的号码重复的去掉,如此进行下去,直到取满为止;根据选定的号码抽取样本。练习:要从某厂生产的300台机器中用随机数表法抽出10台作为样本,试设计抽样方案。第一步:将
3、300台机器编号,号码是000,001,299;第二步:在随机数表中任选一个数作为开始,例如选出第3行第2列的数“6”;第三步:从数“6”开始,向右读,每次读取3位,凡不在000299中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到:026,141,012,269,050,101,243,099,006,184;第四步:以上号码对应的10台机器就是要抽取的对象。思考:当N100时,分别以0,1,3,6为起点对总体编号,再利用随机数表抽取10个号码,你能说出从0开始对总体编号的好处吗?当总数为100时,从0开始编号,那么用两位数字即可,因此可以节省从随机数表中抽取随机数的时间。2.1.2
4、 系统抽样【探究】:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,用简单随机抽样获取样本方便吗?你能否设计其他抽取样本的方法?【探究】:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,用简单随机抽样获取样本方便吗?你能否设计其他抽取样本的方法?我们按照下面的步骤进行抽样:第一步:将这500名学生从1开始进行编号;第二步:确定分段间隔k,对编号进行分段.由于k=500/50=10,这个间隔可以定为10;第三步:从号码为110的第一个间隔中用简单随机抽样的方法确定第一个个体编号,假如为6号;第四步:从第6号开
5、始,每隔10个号码抽取一个,得到6,16,26,36,496.这样就得到一个样本容量为50的样本.一.系统抽样的定义:将总体平均分成几部分,然后按照一定的规则,从每一部分抽取一些个体作为样本,这种抽样的方法叫做系统抽样。【说明】由系统抽样的定义可知系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。(2)将总体平均分成几部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k(x表示不超过x的最大整数).(3)一定的规则通常指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。二、从容量为N的总体中抽取容量为
6、n的样本,用系统抽样的一般步骤为:(1)将总体中的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(2)将编号按间隔k分段(kN).(3)在第一段用简单随机抽样确定起始个体的编号L(LN,Lk)。(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本.说明(1)分段间隔的确定:当是整数时,取k=;当不是整数时,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.通常取k=(2)从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而
7、把复杂问题简单化,体现了数学转化思想。思考:下列抽样中不是系统抽样的是()A、从标有115号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样;B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。C系统抽样与简单随机抽样比较,有何优、缺点?点评:(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;(2)系统抽
8、样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.(3)系统抽样比简单随机抽样的应用范围更广.【例题解析】例1、某校高中三年级的295名学生已经编号为1,2,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。解:样本容量为2955=59.确定分段间隔k=5,将编
9、号分段15,610,291295;采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,如确定编号为3的学生,依次取出的学生编号为3,8,13,288,293,这样就得到一个样本容量为59的样本.例2、从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A5,10,15,20,25 B、3,13,23,33,43 C、1,2,3,4,5 D、2,4,6,16,32B例3:从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()A99B、99.5 C100D、100.5C例
10、4:某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是抽样方法。系统例5:采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 _.例6:从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000个再按系统抽样的方法进行,则每人入选的机会()A.不全相等B.均不相等C.都相等D.无法确定C探究?假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情
11、况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?80604020 0近视率%小学初中高中你认为哪些因素影响学生视力?抽样要考虑和因素?2.1.3 分层抽样一、分层抽样的定义。一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与
12、这层个体数量与总体容量的比相等。二、分层抽样的步骤:(1)按某种特征将总体分成互不相交的层(2)按比例k=n/N确定每层抽取个体的个数(n/N)*Ni个。(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。练习:分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行()A、每层等可能抽样B、每层不等可能抽样C、所有层按同一抽样比等可能抽样c例1、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()
13、A.15,5,25 B.15,15,15C.10,5,30 D15,10,20例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。D解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。3003/15=60(人),3002/15=100(人),3002/15=40(人),3002/15=60(
14、人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。(3)将300人组到一起,即得到一个样本。1.系统抽样的定义;2.系统抽样的一般步骤;3.分段间隔的确定.课堂小结一、系统抽样1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程
15、中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。二、分层抽样探究?比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围类 别简 单随 机抽 样系 统抽 样分 层抽 样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样共同点各自特点从总体中逐个抽取将总体均分成几部分,按预先制定的规则在各部分抽取将总体分成几层,分层进行抽取联 系在起始部分样时采用简随机抽样分层抽样时采用简单随机抽样或系统抽样适 用范 围总体个数较少总体个数较多总体由差异明显的几部分组成课堂练习1、某单位有老年人28人,中年人54人,青年人81人,为了
16、调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()A简单随机抽样B系统抽样C分层抽样D先从老人中剔除1人,然后再分层抽样2、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为人,A型血应抽取的人数为人,B型血应抽取的人数为人,AB型血应抽取的人数为人。3、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,若该校取一个容量为n的样本,每个学生被抽到的可能性均为0.2,则n=。4、对某单位1000名职工
17、进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:任职年限5年以下5年至10年10年以上人数300500200试利用上述资料设计一个抽样比为1/10的抽样方法。系统抽样088,188,288,388,488,588,688,788,888,988练习、在1000个有机会中奖的号码(编号为000999)中,在公证部门的监督下,按随机抽取的方法确定最后两位数为88的号码为中奖号码,这是运用那种抽样方法确定中奖号码的?依次写出这10个中奖号码。(2004年福建省高考卷)一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10个小组,组号分别为1,2,3,10
18、.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是_.解析:依编号顺序平均分成的10个小组分别为09,1019,2029,3039,4049,5059,6069,7079,8089,9099.因第7组抽取的号码个位数字应是3,所以抽取的号码是63.这个样本的号码依次是6,18,29,30,41,52,63,74,85,96这10个号.一.系统抽样的定义:将总体平均分成几部分,然后按照一定的规则,从每一部分抽取一些个体作为样本,这种抽样的方法叫做系统抽样。【说明】由系统抽样的定义
19、可知系统抽样有以下特证:(1)当总体容量N较大时,采用系统抽样。(2)将总体平均分成几部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k(x表示不超过x的最大整数).(3)一定的规则通常指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。二、从容量为N的总体中抽取容量为n的样本,用系统抽样的一般步骤为:(1)将总体中的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(2)将编号按间隔k分段(kN).(3)在第一段用简单随机抽样确定起始个体的编号L(LN,Lk)。(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本.说明(1)分段间隔的确定:当是整数时,取k=;当不是整数时,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.通常取k=(2)从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。