1、第九单元 统计、算法 第一节 随机抽样基础梳理1.简单随机抽样(1)定义:设一个总体含有N个个体,从中 抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:和 2.系统抽样定义:将总体的个体进行,按照简单随机抽样抽取第一个样本,然后按的间隔(称为抽样距)抽取其他样本,这种抽样方法称为系统抽样,也叫或。NnNn.系统抽样的步骤 假设要从容量为N的总体中抽取容量为n的样本 先将总体的N个个体 ;确定 ,对编号进行 ,当 是整数时,取k=在第1段用 确定第1个个体编号l(lk);按照一定的规则抽取样本,通常是
2、将l加上间隔k得到第2个个体编号 ,再加k得到第3个个体编号 ,依次进行下去,直到获取整个样本 3.分层抽样(1)定义:在抽样时,将总体 的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由 组成时,往往选用分层抽样 4.三种抽样方法比较 类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中每个个体被抽到的机会均等 从总体中 抽取 总体中的个 体数较少 系统抽样 将总体 分成几部分,按一定的规则分别在各部分中抽取 在起始部分抽样时采用 抽样 总体中的 个体数 较多 分层抽样 将总体分成几
3、层,分层进行抽取 各层抽样时采用 抽样或 抽样 总体由 差异明 显的几 部分组成 答案:1.(1)逐个不放回地 相等(2)抽签法 随机数法 2.(1)编号相同等距抽样机械抽样(2)编号(3)分段间隔k 分段(4)简单随机抽样 (5)(l+k)(l+2k)3.(1)分成互不交叉 一定的比例(2)差异明显的几个部分 4.逐个 均匀 简单随机 简单随机 系统 基础达标1.(教材改编题)在抽样过程中,每次抽取的个体不再放回总体的为不放回抽样,则分层抽样、简单随机抽样、系统抽样中,为不放回抽样的有()A.1个 B.2个 C.3个 D.0个 解析:三种抽样都是不放回抽样 答案:C 2.(教材改编题)为了解
4、1 200名学生对学校某项教学实验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为()A.40 B.30 C.20 D.12 解析:总体容量N=1 200,样本容量n=30,所以分段间隔k=40.答案:A 3.(原创题)某养猪场养有四大名猪:大白猪、长白猪、杜洛克猪、汉普夏猪,其中大白猪有200头,长白猪250头,杜洛克猪180头、汉普夏猪230头,估计产量时,应采用的抽样方法是()A.分层抽样 B.随机抽样 C.系统抽样 D.以上三种方法都可以 解析:由于品种之间差异较大,故采用分层抽样 答案:A 4.(2010四川)一个单位有职工800人,其中具有高级职称的16
5、0人,具有中级职称的320人,具有初级职称的200人,其余人员120人为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7 C.8,15,12,5 D.8,16,10,6 5.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号)若第5组抽出的号码为22,则第8组抽出的号码应是 若用分层抽样方法,则40岁以下年龄段应抽取 人 解析:因为抽样比 =,.故各层中依次抽取的人数分别是
6、 =8,=16,=10,答案:D =6,故选D.4080012016020320202002012020解析:由系统抽样知第1组抽出的号码为2,则第8组抽出的号码为2+5*7=37;当用分层抽样抽取时,40岁以下年龄段应抽取 12*40=20(人)答案:37 20 经典例题 题型一 简单随机抽样【例1】上海世博会组委会决定从来自上海的1 800名志愿者中,选取6人组成志愿小组去中国馆服务,请用抽签法或随机数法设计抽样方案 解析:第一步,先将1 800名志愿者编号,可以编为0001,0002,0003,1800;第二步,在随机数表中任选一个数,例如选出第2行第5列的数2;第三步,从选定的数开始向
7、右读,依次可得0 736,0 751,0 732,1 355,1 410,1 256为样本的6个号码,这样我们就得到一个容量为6的样本 题型二 系统抽样【例2】从某厂生产的905辆家用轿车中随机抽取90辆测试某项性能,请合理选择抽样方法进行抽样,并写出抽样过程 解析:可用系统抽样法进行抽样,抽样步骤如下:第一步,将905辆轿车用随机方式编号;第二步,从总体中剔除5辆(剔除法可用随机数法),将剩下的900辆轿车重新编号(分别为001,002,900),并分成90段;第三步,在第一段001,002,010这十个编号中用简单随机抽样法抽出一个作为起始号码(如006);第四步,把起始号码依次加间隔10
8、,可获得样本 变式2-1 下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1 200人,户数300,每户平均人口数4人;应抽户数:20户;抽样间隔:=60;120020 确定随机数字:取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+60=72,72号为第二样本户;(1)该村委采用了何种抽样方法?(2)抽样过程中存在哪些问题,并修改.(3)何处是用简单随机抽样?解析:(1)系统抽样(2)本题是对某村各户进行抽样,而不是对某村人口进行抽样,抽样间隔为 =15,30020 其他步骤相应改为确定随机数字:取一张人民
9、币,编码的后两位数为12,确定第一样本户:编号为12的户为第一样本户;确定第二样本户:12+15=27,27号为第二样本户.(3)确定随机数字用的是简单随机抽样,即“取一张人民币,编码的后两位数是12”用的为简单随机抽样.题型三 分层抽样【例3】一中学有高一学生400人,高二学生302人,高三学生250人,现用分层抽样法从全校所有学生中抽取一个容量为190人的样本,应剔除多少人?每个年级分别抽取多少人?解析:总体人数为400+302+250=952人,样本容量为190,若按190952取样,无法取得整数解,故考虑从高二学生中剔除2人,抽取比例为190950=15,则高一学生应抽400 =80人
10、,高三学生抽取250 =50人.先从高二学生中剔除2人,高二学生抽取300 =60人,组成容量为190的样本.因此应从高二学生中剔除2人,高一学生抽取80人,高二学生抽取60人,高三学生抽取50人 151515 某学院的A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本已知该学院的A专业有380名学生,B专业有420名学生,则在该学院的C专业应抽取 名学生 变式3-1 解析:C专业的学生有1 200-380-420=400名,由分层抽样原理,应抽取120*4001200=40名 答案:40 链接高考(2010重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为()A.7 B.15 C.25 D.35 知识准备:知道分层抽样中各层的抽样比相同,并会求抽样比 答案:B 解析:青年职工、中年职工、老年职工三层之比为753,所以样本容量为 =15.故选B.7715