1、第一章 统 计 2 抽样方法 2.2 分层抽样与系统抽样1理解分层抽样和系统抽样的概念2掌握分层抽样、系统抽样的步骤,会用这两种抽样方法抽取样本3能解决分层抽样、系统抽样中的计算问题(重点)4能综合运用三种抽样方法解决相关问题(难点)一、阅读本节“1.分层抽样”部分,完成下列问题 分层抽样(1)定义将总体按其_分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本这种抽样方法通常叫作分层抽样,有时也称为_(2)抽象概括如果知道某一类个体在总体中占有的百分比,那么按照这个比例抽取这类个体,这样的抽样会提高对总体推断的精度属性特征类型抽样什么情况下,运用分层抽样获取样本?提示:
2、当总体中的个体有明显差异时,运用分层抽样获取样本二、阅读本节“2.系统抽样”部分,完成下列问题系统抽样系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照_抽取第一个样本,然后按分组的_(称为_)抽取其他样本这种抽样方法有时也叫_抽样或_抽样简单随机抽样间隔抽样距等距机械在什么情况下,运用系统抽样获取样本?提示:当总体容量较大(均衡)时,采用系统抽样一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?解:用分层抽样来抽取样本
3、,步骤是:第一步,分层按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁以上的职工分层抽样第二步,确定每层抽取个体的个数抽样比为10050015,则在不到 35 岁的职工中抽取 1251525(人);在 35 岁至 49 岁的职工中抽取 2801556(人);在 50 岁以上的职工中抽取 951519(人)第三步,在各层分别按抽签法或随机数表法抽取样本第四步,综合每层抽取的个体,组成样本(1)分层抽样的步骤将总体按照不同的类型来分层;计算各层的个体数与总体中的个体数的比;按照每层的个体数占总体个体数的比确定各层应抽取的个体数;对每一层进行随机抽样;综合每层抽取的个体,
4、得到样本(2)抽样比 样本容量n总体的个数N该层抽取的个体数该层的个体数.1(1)某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人,现采用分层抽样方法抽取容量为30的样本,则样本中的高级职称人数为_(2)某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2352,现用分层抽样的方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n_.解析:(1)用分层抽样方法抽取容量为 30 的样本,则样本中的高级职称人数为 15150303.(2)由 题 意 知,总 体 中 A 种 型 号 产 品 所 占 的 比 例 是2235216,因样本中 A
5、 种型号产品有 16 件,则16n16,解得 n96.答案:(1)3(2)96某 校 高 三 年 级 的 295 名 学 生 已 经 随 机 编 号 为1,2,295,为了了解学生的学习情况,要按15的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程解:(1)因为按照15的比例抽取,所以样本容量为295559,分段间隔为5.(2)我们把295名同学分成59组,每组5人,第1组是编号为15的5名学生,第2组是编号为610的5名学生,依次类推,第59组是编号为291295的5名学生系统抽样(3)采用简单随机抽样的方法,从第1组的5名学生中抽一名学 生,不 妨 设 编 号 为 k(1k5),则
6、 编 号 为 k 5L(L 0,1,2,58)的这59个个体就是所抽取的样本,如当k3时的样本编号为3,8,13,288,293.【互动探究】把本例中的“某校高三年级的295名学生编号为1,2,295”改为“某校高三年级的297名学生编号为1,2,297”其余条件不变,应如何解答?解:(1)2975952,先用简单随机抽样从297名学生中抽取2名学生,把剩余的295名学生重新编号为1,2,295.(2)因为按照15的比例抽取,所以样本容量为295559,分段间隔为5.(3)我们把295名同学分成59组,每组5人,第1组是编号为15的5名学生,第2组是编号为610的5名学生,依次类推,第59组是
7、编号为291295的5名学生(4)采用简单随机抽样的方法,从第1组的5名学生中抽一名学 生,不 妨 设 编 号 为 k(1k5),则 编 号 为 k 5L(L 0,1,2,58)的这59个个体就是所抽取的样本,如当k3时的样本编号为3,8,13,288,293.系统抽样的步骤:一般地,从容量为 N 的总体中抽取容量为 n 的样本,可以按照下列步骤进行系统抽样(1)确定抽样距 k.当Nn(n 是样本容量)是整数时,抽样距 kNn;否则抽样距 kNn(Nn 为不大于Nn的最大整数)(2)当 kNn是整数时,将总体的 N 个个体进行编号:当 kNn不是整数时,先用简单随机抽样的方法剔除余数个个体后,
8、再将剩余个体进行编号(3)在第一段编号内用简单随机抽样确定一个个体编号m(mk)(4)按照一定的规则抽取其他个体,通常是将编号 m 加上间隔 k 得到第二个个体编号,以此类推,分别加上 2k,3k,4k,直到获取整个样本2(1)一个总体中有60个个体,随机编号为0,1,2,59,依编号顺序平均分成6个小组,组号依次为1,2,3,6.现用系统抽样方法抽取一个容量为6的样本,若在第1组随机抽取的号码为3,则在第5组中抽取的号码是()A33 B43 C53 D54(2)某中学有840名学生,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间2
9、41,480的人数为()A11B12C13D14解析:(1)总体为 60 个个体,依编号顺序平均分成 6 个小组,则间隔号为606 10,所以在第 5 组中抽取的号码为 310443.(2)使用系统抽样方法,从 840 人中抽取 42 人,即从 20 人抽取 1 人所以从编号 1240 的人中,恰好抽取24020 12,接着从编号 241480 共 240 人中抽取24020 12 人答案:(1)B(2)B某地质量监督部门对本地某奶粉厂的所有种类的库存奶粉进行抽样检测,已查明该厂库存奶粉10 000袋,其中婴儿奶粉4 000袋、普通奶粉5 000袋、老年奶粉1 000袋(1)如果质量监督部门打
10、算抽取500袋奶粉作为样本进行检测,那么应该如何抽样?(2)试分别选择不同的方法对4 000袋婴儿奶粉和1 000袋老年奶粉完成第(1)问中的抽取计划,写出抽样过程三种抽样方法的综合运用解:(1)总体上分三个层次进行抽样:婴儿奶粉、普通奶粉、老年奶粉按451的比例抽取,其中婴儿奶粉抽取200袋,普通奶粉抽取250袋,老年奶粉抽取50袋(2)对4 000袋婴儿奶粉采用系统抽样法抽样:第一步,将4 000袋婴儿奶粉编号为0001,0002,0003,4000;第二步,按编号平均分成200段:0001,0002,0020;0021,0022,0040;3981,4000;第三步,在第一段0001,0
11、002,0020这20个编号中用简单随机抽样法抽出一个(如0013)作为起始号码;第四步,将编号为0013,0033,0053,3993的个体抽出,完成4 000袋婴儿奶粉的抽样对1 000袋老年奶粉采用随机数表法抽样:第一步,将1 000袋老年奶粉编号为000,001,002,999;第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向比如,选第3行第1列数0,向右读(见教材附录2随机数表);第三步,从数0开始,向右读,每次读取三位,凡不在000999中的数跳过去不读,前面已经读过的也跳过去不读,依次得到50个号码:084,226,895,319,645,093,;第四步,以上号码对
12、应的50袋老年奶粉就是要抽取的样本在多层抽样中,要根据各层所含个体的多少,采取不同的方法抽取本层中的样本3(1)某学校有职工140人,其中教师91人,教辅行政人员28人,总务后勤人员21人为了了解职工的某种情况,要从中抽取一个容量为20的样本以下的抽样方法中,按简单随机抽样,系统抽样,分层抽样的排列顺序是()方法1:将140人从1140编号,然后制作出标有1140的形状、大小相同的号签,并将号签放入同一箱子里均匀搅拌,然后从中抽出20个号签,编号与号签相同的20个人被选出方法2:将140人分成20组,每组7人,并将每组7人按17编号,在第1组采用抽签法抽出k(1k7)号,其余各组k号也被抽出,
13、20个人被选出方法3:按2014017的比例,从教师中抽出13人,从教辅行政人员中抽出4人,从总务后勤人员中抽出3人从各类人员中抽取所需人员时,均采用随机数表法,可抽到20人A方法2,方法1,方法3B方法2,方法3,方法1C方法1,方法2,方法3D方法3,方法1,方法2(2)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人进行某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,3,270;使用系统抽样时,将学生统一随机编号为1,2,3,270,并将整个编号平均分为10段如
14、果抽得的号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;36,62,88,114,140,166,192,218,244,270.关于上述样本的下列结论中,正确的是()A都不能为系统抽样B都不能为分层抽样C都可能为系统抽样D都可能为分层抽样解析:(1)结合简单随机抽样、系统抽样、分层抽样的含义判断方法1是简单随机抽样,方法2是系统抽样,方法3是分层抽样(2)系统抽样又名“等距抽样”,做到等距的有,但只做到等距还
15、不一定是系统抽样,还应做到10段中每段要抽1个,检查这一点只需看第一个元素是否在127范围内,结果发现不符合,所以可能是系统抽样的为,因此排除A,C;若采用分层抽样,一、二、三年级的人数比例应为433,由于共抽取10人,所以三个年级分别抽取4人、3人、3人,即在1108范围内要有4个编号,在109189和190270范围内要分别有3个编号,符合此要求的有,即它们都可能为分层抽样(其中在每一层内采用了系统抽样,在每一层内采用了简单随机抽样),所以排除B.答案:(1)C(2)D三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样(1)抽样过程中每个个体被抽取的概率相等;(2)均属于不放回抽样从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成点击进入WORD链接点击进入WORD链接课时作业(三)谢谢观看!