1、22分层抽样与系统抽样知识点一分层抽样 填一填1分层抽样(1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本这种抽样方法通常叫作分层抽样,有时也称为类型抽样(2)分层抽样的步骤:分层:按某种特征将总体分成若干部分(层)按所占比例确定每层抽取个体的个数各层分别按简单随机抽样或其他的抽样方法抽取样本综合每层抽样,组成样本答一答1应用分层抽样时应遵循什么要求?提示:使用分层抽样应遵循的原则(1)将相似的个体归入一类,即为一层分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机
2、抽样,每层样本数量与每层个体数量的比等于抽样比知识点二系统抽样 填一填2系统抽样(1)定义:将总体中的个体进行编号,等距分组,在第一组中,按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本这种抽样方法称为系统抽样,有时也叫等距抽样或机械抽样(2)注意:编号时要随机编号,否则抽取的样本代表性差(3)系统抽样的步骤:采用随机抽样的方法将总体中的N个个体编号确定分段间隔k(kN),将整体按编号进行分段(组) 在第一段用简单随机抽样确定起始个体的编号l(lN,0lk)按照一定的规则抽取样本,通常是将起始编号l加上间隔k得到第2个个体编号lk,再加上k得到第3个个体编号l2k,这
3、样继续下去,直到获取整个样本答一答2在进行系统抽样时,如果遇到不是整数,怎么办?提示:用系统抽样法抽取样本,当不为整数时,取k,即先从总体中用简单随机抽取的方法剔除Nnk个个体且剔除的多余个体不影响抽样的公平性三种抽样方法的比较类型一分层抽样的概念 【例1】(1)下列问题中,最适合用分层抽样抽取样本的是()A从10名同学中抽取3人参加座谈会B某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C从1 000名工人中,抽取100名调查上班途中所用时间D从生产流水线上,抽取样本检查产品质量(2)分层
4、抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等可能抽样,必须进行 ()A每层等可能抽样B每层可以不等可能抽样C所有层按同一抽样比等可能抽样D所有层抽个体数量相同【解析】(1)A中总体个体无明显差异且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样(2)保证每个个体等可能的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等可能抽取【答案】(1)B(2)C规律方法 (1)为了保证分层抽样的公平性,第i层抽取的个体数Ni满足Ni
5、Mi(i1,2,k)其中n,N分别为样本容量,总体容量,Mi为第i层个体总数(2)解决此类问题,必须准确理解并掌握分层抽样的概念和特点下列各项中属于分层抽样的特点的是(B)A从总体中逐个抽取B将总体分成几层,分层进行抽取C将总体分成几部分,按事先确定的规则在各部分中抽取D将总体随意分成几部分,然后进行随机抽取解析:A属于简单随机抽样的特点,B属于分层抽样的特点,C属于系统抽样的特点,D不属于三种抽样方法,所以应选B.类型二分层抽样的应用 【例2】一个地区共有5个乡镇,人口30 000,各乡镇人口比例为32523,要从这30 000人中抽取300人进行癌症发病分析已知癌症与不同地理位置及水土有关
6、,则应该采用什么样的抽样方法?请写出具体过程【思路探究】由题意,知不同乡镇的发病情况差异比较明显,要想使抽样更加科学合理,应采用分层抽样首先要确定分层的层次,然后算出各层次的比例系数,最后在各层次抽出相应的样本个数【解】应采用分层抽样的方法,具体过程如下:第一步:将30 000人分成5层,其中每个乡镇为一层第二步:按照样本容量与总体容量的比例及各乡镇的人口比例随机抽取各乡镇应抽取的样本因为总体个数为30 000,样本容量为300,故样本容量与总体容量的比例为1100,这5个乡镇人口数依次为6 000,4 000,10 000,4 000,6 000.通过计算,易知在各乡镇应抽取的人数分别为60
7、,40,100,40,60.第三步:将这300人组合在一起,即得到一个样本规律方法 当采用分层抽样时,应该严格按照分层抽样的步骤进行,即首先确定抽样比,然后进行层内抽样,最后将各个层的样本综合起来在进行层内抽样时,需要注明所采用的抽样方法,如抽签法、随机数法或系统抽样,根据各个抽样方法的特点以及适用范围选用合适的方法即可某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取60名学生解析:由分层抽样的方法可得,从一年级本科生中抽
8、取学生人数为30060.类型三系统抽样的概念 【例3】下列抽样中不是系统抽样的是()A从标有116号的电视机中,任选4个作样本,按从小到大的号数排序,随机选起点K,以后按K4、K8(超过16则从1再数起)抽样B光明会堂有32排座位,每排有40个座位(座位号为140),一次报告会坐满了听众,会后为听取意见留下座位号为18的所有32名听众进行座谈C工厂生产的产品,用传送带将产品送入包装车间前,检验人员每隔5分钟抽一件产品进行检验D从8台彩电中抽取2台进行质量检验【思路探究】系统抽样适用于个体数较多的总体,判断一种抽样是否为系统抽样,首先看在抽样前是否知道总体是由什么构成的,抽样的方法是否符合系统抽
9、样的特点【解析】A、B符合系统抽样的特点是系统抽样C项中,传送带的速度是恒定的,实际上是将其一段时间内生产的产品分成一组,且可以认为这些产品已经排好,又总在某一位置抽取样品,这正好符合系统抽样的概念故选D.【答案】D规律方法 (1)判断某抽样方法是否为系统抽样应注意两点:间隔是否等距离;是否将总体均分(2)解决此类问题的关键是掌握好各种抽样方法的特点,当总体容量较大,样本容量也较大时适宜于系统抽样(1)下列抽样试验中,最适宜用系统抽样法的是 (C)A某市的4个区共有2 000名学生,且4个区的学生人数之比为3282,从中抽取200人入样B从某厂生产的2 000个电子元件中随机抽取5个入样C从某
10、厂生产的2 000个电子元件中随机抽取200个入样D从某厂生产的20个电子元件中随机抽取5个入样(2)从3 009名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从3 009人中剔除9人,剩下的3 000人再按系统抽样的方法抽取,则每人入选的概率(C)A不全相等B均不相等C都相等,且为D都相等,且为解析:(1)只有C选项样本容量和总体容量都较大,且个体之间无明显差异(2)因为在系统抽样中,若所给的总体个数不能被样本容量整除,则要先剔除几个个体,本题要先剔除9人,然后再分组,在剔除过程中,每个个体被剔除的机会相等,所以每个个体被抽到包括两个过程,一是不被剔除,二是被
11、选中,这两个过程是相互独立的,所以,每个人入选的机会都相等,且为.易错警示抽取方法考虑不全致误【例4】某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为_【易错点分析】(1)若没有考虑样本容量为n1时的变化情况,会得到n6或12或18或36的错误结论(2)样本容量增加1个个体,若总体没有剔除1人,没有考虑到系统抽样的间隔为N*,而是利用n1是36的约数,则易得n5,从而导致解题错误【防范措施】一个总体中有m个个体,用分层抽样方法从
12、中抽取一个容量为n(nm)的样本,某层中含有x(xn)个个体,在该层中抽取的个体数目为y,则有y,该等式中含有4个量,已知其中任意三个量,就能求出第四个量【解析】总体容量N36.当样本容量为n时,系统抽样间隔为N*,所以n是36的约数;分层抽样的抽样比为,求得工程师、技术员、技工的抽样人数分别为、,所以n应是6的倍数,所以n6或12或18或36.当样本容量为n1时,总体中先剔除1人时还有35人,系统抽样间隔为N*,所以n只能是6.【答案】6某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则合适的抽样方法是(C)A简单随机抽样B系统抽样C
13、直接运用分层抽样D先从老年人中剔除1人,然后再用分层抽样解析:因为总体由差异明显的三部分组成,所以考虑用分层抽样因为总人数为285481163,样本容量为36,按照抽样比进行分层抽样,老年人、中年人和青年人中应抽取的人数分别为286,5412,8118.一、选择题1某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(D)A抽签法B随机数法C系统抽样法D分层抽样法解析:由数据特点可采用分层抽样2中央电视台动画城节目为了对本周的热心小观众给予奖励,要从已确定编号的10 000名小观众中抽出10名幸运小
14、观众现采用系统抽样方法抽取,其中每组容量为(C)A10B100C1 000D10 000解析:由系统抽样的步骤可求解,依题意,要抽出10名幸运小观众,所以要分10个组,其中每组容量为10 000101 000.3某商场想通过检查发票及销售记录的2%来快速估计每月的销售金额采用如下方法:从某本发票的存根中随机抽取一张,如15号,然后按顺序往后依次抽出65号,115号,165号,发票上的销售金额组成一个调查样本这种抽样的方法是(C)A抽签法B随机数法C系统抽样法D其他方式的抽样解析:题述抽样方法是将发票平均分成若干组,每组50张,从第一组中抽出15号,以后各组抽取1550n(nN)号,符合系统抽样
15、的特点二、填空题4某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为160.解析:本题考查了分层抽样的特点,因抽样比为,所以男生数应为560160.分层抽样是按比例抽取,一定要先找出抽样比5在一次有奖的明信片的100 000个有机会中奖的号码(编号1100 000)中,邮政部门按照随机抽取的方式确定后两位是23的作为中奖号码这是运用了系统抽样的抽样方法三、解答题6某网站欲调查网民对当前网页的满意程度,在登陆的所有网民中,收回有效帖子共50 000份,其中持各种态度的份数如下表所示:很满意满意一般不满意10 80012 40015 60011 200为了了解网民的具体想法和意见,以便确定更改方案使网页更完美,打算从中抽出500份有效帖子,为使样本具有代表性,每类中各应抽出多少份?解:首先确定抽取比例,然后再确定各层要抽取的份数,因为,所以108,124,156,112,所以持四种态度的有效帖子应分别抽取108,124,156,112份进行调查