1、第一章 统计 2.2 分层抽样与系统抽样 1.通过实例,准确把握分层抽样、系统抽样的概念(重点)2会用分层抽样、系统抽样解决实际问题(难点)3了解各种抽样方法的适用范围,能根据具体情况选择恰当的抽样方法(难点)1.通过学习分层抽样、系统抽样的概念,培养数学抽象素养2通过运用分层抽样、系统抽样解决实际问题,提升数据分析素养.自 主 预 习 探 新 知 一、分层抽样1分层抽样的概念将总体按其属性特征分成若干类型(有时称为),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法通常叫作分层抽样,有时也称为层类型抽样2对分层抽样的公平性的理解在分层抽样的过程中,每个个体被抽到的概率是相同的,与
2、分层的情况无关如果总体的个体数是 N,共分 k 层,n 为样本容量,Ni(i1,2,3,k)是第 i 层中的个体数,则第 i 层中所要抽取的个体数 ninNiN,而每一个个体被抽取的可能性是niNinN,与层数无关,所以对所有个体而言,其被抽到的概率是相同的,也就是说分层抽样是公平的二、系统抽样的概念将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按分组的间隔(称为抽样距)抽取其他样本这种抽样方法叫,有时也叫或思考:系统抽样一般适用于具有怎样特征的样本?提示 系统抽样的实质是“分组”抽样,适用于总体中的个体数较大的情况系统抽样机械抽样等距抽样1下列问题中,最适合
3、用分层抽样抽取样本的是()A从 10 名同学中抽取 3 人参加座谈会B某社区有 500 个家庭,其中高收入的家庭 125 个,中等收入的家庭 280 个,低收入的家庭 95 个,为了了解生活购买力的某项指标,要从中抽取一个容量为 100 的样本C从 1 000 名工人中,抽取 100 名调查上班途中所用时间D从生产流水线上,抽取样本检查产品质量B A 中总体个体无明显差异且个数较少,适合用简单随机抽样;C 和 D 中总体个体无明显差异且个数较多,不适合用分层抽样;B 中总体中的个体差异明显,适合用分层抽样2为了解 1 200 名学生对学校食堂饭菜的意见,打算从中抽取一个样本容量为 40 的样本
4、,考虑采用系统抽样,则分段间隔 k 为()A10 B20 C30 D40C 分段间隔 k1 20040 30.3甲校有 3 600 名学生,乙校有 5 400 名学生,丙校有 1 800 名学生,为统计三校学生某方面的情况,计划采用分层抽样法抽取一个容量为 90的样本,应在这三校分别抽取学生()A30 人,30 人,30 人B30 人,45 人,15 人C20 人,30 人,10 人D30 人,50 人,10 人B 先求抽样比nN903 6005 4001 800 1120,再各层按抽样比分别抽取,甲校抽取 3 600 112030(人),乙校抽取 5 400 112045(人),丙校抽取 1
5、 800 112015(人),故选 B.4某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300 的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4556,则应从一年级本科生中抽取_名学生60 根据题意,应从一年级本科生中抽取的人数为4455630060.合 作 探 究 释 疑 难 分层抽样【例 1】某企业共有 3 200 名职工,其中青、中、老年职工的比例为 352.若从所有职工中抽取一个容量为 400 的样本,则采用哪种抽样方法更合理?青、中、老年职工应分别抽取多少人?每人被抽到的可能性相同吗?解 因
6、为总体由差异明显的三部分(青、中、老年)组成,所以采用分层抽样的方法更合理 因为青、中、老年职工的比例是 352,所以应分别抽取:青年职工 400 310120(人);中年职工 400 510200(人);老年职工 400 21080(人)由样本容量为 400,总体容量为 3 200 可知,抽样比是 4003 20018,所以每人被抽到的可能性相同,均为18.1分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占的比例抽取2用分层抽样抽取样本时,需照顾到各层中的个体,所以每层抽取的比例应等于样本容量在总体中的比例3
7、在分层抽样中,确定抽样比 k 是抽样的关键一般地,抽样比 knN(N 为总体容量,n 为样本容量),按抽样比 k 在各层中抽取个体,就能确保抽样的公平性4在每层抽样时,应采用简单随机抽样或系统抽样的方法进行跟进训练1(1)为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为()A3 B4 C5 D6(2)我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送来米 1 534 石,验得米内夹谷,抽样取米一把,数得254 粒内夹谷 28 粒,则这批米内夹谷约为()A134 石B1
8、69 石C338 石D1 365 石(1)B(2)B(1)根据分层抽样的特点可知,抽样比例为124814,则应抽取的中型城市数为 16144.(2)设 1 534 石米内夹谷 x石,则由题意知x1 534 28254,解得 x169.故这批米内夹谷约为 169 石系统抽样【例 2】某单位共有在岗职工 624 人,为了调查职工上班时从离开家到来到单位的平均用时,决定抽取 10%的工人进行调查,如何采用系统抽样完成这一抽样?解 第一步:由题意知,应抽取在岗职工 62 人作为样本,即分成62 组,由于62462 的商是 10,余数是 4,所以每组有 10 人,还剩 4 人这时,抽样距是 10;第二步
9、:用随机数法从这些职工中抽取 4 人并剔除,不进行调查;第 三 步:将 余 下 的 在 岗 职 工 620 人 进 行 编 号,编 号 分 别 为000,001,002,619;第四步:在第一组 000,001,002,009 这 10 个编号中,随机选定一个起始编号,每间隔 10 抽取一个编号,共抽 62 个编号,这样就抽取了容量为 62 的一个样本1解决本题时,对总体、个体先进行编号,然后依据样本容量确定分段数及每段间隔长度,再利用简单随机抽样法在第1段中抽取一个号码作为起始号码,并依次加间隔长度即可获取样本号码2系统抽样又称等距抽样,当给出总体数和样本容量后,应先确定组数和组距(注意一般
10、组数等于样本容量/组距),在第一组抽取起始号码后,只需依次加间隔长度即可得到样本跟进训练2(1)某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了()A抽签法B随机数法C系统抽样法D放回抽样法(2)为了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k_.(1)C(2)40(1)此抽样方法将座位分成 40 组,每组 46 个个体,会后留下座号为 20 的相当于第一组抽 20 号,以后各组抽取 2046n,n1,2,3,符合系统抽样特点(2)根据样本容量为 30,将 1 200
11、 名学生分为 30 段,每段人数即间隔 k1 20030 40.三种抽样方法的综合应用探究问题1简单随机抽样是不放回抽样吗?提示:是不放回抽样2分层抽样时为什么要将总体分成互不重叠的层?提示:在总体中由于个体之间存在着明显的差异,为了使抽取的样本更合理、更具代表性,故将总体分成互不重叠的层,而后独立地抽取一定数量的个体3系统抽样的第二步中,当Nn不是整数时,从总体中剔除一些个体采用的方法是什么?影响系统抽样的公平性吗?提示:剔除一些个体可以用简单随机抽样的方法抽取,不影响系统抽样的公平性【例 3】某学校为了了解高一学生的情况,从每班抽 2 人进行座谈;一次数学竞赛中,某班有 10 人的成绩在
12、110 分以上,10人的成绩在 100110 分,30 人的成绩在 90100 分,12 人的成绩低于 90 分,现在从中抽取 12 人了解有关情况;运动会服务人员为参加 400 m 决赛的 6 名同学安排跑道就这三件事,合适的抽样方法分别为_、_、_.系统抽样 分层抽样 简单随机抽样 系统抽样适合总体中个体数量比较大的情况分层抽样适合总体由差异明显的几部分组成的情况总体中个体数比较少的时候,选用简单随机抽样三种抽样方法的比较类别共同点各自特点相互联系适用范围 简单随机抽样 从总体中逐个抽取 总体中的个体数较少 系统抽样 将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单
13、随机抽样总体中的个体数较多分层抽样(1)抽样过程中每个个体被抽取的概率相等;(2)均属于不放回抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成跟进训练3某社区有 700 户家庭,其中高收入家庭有 225 户,中收入家庭有 400 户,低收入家庭有 75 户,为了调查社会购买力的某项指标,要从中抽取一个容量为 100 户的样本,记作;某中学高二年级有12 名篮球运动员,要从中选出 3 人调查投篮命中率情况,记作;从某厂生产的 802 辆轿车中抽取 40 辆测试某项性能,记作.为完成上述三项抽样,则应采取的抽样方法是()A简单随机抽样,系统抽样,分层抽
14、样B分层抽样,简单随机抽样,系统抽样C简单随机抽样,分层抽样系统抽样D分层抽样,系统抽样,简单随机抽样B 对于.总体由差异明显的高收入家庭、中收入家庭和低收入家庭三部分组成,而所调查的指标与收入情况密切相关,所以应采用分层抽样;对于,总体中的个体数较少,而且所调查内容对 12 名调查对象是平等的,应采用简单随机抽样;对于,总体中的个体数较多,且个体之间差异不明显,样本中个体数也较多,应采用系统抽样课 堂 小 结 提 素 养 1对于分层抽样中的比值问题,常利用以下关系式解:(1)样本容量n总体容量N各层抽取的样本数该层的容量;(2)总体中各层容量之比对应层抽取的样本数之比2选择抽样方法的规律:(
15、1)当总体容量较小,样本容量也较小时,制签简单,号签容易搅匀,可采用抽签法(2)当总体容量较大,样本容量较小时,可采用随机数法(3)当总体容量较大,样本容量也较大时,可采用系统抽样法(4)当总体是由差异明显的几部分组成时,可采用分层抽样法.1思考辨析(1)分层抽样中每层抽样的可能性是不相等的()(2)分层抽样时,样本是在各层中分别抽取()(3)分层抽样时,如果总体个数不能被样本容量整除,则应先剔除部分个体 ()(4)系统抽样的分段段数与所抽取的样本容量的关系是相等()(5)系统抽样时每个个体被抽到的机会不同()(6)系统抽样时,如果总体个数不能被样本容量整除,则应先剔除部分个体 ()解析(1)
16、,每个个体被抽到的可能性相同(2),由分层抽样的概念知正确(3),由于考虑到实际意义,需剔除部分个体(4),系统抽样时,分段的段数由所抽样本容量确定(5),无论是系统抽样还是分层抽样,每个个体被抽到的机会都相等(6),系统抽样时为了保证间隔 k 为整数,应先剔除一部分个体 答案(1)(2)(3)(4)(5)(6)2为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样C 由于该地区的
17、中小学生人数比较多,不能采用简单随机抽样,排除选项 A;由于小学、初中、高中三个学段的学生视力差异性比较大,可采取按照学段进行分层抽样,而男女生视力情况差异性不大,不能按照性别进行分层抽样,排除 B 和 D.故选 C.3某中学有高中生 3 500 人,初中生 1 500 人,为了解学生的学习情况用分层抽样的方法从该学生中抽取一个容量为 n 的样本已知高中学生抽取 70 人,则 n 的值为_100 由题意,得 703 500n3 5001 500,解得 n100.4从编号为 0,1,2,79 的 80 件产品中,采用系统抽样的方法抽取容量是 5 的样本,若编号为 28 的产品在样本中,则该样本中产品的最大编号为_76 根据系统抽样的定义可得,样本中产品的编号间隔为 16,再根据编号为 28 的产品在样本中,可得样本中产品的编号为12,28,44,60,76,故该样本中产品的最大编号为 76.课 时 分 层 作 业 点击右图进入 Thank you for watching!