1、 第九章 统计9.1 随机抽样9.1.2 分层随机抽样教学设计一、 教学目标1. 通过实例了解分层随机抽样的特点和适用范围;2. 了解分层随机抽样的必要性;3. 掌握各层样本量化比例分配的方法.二、 教学重难点1. 教学重点分层随机抽样的方法及计算.2. 教学难点实际问题中抽样方法的选择与操作.三、 教学过程(一) 新课导入在对树人中学高一年级学生身高的调查中,我们使用简单随机抽样,使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本.可能出现样本中50个个体大部分来自高个子或矮个子的情形.这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现
2、较大的误差.问题1 能否利用总体中的一些额外信息对抽样方法进行改进呢?(二) 探索新知问题2 在树人中学高一年级的712名学生中,男生有326名、女生有386名.能否利用这个辅助信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢?影响身高的因素有很多,性别是其中的一个主要因素.我们可以利用性别和身高的这种关系,把高一年级学生分成男生和女生两个身高有明显差异的群体,对两个群体分别进行简单随机抽样,然后汇总作为总体的一个样本.由于在男生和女生两个群体中都抽取了相应的个体,这样就能有效地避免“极端”样本.问题3 对男生、女生分别进行简单随机抽样,样本量在男生、女
3、生中应如何分配?为了使样本的结构与总体的分布相近,人数多的群体应多抽一些,人数少的群体应少抽一些.因此,按男生、女生在全体学生中所占的比例进行分配是一种比较合理的方式,即这样无论是男生还是女生,每个学生抽到的概率都相等.当总样本量为50时,可以计算出从男生、女生中分别应抽取的人数为按上述方法抽取一个容量为50的样本,其观测数据(单位:cm)如下:男生和女生身高的样本平均数分别为170.6,160.6.根据男生、女生身高的样本平均数以及他们各自的人数,可以估计总体平均数为即估计树人中学高一年级学生的平均身高在165.2cm左右.上面我们按性别变量,把高一学生划分为男生、女生两个身高差异较小的子总
4、体分别进行抽样,进而得到总体的估计.一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n. 我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平
5、均数和样本平均数分别为第2层的总体平均数和样本平均数分别为总体平均数和样本平均数分别为由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.在比例分配的分层随机抽样中,可得因此,在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数问题4 与考察筒单随机抽样估计效果类似,小明也想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级的学生中抽取了10个样本量为50的样本,计算出样本平均数如表所示. 与上一小节“探究”中相同样本量的简单随机抽样的结果比较,有什么发现? 把分层随机抽样的
6、平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示(如图),其中红线表示整个年级学生身高的平均数.从试验结果看,分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层随机抽样并没有明显优于简单随机抽样.但相对而言,分层随机抽样的样本平均数波动幅度更均匀,简单随机抽样中出现了一个(第2个)偏离总体平均数的幅度比较大的样本平均数,即出现了比较“极端”的样本,而分层随机抽样没有出现.实际上,在个体之间差异较大的情形下,只要选取的分层变量合适,使得各层间差异明显、层内差异不大,分层随机抽样的效果一般会好于简单随机抽样,也好于很多其他抽样方法.分层随机抽样的组织实施也比
7、简单随机抽样方便,而且除了能得到总体的估计外,还能得到每层的估计.在实际抽样调查中,由于实际问题的复杂性,除了要考虑获得的样本的代表性,还要考虑调查实施中人力、物力、时间等因素,因此通常会把多种抽样方法组合起来使用.(二) 课堂练习1. 下列问题中,最适合用分层抽样抽取样本的是()A从10名同学中抽取3人参加座谈会B某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个,为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本C从1000名工人中,抽取100名调查上班途中所用时间D从生产流水线上,抽取样本检查产品质量答案:B解析:A中总体个体无明显差异
8、且个数较少,适合用简单随机抽样;C和D中总体个体无明显差异且个数较多,适合用系统抽样;B中总体个体差异明显,适合用分层抽样故选B.2. 某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为()A100 B150 C200 D250答案:A解析:由题意得,解得n100.故选A.3. 某校做了一次关于“感恩父母”的问卷调查,从810岁,1112岁,1314岁,1516岁四个年龄段回收的问卷依次为:120份,180份,240份,x份因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在1112岁学生问卷中抽取60份,则在1516岁学生中抽取的问卷份数为()A60B80C120D180答案:C解析:1112岁回收180份,其中在1112岁学生问卷中抽取60份,抽样比为,因为分层抽取样本的容量为300,故回收问卷总数为900份,故x900120180240360份,360120份故选C.(四) 小结作业小结:1. 分层随机抽样的概念;2. 分层随机抽样的方法及计算.作业:四、 板书设计9.1.2 分层随机抽样1. 分层随机抽样;层;比例分配;2. 总体平均数;样本平均数;