1、排查随机抽样中的“雷区”山东 韩文文随机抽样问题基本概念较多,联系密切,方法独特,解题时稍有疏忽就会致错。下面就随机抽样中的常见“雷区”予以排查,以使同学们防微杜渐。一、概念理解不透彻例1. 为了了解参加第十一届全运会的2000名运动员的身高情况,从中抽取100名运动员进行调查。就这个问题,下面说法中正确的是( )2000名运动员是总体;每个运动员是个体;所抽取的100名运动员是一个样本;样本容量为100;这个抽样方法可采用按参加的运动项目进行分层抽样;每个运动员被抽到的可能性相等。A. B. C. D.错解:6种说法都正确,应选D。剖析:抽样的目的是了解参加运动会的2000名 运动员的“身高
2、情况”,故总体应该是“这2000名运动员的身高”,而不是“这2000名运动员”;同理,个体应该是“每个运动员的身高”,样本应该是“所抽取的100名运动员的身高”。错解对“总体”、“个体”和“样本”的概念理解不透致误。正解:都不对。故应选A。二、审题不仔细例2. 一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10个小组,组号依次为1,2,3,10。现用系统抽样法抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码个位数字要与m+k的个位数字相同。若m=6,则在第7组中抽取的号码是 。错解:m=6,k=7,故m+k=13,它的个位数字是
3、3,所以在第7组中抽取的号码是73。剖析:审题不仔细,错因是第7组中个体的号码错误,第7组应为60,61,62,69,即第7组号码中抽到的号码十位数为6。正解:因为m=6,k=7,所以m+k=13,它的个位为3,依据题意,第7组的号码为60,61,62,69。所以第7组抽取的号码应为63。三、违背抽样原理例3.要从学校的10013名学生中抽取100名进行健康检验,采用何种抽样方法较好,并写出过程。错解:应采用系统抽样法。具体过程如下:有系统抽样的步骤先分为100段,其中前87段每段100人,后13段每段101人,再在第一段中用简单随机抽样确定起始个体编号为l;然后将l+100,l+200,l+
4、9900分别抽出,得到第2,3,100个编号,从而获得整体样本。剖析:上面的解法违背了系统抽样的等距均分原理,抽出的个体不都是处在每段的同一位置上,前87段与后13段各自处的位置不一样,导致抽样的不公平性,所以解法是错误的,必须先要随机地去掉13人。正解:由系统抽样的步骤可知编号分段时,10013100不为整数,应先从总体中随机去掉13人,再按如下步骤操作:采用随机的方式将总体中的个体编号为1,2,3,10000;把总体分成100段,每段=100人;在第一段中用简单随机抽样确定起始个体编号为l;将l+100,l+200,l+9900分别抽出,得到第2,3,100个编号,从而获得整个样本。四、方
5、法运用不当例4. 某电视台在网络上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2435453739561072该电视台为进一步了解观众的具体想法和意见,打算从中抽选出60人进行更为详细的问卷调查,请帮助设计合理的抽样方法。错解:由于参加调查的总体容量较大,所以采用系统抽样法比较好。剖析:总体的容量较大是事实,但是题意中还有一条“持不同态度的人数差异也较大”,故不宜采用系统抽样法,应采用分层抽样法。错解中对题意理解不透,只考虑了总体容量,而忽略了各层明显的差异性致误。正解:因为总体容量较大,所以不宜采用简单随机抽样法;又由于持不同态度的人数差异较大,故也不宜采用系统抽样法;所以采用分层抽样法较好。因为,所以对持“很喜爱”、“喜爱”、“一般”和“不喜爱”态度的观众依次抽取的人数设为x,y,z,m,则:,解得:x12,y23,z20,m5,即对持“很喜爱”、“喜爱”、“一般”和“不喜爱”态度的观众依次抽取12人、23人、20人、5人。