1、11.1随机抽样1.简单随机抽样(1)定义:一般地,从个体数为N的总体中逐个不放回地取出几个个体作为样本(nN),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数表法.2.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k;当不是整数时,可随机地从总体中剔除余数再确定分段间隔;(3)在第1段用简单随机抽样确定第一个个体编号l (lk);(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(lk),再加k
2、得到第3个个体编号(l2k),依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.判断下面结论是否正确(请在括号中打“”或“”)(1)简单随机抽样是一种不放回抽样.()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(3)系统抽样在起始部分抽样时采用简单随机抽样.()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学
3、生,这样对被剔除者不公平.()(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()2.(2012江苏)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生.答案15解析抽取比例与学生比例一致.设应从高二年级抽取x名学生,则x50310.解得x15.3.将参加英语口语测试的1 000名学生编号为000,001,002,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,019,且第一组随机抽取的编号为015,则抽取的第35个编号为_.答案695
4、解析由题意可知,第一组随机抽取的编号l15,分段间隔数k20,则抽取的第35个编号为a3515(351)20695.4.大、中、小三个盒子中分别装有同一种产品120个、60个、20个,现在需从这三个盒子中抽取一个样本容量为25的样本,较为恰当的抽样方法为_.答案简单随机抽样解析因为三个盒子中装的是同一种产品,且按比例抽取每盒中抽取的不是整数,所以将三盒中产品放在一起搅匀按简单随机抽样法(抽签法)较为适合.5.一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为_.答案12解析样本的抽取比例为, 所以应抽取男运动员48
5、12(人).题型一简单随机抽样例1下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本.(2)盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.(3)从20件玩具中一次性抽取3件进行质量检验.(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.思维启迪判断一个抽样是否为简单随机抽样,要判断是否符合简单随机抽样的特征.解(1)不是简单随机抽样.因为被抽取的样本总体的个体数是无限的,而不是有限的.(2)不是简单随机抽样.因为它是放回抽样.(3)不是简单随机抽样.因为这是“一次性”抽
6、取,而不是“逐个”抽取.(4)不是简单随机抽样.因为不是等可能抽样.思维升华(1)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;是不放回抽取;是等可能抽取.(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况).(2013江西改编)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_.7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3
7、623 4869 6938 7481答案01解析从第1行第5列、第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.题型二系统抽样例2将参加夏令营的600名学生编号为001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为_.思维启迪系统抽样又称“等距抽样”.可以根据“等距”确定各营区被抽中的人数.答案25,17,8解析由题意及系统抽样的定义可知,将这600名学生按编号依次分成5
8、0组,每一组各有12名学生,第k(kN*)组抽中的号码是312(k1).令312(k1)300得k,因此第营区被抽中的人数是25;令300312(k1)495得k42,因此第营区被抽中的人数是422517.结合各选项知.思维升华(1)系统抽样的特点机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.(2013陕西改编)某单位有840名职工,现采用系统抽
9、样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为_.答案12解析由20,即每20人抽取1人,所以抽取编号落入区间481,720的人数为12(人).题型三分层抽样例3(2013湖南改编)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于_.思维启迪分层抽样,抽样比是一个定值.答案13解析,n13.思维升华在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所
10、抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即niNinN.某校共有学生2 000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为_.一年级二年级三年级女生373xy男生377370z答案16解析依题意我们知道二年级的女生有380人,那么三年级的学生人数应该是2 000373377380370500,即总体中各个年级的人数比为332,故在分层抽样中应在三年级抽取的学生人数为6416.五审图表找规律典例:(14分)某单位有2 000名职工,老年、中年、青年分布在
11、管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共计老年40404080200中年80120160240600青年401602807201 200小计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽取出席人?(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?抽取40人调查身体状况(观察图表中的人数分类统计情况)样本人群应受年龄影响(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样要开一个25人的座谈会(讨论单位发展与薪金调整)样本人群
12、应受管理、技术开发、营销、生产方面的影响(表中管理、技术开发、营销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样(可认为亚运会是大众体育盛会一个单位人员对情况,了解相当)要抽20人调查对广州亚运会举办情况的了解将单位人员看作一个整体(从表中数据看总人数为2 000人)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层,用分层抽样法抽取,2分抽取比例为.3分故老年人,中年人,青年人各抽取4人,12人,24人.6分(2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,8分抽取比例为,10分故管理,技术开发,营销,生产各抽取2人,4人,6人,13人.11
13、分(3)用系统抽样,对全部2 000人随机编号,号码从00012000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,1 900,共20人组成一个样本.14分温馨提醒(1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确.(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样.方法与技巧三种抽样方法的比较类别各自特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的
14、规则分别在各部分中抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成失误与防范进行分层抽样时应注意几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.A组专项基础训练(时间:25分钟)1.(2012四川改编)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙
15、、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为_.答案808解析由题意知抽样比为,而四个社区一共抽取的驾驶员人数为12212543101,故有,解得N808.2.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为_.答案8解析设样本容量为N,则N6,N14,高二年级所抽人数为148.3.某单位有职工750人,其中青年职工3
16、50人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为_.答案15解析由题意知青年职工人数中年职工人数老年职工人数350250150753.由样本中青年职工为7人得样本容量为15.4.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学 生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为_.答案20解析抽样间隔为463313,故另一位同学的编号为71320.5.某学校高一、高二、高三三个年级共有
17、学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为_.答案8解析设高一学生有x人,则高三学生有2x人,高二学生有(x300)人,学校共有4x3003 500(人),解得x800(人),由此可得按的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为8008.6.(2012天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取_所学校.答案189解析15015018,759.7.将某班的60名学生编号为
18、01,02,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是_.答案16,28,40,528.(2012福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_.答案12解析依题意,女运动员有985642(人).设应抽取女运动员x人,根据分层抽样特点,得,解得x12.9.课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为_.答案2解析由已知得抽样比为,丙组
19、中应抽取的城市数为82.10.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1160编号,按编号顺序平均分成20组(18号,916号,153160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是_.答案11解析由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x(n1)8,所以第16组应抽出的号码为x(161)8123,解得x3,所以第2组中应抽出个体的号码为3(21)811.B组专项能力提升(时间:25分钟)1.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽
20、样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270,使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,2505,9,100,107,111,121,180,195,200,26511,38,65,92,119,146,173,200,227,25430,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是_.(填序号)(
21、1)、都不能为系统抽样;(2)、都不能为分层抽样;(3)、都可能为系统抽样;(4)、都可能为分层抽样.答案(4)解析因为为系统抽样,所以(1)不对;因为为分层抽样,所以(2)不对;因为不为系统抽样,所以(3)不对,只有(4)正确.2.(2012山东改编)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为_.答案10解析由系统抽样的特点知:抽取号码的间隔为30,抽取的号码
22、依次为9,39,69,939.落入区间451,750的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729459(n1)30,解得n10.所以做问卷B的有10人.3.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为_.答案404.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1200编号分为40组,分别为15,610,196200,第5组抽取号码为22,第8组抽取号码为_.若采用分层抽样,40岁以下年龄段应抽取_人.答案3720解析将1200编号分为4
23、0组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为223537;由已知条件200名职工中40岁以下的职工人数为20050%100,设在40岁以下年龄段中应抽取x人,则,解得x20.5.一个总体中有90个个体,随机编号0,1,2,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同,若m8,则在第8组中抽取的号码是_.答案76解析由题意知:m8,k8,则mk16,也就是第8组抽取的号码个位数字为6,十位数字为817,故抽取的号码为
24、76.6.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行抽查,发现共120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是_.答案5.7%解析该地拥有3套或3套以上住房的家庭可以估计有99 0001 0005 700(户),所以所占比例的合理估计是5 700100 0005.7%.7.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.解总体容量为6121836.当样本容量是n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为6,技术员人数为12,技工人数为18,所以n应是6的倍数,36的约数,即n6,12,18.当样本容量为(n1)时,总体容量是35人,系统抽样的间隔为,因为必须是整数,所以n只能取6.即样本容量n6.