1、11.1随机抽样1简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段当(n是样本容量)是整数时,取k;(3)在第1段用简单随机抽样确定第一个个体编号l (lk);(4)按照一定的规则抽取样本通常是将l加上间隔k得到第2个个体编号(lk),再加k得到第3个个体编号(l2k),依次进行下去,直到获取整个
2、样本3分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样【思考辨析】判断下面结论是否正确(请在括号中打“”或“”)(1)简单随机抽样是一种不放回抽样()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关()(3)系统抽样在起始部分抽样时采用简单随机抽样()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()(5)分层抽样中,每个个体被抽到的
3、可能性与层数及分层有关()1某公司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A33人,34人,33人 B25人,56人,19人C20人,40人,30人 D30人,50人,20人答案B解析因为12528095255619,所以抽取人数分别为25人,56人,19人2为了调查某产品的销售情况,销售部门从下属的92家销售连锁店中抽取30家了解情况若用系统抽样法,则抽样间隔和随机剔除的个体数分别为()A3,2 B2,3C2,30 D30,2答案A解析92被30除余数为2,
4、故需剔除2个数,90303,间隔为3.3将参加英语口语测试的1 000名学生编号为000,001,002,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,019,且第一组随机抽取的编号为015,则抽取的第35个编号为()A700 B669 C695 D676答案C解析由题意可知,第一组随机抽取的编号l15,分段间隔数k20,则抽取的第35个编号为a3515(351)20695.4某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为235,现用分层抽样方法抽出一个容量为n的样本,样本中A型产品有16件,那么此样本容量n_.答案80解
5、析依题意A、B、C三种不同型号样本个数之比为235,样本中B型产品有24件,C型产品有40件,n16244080.题型一简单随机抽样例1下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取100个个体作为样本(2)盒子里共有80个零件,从中选出5个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里(3)从20件玩具中一次性抽取3件进行质量检验(4)某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛思维点拨由简单随机抽样的特征判断解(1)不是简单随机抽样因为被抽取的样本总体的个体数是无限的,而不是有限的(2)不是简单随机抽样因为它是放回抽样(
6、3)不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取(4)不是简单随机抽样因为不是等可能抽样思维升华(1)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;是不放回抽取;是等可能抽取(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数法(适用于个体数较多的情况)(2013江西)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()781665720802631407024369972801983204923449358200
7、3623486969387481A.08 B07 C02 D01答案D解析从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.题型二系统抽样例2将参加夏令营的600名学生编号为001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为()A26,16,8 B25,17,8C25,16,9 D24,17,9思维点拨根据“等距”抽样确定各营区被抽中的人数答案B解析由题意
8、及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(kN*)组抽中的号码是312(k1)令312(k1)300得k,因此第营区被抽中的人数是25;令300312(k1)495得k42,因此第营区被抽中的人数是422517.结合各选项知,选B.思维升华(1)系统抽样适用的条件是总体容量较大,样本容量也较大(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定(2013陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,
9、将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11 B12 C13 D14答案B解析由20,即每20人抽取1人,所以抽取编号落入区间481,720的人数为12(人)题型三分层抽样例3(2014广东)已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A200,20 B100,20C200,10 D100,10答案A解析该地区中小学生总人数为3 5002 0004 50010 000,则样本容量为10 0002%200,其中
10、抽取的高中生近视人数为2 0002%50%20,故选A.思维升华进行分层抽样的相关计算时,常利用以下关系式巧解:(1);(2)总体中某两层的个体数之比样本中这两层抽取的个体数之比(2013湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于()A9 B10 C12 D13答案D解析,n13.五审图表找规律典例:(12分)某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:人数管理技术开发营销生产共
11、计老年40404080200中年80120160240600青年401602807201 200共计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对广州亚运会举办情况的了解,则应怎样抽样?审题路线图抽取40人调查身体状况(观察图表中的人数分类统计情况)样本人群应受年龄影响(表中老、中、青分类清楚,人数确定)要以老、中、青分层,用分层抽样要开一个25人的座谈会(讨论单位发展与薪金调整)样本人群应受管理、技术开发、营销、生产方面的影响(表中管理、技术开发、营
12、销、生产分类清楚,人数确定)要以管理、技术开发、营销、生产人员分层,用分层抽样要抽20人调查对广州亚运会举办情况的了解(可认为亚运会是大众体育盛会,一个单位人员对情况了解相当)将单位人员看作一个整体(从表中数据看总人数为2 000人)人员较多,可采用系统抽样规范解答解(1)按老年、中年、青年分层,用分层抽样法抽取,1分抽取比例为.2分故老年人,中年人,青年人各抽取4人,12人,24人4分(2)按管理、技术开发、营销、生产分层,用分层抽样法抽取,5分抽取比例为,6分故管理,技术开发,营销,生产各部门抽取2人,4人,6人,13人8分(3)用系统抽样,对全部2 000人随机编号,号码从0001200
13、0,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,1 900,共20人组成一个样本12分温馨提醒(1)本题审题的关键有两点,一是对图表中的人员分类情况和数据要审视清楚;二是对样本的功能要审视准确(2)本题易错点是,对于第(2)问,由于对样本功能审视不准确,按老、中、青三层分层抽样方法与技巧1简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距2系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样
14、3分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样失误与防范进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.A组专项基础训练(时间:25分钟)1(2013课标全国)为了了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是
15、()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样答案C解析不同的学段在视力状况上有所差异,所以应该按照学段分层抽样2某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()A6 B8 C10 D12答案B解析设样本容量为N,则N6,N14,高二年级所抽学生人数为148.3某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学
16、生按一、二、三年级依次统一编号为1,2,270,使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,2505,9,100,107,111,121,180,195,200,26511,38,65,92,119,146,173,200,227,25430,57,84,111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是()A、都不能为系统抽样 B、都不能为分层抽样C、都可能为系统抽样 D、都可能为分层抽样答案D解析因为为系统抽样,所以选项A不对;
17、因为为分层抽样,所以选项B不对;因为不为系统抽样,所以选项C不对,故选D.4为规范学校办学,省教育厅督察组对某所高中进行了抽样调查抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应为()A13 B19 C20 D51答案C解析抽样间隔为463313,故另一位同学的编号为71320,选C.5某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生是高一学生的两倍,高二学生比高一学生多300人,现在按的抽样比例用分层抽样的方法抽取样本,则高一学生应抽取的人数为()A8 B11 C16
18、 D10答案A解析设高一学生有x人,则高三学生有2x人,高二学生有(x300)人,学校共有4x3003 500(人),解得x800(人),由此可得按的抽样比例用分层抽样的方法抽取样本,高一学生应抽取的人数为8008(人),故应选A.6已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否达标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则61组抽出的号码为_答案1211解析每组袋数:d20,由题意知这些号码是以11为首项,20为公差的等差数列,a611160201211.7将某班的60名学生编号为01,02,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号
19、码为04,则剩下的四个号码依次是_答案16,28,40,52解析编号组数为5,间隔为12,因为在第一组抽得04号:41216,161228,281240,401252,所以其余4个号码为16,28,40,52.8某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生答案15解析抽取比例与学生比例一致设应从高二年级抽取x名学生,则x50310.解得x15.9某校共有学生2 000名,各年级男、女学生人数如下表已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,
20、则应在三年级抽取的学生人数为_.一年级二年级三年级女生373xy男生377370z答案16解析依题意可知二年级的女生有380人,那么三年级的学生人数应该是2 000373377380370500,即总体中各个年级的人数比为332,故在分层抽样中应在三年级抽取的学生人数为6416.10用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1160编号,按编号顺序平均分成20组(18号,916号,153160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是_答案11解析由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出
21、个体的号码应该为x(n1)8,所以第16组应抽出的号码为x(161)8123,解得x3,所以第2组中应抽出个体的号码为3(21)811.B组专项能力提升(时间:15分钟)11(2014湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()Ap1p2p3 Bp2p3p1Cp1p3p2 Dp1p2p3答案D解析由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1p2p3.12采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单
22、随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A7 B9 C10 D15答案C解析由系统抽样的特点知:抽取号码的间隔为30,抽取的号码依次为9,39,69,939.落入区间451,750的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729459(n1)30,解得n10.所以做问卷B的有10人13某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为_答案160
23、解析关键是确定样本的抽取比例男生人数为560160.14.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,采用系统抽样方法,按1200编号分为40组,分别为15,610,196200,第5组抽取号码为22,第8组抽取号码为_若采用分层抽样,40岁以下年龄段应抽取_人答案3720解析将1200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为223537;由已知条件200名职工中40岁以下的职工人数为20050%100,设在40岁以下年龄段中应抽取x人,则,解得x20.15一个总体中有90个个体,随机编号0,1,2,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,9.现用系统抽样方法抽取一个容量为9的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与mk的个位数字相同,若m8,则在第8组中抽取的号码是_答案76解析由题意知:m8,k8,则mk16,也就是第8组抽取的号码个位数字为6,十位数字为817,故抽取的号码为76.