1、第十一章 概率与统计第 讲(第一课时)考 点搜 索简单随机抽样、系统抽样、分层抽样的含义及操作步骤用样本的频率分布去估计总体分布,会根据频率分布直方图进行数据分析高高 考猜 想1.利用抽样方法,对实际问题进行抽样,确定抽样过程中的相关数据.2.分析频率分布直方图,确定样本中各组的频数、频率,进而对总体进行估计.1.在统计中所有考察对象的全体叫做总体,其中叫做个体;从总体中抽取的一部分个体叫做总体的一个样本,叫做样本的容量.2.通过的方法从总体中抽取一个样本,且每次抽取时被抽到的概率相等,称这样的抽样为简单随机抽样.常用的简单随机抽样方法有;.每个考察对象样本中个体的数目逐个抽取每个个体抽签法
2、随机数表法3.将总体分成的几个部分,然后按照预先定出的规则,从每一部分抽取,得到所需要的样本,称这样的抽样为系统抽样.4.将总体分成几部分,然后按照各部分抽样,得到所需要的样本,称这样的抽样为分层抽样,其中所分成的各部分叫做.5.总体分布是指总体取值的,这种分布我们一般是不知道的,所以要用样本分布去估计总体分布.一般地,样本容量越大,估计就越准确.均衡一个个体所占的比例层概率分布规律6.样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的,所有数据(或者数据组)的频率的分布变化规律叫做,可以用样本频率分布表、样本频率分布条形图或者频率分布直方图等来表示.7.当样本容量无限增大,分组的
3、组距无限缩小时,频率分布直方图就会无限接近于一条光滑曲线,称这条曲线为.总体密度曲线频率样本频率分布1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是()解:简单随机抽样中每个个体的入样概率为,故选C.C3103331A.B.C.D.10 9 81010C nN2.为应对甲型H1N1流感第二波全球大爆发的态势,截至2009年10月31日,我国国家食品药品监督管理局已批准8家疫苗生产企业生产甲型H1N1流感疫苗为了调查这些企业的生产能力,随机抽查了其中一个企业20天每天生产甲型H1N1流感疫苗的数量(单位:万剂),疫苗数量的分组区间为45,55)
4、,55,65),65,75),75,85),85,95),由此得到频率分布直方图如图,则由此估计该企业一个月(以30天计算)生产产品数量在65万剂以上的天数约为 12天.解:生产产品数量在65万剂以上的频率为(0.025+0.010+0.005)10=0.4,故天数约为300.4=12天3.某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取_辆、辆、辆.解:因总轿车数为9200辆,而抽取46辆进行检验,抽样比例为,而三种型号的轿车有显著区别,根据分层抽样分为三层,按比例分别有6辆、30
5、辆、10辆.6301046192002001200题型1 几种常见抽样问题1.某批零件共160个,其中一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.解:(1)简单随机抽样法:可采取抽签法,将160个零件按1160编号,相应地制作1160号的160个签,从中随机抽20个.显然每个个体被取到的概率为.(2)系统抽样法:将160个零件按1至160编号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1k8),则在其余组中分别抽取第k+8n
6、(n=1,2,3,19)号,此时每个个体被取到的概率为.201160818(3)分层抽样法:按比例,分别在一级品、二级品、三级品、等外品中抽取48=6个,64=8个,32=4个,16=2个,每个个体被取到的概率分别为,即都是.综上可知,无论采取哪种抽样,总体中的每个个体被取到的概率都是.点评:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.201160818181818181864884264 32 16,(1)一批产品中有一级品100个,二级品60个,三级品40个,用分层抽样法从这批产品中抽取一个容量为20的样本,应如何抽取?(2)某工厂有1 003名工
7、人,从中抽取10人作某项调查,试简述抽样过程.解:(1)采用分层抽样可按一、二、三级品的个数之比532,从一级品中抽取10个,从二级品中抽取6个,从三级品中抽取4个.抽取时,将一级品中100个产品按00,01,02,99编号;将二级品中的60个产品按00,01,02,59编号,将三级品中的40个产品按00,01,02,39编号,用随机数表法分别抽10个,6个,4个产品,这样取得一个容量为20的样本.(2)第一步,将每个人编一个号由0001到1003.第二步,利用随机数表法找到3个号将这3名工人排除.第三步,将剩余的1 000名工人重新编号0001到1000.第四步,分段,取间隔k=将总体均分为
8、10组,每组含100个工人.第五步,从第一段即0001号到0100号中随机抽取一个号l.第六步,按编号将l,100+l,200+l,900+l共10个号选出.将这10个号所对应的工人抽出即可.100010010,题型2 抽样问题中有关数据的计算2.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容
9、量为200的样本.试确定:1(1)游泳组中,青年人、中年人、老年人分别所占的比例;(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a、b、c,则有b=50%c=10%.,解得40%347.5%410%310%4xxbxxxcx从而a=1-b-c=100%-50%-10%=40%,故游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%.(2)游泳组中,抽取的青年人数为200 40%=60(人);抽取的中年人数为200 50%=75(人);抽取的老年人数为200 10%=15(人).点评:分层抽样的特
10、点是按比例抽取,这是分层抽样问题中一个主要计算依据.343434在120个零件中,一级品24个,二级品36个,三级品60个.用系统抽样法从中抽取容量为20的样本.则每个个体被抽取到的概率是()解:因总体数是120,样本容量是20,所以每个个体被抽到的概率是.故选D.1111A.B.C.D.2436606 D 20112063.某初级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270;使用系统抽样时,将学生统一随机编号
11、为 1,2,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:题型3 抽样方法的对比分析7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是()A.都不能为系统抽样B.都不能为分层抽样C.都可能为系统抽样D.都可能为分层抽样解:可能为分层抽样或系统抽样,可能为分层抽样,不能为系统抽样,故选D.D 点评:三种抽样各有
12、其特点:随机抽样的号码一般没有什么规律;分层抽样是各层抽取的个数与样本容量数成比例;系统抽样的编号数有一定的规律,如等距离.某公司甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取7个调查其收入和售后服务等情况,记这项调查为.则完成、这两项调查宜采用的抽样方法依次是()A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法解:易知调查宜用分层抽样法,而调查宜用简单随机抽样法.故选B.B 1.三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体个数较多类别共同点各自特点相互联系 适用范围分层抽样抽样过程中每个个体被抽取的概率相等将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.掌握三种抽样方法的适用范围是正确选取抽样方法的前提.一般地,总体的个体数较少时,用简单随机抽样;总体的个体较多时,用系统抽样;总体是由差异明显的几部分组成时,用分层抽样.