1、12.3 统 计知识梳理1.抽样当总体中的个体较少时,一般可用简单随机抽样;当总体中的个体较多时,一般可用系统抽样;当总体由差异明显的几部分组成时,一般可用分层抽样,而简单随机抽样作为一种最简单的抽样方法,又在其中处于一种非常重要的地位.实施简单随机抽样,主要有两种方法:抽签法和随机数表法.系统抽样适用于总体中的个体数较多的情况,因为这时采用简单随机抽样就显得不方便,系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均匀分后的每一段进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样也属于等概率抽样.分层抽样在内容上与系统抽样是平行的,在每一层进行抽样时,采用简单随机抽样或
2、系统抽样,分层抽样也是等概率抽样.2.样本与总体用样本估计总体是研究统计问题的一种思想方法.当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图,当总体中的个体取不同值较多,甚至无限时,其频率分布的研究要用到初中学过的整理样本数据的知识.用样本估计总体,除在整体上用样本的频率分布去估计总体的分布以外,还可以从特征数上进行估计,即用样本的平均数去估计总体的平均数,用关于样本的方差(标准差)去估计总体的方差(标准差).特别提示在三种抽样中,简单随机抽样是最简单、最基本的抽样方法,其他两种抽样方法是建立在它的基础上的.三种抽样方法的共同点是
3、:它们都是等概率抽样,体现了抽样的公平性.三种抽样方法各有其特点和适用范围,在抽样实践中要根据具体情况选用相应的抽样方法.点击双基1.一个总体中共有10个个体,用简单随机抽样的方法从中抽取一容量为3的样本,则某特定个体入样的概率是A.B.C.D. 解析:简单随机抽样中每一个体的入样概率为.答案:C2.(2004年江苏,6)某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示.根据条形图可得这50名学生这一天平均每人的课外阅读时间为A.0.6 hB.0.9 hC.1.0 hD.1.5 h解析:一天平均每人的课外阅读时间应为一天的
4、总阅读时间与学生数的比,即=0.9 h.答案:B3.一个年级有12个班,每个班有50名同学,随机编号为150号,为了了解他们在课外的兴趣爱好,要求每班的33号学生留下来参加阅卷调查,这里运用的抽样方法是A.分层抽样法 B.抽签法C.随机数表法 D.系统抽样法答案:D典例剖析【例】 某批零件共160个,其中,一级品48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样和分层抽样法抽取时总体中的每个个体被取到的概率均相同.剖析:要说明每个个体被取到的概率相同,只需计算出用三种抽样方法抽取个体时,每个个体被取到的概率.解:(1)简单随机抽样
5、法:可采取抽签法,将160个零件按1160编号,相应地制作1160号的160个签,从中随机抽20个.显然每个个体被抽到的概率为=.(2)系统抽样法:将160个零件从1至160编上号,按编号顺序分成20组,每组8个.然后在第1组用抽签法随机抽取一个号码,如它是第k号(1k8),则在其余组中分别抽取第k+8n(n=1,2,3,19)号,此时每个个体被抽到的概率为.(3)分层抽样法:按比例=,分别在一级品、二级品、三级品、等外品中抽取48=6个,64=8个,32=4个,16=2个,每个个体被抽到的概率分别为,即都是.综上可知,无论采取哪种抽样,总体的每个个体被抽到的概率都是.评述:三种抽样方法的共同
6、点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性.思考讨论现有20张奖券,已知只有一张能获奖,甲从中任摸一张,中奖的概率为,刮开一看没中奖.乙再从余下19张中任摸一张,中奖概率为,这样说甲、乙中奖的概率不一样,是否正确?闯关训练夯实基础1.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的概率为0.25,则N等于A.150 B.200 C.120 D.100解析:=0.25,N=120.答案:C2. (2003年全国,14)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种
7、型号的轿车依次应抽取_辆、_辆、_辆.解析:因总轿车数为9200辆,而抽取46辆进行检验,抽样比例为=,而三种型号的轿车有显著区别.根据分层抽样分为三层按比例分别有6辆、30辆、10辆.答案:6 30 103.一个容量为100的样本,数据的分组和各组的一些相关信息如下:分 组频 数频 率累积频率12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,330.1033,36)1.00合 计1001.00(1)完成上表;(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,总体中小于22的样本数据大约占多大的百分比?解:(1)分
8、 组频 数频 率累积频率12,15)60.060.0615,18)80.080.1418,21)160.160.3021,24)210.210.5124,27)180.180.6927,30)160.160.8530,33)100.100.9533,36)50.051.00合 计1001.00(2)频率分布直方图及累积频率分布图如下:(3)在这个累积频率分布图上,横坐标为22,落在2124的区间内,折线图在这段区间上的线段所在的直线方程是y0.3=(x21),即y=0.07x1.17.当x=22时,y=1.540.17=0.37.因此,总体中小于22的数据大约占37%.思悟小结1.抽样三种方法
9、比较类 别共同点相互联系适用范围各自特点简单随机抽样抽样过程中每个个体被抽到的概率相等总体中的个数较少从总体中逐个抽取系统抽样在起始部分抽样时采用简单随机抽样总体中的个数较多将总体均分成几部分,按事先确定的规则在各部分抽取分层抽样每层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成将总体分成几层,分层进行抽取2.总体分布估计的两种情况比较以上两种情况的不同之处在于前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来取各个值的频率的;后者的频率分布表中列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率.教师下载中心教学点睛简
10、单随机抽样,有以下特点:(1)它要求被抽取样本的总体的个体数有限.这样,就便于对其中各个个体被抽取的概率进行分析.(2)它是从总体中逐个地进行抽取,这样,就便于在抽样实践中进行操作.(3)它是一种不放回抽样.由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等概率抽样.不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程当中,各个个体被抽取的概率相等,从而保证了这种抽样方法的公平性.频率分布随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图
11、就会演变成一条光滑曲线反映总体分布的频率密度曲线,基于频率分布与相应的总体分布的关系,且通常我们并不知道一个总体的分布,因此,我们往往是从总体中抽取一个样本,用样本的频率分布去估计相应的总体分布.统计中假设检验的基本思想是:根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:是拒绝假设,还是接受假设.拓展例题【例题】 设有一样本x1,x2,xn,其标准差为sx,另有一样本y1,y2,yn,其中yi=3xi+2(i=1,2,n),其标准差为sy,求证:sy=3sx.证明:=,=3+2.sy2=(y12+y22+yn2)n 2=(3x1+2)2+(3x2+2)2+(3xn+2)2n(3+2)2=9(x12+x22+xn2)+12(x1+x2+xn)+4nn(92+12+4)=(x12+x22+xn2)n2=9sx2.sx0,sy0,sy=3sx.