1、高考资源网提供高考试题、高考模拟题,发布高考信息题本站投稿专用信箱:ks5u,来信请注明投稿,一经采纳,待遇从优14总体分布估计教学目的:1了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布;了解当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布,并会用这两种方式估计总体分布教学重点:用样本的频率分布估计总体分布教学难点:频率分布表和频率分布直方图的绘制授课类型:新授课 课时安排:1课时 教 具:多媒体、实物投影仪 内容分析:统计学中有两个核心问题,一是如何从整体中抽取样本?二是如何用样本估计总体?经过
2、前面的学习,我们已经了解了一些常用的抽样方法本节课,我们在初中学过样本的频率分布的基础上,研究总体的分布及其估计 教学过程:一、复习引入: 1.简单随机抽样:设一个总体的个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样 用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为; 简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等; 简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础(4).简单随机抽样的特点:它是不
3、放回抽样;它是逐个地进行抽取;它是一种等概率抽样2.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本 适用范围:总体的个体数不多时 优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法 3.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码 4.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部
4、分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样系统抽样的步骤:采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 为将整个的编号分段(即分成几个部分),要确定分段的间隔k当(N为总体中的个体的个数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时k=.在第一段用简单随机抽样确定起始的个体编号 按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,这样继续下去,直到获取整个样本) 系统抽样适用于总体中的个体数较多的情况,它与简单随机
5、抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样 5.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层 6.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放
6、回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样随机抽样、系统抽样、分层抽样都是不放回抽样 7. 分布列: x1x2xiPP1P2Pi分布列的两个性质: Pi0,i1,2,; P1+P2+=1 二、讲解新课:频率分布表或频率分布条形图历史上有人通过作抛掷硬币的大量重复试验,得到了如下试验结果:试验结果频数频率正面向上(0)361240.5011反面向上(1)359640.4989抛掷硬币试验的结果的全体构成一个总体,则上表就是从总体中抽取容量为72088的相当大的样本的频率分布表尽管这里的样本容量很大,但由于不同取值仅有2个(用0和1表示),所以其频率分布可以用上表和右面的条形
7、图表示其中条形图是用高来表示取各值的频率试验结果概率正面向上(记为0)05反面向上(记为1)05说明:频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚各长条的宽度要相同;相邻长条之间的间隔要适当当试验次数无限增大时,两种试验结果的频率值就成为相应的概率,得到右表,除了抽样造成的误差,精确地反映了总体取值的概率分布规律这种整体取值的概率分布规律通常称为总体分布. 说明:频率分布与总体分布的关系:通过样本的频数分布、频率分布可以估计总体的概率分布.研究总体概率分布往往可以研究其样本的频数分布、频率分布.2.总体分布:总体取值的概率分布
8、规律 在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布 一般地,样本容量越大,这种估计就越精确 3.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线它反映了总体在各个范围内取值的概率根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积三、讲解范例:例1为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁18岁的男生的体重情况,结果如下(单位:kg)5
9、6.569.56561.564.566.56464.57658.57273.556677057.565.56871756268.562.56659.563.564.567.57368557266.574636055.57064.5586470.55762.5656971.573625876716663.55659.563.5657074.568.56455.572.566.5687657.56071.55769.57464.55961.5676863.5585965.562.569.57264.575.568.5646265.558.567.570.5656666.5706359.5试根据上述
10、数据画出样本的频率分布直方图,并对相应的总体分布作出估计 解:按照下列步骤获得样本的频率分布.(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是7655=21)所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由212=10.5,组数为11,这个组数适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是54.5,56.5),56.
11、5,58.5),74.5,76.5). (4)列频率分布表,如表 频率分布表分组频数累计频数频率54.5,56.5)20.0256.5,58.5)60.0658.5,60.5)100.1060.5,62.5)100.1062.5,64.5)140.1464.5,66.5)160.1666.5,68.5)130.1368.5,70.5)110.1170.5,72.5)80.0872.5,74.5)70.0774.5,76.5)30.03合计1001.00(5)绘制频率分布直方图.频率分布直方图如图所示由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大
12、小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5kg的学生较少,约占8%;等等 例2对某电子元件进行寿命追踪调查,情况如下:寿命()100200200300300400400500500600个数2030804030出频率分布表;()画出频率分布直方图和累计频率分布图;()估计电子元件寿命在100400以内的概率;寿命300200100500400600频率分布直方图()估计电子元件寿命在400以
13、上的概率;()估计总体的数学期望值 解:()寿命频数频率累计频率100200200.10.10200300300.150.25300400800.400.65400500400.200.85500600300.151合计2001()频率分布直方图如右和累计频率分布图如下累计频率寿命30020010050040060010.200.400.100.800.600()频率分布图可以看出,寿命在100400的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100400的概率为0.65 ()由频率分布表可知,寿命在400以上的电子元件出现的频率为0.20+0.150.35,故我们估计电子元件寿
14、命在400以上的概率为0.35 ()样本的期望值为所以,我们估计总体生产的电子元件寿命的期望值(总体均值)为365 四、课堂练习: 1 . 为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品14件列出样本频率分布表;画出表示样本频率分布的条形图;根据上述结果,估计此种商品为二级品或三级品的概率约是多少?解:样本的频率分布表为产品频数频率一级品50.17二级品80.27三级品130.43次品40.13样本频率分布的条形图如右:此种产品为二极品或三极品的概率为0.27+0.43=0.72. 如下表:分 组频数频 率分 组频数频 率10.75,10
15、.85)311.25,11.35)2010.85,10.95)911.35, 11.45)710.95,11.05)1311.45, 11.55)411.05,11.15)1611.55, 11.65)211.15,11.25)26合 计100完成上面的频率分布表根据上表,画出频率分布直方图根据上表,估计数据落在10.95,11.35)范围内的概率约为多少?答案:略数据落在10.95,11.35)范围的频率为0.13+0.16+0.26+0.20=0.75落在10.95,11.35)内的概率约为075 五、小结 :用样本的频率分布估计总体分布,可以分成两种情况讨论:当总体中的个体取不同数值很少(并不是总体中的个数很少)时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图;当总体中的个体取不同值较多、甚至无限时,对其频率分布的研究要用到初中学过的整理样本数据的知识它们的不同之处在于:前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示取各个值的频率;后者的频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率 六、课后作业: 七、板书设计(略) 八、课后记: 共6页 第6页