1、1会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法2了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点3理解样本数据标准差的意义和作用,会计算数据标准差,并能做出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想会用统计思想解决一些简单的实际问题5通过实际问题,借助直观(如实际问题的直方图),认识正态分布曲线的特点及曲线所表示的意义 28548136A BCD11.某单位有老年人人,中年人人,青年人人为了解他们的学历水平,从中抽取容量为的样本,最适合的抽样方法是简单随机
2、抽样系统抽样分层抽样 先从老年人中剔除 人,再分层抽样361631361622D9.由题设,个体有明显差异,因此应选择分层抽样,但抽样比例若是,不能得到整数解值,而先剔除名老年人后按比例,即,能从各层中抽取整数个个体,故选析:(150)5055 A 5,10,15,20,25B 1,2,3,4,5C 2,4,8,16,32D 3,13,23,33,42.3现要从已编号 的枚最新研制的某型号导弹中随机抽取 枚进行发射试验,决定采取系统抽样的方法确定选取的 枚导弹的编号可能是 0010511,2,3,4,5.1,2,3,4,5110110.D.nk kknk由题设,共分个系统,每个系统 个个体,第
3、 个系统的号码是若在其中抽取的号码为,则第个系统应抽的号码是,其中由此可解知应选析 系统抽样号码确认规律应易错点:用错误 1015,17,14,10,15,17,17,316,14,12ABCD.abcabcabcbcacabcba有名工人某天生产同一零件,生产的件数是,设其平均数为,中位数为,众数为,则,从大到小的排列顺序为15171410151717161412141.D.7157abccba依题设,故而解,故选析:对平均数、中位数、众数概念理易错点:解错误23786.5.5.解析由题设所求:方差为1231238.535,35,3535 4.nnxxxxxxxx若数据,的方差为,则数据,的
4、方差为 2N(0)20.023(22)5.PP 已知随机变量 服从正态分布,若,则 0220.023(22)120.023.0.954xPPP 由题设,正态曲线关于直线对称,则以解析:,所不能恰当数形结合进行转易错点:化求解 121._.231nxnxxxx平均数:一组数据的平均数,记为 设有 个数据,则平均数为中位数:一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数当这组数据的个数为奇数时,中位数为中间一个数;当这组数据的个数为偶数时,中位数为中间数据的基本数字特征的两个数的平均数众数:一组数据中出现次数最多的数 2245s_.6.ss极差:一组数据中最大数与最小数的差方差:
5、一组数据中所有数与平均数的差的平方和的平均数,记为,即标准差:方差的算术平方根,记作 12()()()()()()23基本统计图表:象形、条形、折线、直方图、茎叶图频率分布直方图的画图步骤:求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图 以为纵坐标 频率分布折线图:连接频率分布直方图中各小长方形上端的中点所主要统计图表得的折线 45()总体密度曲线:随着样本容量的增加,作频率分布折线图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,则称这条光滑曲线为总体密度曲线茎叶图:中间的数字表示数据的十位 十位和百位数字,旁边的数字分别表示两组数据中各个数据的个
6、位数字 1Nn(nN)_.()_3Nnn简单随机抽样:从含有 个个体的总体中逐个不放回地抽取 个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做有两种常用方法:就是把总体中的 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签,连续抽取 次,就得到一个容量抽样方法为 的样本 ()_2()()()1()()3_.Nkl lk:利用随机数表、随机数骰子或计算机产生的随机数进行抽样系统抽样:按下列步骤进行抽样:先将总体的 个个体编号;确定分段间隔,对编号进行分段;在第 段用简单随机抽样确定第一个个体编号;按照一定的规则抽取样本分层
7、抽样:即 21_.()()d_4_.baxNabP abxx ,如果随机变量 的概率密度为其中、分别表示总体的平均数与标准差,称 服从参数为、的正态分布,记作,函数图象称为正态密度曲线,简称正态曲线一般的,如果对于任何实数,随机变量 满足,则称正态分布的分布为 2_0,10,13()()()NNxxxx标准正态分布在正态分布中,当,时,正态总体称为标准正态总体,正态分布,称为标准正态分布,记作 正态曲线的性质曲线在 轴的上方,与 轴不相交;曲线关于直线对称;曲线在时位于最高点;()x()xx 当时,曲线上升;当时,曲线下降,并且当曲线向左、右两边无限延伸时,以 轴为渐近线向它无限靠近;当 一定
8、时,曲线的形状由 确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中 22224().5()()0.6826(22)0.9544(33)0.9974.6()_3NEDXNPXPXPXNX若,则,若,则,通常认为服从正态分布,的随机变量 只取,并简称之为原则222221212()2.1()201(33)nnxxxxxxxxxxnnex ;简单随机抽样;抽签法;随机数表法;在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽出一定数量的个体,将各层取出的个体合在一起作为样本;,;正态分布;,【要点指南】之间的值510.61820.5980.
9、6250.6280.5950.6390.6180.6130.5920.(20096220.6 0)2abb a设矩形的长为,宽为,其比满足,这种矩形给人以美感,称为黄金矩形黄金矩形常应用于工艺品设计中下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:乙批次:例1四川卷题型一用样本估计总体0.618()ABCD根据上述两个样本来估计两个批次的总体平均数,与标准值比较,正确结论是 甲批次的总体平均数与标准值更接近乙批次的总体平均数与标准值更接近两个批次总体平均数与标准值接近程度相同两个批次总体平均数与标准值接近程度不能确定0.6170.613.A甲批次的平均数为,乙批次的平
10、均数为所以,可以估计甲批次的总体平均数与标准值更接解近,故选析:评析:样本估计总体即以样本的平均数、方差估计总体的平均数、方差 22100,18164236N某批材料的强度 服从正态分布,任取一件这种材料,强度在的概率变式:是多少?20018.(164236)(2002 182002 18)(22)0.9544.1640.954236.4PPP依题意,得,则故任取一件材料,其强度在的概率是解析:200(h)100,20022.(201100,300300,400400,500500,600600,700)某工厂对个电子元件的使用寿命进行检查,按照使用寿命 单位:,可以把这批电子元件分成第一组,
11、第二组,第三组,第四组,第五组,第六组,由于工作不慎将部分数据丢失,现留有以例皖南八校联考下部分图表:题型二 频率分布直方图及应用分组100,200)200,300)300,400)400,500)500,600)600,700频数B30EF20H频率CD0.20.4GI 1223300 hABCDEFGHI求图 中的 及表格中的,的值;求上图中阴影部分的面积;若电子元件的使用时间超过,则为合格产品,求这批电子元件合格的概率 10.11000.001.300.1200.10.152002000.2200400.4200800.110100.05.20020.40.10.5.3300 h1501
12、503.2004AABBCDEFGHIP由题意可知,所以 又,所以,阴影部分的面积电子元件的使用时间超过的共有个,这批电子元件合格的概率解析:评析:熟悉频率的计算方法,掌握直线图中各矩形面积即该区域的频率是分析求解有关频率分布直方图问题的关键和思维的切入点 012.()1 0在生产过程中,测得纤维产品的纤度 表示纤维粗细的一种量 共有个数据,数据分组如下表:完成频率分布表,并在给定的坐标系中画出频率分变式布直方图;分组1.30,134)1.34,138)1.38,142)1.42,146)1.46,150)1.50,1.54)总计频数4253029102100分组频数频率1.30,1.34)4
13、1.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.54)2合计100 21.38,1.501.403(1.30,1.341.32估计纤度落在中的概率及纤度小于的概率是多少?统计方法中,同一组数据常用该组区间的中点值 例如区间的中点值是作为代表据此,估计纤度的期望 1 频率解析:分布表为:分组频数频率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.301.42,1.46)290.291.46,1.50)100.101.50,1.54)20.02合计1001.00 21.38,1.500.300.
14、290.1010.691.400.040.250.302.31.320.041.360.251.400.301.440.291.480.1001.520.0.441.24088纤度落在中的概率约为,纤度小于的概率约为总体数据的期望约为10(cm)182,158,162,170,179,163,168,3.179,171,168159,168,162,170,173,165,181,176,178,179(2010)随机抽取某中学甲、乙两班各名同学,测量他们的身高 单位:,获得身高数据如下:甲例广东班:调:研乙班题型三 茎叶图及应用 12310173 cm176 cm根据甲、乙两班身高的数据画出
15、对应的茎叶图,并依据茎叶图判断哪个班的平均身高较高;计算甲班的样本方差;现从乙班这名同学中随机抽取两名身高不低于的同学,求身高为的同学被抽中的概率 1160 cm179 cm170 cm180 cm茎叶图如下:由茎叶图可知:甲班同学的身高集中于之间,而乙班同学的身高集中于之间,因此,乙班同学的平均身高解析:高于甲班甲班乙班21819 9 1 0170 3 6 8 98 8 3 2162 5 88159 22222222222158162163168168170171 17917918210170 cm1 158170162170163 17016817010168170170170171 17
16、0179170179170182170 57.2.x 甲班的样本方差为 3176 cm.10173 cm181,173181,176181,178181,179179,173179,176179,178178,173178,176176,17310442.105AAP A 设身高为的同学被抽中的事件为 从乙班名同学中抽取两名身高不低于的同学有:,共个基本事件而事件 含有 个基本事件,所以评析:茎叶图为原始数据的再现,方便观察分析平均数和方差,同时也方便添加新的数据 6m/s12m/s3.对甲、乙两名自行车赛手在相同条件下进行了次测试,测得他们的最大速度的数据如下表:画出茎叶图,由茎叶图你能获得
17、哪些信息?分别求出甲、乙两名自行车赛手最大速度数据的平均数、中位数、标准差,并判断选谁参加比赛变式更合适甲273830373531乙332938342836 133.533.画茎叶图,中间数为数据的十位数字:从这个茎叶图上可以看出,甲、乙的最大速度情况都是分布均匀的解,只是乙更好一些;乙的中位数是,甲的中位数是因此,乙发挥比较稳定,总体情析:况比甲好甲 乙729 81 5 7 0 833 8 4 6 233333.963.563333.5.xxss乙甲乙甲,;,;甲的中位数是,乙的中位数是综合比较,选乙参加比赛较为合适2,3,3,7,12,13.7,18.3,2010.5.abab已知总体的各
18、个体的值由小到大依次为,且总体的中位数为若要使该总体的方差最小,则、的取值分别备选例题是222222222222210.510.21 23371213.71018.32010 10 10.510.5.abxsaba=bsab由中位数的定义知,当时,有最小值,此时,解析:1统计的基本思想方法是用样本估计总体,即用局部推断整体,这就要求样本应具有很好的代表性,而样本良好客观的代表性,完全依赖抽样方法 三种抽样方法的比较:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相等的;均属于不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少分层抽样将总体分成几层进行抽
19、取各层抽样时采用简单随机抽样总体由差异明显的几部分组成系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多2.频率分布直方图会使样本的一些数字特征更明显,绘制频率分布直方图时,要合理分组,以便使数据中的特征能更好地反映出来 总体分布估计中,(1)先确定分组的组数,其方法是:最大数据与最小数据之差除组距得组数(2)计算每组中的频数及频率,其中频率=.(3)画出直方图 3画茎叶图的步骤如下:(1)将每个数据分为茎(高位)和叶(低位)两部分;(2)将最小茎和最大茎之间数按大小次序排成一列,写在左(右)侧;(3)将各个数据的叶按大小次序写在其茎右(
20、左)侧;频数总数4用样本的数字特征(众数、中位数、平均数)估计总体数字特征5正态分布应用十分广泛,应用正态分布的关键是通过数形结合,利用正态分布曲线分析求解,或转化为“,2,3原则”问题求解6由正态曲线过点(a,0)和点(b,0)的两条x轴的垂线,及x轴所围成的平面图形的面积,就是随机变量落在区间(a,b)的概率的近似值,且正态曲线与x轴围成的总面积为1.B25()A 357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454B 363,371,374,3
21、83,385,386,3A某良种培育基地正在培育一种小麦新品种将其与原有的一个优良品种 进行对照试验两种小麦各种植了亩,所得亩产数据 单位:千克 如下:品种:品种:91,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430 1 完成所附的茎叶图;A B3545444336374038394142 2AB通过观察茎叶图,对品种 与 的亩产量及其稳定性进行比较,写出统计结论(1)茎叶图如错解:图所示:A B9 7354 1 455 5 3444 0 0 4308 7363 5371 45 0 400 1 1
22、3 6 78 383 5 6 9 2391 2 4 4 5 7 7 5 4 2410 2 5 6 7 3 3 1 422 2AB 通过观察茎叶图可以看出:品种 的亩产方差比品种 大,而平均数不便观察()在绘制茎叶图时,“茎”应由大到小或由小到大 排列,同时叶应按大小顺序排列,而错解中茎的排列是错误的,因而不便观察错误分析:平均数 1 茎叶图正解:如图所示:A B9 7358 7 3635371 48383 5 6 9 2391 2 4 4 5 7 7 5 0400 1 1 3 6 7 5 4 2410 2 5 6 7 3 3 1422 4 0 04305 5 3444 1 45 2BAAB通过观察茎叶图,可以发现:品种 的平均亩产量比品种 的平均亩产量高品种 的亩产量不够稳定,而品种 的亩产量比较集中在平均亩产量附近