1、最新考纲 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解他们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题第2讲 用样本估计总体1用样本的频率分布估计总体分布(1)频率分布:样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的_,所有数据(或者数据组)的频率的分布变化规律叫做_
2、(2)作频率分布直方图的步骤:求极差,即一组数据中的_与_的差;决定_;将_;列_;画频率分布直方图知 识 梳 理频率频率分布最大值最小值组距与组数数据分组频率分布表在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示,各小长方形的面积总和等于_.(3)总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线各小长方形的面积1频率组距(4)茎叶图:统计中还有一种被用来表示数据的图叫茎叶图,茎是指中间一列数,叶是
3、从茎的旁边生长出来的数当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便2用样本的数字特征估计总体的数字特征(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(3)平均数:样本数据的算术平均数,即_(4)样本方差、标准差标准差s_其中xn是样本数据的第n项,n是样本容量,是平均数标准差是反映总体波动大小的特征数,样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体
4、方差x1n(x1x2xn)1n(x1x)2(x2x)2(xnx)21判断正误(在括号内打“”或“”)精彩PPT展示(1)在频率分布直方图中,小矩形的高表示频率()(2)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()诊 断 自 测2.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A46,45,56 B46,45,53C47,4
5、5,56 D45,47,53解析 由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为681256.答案 A3(2014山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组下图是根据试验数据制成的频率分布直方图已知第一组与
6、第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6 B8 C12 D18所以第三组有志愿者:0.3615018(人),第三组中没有疗效的有6人,有疗效的有18612(人),故选C.答案 C解析 全体志愿者共有:20(0.240.16)150(人),4由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为_(从小到大排列)解析 不妨设x1x2x3x4,由中位数及平均数均为2,得x1x4x2x34,故这四个数只可能为1,1,3,3或1,2,2,3或2,2,2,2,由标准差为1可得这四个数只能为1,1,3,3.答案 1,1,3,3
7、5(人教A必修3P82A6改编)甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲 0 1 0 2 2 0 3 1 2 4乙 2 3 1 1 0 2 1 1 0 1则机床性能较好的为_答案 乙解析 x甲1.5,x乙1.2,s2甲1.65,s2乙0.76,s2乙s2甲,乙机床性能较好考点一 频率分布直方图【例1】(2014新课标全国卷)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组 75,85)85,95)95,105)105,115)115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直
8、方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解(1)(2)质量指标值的样本平均数为所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.x 800.06 900.26 1000.38 1100.22 1200.08100.质量指标值的样本方差为s2(20)20.06(10)20.2600.381020.222020.08104.(3)质量指标值不低于95的产品所占比例的估计值为0380.220.080.68.由于
9、该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定规律方法 解决频率分布直方图的问题,关键在于找出图中数据之间的联系这些数据中,直接的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积组距频率组距频率,小长方形面积之和等于 1,即频率之和等于 1,就可以解决直方图的有关问题.【训练1】某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,
10、104),104,106已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()A90 B75 C60 D45答案 A解析 产品净重小于 100 克的频率为(0.0500.100)20.300,已知样本中产品净重小于 100 克的个数是 36.设样本容量为 n,则36n 0.300,所以 n120,净重大于或等于 98 克并且小于 104 克的产品的频率为(0.1000.1500.125)20.750,所以样本中净重大于或等于98 克并且小于 104 克的产品的个数是 1200.75090.考点二 茎叶图【例2】(2014广东卷)某车间20名工
11、人年龄数据如下表:年龄(岁)工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计 20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差解(1)由题意可知,这20名工人年龄的众数是30,极差是401921.(2)这20名工人年龄的茎叶图如图所示:(3)这 20 名工人年龄的平均数为x 120(1932832953043133240)30,这 20 名 工 人年龄 的 方差为 s2 12020i1(xi x)2 1126227125021022025220 12.6.规律方法(1)茎
12、叶图的绘制需注意:“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等【训练2】(2015海口调研)某样本数据的茎叶图如图所示,若该组数据的中位数为85,则该组数据的平均数为_答案 85.3解析 依题意得,将样本数据由小到大排列,中间的两个数之和等于 852170,因此 x6,样本数据的平均数等于 110(70280690253)85.3.考点三
13、 用样本的数字特征估计总体的数字特征【例3】甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价解(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分x甲1013121416513,x乙1314121214513,s2甲15(1013)2(1313)2(1213)2(1413)2(1613)24,从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高规律方法 平均数与方
14、差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小s2乙15(1313)2(1413)2(1213)2(1213)2(1413)20.8.(2)由 s2甲s2乙可知乙的成绩较稳定【训练3】(1)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A.1169B.367C36D.6 77(2)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A甲的成绩的平均
15、数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差解析(1)由题意知879490919090 x91791,解得 x4.所以 s217(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)217(16910190)367.答案(1)B(2)C(2)由题意可知,甲的成绩为 4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为 6,A 错;甲、乙的成绩的中位数分别为 6,5,B 错;甲、乙的成绩的方差分别为15(46)2(56)2(66)2(76)2(8
16、6)22,15(56)2(56)2(56)2(66)2(96)2125,C 对;甲、乙的成绩的极差均为 4,D 错思想方法1用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计2茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作3若取值 x1,x2,xn
17、的频率分别为 p1,p2,pn,则其平均值为 x1p1x2p2xnpn;若 x1,x2,xn 的平均数为x,方差为 s2,则 ax1b,ax2b,axnb的平均数为 axb,方差为 a2s2.易错防范1在使用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义2利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和3直方图与条形图不要搞混(1)条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距,因此其高度与宽度均有意义(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列.