1、5用样本估计总体 6统计活动:结婚年龄的变化考纲定位重难突破1.理解频率分布直方图,频率分布折线图的概念.2.会用样本的频率分布估计总体分布.3.会用样本的基本数字特征估计总体的基本数字特征.重点:用样本的频率分布、数字特征估计总体. 难点:1.对频率分布直方图、频率分布折线图的理解与应用.2.根据数字特征,分析、比较总体差异.授课提示:对应学生用书第13页自主梳理1一般地,总体分布是指总体中个体所占的比例2频率分布直方图和频率折线图频率分布直方图频率折线图定义频率分布直方图由一些小矩形来表示,每个小矩形的宽度为xi(分组的宽度),高为fi/xi,小矩形的面积恰为相应的频率fi,图中所有小矩形
2、的面积之和为1在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图当样本容量很大时样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率,因此我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的概率所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线作用用样本分布去估计总体分布情况3.样本平均数和样本标准差假设通过随机抽样得到的样本为x1,x2,xn,则样本平均数.样本标准差s 4估计
3、总体的数字特征样本平均数和样本标准差可分别用来估计总体的平均数和标准差,如果抽样的方法比较合理,那么样本可以反映总体的信息,从样本中所得到的有关总体的估计可能互不相同,这一现象是由抽样的随机性引起的,当样本容量很大时,样本数据确实反映了总体的信息5统计活动的步骤(1)明确调查的目的,确定调查的对象(2)利用随机抽样抽取样本,收集数据(3)整理数据用表格来表示数据(4)分析数据其方法有两种:一是用统计图表来分析,二是计算平均数和标准差,并比较它们的大小(5)作出推断通过分析数据作出推断双基自测1一个容量为100的样本,已知某组的频率为0.3,则该组的频数为()A3B7C30D70解析:根据样本容
4、量与频数、频率的关系,得该组的频数为1000.330.答案:C2将容量为100的样本数据分为8个组,如下表:组号12345678频数1013x141513129则第3组的频率为()A0.03 B0.07 C0.14 D0.21解析:由题意得x100(1013141513129)14,所以第3组的频率为0.14.答案:C3一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为_解析:频数样本容量频率320.1254.答案:4授课提示:对应学生用书第14页探究一画频率分布直方图、折线图典例1已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25
5、,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布直方图,估计总体出现在2328内的频率是多少?解析(1)计算极差:30219.决定组距和组数:取组距为2,4,共分5组决定分点,使分点比数据多一位小数,并把第1小组的分点减小0.5,即分成如下5组:20522.5,22.524.5,24.526.5,26.528.5,28.530.5.列出频率分布表如下:分组个数累计频数频率频率/组距20.522.5丅20.10.0522.524.530.150.07524.526.5正80.40.226.528.540.20.128
6、.530.530.150.075合计20201.00(2)作出频率分布直方图如图:取各小长方形上的中点并用线段连接就构成了频率折线图,如图(3)由频率分布表和频率分布直方图观察得:样本值出现在2328之间的频率为0.150.400.20.75,所以可以估计总体中出现在2328之间的数的频率约为0.75.(1)通过频率分布表、频率分布直方图可以将大量数据包含的信息比较清楚地反映出来,便于掌握数字特征(2)作图时小矩形的高易错用该组的频率的大小来表示,其原因是不清楚频率分布直方图的意义1某中学同年级40名男生的体重数据如下(单位:千克):616059595958585757575756565656
7、56565655555555545454545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图,画出频率分布折线图解析:(1)计算极差:614813;(2)决定组距与组数,取组距为2,6,共分7组;(3)决定分点,使分点比数据多一位小数,并把第1小组的分点减小0.5,即分成如下7组:47549.5,49.551.5,51.553.5,53.555.5,55.557.5,57.559.5,59.561.5.(4)列出频率分布表如下:分组频数累计频数频率47.549.5丅20.0549.551.5正50.12551.553.5正丅70.17553.55
8、5.5正80.2055.557.5正正一110.27557.559.5正50.12559.561.5丅20.05合计40401.00(5)作出频率分布直方图如图:(6)取各小长方形上边的中点并用线段连接就构成了频率分布折线图,如图探究二用样本的频率分布估计总体典例2为了了解小学生的体能情况,抽取某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图,已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内?解析(1)第四小组的频率为1(0
9、.10.30.4)0.2.(2)参加测试的人数为50.150(人)(3)由题意可得,0.1505,0.35015,0.45020,0.25010.则第一、第二、第三、第四小组的频数分别是5,15,20,10,所以中位数应在第三小组1利用频率分布直方图求数字特征:(1)众数是最高的矩形的底边的中点;(2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标2利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致但它们能粗略估计其众数、中位数和平均数2从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图)由图中
10、数据可知a_若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_解析:小矩形的面积等于频率,除120,130)之外的频率和为0.70,a0.030.由题意知,身高在120,130),130,140),140,150内的学生分别为30人,20人,10人,由分层抽样可知,抽样比为,在140,150中选取的学生应为3人答案:0.0303探究三用样本的数字特征估计总体典例3为迎接5月31日世界无烟日的到来,小华对10名戒烟成功者戒烟前和戒烟5个星期后的体重作了认真统计,并记录如下表所示(
11、单位:kg):人员ABCDEFGHIJ戒烟前67806952526055556460戒烟后70816855576254526758(1)求这10人在戒烟前和戒烟后的体重的平均数;(2)求这10人在戒烟前和戒烟后的体重的方差;(3)通过上述数据,你能得到什么结论?解析(1)将数据按从小到大的顺序重新排列:戒烟前:52,52,55,55,60,60,64,67,69,80;戒烟后:52,54,55,57,58,62,67,68,70,81.求得戒烟前61.4(kg),戒烟后62.4(kg)(2)s70.44,s73.84.(3)从戒烟前后两组数据的统计量知:从平均数看戒烟后这10人的平均体重增加了
12、1 kg;从方差看,戒烟后数据的波动比戒烟前数据波动大,说明戒烟对不同的人所发生的变化程度是不同的,通过对这两组数据的统计分析,得出结论:吸烟有害健康,戒烟对身体健康是有益的样本的平均数和方差是两个重要的数字特征在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度3某医院门诊部关于病人等待挂号的时间记录如下:等待时间(min)0,5)5,10)10,15)15,20)20,25频数48521试用上述分组资料求病人平均等待时间的估计值及平均等待时间标准差的估计值s.解析:等待时间取各组的中点值,代表等待时间(2.547.581
13、2.5517.5222.51)9.5(min)s2(2.59.5)24(7.59.5)28(12.59.5)25(17.59.5)22(22.59.5)2128.5(min2)s5.34(min)病人平均等待时间约9.5 min,标准差约为5.34 min.分类讨论思想在解决统计问题中的应用典例某班4个小组的人数分别为10,10,x,8,已知这组数据的中位数与平均数相等,求这组数据的中位数解析该组数据的平均数为(x28),中位数一定是其中两个数的平均数,由于x不知是多少,所以要分几种情况讨论(1)当x8时,原数据按从小到大的顺序排列为x,8,10,10,其中位数为(108)9.若(x28)9,
14、则x8,此时中位数为9.(2)当8x10时,原数据按从小到大的顺序排列为8,x,10,10,其中位数为(x10)若(x28)(x10),则x8,而8不在8x10的范围内,所以舍去(3)当x10时,原数据按从小到大的顺序排列为8,10,10,x,其中位数为(1010)10.若(x28)10,则x12,此时中位数为10.综上所述,这组数据的中位数为9或10.感悟提高在解决问题时,由于条件的变化,问题的结果有多种情况,不能用同一标准或同一种方法解决,这就需要对条件进行分类讨论当在数据中有未知数x求其中位数时,因x的取值不同,所以数据由大到小(或由小到大)的排列顺序不同,故中位数也不同,这就是本题分类
15、讨论的原因随堂训练对应学生用书第15页1在频率分布直方图中,一定是中间高,两边低;各矩形的高度等于各组对应的频率;各矩形高度和为1;各矩形的面积和为1.以上结论正确的有()A0个B1个C2个D3个解析:错误,只有正确答案:B2一组样本数据,容量为150,按从小到大的顺序分成5个组,其频数如表所示:组号12345频数28322832x那么第5组的频率为()A120B30C0.8 D0.2解析:根据频数分布表,得第5组的频数为1502832283230,则第5组的频率为0.2.故选D.答案:D3在样本的频率分布直方图中共有n个小矩形,若中间一个小矩形的面积等于其余(n1)个小矩形面积的,且样本容量为3 200,则中间一组的频数为_解析:因为中间一个小矩形的面积等于其余(n1)个小矩形面积的,所以中间一个小矩形的面积为所有矩形面积和的,因此中间一组的频数为3 200400.答案:400