1、5用样本估计总体51估计总体的分布52估计总体的数字特征学 习 目 标核 心 素 养1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用(重点)2在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图(难点)3能根据给出的频率分布直方图解决具体问题(难点)1.通过运用样本的频率分布估计总体分布,体会分布的意义和作用,提升数学抽象素养2通过列频率分布表,画频率分布直方图及折线图提升数据分析素养.一、基本概念1频率分布表和频率分布直方图(1)频率分布表编制的方法步骤:(2)2频率分布折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加
2、的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线二、用样本的平均数、方差与标准差估计总体的数字特征利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布
3、、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息n个样本数据x1,x2,xn的平均数(x1x2xn),则有nx1x2xn.设样本的元素为x1,x2,xn,样本的平均数为,则样本的方差s2(x1)2(x2)2(xn)2 .样本方差的算术平方根即为样本的标准差,即s.思考:在频率分布直方图中,如何求众数、中位数、平均数?提示在频率分布直方图中,众数是最高矩形中点的横坐标;中位数左边和右边的直方图的面积应该相等;平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和1当收集到的数据量很大时,比较合适的统计图是()A
4、茎叶图B频率分布直方图C频率折线图 D频率分布表B当收集到的数据量很大时,一般用频率分布直方图2在抽查产品的尺寸过程中,将其尺寸分成若干组,a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则|ab|()AhmB.C.DhmBh,故|ab|组距.3频率分布直方图中,小矩形的面积等于()A组距B频率C组数 D频数B根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率4某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分)现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示已知图中从左到右的第一、三、四、五小组的频率分别为
5、0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是_,成绩优秀的频率是_1000.15设参赛的人数为n,第二小组的频率为1(0.300.150.100.05)0.4,依题意0.4,n100,优秀的频率是0.100.050.15.画频率分布直方图、折线图【例1】已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布直方图,估计总体出现在2328内的频率是多少解(1)计算极差:30219.决定组距和组数:取组
6、距为2.4,共分5组决定分点,使分点比数据多一位小数并把第1小组的分点减小0.5,即分成如下5组:20.5,22.5),22.5,24.5),24.5,26.5),26.5,28.5),28.5,30.5列出频率分布表如下:分组频数频率频率/组距20.5,22.5)20.10.0522.5,24.5)30.150.07524.5,26.5)80.40.226.5,28.5)40.20.128.5,30.530.150.075合计201.00(2)作出频率分布直方图如下:取各小长方形上的中点并用线段连接就构成了频率折线图,如上图(3)由频率分布表和频率分布直方图观察得:样本值出现在2328之间的
7、频率为0.150.400.20.75,所以可以估计总体中出现在2328之间的数的频率约为0.75.绘制频率分布直方图的具体步骤1求极差一组数据的最大值与最小值的差称为极差2决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多当样本容量不超过120时,按照数据的多少,常分成512组为方便起见,组距的选择应力求“取整”3将数据分组通常对组内数值所在区间取左闭右开区间,最后一组取闭区间1为了了解中学生的身高情况,对实验中学同龄的50名男学生的身高进行了测量,结果如下(单位:cm):1751681701761671811621731711771711711741731741751
8、77166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177179181列出频率分布表,画出频率分布直方图及频率折线图解在这个样本中,最大值为181,最小值为157,它们的极差为24,可以取组距为4,根据题意列出样本的频率分布表如下表:分组频数频率156.5160.530.06160.5164.540.08164.5168.5120.24168.5172.5120.24172.5176.5130.26176.5180.540.08180.5184.520.04合计5
9、01.00由上表画出频率分布直方图及频率折线图如图频率分布直方图的应用【例2】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?解(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为0.08.又因为第二小组频率,所以样本容量150.(2)由图可估计该校高一学生的达标率约为100%88%.频率分布直
10、方图的性质1因为小矩形的面积组距频率组距频率,所以各小矩形的面积表示相应各组的频率这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小2在频率分布直方图中,各小矩形的面积之和等于1.3频数相应的频率样本容量2(1)某班50名学生在一次百米跑测试中,成绩全部介于13 s与19 s之间,将测试结果按如下方式分成六组:第一组,成绩大于或等于13 s且小于14 s;第二组,成绩大于或等于14 s且小于15 s;第六组,成绩大于或等于18 s且小于或等于19 s,如图所示是按上述分组方法得到的频率分布直方图设成绩小于17 s的学生人数占全班总人数的百分比为x,成绩大于或等于15 s且小于
11、17 s的学生人数为y,则从频率分布直方图中分析出x和y分别为 ()A0.9,35B0.9,45C0.1,35 D0.1,45(2)某商场在端午节的促销活动中,对某日9时至14时的销售额进行统计,其频率分布直方图如图所示已知9时至10时的销售额为3万元,则11时至12时的销售额为_万元(1)A(2)12由频率分布直方图知x0.340.360.180.020.9,因为0.360.340.7,所以y35.故选A.(2)由频率分布直方图知,9时至10时的销售额的频率为0.1,故销售总额为30(万元),又11时至12时的销售额的频率为0.4,故销售额为0.43012万元故填12万元估计总体的数字特征探
12、究问题1如何从频率分布直方图中估计中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值2在条形统计图中怎样估计众数?提示:众数是最高矩形的中点的横坐标3怎样估计平均数?提示:平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和【例3】已知一组数据:125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126,128.(1)填写下面的频率分布表:分组频数频率121,123)123,125)125,127)127,129)129,131
13、合计(2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数思路探究(1)根据频数与频率的概念填写表格;(2)利用作频率分布直方图的步骤作图;(3)根据直方图中求数字特征的方法求解解(1)分组频数频率121,123)20.1123,125)30.15125,127)80.4127,129)40.2129,13130.15合计201(2)(3)在125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数126,事实上,众数的精确值为125;(2)图中虚线对应的数据是1252126.25,事实上中位数为125.5.使用“组中值”求平均数1220.
14、11240.151260.41280.21300.15126.3,平均数的精确值为125.75.1平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息2利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致3某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生的平均成绩解(1)由图可知众数为65
15、,又因为第一个小矩形的面积为0.3,所以设中位数为60x,则0.3x0.040.5,得x5,所以中位数为60565.(2)依题意,550.3650.4750.15850.1950.0567,所以平均成绩约为67分1利用直方图求数字特征:(1)众数是最高的矩形的底边的中点(2)中位数左右两边直方图的面积应相等(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和2三种图表的区别与联系:名称区别频率分布表从数量上比较准确地反映样本的频率分布规律频率分布直方图反映样本的频率分布情况频率折线图直观地反映了数据的变化趋势这三种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:1思
16、考辨析(1)频率分布直方图中的纵坐标指的是频率的值()(2)频率分布直方图中各小矩形的面积之和可以不为1.()(3)将数据分组时,一般要求各组的组距相等()(4)在用样本估计总体分布的过程中,样本容量越大,估计越精确()(5)样本平均数一定大于总体平均数()(6)样本标准差与总体标准差的大小关系无法确定()解析(1),纵坐标指的是频率与组距的比值(2),各小矩形的面积之和一定为1.(3),对数据进行分组时,一般要求各组的组距相等(4),样本容量越大,估计越精确(5),样本平均数与总体平均数的大小关系不确定(6),可能大于也可能小于答案(1)(2)(3)(4)(5)(6)2某班的全体学生参加英语
17、测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()A45B50C55D60B成绩在20,40)和40,60)的频率分别是0.1,0.2,则低于60分的频率是0.3,设该班学生总数为m,则0.3,m50.3从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图如图所示由图中数据可知a_.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_图1560030
18、30.005100.03510a100.020100.010101,a0.030,设身高在120,130),130,140),140,150三组的分别有x,y,z人0.03010,x30,同理y20,z10.从140,150中抽取183.4公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分):17142012102418171221319285347251828115311211101612910131910121216221723161516119313218221992328152128121114153
19、11621825512152016122820122815832189(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;(2)候车时间15分钟以上的比例是多少?你能为公交公司提出什么建议?解(1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组时间分组(xi)频数(ni)频率(fi)0,5)60.0750.0155,10)90.11250.022510,15)220.2750.05515,20)220.2750.05520,25)100.1250.02525,30)80.1000.02030,3530.03750.0075频率分布直方图如下图所示:频率折线图如下图所示:(2)候车时间不低于15分钟的百分比为02750.1250.1000.03750.537553.75%,公交公司可以适当增加公交车的数量