1、第一章 统计 5 用样本估计总体 51 估计总体的分布 52 估计总体的数字特征 学 习 目 标核 心 素 养 1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用(重点)2在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图(难点)3能根据给出的频率分布直方图解决具体问题(难点)1.通过运用样本的频率分布估计总体分布,体会分布的意义和作用,提升数学抽象素养2通过列频率分布表,画频率分布直方图及折线图提升数据分析素养.自 主 预 习 探 新 知 一、基本概念1频率分布表和频率分布直方图(1)频率分布表编制的方法步骤:组数与组距分点1各小长方形的面积频率与
2、组距的比值样本分组2频率分布折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之,相应的频率折线图就会越来越接近于一条中点光滑曲线减小精确概率频率折线图二、用样本的平均数、方差与标准差估计总体的数字特征利用随机抽样得到样
3、本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个,但这个估计是合理的,特别是当样本容量时,它们确实反映了总体的信息n 个样本数据 x1,x2,xn 的平均数x ,则有 nx.估计很大1n(x1x2xn)x1x2xn设样本的元素为 x1,x2,xn,样本的平均数为x,则样本的方差 s2 .样本方差的算术平方根即为样本的标准差,即 s .思考:在频率分布直方图中,如何求众数、中位数、平均数?1n(x1x)2(x2x)2(xnx)21nx1x2x2x2xnx2提示 在频率分布直方图中,众数是最高矩形中点的横坐
4、标;中位数左边和右边的直方图的面积应该相等;平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和1当收集到的数据量很大时,比较合适的统计图是()A茎叶图 B频率分布直方图C频率折线图D频率分布表B 当收集到的数据量很大时,一般用频率分布直方图2在抽查产品的尺寸过程中,将其尺寸分成若干组,a,b)是其中的一组,抽查出的个体在该组上的频率为 m,该组上的直方图的高为 h,则|ab|()Ahm B.mh C.hm DhmB 频率组距h,故|ab|组距频率h mh.3频率分布直方图中,小矩形的面积等于()A组距 B频率C组数D频数B 根据小矩形的宽及高的意义,可知小矩形的面
5、积为一组样本数据的频率4某中学举办电脑知识竞赛,满分为 100 分,80 分以上为优秀(含 80 分)现将高一两个班参赛学生的成绩进行整理后分成 5 组,绘制成频率分布直方图如图所示已知图中从左到右的第一、三、四、五小组的频率分别为 0.30、0.15、0.10、0.05,而第二小组的频数是 40,则参赛的人数是_,成绩优秀的频率是_100 0.15 设参赛的人数为 n,第二小组的频率为 1(0.300.150.100.05)0.4,依题意40n 0.4,n100,优秀的频率是 0.100.050.15.合 作 探 究 释 疑 难 画频率分布直方图、折线图【例 1】已知一个样本:30,29,2
6、6,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布直方图,估计总体出现在 2328 内的频率是多少解(1)计算极差:30219.决定组距和组数:取组距为 2.92412,共分 5 组 决定分点,使分点比数据多一位小数 并把第 1 小组的分点减小 0.5,即分成如下 5 组:20.5,22.5),22.5,24.5),24.5,26.5),26.5,28.5),28.5,30.5 列出频率分布表如下:分组频数频率频率/组距 20.5,22.5)20.10.0
7、5 22.5,24.5)30.150.075 24.5,26.5)80.40.2 26.5,28.5)40.20.1 28.5,30.530.150.075 合计201.00 (2)作出频率分布直方图如下:取各小长方形上的中点并用线段连接就构成了频率折线图,如上图(3)由频率分布表和频率分布直方图观察得:样本值出现在 2328 之间的频率为 0.150.400.20.75,所以可以估计总体中出现在 2328 之间的数的频率约为 0.75.绘制频率分布直方图的具体步骤1求极差一组数据的最大值与最小值的差称为极差2决定组距与组数数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多当样本容量
8、不超过120时,按照数据的多少,常分成512组为方便起见,组距的选择应力求“取整”3将数据分组通常对组内数值所在区间取左闭右开区间,最后一组取闭区间跟进训练1为了了解中学生的身高情况,对实验中学同龄的50名男学生的身高进行了测量,结果如下(单位:cm):175168170176167 181162173171177 171171174173174 175177166163160 166166163169174 165175165170158 174172166172167 172175161173167 170172165157172 173166177179181 列出频率分布表,画出频率分
9、布直方图及频率折线图解 在这个样本中,最大值为 181,最小值为 157,它们的极差为 24,可以取组距为 4,根据题意列出样本的频率分布表如下表:分组频数频率 156.5160.530.06 160.5164.540.08 164.5168.5120.24 168.5172.5120.24 172.5176.5130.26 176.5180.540.08 180.5184.520.04 合计501.00 由上表画出频率分布直方图及频率折线图如图 频率分布直方图的应用【例 2】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中
10、从左到右各小长方形面积之比为 24171593,第二小组频数为 12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,试估计该校全体高一学生的达标率是多少?解(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为4241715930.08.又因为第二小组频率第二小组频数样本容量,所以样本容量第二小组频数第二小组频率 120.08150.(2)由图可估计该校高一学生的达标率约为 17159324171593100%88%.频率分布直方图的性质1因为小矩形的面积组距频率组距频率,所以各小矩形的面积表示相应各组的
11、频率这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小2在频率分布直方图中,各小矩形的面积之和等于1.3频数相应的频率样本容量跟进训练2(1)某班50名学生在一次百米跑测试中,成绩全部介于13 s与19 s之间,将测试结果按如下方式分成六组:第一组,成绩大于或等于13 s且小于14 s;第二组,成绩大于或等于14 s且小于15 s;第六组,成绩大于或等于18 s且小于或等于19 s,如图所示是按上述分组方法得到的频率分布直方图设成绩小于17 s的学生人数占全班总人数的百分比为x,成绩大于或等于15 s且小于17 s的学生人数为y,则从频率分布直方图中分析出x和y分别为 ()A
12、0.9,35 B0.9,45C0.1,35 D0.1,45(2)某商场在端午节的促销活动中,对某日 9 时至 14 时的销售额进行统计,其频率分布直方图如图所示已知 9 时至 10 时的销售额为 3 万元,则 11 时至 12 时的销售额为_万元(1)A(2)12 由频率分布直方图知 x0.340.360.180.020.9,因为 y500.360.340.7,所以 y35.故选 A.(2)由频率分布直方图知,9 时至 10 时的销售额的频率为 0.1,故销售总额为 30.130(万元),又 11 时至 12 时的销售额的频率为 0.4,故销售额为 0.43012 万元故填 12 万元估计总体
13、的数字特征探究问题1如何从频率分布直方图中估计中位数?提示:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值2在条形统计图中怎样估计众数?提示:众数是最高矩形的中点的横坐标3怎样估计平均数?提示:平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积的总和【例 3】已知一组数据:125,121,123,125,127,129,125,128,130,129,126,124,125,127,126,122,124,125,126,128.(1)填写下面的频率分布表:分组频数频率 121,123)123,125)125,127)127,129
14、)129,131合计 (2)作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数思路探究(1)根据频数与频率的概念填写表格;(2)利用作频率分布直方图的步骤作图;(3)根据直方图中求数字特征的方法求解 解(1)分组频数频率 121,123)20.1 123,125)30.15 125,127)80.4 127,129)40.2 129,13130.15 合计201(2)(3)在125,127)中的数据最多,取这个区间的中点值作为众数的近似值,得众数 126,事实上,众数的精确值为 125;(2)图中虚线对应的数据是 125258126.25,事实上中位数为
15、125.5.使用“组中值”求 平 均 数 x 1220.1 1240.15 1260.4 1280.21300.15126.3,平均数的精确值为x125.75.1平均数、中位数、众数、极差、方差等统计量是将多个数据“加工”成一个数据,能更清楚地反映这组数据的某些重要特征,要理解这些统计量表达的信息2利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致跟进训练3某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成
16、绩的众数、中位数;(2)高一参赛学生的平均成绩解(1)由图可知众数为 65,又因为第一个小矩形的面积为 0.3,所以设中位数为 60 x,则 0.3x0.040.5,得 x5,所以中位数为 60565.(2)依 题 意,x 550.3 650.4 750.15 850.1 950.0567,所以平均成绩约为 67 分课 堂 小 结 提 素 养 1利用直方图求数字特征:(1)众数是最高的矩形的底边的中点(2)中位数左右两边直方图的面积应相等(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和2三种图表的区别与联系:名称区别 频率分布表从数量上比较准确地反映样本的频率分布规律 频率分布直
17、方图反映样本的频率分布情况频率折线图直观地反映了数据的变化趋势这三种图表都是描述样本数据分布情况,估计总体频率分布规律的,其联系如下:1思考辨析(1)频率分布直方图中的纵坐标指的是频率的值()(2)频率分布直方图中各小矩形的面积之和可以不为1.()(3)将数据分组时,一般要求各组的组距相等()(4)在用样本估计总体分布的过程中,样本容量越大,估计越精确 ()(5)样本平均数一定大于总体平均数()(6)样本标准差与总体标准差的大小关系无法确定()解析(1),纵坐标指的是频率与组距的比值(2),各小矩形的面积之和一定为 1.(3),对数据进行分组时,一般要求各组的组距相等(4),样本容量越大,估计
18、越精确(5),样本平均数与总体平均数的大小关系不确定(6),可能大于也可能小于 答案(1)(2)(3)(4)(5)(6)2某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100若低于60 分的人数是 15,则该班的学生人数是()A45 B50 C55 D60B 成绩在20,40)和40,60)的频率分别是 0.1,0.2,则低于 60 分的频率是 0.3,设该班学生总数为 m,则15m0.3,m50.3从某小学随机抽取 100 名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图如图所示由图中数据可知 a_.若要从
19、身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取 18 人参加一项活动,则从身高在140,150内的学生中选取的人数应为_0030 3 0.005100.03510a100.020100.010101,a0.030,设身高在120,130),130,140),140,150三组的分别有 x,y,z 人 x1000.03010,x30,同理 y20,z10.从140,150中抽取10302010183.4公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求为此,公交公司在某站台随机调查了 80 名乘客,他们的候车时间如下所示(单位:分):171
20、4201210241817122131928534725182811531121110161291013191012121622172316151611931321822199232815212812111415311621825512152016122820122815832189(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;(2)候车时间 15 分钟以上的比例是多少?你能为公交公司提出什么建议?解(1)该数据中最大值为 34,最小值为 1,两者之差为 33,故取组距为 5,分为 7 组 时间分组(xi)频数(ni)频率(fi)fixi 0,5)60.0750.015 5,10)90.11250.0225 10,15)220.2750.055 15,20)220.2750.055 20,25)100.1250.025 25,30)80.1000.020 30,3530.03750.0075 频率分布直方图如下图所示:频率折线图如下图所示:(2)候车时间不低于 15 分钟的百分比为 02750.1250.1000.03750.537553.75%,公交公司可以适当增加公交车的数量 课 时 分 层 作 业 点击右图进入 Thank you for watching!