1、考纲要求1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想5会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题考情分析1.主要以选择题、填空题的形式考查平均数、方差的计算以及茎叶图与频率分布直方图的简单应用2在解答题中经常把频率分布直方图与概率相结合命题,属于中低档题 小题热身1思考辨析(正确的打“”,错误的打
2、“”)(1)一组数据的平均数一定大于这组数据中的每个数据。()(2)平均数、众数与中位数都可以描述数据的集中趋势。()(3)一组数据的方差越大,说明这组数据的波动越大。()(4)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高。()(5)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次。()解析:(1)错误。平均数一定不大于这组数据中的最大值。(2)正确。平均数表示一组数据的平均水平,众数表示一组数据中出现次数最多的数,中位数等分样本数据所占频率,都可以从不同的角度描述数据的集中趋势。(3)正确。由方差的意义知结论正确。(4)正确。由频率分布直方图的意义知结论正
3、确。(5)错误。茎叶图要求不能丢失数据。2已知一个样本中的数据为 0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是()A0.14,0.15 B0.15,0.14C0.15,0.15 D0.15,0.145解析:把样本中的数据按从小到大排列为:012,0.13,0.13,0.14,0.14,0.15,0.15,0.15,0.16,0.17,该样本的众数是 0.15,中位数字0.140.1520.145。答案:D3已知一个样本中的数据为 1,2,3,4,5,那么该样本的标准差为()A1 B.2C.3D2解析:样本容量
4、n5,x 15(12345)3。s151322323324325321541014 2。答案:B4甲、乙两名同学在 5 次体育测试中的成绩统计的茎叶图如下图所示,若甲、乙两人的平均成绩分别为 X 甲、X 乙,则下列结论正确的是()A.X 甲X 乙;乙比甲成绩稳定BX 甲X 乙;甲比乙成绩稳定CX 甲X 乙;乙比甲成绩稳定DX 甲X 乙;甲比乙成绩稳定解析:X 甲7277788692581,X 乙7882889195586.8,X 甲X 乙且乙比甲成绩稳定。答案:A5一个容量为 32 的样本,分成 5 组,已知第三组的频率为 0.375,则另外四组的频数之和为_。解析:由题意,得第三组的频数为
5、320.37512。另四组的频数之和为 321220。答案:20知识重温一、必记 3个知识点1频率分布直方图(1)通常我们对总体作出的估计一般分成两种。一种是用样本的_估计总体的分布。另一种是用样本的_估计总体的数字特征。(2)在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用各小长方形的_表示。各小长方形的面积总和_。频率分布数字特征 频率组距面积等于 1(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。随着_的增加,作图时所分的_增加,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为_,它能够更加精细的反映出总体在各个范围内取值的_。(4)当样本数
6、据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便。样本容量组数总体密度曲线百分比2众数,中位数,平均数(1)众数:在一组数据中,出现次数_的数据叫做这组数据的众数。(2)中位数:将一组数据按大小依次排列,把处在_位置的一个数据(或最中间两个数据的平均数)叫做这组数据的_。(3)平 均 数:样 本 数 据 的 算 术 平 均 数。即 x _。在频率分布直方图中,中位数左边和右边的直方图的面积应该_。最多最中间中位数1n(x1x2xn)相等3样本方差,标准差标准差s1nx1 x 2x2 x 2xn x 2,其中 xn 是样本数据的第 n
7、项,n 是样本容量,x 是_。标准差是反映总体波动大小的特征数,样本方差是标准差的平方。通常用样本方差估计总体方差,当样本容量_总体容量时,样本方差越接近总体方差。平均数接近二、必明 1个易误点不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,连续随机变量在某一点上是没有频率的。考点一 样本的数字特征【典例 1】某公司 10 位员工的月工资(单位:元)为 x1,x2,x10,其均值和方差分别为 x 和 s2,若从下月起每位员工的月工资增加 100元,则这 10 位员工下月工资的均值和方差分别为()A.x,s210
8、02 B.x 100,s21002C.x,s2 D.x 100,s2D解析:方法一:对平均数和方差的意义深入理解可巧解。因为每个数据都加上了 100,故平均数也增加 100,而离散程度应保持不变,故选 D。方法二:由题意知 x1x2xnn x,s21n(x1 x)2(x2 x)2(xn x)2,则所求均值 y 1n(x1100)(x2100)(xn100)1n(n x n100)x 100,而所求方差 t21n(x1100 y)2(x2100 y)2(xn100 y)21n(x1 x)2(x2 x)2(xn x)2s2,故选 D。悟技法众数、中位数、平均数及方差的意义及计算方示(1)平均数与方
9、差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述数据集中趋势,方差和标准差描述波动的大小。(2)平均数、方差的公式推广。若数据 x1,x2,xn 的平均数为 x,那么 mx1a,mx2a,mx3a,mxna 的平均数是 m x a。数据 x1,x2,xn 的方差为 s2。()数据 x1a,x2a,xna 的方差也为 s2;()数据 ax1,ax2,axn的方差为 a2s2。(3)方差的简化计算公式。s21n(x21x22x2n)n x 2或写成 s21n(x21x22x2n)x 2,即方差等于原数据平方的平均数减去平均数的平方。通一类1 某 厂 10 名 工人 在 一
10、个小 时 内生 产 零 件 的个 数 分 别 是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为 a,中位数为 b,众数为 c,则有()Aabc BbcaCcab Dcba解 析:把 该 组 数 据 按 从 小 到 大 的 顺 序 排 列 为10,12,14,14,15,15,16,17,17,17,其平均数 a 110(10121414151516171717)14.7,中位数 b1515215,众数 c17,则 abc。答案:D考点二 茎叶图【典例 2】(2016长治模拟)对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示)则该样本的中位数、
11、众数、极差分别是()A.47,45,56 B46,45,53C46,45,56 D45,47,53解析:由茎叶图可知,中位数为4547246,众数为 45,极差为681256。答案:C悟技法茎叶图的应用(1)茎叶图中的“茎”上的数字代表十位上的数字,“叶”上的数字代表个位上的数字(或没有则表示该数据不存在)(2)解题时,可把茎叶图中的数字按大小顺序转化为总体的个体数字再求解。通一类2某中学高三从甲、乙两个班中各选出 7 名学生参加数学竞赛,他们取得的成绩(满分 100 分)的茎叶图如图,其中甲班学生成绩的众数是 85,乙班学生成绩的中位数是 83,则 xy 的值为()A.7 B8C9 D10解
12、析:由茎叶图可知,甲班学生成绩的众数是 85,所以 x5.乙班学生成绩的中位数是 83,所以 y3,所以 xy538。答案:B考点三 频率分布直方图【典例 3】如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是()A12.5;12.5 B12.5;13C13;12.5 D13;13解析:由题图易知众数为 12.5,中位数是 100.50.20.113,故选 B。答案:B悟技法从频率分布直方图中得出有关数据的方法(1)频率:频率分布直方图中横轴表示组别,纵轴表示频率组距,频率组距频率组距;(2)频率比:频率分布直方图中各小长方形的面积之和为 1,因为在频率分布直方图中
13、组距是一个固定值,所以各小长方形高的比也就是频率比,从而根据已知的几组数据个数比求有关值;(3)众数:最高小长方形底边中点的横坐标;(4)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;(5)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和;(6)性质应用:若纵轴上存在参数值,则根据所有小长方形的高之和组距1,列方程即可求得参数值。3为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17),将其按从左到右的顺序分别编号为第一组,第二组,第
14、五组。下图是根据试验数据制成的频率分布直方图。已知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为()A6 B8C12 D18解析:由题意,第一组和第二组的频率之和为 0.240.160.4,故样本容量为200.450,又第三组的频率为 0.36,故第三组的人数为500.3618,故该组中有疗效的人数为 18612。答案:C高考模拟1(2016惠州一模)为了普及环保知识,增强环保意识,某大学随机抽取 30 名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为 me,众数为 m0,平均值为 x,则()Amem0 xBmem0 xCmem0 xD
15、m0me xD解析:由图可知,30 名学生的得分情况依次为:2 个人得 3 分,3个人得 4 分,10 个人得 5 分,6 个人得 6 分,3 个人得 7 分,2 个人得8 分,2 个人得 9 分,2 个人得 10 分。中位数为第 15,16 个数(分别为5,6)的平均数,即 me5.5,又 5 出现次数最多,故 m05,x 233410566372829210305.97,于是得 m0me x。2某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成 6 组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高
16、一年级共有学生600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为()A588 B480C450 D120解析:不少于 60 分的频率为(0.0300.0250.0150.010)100.8,所以所求学生人数为 0.8600480(人)。答案:B3为了了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前 4 组的频数成等比数列,后 6 组的频数成等差数列,设最大频率为 a,视力在 4.6 到 5.0 之间的学生数为 b,则 a、b 的值分别为()A0.27,78 B0.27,83C2.7,78 D2.7
17、,83A解析:由题意,4.5 到 4.6 之间的频率为 0.09,4.6 到 4.7 之间的频率为 0.27,后 6 组的频数成等差数列,设公差为 d,则有 60.2715d10.010.030.09,解得 d0.05,然后可求得 4.6 到 5.0 之间的频率为 0.270.220.170.120.78,所以学生数为 1000.7878。4(2016海口模拟)某校对高三年级的学生进行体检,现将高三男生的体重(kg)数据进行整理后分成五组,并绘制频率分布直方图(如图),根据一般标准,高三男生的体重超过 65 kg 属于偏胖,低于 55 kg属于偏瘦。已知图中从左到右第一、第三、第四、第五小组的
18、频率分别为 0.25,0.20,0.10,0.05,第四小组的频数为 100,则该校高三年级的男生中体重正常的人数为_。600解析:由题意得第二小组的频率为 1(0.250.200.100.05)0.40,所以体重正常的频率为 0.400.200.60,又由第四小组的频数和频率可得高三男生的总人数为 1 000,所以体重正常的男生人数为1 0000.60600。5(2016武汉模拟)某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图)。其中,上学所需时间的范围是0,100,样本数据分组为0,20),20,40),40,60),60,80),80,100。(1)图中的 x_。(2)若上学所需时间不少于 1 小时的学生可申请在学校住宿,则该校 600 名新生中估计有_名学生可以申请住宿。0.012 572解析:由频率分布直方图知 20 x120(0.0250.006 50.0030.003),解得 x0.012 5。上学时间不少于 1 小时的学生频率为 0.12,因此估计有 0.1260072(名)学生可以申请住宿。