1、2.2 用样本估计总体2.2.2 用样本的数字特征估计总体的数字特征登高揽胜 拓界展怀课前自主学习学 习 目 标1会求样本的众数、中位数、平均数、标准差、方差结合实例理解样本数据的标准差、方差2会用样本的数字特征对总体进行估计3会应用相关知识解决简单的实际问题自主导学知识点一 众数、中位数、平均数 阅读教材 P72P73 的内容,完成下列问题1众数、中位数、平均数的概念(1)众数:在一组数据中,出现 1 _最多的数据(即频率分布最大值所对应的样本数据)叫这组数据的众数次数若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数(
2、2)中 位 数:将 一 组 数 据 按 大 小 依 次 排 列,把 处 在 2_位置的一个数据(或中间两个数据的平均数)叫这组数据的中位数(3)平均数:指样本数据的算术平均数即 x 3 _最中间1n(x1x2xn)2众数、中位数、平均数与频率分布直方图的关系众数众数是最高矩形的 4 _所对应的数据,表示样本数据的中心值中位数在频率分布直方图中,中位数左边和右边的直方图5 _相等,由此可以估计中位数的值,但是有偏差;表示样本数据所占频率的等分线中点面积平均数平均数等于每个小长方形的面积乘以小长方形底边中点的横坐标之和;平均数是频率分布直方图的重心,是频率分布直方图的平衡点思考探究|辨别正误|一组
3、数据的平均数、中位数、众数是唯一的吗?提示:一组数据的平均数、中位数都是唯一的,众数不唯一,可以有一个,也可以有多个,还可以没有如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数知识点二|标准差与方差 阅读教材 P74P78 的内容,完成下列问题1标准差:标准差是样本数据到平均数的一种平均距离,一般用 s 表示,计算时通常用公式s 6 _.显然,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小1nx1 x 2x2 x 2xn x 22方差:标准差 s 的平方 s2,即 s21n(x1 x)2(xn x)2叫做这组数据的方差,同标准差一样,
4、方差也是用来刻画样本数据的离散程度的特征数思考探究|辨别正误|方差或标准差的大小与数据的离散程度有什么关系?提示:标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小小试身手1已知一组数据为 20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是()A平均数中位数众数B平均数中位数众数C中位数众数平均数D众数中位数平均数解析:选 D 平均数、中位数、众数皆为 50,故选 D.2在一组数据中,共有 10 个数,其中 3 出现 2 次,9 出现4次,3出现1次,5出现3次,则这组数据的平均数为_解析:
5、3 出现 2 次,其和为 6,9 出现 4 次,其和为 36,3出现 1 次,其和为3,5 出现 3 次,其和为 15,则这 10 个数据之和为 63631554,则这组数据的平均数 x 54105.4.答案:5.43现有 10 个数,其平均数为 3,且这 10 个数的平方和是100,那么这组数据的标准差是_解析:由 s21n(x21x22x2n)x 2,得 s2 110100321,所以 s1.答案:14已知五个数据 3,5,7,4,6,则该样本的标准差为_解析:因为 x 15(35746)5,所以s153525527524526522.答案:2剖析题型 总结归纳课堂互动探究题型一 众数、中
6、位数、平均数及其应用 多维探究角度 1 众数、中位数、平均数的计算【例 1】从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图试利用频率分布直方图求:(1)这 50 名学生成绩的众数与中位数;(2)这 50 名学生的平均成绩解(1)由众数的概念可知,众数是出现次数最多的数在频率分布直方图中高度最高的小长方形的中间值即为所求,所以众数应为 75 分由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求因为 0.004
7、100.006100.02100.040.060.20.3.所以前三个小矩形面积的和为 0.3.而第四个小矩形面积为 0.03100.3,0.30.30.5,所以中位数应位于第四个小矩形内设其为 x,高为 0.03,所以令 0.03(x70)0.2,得 x76.7 分所以众数是 75 分,中位数约为 76.7 分(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积求和即可所 以 平 均 成 绩 为 45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02410)95(0.01610)76.2(分
8、)所以平均成绩为 76.2 分.方 法 总 结众数、中位数、平均数与频率分布直方图的关系(1)众数:在频率分布直方图中,众数的估计值为最高矩形的底边中点的横坐标(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等(3)平均数:平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点横坐标之和角度 2 众数、中位数、平均数的应用【例 2】据报道,某公司的 33 名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资5 5005 0003 5003 0002 5002 0001 500(1)求该公司职工月工资的平均数、中位数
9、、众数;(2)假设副董事长的工资从 5 000 元提升到 20 000 元,董事长的工资从 5 500 元提升到 30 000 元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法解(1)平均数是 x 1 5004 0003 5002 00021 5001 00055003020331 5005912 091(元)中位数是 1 500 元,众数是 1 500 元(2)平均数是 x 1 50028 50018 5002 00021 5001 00055003020331 5001 7883 288(元)中位数是 1
10、500 元,众数是 1 500 元(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.方 法 总 结当数据较大时,求平均数时通常先减去某一个常数如本例中可先减一个 1 500,而后再求较为简单,由于平均数受极端值影响很大,故有时平均数不一定能客观地反映总体情况,深刻理解平均数、众数、中位数的特点,结合实际情况灵活运用.1一组数据的频率分布直方图如图所示,请你在直方图中标出这组数据的众数、中位数和平均数对应的位置(用虚线标明),并根据直方图读出其相应的估计值解:
11、众数、中位数、平均数对应的位置如图中虚线所示(众数:右端虚线,中位数:左端虚线,平均数:左端虚线)由直方图观察可得众数为 2.25,中位数为 2.02,平均数为 2.02.2(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,根据直方图得到 P(C)的估计值为 0.70
12、.(1)求乙离子残留百分比直方图中 a,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解:(1)由题得 a0.200.150.70,解得 a0.35,由 0.05b0.151P(C)10.70,解得 b0.10.(2)由甲离子的直方图可得,甲离子残留百分比的平均值为0.152 0.203 0.304 0.205 0.106 0.057 4.05,乙离子残留百分比的平均值为 0.0530.1040.1550.3560.2070.1586.题型二 方差、标准差及其应用 多维探究角度 1 方差、标准差的计算【例 3】一组数据:10,11,12,11,1
13、4,8 的方差是_,标准差是_解析 解法一:x 16(10111211148)11,所以s216(1011)2(1111)2(1211)2(1111)2(1411)2(811)216(101099)103,s103 303.解法二:由于该组数据都集中在 11 附近,故每一个数据都减去 11 得到一组新数据:1,0,1,0,3,3,该组数据的方差与原数据组方差相等.x 10,s216(1)202120232(3)2103,s 303.答案 103 303方 法 总 结求一组数据的方差和标准差的步骤(1)先求平均数 x.(2)代入公式得方差和标准差s21n(x1 x)2(x2 x)2(xn x)2
14、s1nx1 x 2x2 x 2xn x 2.角度 2 方差、标准差的实际应用【例 4】如下,茎叶图记录了某 NBA 篮球队内两大中锋在六次训练中抢得篮板球数记录,由于教练一时疏忽,忘了记录乙球员其中一次的数据,在图中以 X 表示.(1)如果乙球员抢得篮板球的平均数为 10,求 X 的值和乙球员抢得篮板球数的方差;(2)如果您是该球队的教练在正式比赛中您会派谁上场呢?并说明理由(用数据说明)解(1)依题意由茎叶图可得X8981412610,解得 X9.乙球员抢得篮板球数的方差为s2乙16(910)2(810)2(910)2(810)2(1410)2(1210)25.(2)会派乙上场.x 甲699
15、141111610.s2甲16(610)2(910)2(910)2(1410)2(1110)2(1110)26.因为 x 甲 x 乙,s2乙s2甲.所以乙球员发挥更稳定,应选派乙球员上场方 法 总 结标准差(方差)的两个作用(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小(2)在实际应用中,常常把平均数与标准差结合起来进行决策在平均值相等的情况下,比较方差或标准差以确定稳定性.3样本中共有 5 个个体,其值分别为 a,0,1,2,3.若该样本的平均值为 1,则样本标准差为()A.65 B65C.2D2解析:选 C 样本的平均值为 1,a012351,a1.故
16、标准差s1120121122123125410145 2.4(2019全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了 100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表.y 的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147(1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到 0.01)附:748.602.解:(1)由题意可知,随机调查的 100 个
17、企业中增长率超过40%的企业有 14721(个),产值负增长的企业有 2 个,所以增长率不低于 40%的企业比例为 21100,产值负增长的企业比例为 2100 150.(2)由题意可知,平均值y 20.1240.1530.3140.570.71000.3,标准差的平方:s2 11002(0.10.3)224(0.10.3)253(0.30.3)214(0.50.3)27(0.70.3)2 1100(0.320.960.561.12)0.029 6,所以标准差s0.029 60.000 4740.028.6020.17.知识归纳 自我测评堂内归纳提升1关注 3 类数的特点众数、中位数、平均数的
18、特点(1)一组数据的平均数、中位数都是唯一的(2)众数不唯一,可以有一个,也可以有多个,还可以没有如果有两个数据出现的次数相同,并且比其他数据出现的次数都多,那么这两个数据都是这组数据的众数(3)众数一定是原数据中的数,平均数和中位数都不一定是原数据中的数2掌握 4 种计算技巧方差的计算方法(1)定义法:s21n(x1 x)2(x2 x)2(xn x)2(2)简化法:s21n(x21x22x2n)n x 2(3)如果在 n 个数中,x1 出现 f1 次,x2 出现 f2 次,xk 出现 fk次,则加权方差公式 s21n(f1x21f2x22fkx2k)n x 2(4)新数据法:当所给的一组数据
19、都在某一常数 a 的附近波动时,一般选用简单化公式 xiaxi,其中常数 a 通常取接近于这组数据的平均数的较“整”的数,运用上面的方差公式即可计算3会用 3 组关系频率分布直方图与众数、中位数、平均数的关系(1)众数与频率分布直方图的关系根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数,表示样本数据的中心值(2)中位数与频率分布直方图的关系中位数是样本数据所占频率的等分线,即有 50%的个体小于或等于中位数,也有 50%的个体大于或等于中位数因此,在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可估计中位数的值(3)平均数与频率分布直方图的关
20、系平均数是频率分布直方图的“重心”用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘小矩形底边中心的横坐标(组中值)之和4理解 1 组区别极差、方差与标准差的区别和联系数据的离散程度可以通过极差、方差或标准差来描述(1)极差是数据的最大值与最小值的差它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感(2)方差则反映了一组数据围绕平均数波动的大小为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离注意:标准差比方差多开一次方,但它的度量单位与原始数据一致,有时用它比较方便,但方差计算容易些,其作用是完全一
21、样的自测检评1若样本 x11,x21,xn1 的平均数为 10,其方差为 2,则对于样本 x12,x22,xn2 的下列结论正确的是()A平均数为 10,方差为 2 B平均数为 11,方差为 3C平均数为 11,方差为 2 D平均数为 14,方差为 4答案:C2在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4 8.4 9.4 9.9 9.6 9.4 9.7去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A9.4,0.484 B9.4,0.016C9.5,0.04 D9.5,0.016解析:选 D 先求平均数:去掉 9.9 和 8.4 得一组数:9.4,9.4,9.6,9.
22、4,9.7,平均数为 x 915(0.40.40.60.40.7)9.5.方差为 s2153(9.49.5)2(9.69.5)2(9.79.5)20.016.3已知一组数据按从小到大排列为1,0,4,x,6,15,且这组数据的中位数是 5,那么数据的众数是_,平均数是_解析:中位数为 5,4x2 5,即 x6,该组数据的众数为 6,平均数为104661565.答案:6 54甲、乙两种水稻,经统计甲水稻的株高方差是 2.0,乙水稻的株高标准差是 1.8,可估计_水稻比_水稻长得整齐解析:因方差、标准差都衡量数据的波动性,2.0(1.8)2.答案:甲 乙5甲、乙两人参加某体育项目训练,近期的五次测
23、试成绩得分情况如图所示(1)分别求出两人得分的平均数与方差;(2)根据折线图和(1)中计算结果,对两人的训练成绩作出评价解:(1)由图可得甲、乙两人五次测试的成绩分别为甲:10,13,12,14,16;乙:13,14,12,12,14.x 甲1013121416513,x 乙1314121214513,s2甲15(1013)2(1313)2(1213)2(1413)2(1613)24,s2乙15(1313)2(1413)2(1213)2(1213)2(1413)20.8.(2)由 s2甲s2乙可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高word部分:请做:课时分层训练水平达标 提升能力点此进入该word板块