1、22.2用样本的数字特征估计总体的数字特征1掌握众数、中位数、平均数、标准差、方差的定义和特征2会求众数、中位数、平均数、标准差、方差,并能用之解决有关问题1众数(1)定义:一组数据中出现次数_的数称为这组数据的众数(2)特征:一组数据中的众数可能_个,也可能没有,反映了该组数据的_众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征【做一做1】 数据组8,1,0,4,4,3的众数是_2中位数(1)定义:一组数据按从小到大的顺序排成一列,处于_位置的数称为这组数据的中位数(2)特征:一组数据中的中位数是_的,反映了该组数据的_在频率分布直方图中,中位数左边和右边的
2、直方图的面积_中位数不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点【做一做2】 数据组5,7,9,6,1,0的中位数是_3平均数(1)定义:一组数据的和与这组数据的个数的商数据x1,x2,xn的平均数为_.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的_任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的_,但平均数受数据中_的影响较大,使平均数在估计总体时可靠性降低【做一做3】 10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,
3、16,14,12,则其平均数是_4标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s_.可以用计算器或计算机计算标准差(2)特征:标准差描述一组数据围绕_波动的大小,反映了一组数据变化的幅度和离散程度的大小标准差较大,数据的离散程度较_;标准差较小,数据的离散程度较_【做一做4】 一组数据的单位是m,平均数是,标准差为s,则()A与s的单位都是kmB与s的单位都是cmC与s的单位都是mD与s的单位不同5方差(1)定义:标准差的平方,即s2_.(2)特征:与_的作用相同,描述一组数据围绕平均数波动程度的大小(3)取值范围:_.数据组x1,x2,xn的平
4、均数为,方差为s2,标准差为s,则数据组ax1b,ax2b,axnb(a,b为常数)的平均数为ab,方差为a2s2,标准差为as.【做一做5】 下列刻画一组数据离散程度的是()A平均数 B方差 C中位数 D众数6用样本估计总体现实中的总体所包含的个体数往往很多,总体的平均数、众数、中位数、标准差、方差是不知道的,因此,通常用_的平均数、众数、中位数、标准差、方差来估计这与上一节用_的频率分布来近似地代替总体分布是类似的只要样本的代表性好,这样做就是合理的,也是可以接受的用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数;用样本标准差估计总体标准差样本容量越大,估计就越精确【做
5、一做61】 下列判断正确的是()A样本平均数一定小于总体平均数B样本平均数一定大于总体平均数C样本平均数一定等于总体平均数D样本容量越大,样本平均数越接近总体平均数【做一做62】 电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该日生产电池的平均寿命估计为()A27 B28 C29 D30答案:1(1)最多(2)不止一集中趋势【做一做1】 42(1)中间(2)唯一集中趋势相等【做一做2】 3将该组数据按从小到大排列为5,1,0,6,7,9,则中位数是3.3(1)(2)平均水平信息极端值【做一做3】 14.7
6、平均数是(15171410151717161412)14.7.4(1)(2)平均数大小【做一做4】 C与s的单位都与数据组中的数据单位相同,是m.5(1)(x1)2(x2)2(xn)2(2)标准差(3)0,)【做一做5】 B方差刻画一组数据离散程度的大小6样本样本【做一做61】 D【做一做62】 B这10个数据的平均数是(30352525303426252921)28,则该日生产的电池的平均寿命估计为28小时1理解众数、中位数、平均数剖析:(1)众数体现了样本数据的最大集中点,容易计算,但它只能表达样本数据中很少一部分信息,显然对其他数据信息的忽略使其无法客观地反映总体特征(2)中位数不受少数
7、几个极端值的影响,容易计算,但它对极端值的不敏感有时也会成为缺点(3)由于平均数与每一个样本的数据有关,“越离群”的数据,对平均数的影响也越大,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低如在体育、文艺等各种比赛的评分中,使用的是平均数,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止由于个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而降低误差,尽量保证公平性(4)
8、在一组数据中,它们的众数、中位数、平均数可能相同,也可能不同,而实际问题中,计算平均数时应该注意按实际要求进行计算(5)实际问题中求得的平均数、众数和中位数应带上单位2众数、中位数、平均数与频率分布直方图的关系剖析:(1)在样本数据的频率分布直方图中,众数的估计值就是最高矩形的中点的横坐标(2)在频率分布直方图中,中位数左右两侧的直方图的面积相等,但是因为样本数据的频率分布直方图只是直观地表明分布的特征,因而从直方图本身得不出原始的数据内容,所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数的值不一致(3)平均数显然是频率分布直方图的“重心”我们知道,n个样本数据x1,x2,xn的平
9、均数(x1x2x3xn),则就有nx1x2x3xn,所以对数据有“取齐”的作用,代表了一组数据的数值平均水平在频率分布直方图中,平均数是直方图的平衡点,假设横轴表示一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡3理解方差与标准差剖析:(1)标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小(2)标准差、方差的取值范围是0,)标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性(3)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样
10、的,但在解决实际问题时,一般多采用标准差题型一 计算方差(标准差)【例题1】 从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的标准差为_分数54321人数2010303010反思:求一组数据的方差和标准差的步骤如下:先求平均数.代入公式得方差和标准差s2(x1)2(x2)2(xn)2,s.题型二 众数、中位数、平均数的应用【例题2】 某工厂人员及月工资构成如下:人员经理管理人员高级技工工人学徒合计月工资(元)22 0002 5002 2002 0001 00029 700人数16510123合计22 00015 00011 00020 0001 00069 000(1)指
11、出这个问题中的众数、中位数、平均数(2)这个问题中,平均数能客观地反映该工厂的月工资水平吗?为什么?分析:反思:(1)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中的极端数据信息,帮助我们作出决策(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各个数据的重心题型三 方差的应用【例题3】 甲、乙两台包装机同时包装质量为200克的糖果,从中各抽出10袋,测得其实际质量分别如下(单位:克):甲:203204202196199201205197202199
12、乙:201200208206210209200193194194(1)分别计算两个样本的平均数与方差(2)从计算结果看,哪台包装机包装的10袋糖果的平均质量更接近于200克?哪台包装机包装的10袋糖果的质量比较稳定?反思:研究两个样本的波动情况或比较它们的稳定性、可靠性、平整性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准若平均数相等,则再比较两个样本方差的大小来作出判断在计算过程中,要仔细观察所给样本数据的特征,选择恰当的公式来计算平均数和方差,这样可避免计算的烦琐,降低错误率题型四 易错辨析【例题4】 小明是班里的优秀学生,他的历次数学成绩是96,98,95,93分,但最近的一次
13、考试成绩只有45分,原因是他带病参加了考试期末评价时,怎样给小明评价?错解:这五次数学考试的平均分是85.4,则按平均分给小明一个“良好”错因分析:这种评价是不合理的,尽管平均分是反映一组数据平均水平的重要特征,但任何一个数据的改变都会引起它的变化,而中位数则不受某些极端值的影响本题中的5个成绩从小到大排列为:45,93,95,96,98,中位数是95,较为合理地反映了小明的数学水平,因而应该用中位数来衡量小明的数学成绩答案:【例题1】 这100人的总成绩为520410330230110300,平均成绩为3,则该100人成绩的标准差为.【例题2】 解:(1)由表格可知,众数为2 000元把23
14、个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元平均数为(22 00015 00011 00020 0001 000)2369 000233 000(元)(2)虽然平均数为3 000元/月,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平【例题3】 解:(1)甲(3424115321)200200.8.乙(10861090766)200201.5.s7.96,s38.05.(2)200甲乙,甲台包装机包装的10袋糖果的平均质量更接近于200克ss,甲台包装机包装的
15、10袋糖果的质量比较稳定【例题4】 正解:小明5次考试成绩,从小到大排列为45,93,95,96,98,中位数是95,应评定为“优秀”1如图,是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则得分的中位数与众数分别为()A3与3 B23与3C3与23 D23与232(2011北京海淀二模,理5)某赛季甲、乙两名篮球运动员各13场比赛的得分情况用茎叶图表示如下:根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是()A甲运动员得分的极差大于乙运动员得分的极差B甲运动员得分的中位数大于乙运动员得分的中位数C甲运动员的得分平均值大于乙运动员的得分平均值D甲运动员的成绩比乙运动员的成
16、绩稳定3抛硬币20次,抛得正面朝上12次,反面朝上8次如果抛到正面朝上得3分,抛到反面朝上得1分,则平均得分是_,得分的方差是_4某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则x2y2_.5某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:甲127138130137135131乙133129138134128136求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛答案:1D中位数是指一组数据按从小到大(或从大
17、到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D2D甲运动员比赛得分的最高分为47,最低分为18,极差为29,乙运动员比赛得分的最高分为33,最低分为17,极差为16,所以A项正确;甲运动员比赛得分的中位数为30,乙运动员比赛得分的中位数为26,所以B项正确;甲运动员的得分平均值 (18181920212630323335404147),乙运动员的得分平均值(17171919222526272929303233),甲运动员的得分平均值大于乙运
18、动员的得分平均值,所以C项正确;由茎叶图知甲得分较为分散,乙得分较为集中,故甲的成绩没有乙的成绩稳定32.20.96总得分为1238144,则平均分是2.2,方差s2(32.2)212(12.2)280.96.4208由平均数为10,得(xy10119)10,则xy20;又由于方差为2,则(x10)2(y10)2(1010)2(1110)2(910)22,整理得x2y220(xy)192,则x2y220(xy)1922020192208.5解:设甲乙两人成绩的平均数分别为,则130133,130133,.因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适高考资源网版权所有!投稿可联系QQ:1084591801