1、4用样本估计总体的数字特征41样本的数字特征新课程标准解读核心素养1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义数据分析2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义数学运算、数据分析藏宝图只能够标出宝藏所在的具体位置及路线图,但真正探索宝藏的秘密还有很多工作要做,同样杂乱无章的数据仅用统计图表来分析显然是不全面的,不同的数字特征往往具有不同的意义和作用问题你知道平均数、中位数、众数所代表的含义吗?知识点一平均数、中位数、众数1平均数:平均数是指一组数据的平均值2中位数:将一组数据按从小到大的顺序
2、排列后,“中间”的那个数据3众数:一组数据中出现次数最多的数据4平均数、中位数、众数都刻画了一组数据(样本)的“中心”位置,通常称它们为数据的集中趋势参数5在统计中,平均数是最常用的量如数据中个别数据特别大或特别小时,用中位数会更合理众数、中位数、平均数的比较名称优点缺点众数体现了样本数据的最大集中点;容易计算它只能表达样本数据中很少的一部分信息;无法客观地反映总体的特征中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响;容易计算,便于利用中间数据的信息对极端值不敏感平均数代表性较好,是反映数据集中趋势的量一般情况下,可以反映出更多的关于样本数据的信息任何一个数据的改变都会引起平均数的
3、改变数据越“离群”,对平均数的影响越大 1中位数一定是样本数据中的一个数吗?提示:不一定一组数据按大小顺序排列后,如果有奇数个数据,处于中间位置的数据就是中位数;如果有偶数个数据,则取中间两个数据的平均数才是中位数2一组数据的众数可以有几个?中位数是否也具有相同的结论?提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个1某射击小组有20人,教练将他们某次射击的数据绘制成如下表格,则这组数据的众数和中位数分别是()环数5678910人数127631A.7,7B8,7.5C7,7.5 D8,6解析:选C从表中数据可知7环有7人,人数最多,所以众数是7;中位数是将数据从小到大排列,第1
4、0个与第11个数据的平均数,第10个数是7,第11个数是8,所以中位数是7.5.2已知一组数据的平均数是x,众数是m,中位数是n,将每个数据加上3后得到一组新数据,则这组新数据的平均数、众数、中位数分别为_解析:根据平均数的计算公式可得平均数变为x3.因为原众数为m,原中位数为n,每个数据加上3后,m会变为m3,n会变为n3,所以众数变为m3,中位数变为n3.答案:x3,m3,n3知识点二极差、方差和标准差1极差:数据中最大值和最小值的差2方差:方差刻画的是数据偏离平均数的离散程度3标准差:方差的算术平方根s,称之为标准差1标准差、方差描述了一组数据围绕着平均数波动的大小,标准差、方差越大,数
5、据的离散程度越大;标准差、方差越小,数据的离散程度越小2标准差、方差为0时,表明样本数据全相等,数据没有波动幅度和离散性3标准差的大小不会超过极差 1方差和标准差的取值范围是什么?提示:标准差、方差的取值范围是0,)2方差和标准差是如何反映一组数据的离散程度的?提示:标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小某校一名篮球运动员在五场比赛中所得分数分别为8,9,10,13,15,则该运动员在这五场比赛中得分的平均值为_,方差为_,标准差为_解析:依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为11.由方差公式得s2(811)2(911)
6、2(1011)2(1311)2(1511)2(941416)6.8.s.答案:116.8平均数、众数、中位数的计算例1某工厂人员及周工资构成如表:人员经理管理人员高级技工工人学徒合计周工资/元2 2001 2501 2201 200490人数16510123(1)求工厂人员周工资的众数、中位数、平均数;(2)平均数能客观地反映该工厂的工资水平吗?为什么?解(1)由题中表格可知周工资的众数为1 200元,中位数为1 220元,平均数为(2 2001 25061 22051 20010490)231 230(元)(2)虽然平均数为1 230元,但从题干表格中所列出的数据可见,只有经理和6名管理人员
7、的周工资在平均数以上,其余的人的周工资都在平均数以下,故用平均数不能客观真实地反映该厂的工资水平平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算提醒如果样本平均数大于样本中位数,说明数据中存在较大的极端值 跟踪训练1某射击运动员进行打靶练习,已知打十枪的靶数分别为9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数为c,则有()AabcBcabCbca Dcba解析:选D平均数a(9107810106897)8.4,中位数b8.5,众数c10,因此cba,故选D.2已知样
8、本数据x1,x2,xn的平均值5,则样本数据2x11,2x21,2xn1的平均值为_解析:由条件知5,则所求平均值02125111.答案:11由频率分布直方图求平均数、中位数和众数例2某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数解(1)由题图知众数为75(分)(2)由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.30.40.5,因此中位数位于第四个矩形内,得0.10.03(x70),所以x73.3.故这次测试数学成绩的中位数为73.3分母题
9、探究1(变设问)若本例的条件不变,求数学成绩的平均分解:由题图知这次数学成绩的平均分为0.005100.015100.02100.03100.025100.0051072(分)2(变设问)若本例条件不变,求80分以下的学生人数解:40,80)分的频率为(0.0050.0150.0200.030)100.7,所以80分以下的学生人数为800.756.众数、中位数、平均数与频率分布直方图的联系(1)众数:众数在样本数据的频率分布直方图中,就是最高矩形的底边中点的横坐标;(2)中位数:在样本中,有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估
10、计中位数的值;(3)平均数:用频率分布直方图估计平均数时,平均数等于频率分布直方图中每个小矩形的面积乘以每个小矩形底边中点的横坐标之和 跟踪训练某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生成绩的众数、中位数;(2)高一参赛学生的平均成绩解:(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65分,又第一个小矩形的面积为0.3,设第二个小矩形底边的一部分长为x,则x0.040.2,得x5,中位数
11、为60565(分)(2)依题意,平均成绩为550.3650.4750.15850.1950.0567(分),平均成绩约为67分.极差、方差、标准差的计算及应用例3(链接教科书第168页例3)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲:7,8,6,9,6,5,9,9,7,4.乙:9,5,7,8,7,6,8,6,7,7.(1)分别计算甲、乙两人射击命中环数的极差、众数和中位数;(2)分别计算甲、乙两人射击命中环数的平均数、方差、标准差;(3)比较两人的成绩,然后决定选择哪一个人参赛解(1)对于甲:极差是945,众数是9,中位
12、数是7;对于乙:极差是954,众数是7,中位数是7.(2)甲7,s(77)2(87)2(67)2(97)2(67)2(57)2(97)2(97)2(77)2(47)22.8,s甲1.673.乙7,s(97)2(57)2(77)2(87)2(77)2(67)2(87)2(67)2(77)2(77)21.2,s乙1.095.(3)甲乙,s甲s乙,甲、乙两人的平均成绩相等,乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差
13、越小,数据越集中、越稳定 跟踪训练甲、乙两位同学进行投篮比赛,每人玩5局每局在指定线外投篮,若第1次不进,则再投第2次,依此类推,但最多只能投6次当投进时,该局结束,并记下投篮的次数;若第6次投不进,该局也结束,记为“”在每局中, 第1次投进得6分,第2次投进得5分,第3次投进得4分,第6次投进得1分,若第6次投不进,得0分两人的投篮情况如下:第1局第2局第3局第4局第5局甲5次4次5次1次乙2次4次2次请判断哪位同学投篮的水平较高解:甲同学投篮的水平较高理由如下:依题意,甲、乙两位同学的得分情况如下表:第1局第2局第3局第4局第5局甲20326乙05350通过计算,可得甲2.6(分),乙2.
14、6(分),s(22.6)2(02.6)2(32.6)2(22.6)2(62.6)23.84,s(02.6)2(52.6)2(32.6)2(52.6)2(02.6)25.04,所以甲乙,ss.故甲同学投篮的水平较高1(多选)下列对一组数据的分析,说法正确的是()A数据极差越小,样本数据分布越集中、稳定B数据平均数越小,样本数据分布越集中、稳定C数据标准差越小,样本数据分布越集中、稳定D数据方差越小,样本数据分布越集中、稳定解析:选ACD极差反映了最大值与最小值差的情况,极差越小,数据越集中方差、标准差是用来衡量一组数据波动大小的量,方差、标准差越大,表明这组数据偏离平均数越大,即波动越大,数据越
15、不稳定方差、标准差较小的数据波动较小,稳定程度较高平均数越小,说明数据整体上偏小,不能反映数据稳定与否故选A、C、D.2已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数据3x12,3x22,3x32,3x42,3x52的平均数和方差分别为()A2, B2,1C4, D4,3解析:选D由题意得数据x1,x2,x3,x4,x5的平均数x2,方差s2,所以数据3x12,3x22,3x32,3x42,3x52的平均数为x3x23224,方差为s29s293.3.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是()A12.5,12.5B12.5,1
16、3C13,12.5D13,13解析:选B众数是频率分布直方图中最高矩形的底边中点的横坐标中间的一个矩形最高,10与15的平均数是12.5,众数是12.5.中位数是把频率分布直方图分成两个面积相等部分的平行于纵轴的直线与横轴交点的横坐标第一个矩形的面积是0.2,第三个矩形的面积是1(0.040.10)50.3,中位数线将第二个矩形分成32两部分,中位数是13.故选B.4一组数据1,10,5,2,x,2,且2x5,若该数据的众数是中位数的倍,则该数据的平均数为_解析:根据题意知,该组数据的众数是2,则中位数是23,把这组数据从小到大排列为1,2,2,x,5,10,则3,解得x4,所以这组数据的平均
17、数为x(1224510)4.答案:45在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩(单位:m)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数、中位数与平均数解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.这组数据的平均数是x(1.5021.6031.901)1.69(m)故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.