1、温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。92.3总体集中趋势的估计9.2.4总体离散程度的估计现从甲、乙、丙三个厂家生产的同一种耐用家电产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下:(单位:年)甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.【问题1】如果要确定哪家的产品更耐用,你觉得应该研究样本数据的哪些数字特征?【问题2】三家广告中都称其产品的使用寿命为8年,你能说明为什么吗?【问题3】能否用样本的数字特征估计总体的数字
2、特征?1众数、中位数、平均数数字参数定义与求法优点与缺点众数一组数据中重复出现次数最多的数众数通常用于描述变量的值出现次数最多的数但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大(或从大到小)排列,处在最中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有n个数据x1,x2,xn,那么这n个数据的平均数x(x1x2xn)平均数和每一个数据都有关,可以反映样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低2.总体集中
3、趋势的估计(1)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关(2)单峰频率分布直方图的平均数与中位数形状关系对称平均数与中位数差不多右边“拖尾”平均数大于中位数左边“拖尾”平均数小于中位数平均数总是在“长尾巴”那边(3)对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数1本质:众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势2混淆:(1)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,x2n1,则称xn1为这组数的中位
4、数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,x2n,则称为这组数的中位数(2)如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数一组数据的众数可以有几个?中位数是否也具有相同的结论?提示:一组数据的众数可能有一个,也可能有多个,中位数只有唯一一个3总体离散程度的估计(1)极差一种简单的度量数据离散程度的方法就是用极差极差越大,波动范围越大(2)平均距离假设一组数据是x1,x2,xn,用x表示这组数据的平均数距离:每个数据与平均数的差的绝对值,表示:|xix|(i1,2,n)
5、.平均距离:xix|.(3)方差、标准差方差:(xix)2x2.标准差:.(4)总体方差、总体标准差如果总体中所有个体的变量值分别为Y1,Y2,YN,总体平均数为,则总体方差:S2(Yi)2,总体标准差:S如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为Y1,Y2,Yk,其中Yi出现的频率为fi(i1,2,k),则总体方差为S2i(Yi)2(5)样本方差、样本标准差如果一个样本中个体的变量值分别为y1,y2,yn,样本平均数为,则样本方差:s2(yi)2,样本标准差:s标准差、方差与数据离散程度有何关系?提示:标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准
6、差越小,数据的离散程度越小在刻画数据的分散程度上,方差和标准差是一样的1一组数据的平均数只有一个,是吗?2一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,是吗?3标准差越大,表明各个样本数据在样本平均数周围越集中吗?4若一组数据的值大小相等,则标准差为1,是吗?提示:1.是;2.是;3.不是;4.不是阅读教材P204“思考”及下面的解释两段文字,因为中位数对样本数据不敏感,是不是个别数据录入错误时,一定不会影响中位数的大小?提示:不是1一组样本数据为:19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为()A14,14 B12,14C1
7、4,15.5 D12,15.5【解析】选A.把这组数据按从小到大排列为:10,12,12,14,14,14,17,18,19,23,27,则可知其众数为14,中位数为14.2学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4则:命中环数的标准差为_【解析】7.s2(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,所以s2.答案:2学生用书P108基础类型一众数、中位数、平均数的计算与应用(数学运算、数据分析)1某班50名学生的一次安全知识竞赛成绩分布如表所示:(满分10分)成绩012345678910人
8、数0001013561915这次安全知识竞赛成绩的众数是()A5分 B6分 C9分 D10分【解析】选C.根据众数是一组数据中出现次数最多的进行判断,由表中数据可知成绩9分出现了19次,最多,所以众数是9分2如果5个数x1,x2,x3,x4,x5的平均数是7,那么x11,x21,x31,x41,x51这5个数的平均数是()A5 B6 C7 D8【解析】选D.依题意x1x2x535,所以(x11)(x21)(x51)40,故所求平均数为8.3某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,
9、4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?【解析】(1)甲群市民年龄的平均数为15(岁),中位数为15岁,众数为15岁平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征(2)乙群市民年龄的平均数为15(岁),中位数为5.5岁,众数为6岁由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差众数、中位数、平均数的计算方法与意义样本的众数、中位数和平均数常用来表
10、示样本数据的“中心值”,其中众数和中位数可以将数据排序后计算、不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数一般利用公式计算,代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大基础类型二总体集中趋势的估计(数据分析)【典例】某地遭遇严重干旱,乡政府计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表:(月均用水量的单位:吨)用水量分组频数频率0.5,2.5)122.5,4.5)4.5,6.5)406.5,8.5)0.188.5,10.56合计1001.00(1)请完成该频率分布
11、表,并画出相对应的频率分布直方图(2)估计样本的中位数是多少(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?【解析】(1)频率分布表与相应的频率分布直方图如下:用水量分组频数频率0.5,2.5)120.122.5,4.5)240.244.5,6.5)400.406.5,8.5)180.188.5,10.560.06合计1001.00(2)设中位数为x,因为月均用水量在0.5,4.5)内的频率是0.120.240.36,月均用水量在0.5,6.5)内的频率是0.120.240.400.76,所以x4.5,6.5),则(x4.5)0.20.
12、50.36,解得x5.2.所以中位数是5.2.(3)该乡每户月均用水量估计为1.50.123.50.245.50.407.50.189.50.065.14,5.141 2006 168,所以上级支援该乡的月调水量是6 168吨用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和某校从参加高一年级期末测试的学生中抽出80名学生,其数学
13、成绩(均为整数)的频率分布直方图如图所示则这次测试数学成绩的众数、中位数、平均分分别为_【解析】由题图知众数为75.设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.30.40.5,因此中位数位于第四个矩形内,得0.10.03(x70),所以x73.3.这次数学成绩的平均分为:0.005100.015100.02100.03100.025100.0051072.答案:75,73.3,72综合类型总体离散程度的估计(数学运算)极差、方差、标准差的计算【典例】1.若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8 B15 C16
14、 D32【解析】选C.令yi2xi1(i1,2,3,10),则所求的标准差为s2816.2样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的极差为_,方差为_【解析】由题可知样本的平均数为1,所以1,解得a1,所以样本的极差为:3(1)4;样本的方差为:s2(11)2(01)2(11)2(21)2(31)22.答案:42计算标准差的5步骤(1)求出样本数据的平均数.(2)求出每个样本数据与样本平均数的差xi(i1,2,n).(3)求出xi(i1,2,n)的平方值(4)求出上一步中n个平方值的平均数,即为样本方差(5)求出上一步中平均数的算术平方根,即为样本标准差已
15、知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,21,且总体的中位数为10,若要使该总体的方差最小,则ab_【解析】由题意得ab10220,要使该总体的方差最小,方差化简后即满足(a10)2(b10)2最小,故ab10,ab100.答案:100总体离散程度的估计【典例】假定以下数据是甲、乙两个供货商的交货时间(单位:天):甲:109101011119111010乙:81014710111081512估计两个供货商的交货情况,并判断哪个供货商的交货时间短一些,哪个供货商的交货时间比较具有一致性和可靠性【解析】甲(109101011119111010)10.1,
16、s(1010.1)2(910.1)2(1010.1)2(1010.1)2(1110.1)2(1110.1)2(910.1)2(1110.1)2(1010.1)2(1010.1)20.49;乙(81014710111081512)10.5,s(810.5)2(1010.5)2(1410.5)2(710.5)2(1010.5)2(1110.5)2(1010.5)2(810.5)2(1510.5)2(1210.5)26.05.从交货时间的平均数来看,甲供货商的交货时间短一些;从交货时间的方差来看,甲供货商的交货时间较稳定,因此甲供货商的交货时间比较具有一致性和可靠性研究两个样本的波动情况或比较它们的
17、稳定性、可靠性等性能好坏的这类题,先求平均数,比较一下哪一个更接近标准,若平均数相等,则再比较两个样本方差的大小来作出判断【加固训练】 某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:甲:9582888193798478乙:8392809590808575(1)试比较哪个工人的成绩较好(2)甲、乙成绩位于xs与xs之间的有多少?【解析】(1)x甲(9582888193798478)85,x乙(8392809590808575)85.s(9585)2(8285)2(8885)2(8185)2(9385)2(7985)2(8485)2(7885)235.5, s(8
18、385)2(9285)2(8085)2(9585)2(9085)2(8085)2(8585)2(7585)241.因为x甲x乙,ss,所以甲的成绩较稳定综上可知,甲的成绩较好(2)因为s甲5.96,x甲s甲79.04,x甲s甲90.96,所以甲位于xs与xs之间的数据有4个又s乙6.4,x乙s乙78.6,x乙s乙91.4,所以乙的成绩位于xs与xs之间的有5个创新题型动态样本平均数、方差问题(数学抽象、数据分析)【典例】若一个样本量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本量为9,平均数为,方差为s2,则()A5,s22 B5,s22C5,s22 D5,s22【解析
19、】选A.因为(x1x2x8)5,所以(x1x2x85)5,所以5.由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,所以s22.动态样本求平均数、方差的策略(1)平均数、方差的基本公式不变,但要注意变化前后的关系;(2)可适当结合平均数、方差的意义估值【加固训练】 某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是_,_【解析】因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得s2(x170)2(x270)2(8070
20、)2(7070)2(x4870)2,而更正前有75(x170)2(x270)2(5070)2(10070)2(x4870)2,化简整理得s250.答案:70501下列说法中,不正确的是()A数据2,4,6,8的中位数是4,6B数据1,2,2,3,4,4的众数是2,4C一组数据的平均数、众数、中位数有可能是同一个数据D8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是【解析】选A.数据2,4,6,8的中位数为5,显然A是错误的,B、C、D都是正确的2奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为()A减少计算
21、量 B避免故障C剔除异常值 D活跃赛场气氛【解析】选C.因为在体操比赛的评分中使用的是平均分,计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量公平3下列说法中不正确的是()A数据的极差越小,样本数据分布越集中、稳定B数据的平均数越小,样本数据分布越集中、稳定C数据的标准差越小,样本数据分布越集中、稳定D数据的方差越小,样本数据分布越集中、稳定【解析】选B.由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关4已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为_【解析】因为样本容量n5,所以(12345)3,所以s.答案:5已知甲、乙两组数据按从小到大排列后如下所示:甲:27,m,39;乙:n,32,34,38.若这两组数据的中位数相同,平均数也相同,则_【解析】因为两组数据的中位数相同,所以m(3234)33,由于两组数据的平均数相同,所以(273339)(n323438).解得n28,故.答案:关闭Word文档返回原板块