1、-1-1.1 回归分析目标导航 知识梳理 典例透析 随堂演练 1.通过实例掌握回归分析的基本思想方法.2.利用最小二乘法会求线性回归直线方程,并能用线性回归直线方程进行预报.目标导航 知识梳理 典例透析 随堂演练 1 2 1.线性回归方程 假设样本点为(x1,y1),(x2,y2),(xn,yn),设线性回归直线方程为y=a+bx,要使这n个点与直线y=a+bx的“距离”平方之和最小,即使得Q(a,b)=(y1-a-bx1)2+(y2-a-bx2)2+(yn-a-bxn)2达到最小,a,b需满足对两个变量之间的相关关系进行统计分析的方法叫回归分析.回归分析是寻找相关关系中非确定性关系的某种确定
2、性.如果散点图中样本点的分布从整体上看大致在一条直线附近,我们称这两个变量之间具有线性相关关系,这条直线叫线性回归直线,从整体上看各点与此直线的距离平方之和最小,即该直线最贴近已知的样本点,最能代表变量x与y之间的关系.足 b=1xiyi-x yi=1n2-2,a=.目标导航 知识梳理 典例透析 随堂演练 1 2 2.求线性回归方程的一般步骤(1)作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图.从散点图中我们可以看出样本是否呈现线性分布,从而判断两个变量是否具有线性相关关系.(2)求回归系数a,b,其具体步骤为将所给的数据xi,
3、yi(i=1,2,n)列成相应的表格,如下表所示:i xi yi xi2 yi2 xiyi 1 x1 y1 x12 y12 x1y1 2 x2 y2 x22 y22 x2y2 n xn yn xn2 yn2 xnyn xi yi xi2 yi2 xiyi 目标导航 知识梳理 典例透析 随堂演练 1 2 设线性回归方程为 y=bx+a.其中(xi,yi)为样本数据,=1=1xi,y=1n i=1nyi为样本平均数,(,)称为样本点的中心,且所求回归直线 y=a+bx 一定经过点(,).(3)写出线性回归方程 y=bx+a,并进行预测说明:当 x 取 x0 时,由线性回归方程可得 y0 的值,从而
4、可进行相应的预测判断.目标导航 知识梳理 典例透析 随堂演练 1 2【做一做1】随机抽样中得到四个样本点分别为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y=x+1 B.y=x+2 C.y=2x+1 D.y=x-1 答案:A 目标导航 知识梳理 典例透析 随堂演练 1 2【做一做2】某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料:若由资料知,y与x呈线性相关关系.试求:(1)线性回归方程y=bx+a的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?使用年限 x/年 2 3 4 5 6 维修费用 y/万元 2
5、.2 3.8 5.5 6.5 7.0 目标导航 知识梳理 典例透析 随堂演练 1 2 解:(1)根据题中数据列表如下:i xi yi xi2 xiyi 1 2 2.2 4 4.4 2 3 3.8 9 11.4 3 4 5.5 16 22.0 4 5 6.5 25 32.5 5 6 7.0 36 42.0 20 25 90 112.3 由此可得=4,=5.于是有 b=112.3-54590-542=12.310=1.23,a=-b=5-1.234=0.08.(2)由(1)知线性回归方程为 y=1.23x+0.08.当 x=10时,y=1.2310+0.08=12.38,即估计使用年限为 10 年
6、时维修费用为12.38 万元.知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 题型一 求线性回归方程 【例1】在关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获得了一组数据:年龄 x 23 27 39 41 45 49 50 脂肪含量 y 9.5 17.8 21.2 25.9 27.5 26.3 28.2 年龄 x 53 54 56 57 58 60 61 脂肪含量 y 29.6 30.2 31.4 30.8 33.5 35.2 34.6 (1)假设x与y之间呈现近似的线性相关关系,求y与x之间的线性回归方程;(2)给出37岁人的脂肪含量的预测值.分析:两个变量呈现近似的线性
7、相关关系,可通过公式计算出其线性回归方程,并根据方程求出预测值.知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 解:(1)设线性回归方程为y=a+bx,根据已知列表如下:i xi yi xi2 xiyi 1 23 9.5 529 218.5 2 27 17.8 729 480.6 3 39 21.2 1 521 826.8 4 41 25.9 1 681 1 061.9 5 45 27.5 2 025 1 237.5 6 49 26.3 2 401 1 288.7 7 50 28.2 2 500 1 410 8 53 29.6 2 809 1 568.8 知识梳理 典例透析 随堂演练
8、目标导航 题型一 题型二 9 54 30.2 2 916 1 630.8 10 56 31.4 3 136 1 758.4 11 57 30.8 3 249 1 755.6 12 58 33.5 3 364 1 943 13 60 35.2 3 600 2 112 14 61 34.6 3 721 2 110.6 673 381.7 34 181 19 403.2 由此可得,48.07,27.26,b=19 403.2-1448.0727.2634 181-1448.0720.58,a=-b-0.62.所以线性回归方程为 y=0.58x-0.62.(2)当 x=37 时,y=20.84.所以
9、37 岁人的脂肪含量的预测值为 20.84%.知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 反思1.求线性回归方程的基本步骤.(1)画出散点图,从直观上分析数据间是否存在线性相关关系;(2)计算:,=1xi2,i=1n2,=1;(3)代入公式求出y=bx+a中参数b,a的值;(4)写出线性回归方程并对实际问题作出估计.2.需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.知识梳理 典例透析 随堂演练 目标导航 题型一 题型二【变式训练1】某5名学生的数学和化学成绩如下表:(1)画出散点图;(2)求化学成绩y对数学成绩x的线性回归方程.学
10、生学科成绩 A B C D E 数学成绩 x 88 76 73 66 63 化学成绩 y 78 65 71 64 61 知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 解:(1)散点图如图所示.(2)=15(88+76+73+66+63)=73.2,=15(78+65+71+64+61)=67.8,=15xiyi=8878+7665+7371+6664+6361=25 054,i=152=882+762+732+662+632=27 174,b=15-5=152-52=25 054-573.267.827 174-573.220.625.a=-b=67.8-0.62573.2=22.0
11、5.y 对 x 的线性回归方程为 y=0.625x+22.05.知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 题型二 回归分析的应用 【例2】某农场对单位面积化肥用量x(单位:kg)和水稻相应产量y(单位:kg)的关系作了统计,得到数据如下:求出线性回归方程,并预测当单位面积化肥用量为32 kg时,水稻的产量大约是多少?(精确到0.01 kg)x 15 20 25 30 35 40 45 y 330 345 365 405 445 450 455 知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 解:用列表的方法计算 a 与回归系数 b.i xi yi xi2 xiyi 1 1
12、5 330 225 4 950 2 20 345 400 6 900 3 25 365 625 9 125 4 30 405 900 12 150 5 35 445 1 225 15 575 6 40 450 1 600 18 000 7 45 455 2 025 20 475 =17(15+20+45)=30,=17(330+345+455)399.29,知识梳理 典例透析 随堂演练 目标导航 题型一 题型二=17xi2=225+400+2 025=7 000,i=17xiyi=4 950+6 900+20 475=87 175,b=87 175-730399.297 000-73024.7
13、5,a=399.29-4.7530=256.79.y 关于未知量 x 的线性回归方程为 y=a+bx=256.79+4.75x.当 x=32 时,y=256.79+4.7532=408.79.故所求线性回归方程为 y=256.79+4.75x.当单位面积化肥用量为 32 kg 时,水稻的产量大约为 408.79 kg.知识梳理 典例透析 随堂演练 目标导航 题型一 题型二【变式训练2】一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5
14、),(12,8),(14,9),(16,11).(1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程;(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(结果精确到1)知识梳理 典例透析 随堂演练 目标导航 题型一 题型二 解:(1)设回归方程为 y=a+bx,则=8+12+14+164=12.5,=5+8+9+114=8.25,=14xi2=660,i=14=438,b=14-4=142-42=438-412.58.25660-412.520.73,a=8.25 0.73 12.5=0.875,故所求回归方程为 y=-0.875+0.73x.
15、(2)由 y10,即-0.875+0.73x10,得 x 10.8750.73 15,即机器速度不得超过 15 转/秒.知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b()A.可以小于0B.只能大于0 C.可能等于0D.只能小于0 解析:b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.答案:A 知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5 2.下列两个变量间的关系不是函数关系的是()A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量
16、D.日照时间与水稻亩产量 答案:D 知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5 3.已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是()A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行 D.l1与l2必定重合 答案:A 知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5 4.某城市供电局为了了解用电量y(单位:度)与气温x
17、(单位:)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据,得线性回归方程y=-2x+a,当气温为-4 时,预测用电量的度数约为 .气温/18 13 10-1 用电量/度 24 34 38 64 答案:68 解析:因为=18+13+10-14=10,=24+34+38+644=40,且回归直线方程过(,),所以 40=-20+a,解得 a=60,把 x=-4 代入回归直线方程,可预测用电量的度数约为 68.知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5 5.某工厂18月份某种产品的产量x与成本y的统计数据见下表:月份 1 2 3 4 5 6 7 8 产量
18、x/t 5.6 6.0 6.1 6.4 7.0 7.5 8.0 8.2 成本 y/万元 130 136 143 149 157 172 183 188 (1)画出散点图.(2)y与x是否具有线性相关关系?若有,求出其线性回归方程.知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5 解:(1)散点图如图所示.知识梳理 典例透析 随堂演练 目标导航 1 2 3 4 5(2)由上图可看出,这些点基本散布在一条直线附近,可以认为 x和 y 线性相关,下面求线性回归方程:=6.85,=157.25,=18xiyi=8 764.5,i=182=382.02,b=18-8=182-82=8 764.5-86.85157.25382.02-86.85222.17,a=-b=157.25-22.176.855.39,线性回归方程为 y=22.17x+5.39.