1、 求线性回归方程 求线性回归方程的一般步骤(1)计算平均数、;(2)计算xi与yi的积,求 ;(3)计算 ;xyniii 1x y2ix(4)将上述有关结果代入公式 求b、a,写出线性回归方程.求线性回归方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时应仔细谨慎、分层进行,避免因计算产生失误.【例1】(2011中山模拟)某公司近年来科研费用支出x万元与公司所获得利润y万元之间有如下的统计数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a.参考公式:【审题指导】解答本题的关键是明确公式中各量的意义,分别计算出结果
2、.【规范解答】(1)画出散点图如图:【例】以下资料是一位销售经理收集来的销售员每年的销售额和销售经验年数的关系表:(1)根据这些数据画出散点图并作出直线y=78+4.2x,计 算 ;(2)根据这些数据用最小二乘法求线性回归方程 =a+bx,并由此计算 ;(3)比较(1)和(2)中两个计算结果的大小.102iii 1y yy102iii 1y y【审题指导】解答本题的关键是明确yi,yi的意义,代入公式求解.【规范解答】(1)散点图与直线y=78+4.2x如图所示.当x 分别取1,3,4,4,6,8,10,10,11,13时,y的值分别为 82.2,90.6,94.8,94.8,103.2,11
3、1.6,120,120,124.2,132.6,则 =179.28.102iii 1yy(3)因为179.28170,故用最小二乘法求出的 较小.102iii 1yy 回归方程的应用 1.回归方程的应用体现在以下几个方面:(1)描述两变量之间的依赖关系:利用线性回归方程即可定量的描述两个变量间的依赖关系.(2)利用回归方程可以进行预测,把预报因子(相当于随机变量x)代入回归方程对预报量(相当于因变量y)进行估计,即可得到个体y值的允许区间.(3)利用回归方程进行统计控制规定y值的变化,通过控制x的范围来实现统计控制的目标.2.应用线性回归方程的方法技巧(1)求线性回归方程时,应注意只有在散点图
4、大致呈线性相关时,求出的线性回归方程才有实际意义,因此,对数据作线性回归分析时,应先看其散点图是否呈线性相关关系.(2)求线性回归方程,关键在于正确地求出系数a、b,由于求a、b的计算量较大,计算时应仔细谨慎、分层进行,避免因计算产生失误.(3)得到的实验数据不同,则a、b的结果也不尽相同.在线性回归方程中,b是线性回归方程的斜率,a是截距;b的含义容易理解成增加的单位数,而实际上,它代表x每增加一个单位,y平均增加的单位数为b个单位.【例2】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下:(1)画出散点图;(2)求线性回归方程.【审题指导】先画散点
5、图,判断其是否线性相关,再利用最小二乘法求其回归方程.【规范解答】(1)散点图如图所示.由散点图知二者呈线性相关关系.(2)设线性回归方程为y=bx+a.列表并利用科学计算器进行有关计算.所以b=0.668,a=-b=91.7-0.66855=54.96.故所求线性回归方程为y=0.668x+54.96.255 950 10 55 91.738 500 10 55yx【典例】(2011包头高二检测)假设关于某设备的使用年限x和所支出的维修费用y(万元)有如表格所示的统计数据,由资料显示y对x呈线性相关关系.(1)请根据上表数据,用最小二乘法求出y关于x的线性回归方程.(2)试根据(1)求出的线
6、性回归方程,预测使用年限为10年时,维修费用是多少?【审题指导】解答本题的关键是最小二乘法求回归方程,再利用它的意义解答第(2)问.【规范解答】(1)=32.5+43+54+64.5=66.5 =4.5 =3.5 =32+42+52+62=86 b=0.7 a=-b=3.5-0.74.5=0.35.故线性回归方程为y=0.7x+0.35.4iii 1x yx34564 y2.5344.54 42ii 1x266.54 4.5 3.5864 4.5 66.5638681yx(2)当x=10(年)时,维修费用是0.710+0.35=7.35(万元),所以根据回归方程的预测,使用年限为10年时,维修
7、费用是7.35(万元).【误区警示】对解答本题时易犯的错误具体分析如下:1.下列命题:线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归直线ybxa及回归系数b,可以估计和预测变量的取值和变化趋势.其中正确的命题是()(A)(B)(C)(D)【解析】选D.利用最小二乘法求回归直线就是求样本数据的点到直线的距离的平方和的最小值.利用线性回归方程,可以进行预测.而从散点图的分布可以判断是否线性相关.2.有关线性回归的说法,不正确的是()(A)相关关系的两个变量是非确定关系(B)散点图能直接地反映数据的相关程
8、度(C)线性回归方程最能代表线性相关的两个变量之间的关系(D)散点图中的点越集中,两个变量的相关性越强【解析】选D.散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强.3.若施化肥量x kg与水稻产量y kg在一定范围内线性相关,若回归方程为y5x250.当施化肥量为80 kg时,预计水稻的产量为_.【解析】当x80时,y580250650(kg).答案:650 kg 4.某饮料店的日销售收入y(单位:百元)与当天平均气温 x(单位:)之间有下列数据:甲,乙,丙三位同学对上述数据进行了研究,分别得到了x与y 之间的三个线性回归方程y=-x+2.8;y=-x+3;y=-1.2x+2.6,其中正确的是_;【解析】把 ,代入可知.答案:xy5.已知变量x,y线性相关,x与y有下列对应数据:求y对x的线性回归方程.【解析】132 31 2 3 45722xy4244 ,422222ii 1x123430 ,4iii 11343x y123 2 4 3222,4iii 1422ii 143574x y4xy4224b255x4x30 44,745141aybx.yx.452454