1、回归直线方程的推导 设x与y是具有线性相关关系的两个变量,且相应于样本的一组观测值的n个点的坐标分别是:,下面给出回归方程的推导。 设所求的回归方程为,其中是待确定的参数,那么:,(),样本中各个点的偏差是 ,()显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分,因此他们的和不能代表n个点与回归直线在整体上的接近程度,而是采用n个偏差的平方和来表示n个点与相应直线(回归直线)在整体上的接近程度。即求出当取最小值时的的值,就求出了回归方程。 (一) 先证明两个在变形中用到的公式:公式(1) 其中 因为所以公式() 因为所以(二)推导:将的表达式的各项先展开,再合并、变形 -展
2、开 -以a,b为同类项,合并 -以a,b的次数为标准整理 -将数据转化为平均数 -配方法 -展开 -整理 -用公式(一)、(二)变形 -配方 在上式中,共有四项,后两项与a,b无关,为常数;前两项是两个非负数的和,因此要使得区的最小值,当且仅当前两项的值都为0。所以 或 -用公式(一)、(二)变形得 (三)总结规律:上述推倒过程是围绕着待定参数a,b进行的,只含有的部分是常数或系数,用到的方法有(1)配方法,有两次配方,分别是a的二次三项式和b的二次三项式;(2)变形时,用到公式(一)、(二)和整体思想;(3)用平方的非负性求最小值。(4)实际计算时,通常是分步计算:先求出,再分别计算, 或,的值,最后就可以计算出a,b的值。 小练习:(1)验证当样本数据只有两个点时的回归方程;(2)当样本数据有三个点,是(),(),()时,试推导回归方程。w.w.w.k.s.5.u.c.o.m