1、预习导航课程目标学习脉络1了解回归分析的必要性及其一般步骤2了解随机误差的概念3会作散点图,会求回归直线方程4会用残差分析判断线性回归模型的拟合效果5掌握建立回归模型的基本步骤,体会回归分析的实际价值和基本思想1线性回归模型(1)线性回归模型ybxae,其中a和b为模型的未知参数,e称为随机误差自变量x称为解释变量,因变量y称为预报变量(2)在线性回归方程x中, ,其中,(,)称为样本点的中心,回归直线过样本点的中心思考1 线性回归模型与一次函数模型的区别在哪里?提示:线性回归模型与一次函数模型的不同之处是增加了随机误差项e,在线性回归模型ybxae中,因变量y的值由自变量x和随机误差e共同确
2、定,即自变量x只能解释部分y的变化在实际问题中,线性回归模型适用的范围要比一次函数模型适用的范围大得多,当随机变量e恒等于0时,线性回归模型就变成了一次函数模型,因此一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式思考2 回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示:不一定是真实值,利用线性回归方程求出的值,只是个预报值,例如人的体重与身高存在一定的线性关系,但体重除了受身高影响外,还受其他因素影响,如饮食等2刻画回归效果的方式残差把随机误差的估计值称为相应于点(xi,yi)的残差残差图作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或
3、体重估计值等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和残差平方和为 (yi)2,残差平方和越小,模型的拟合效果越好R2R21,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归的效果越好思考3 在回归分析中,R2的值越大,则残差平方和越大还是越小?提示:R2的值越大,说明回归模型拟合的效果越好,残差平方和越小,反之,亦成立思考4 怎样理解散点图和R2的关系?提示:散点图可以说明变量间有无线性相关关系,但不能精确地说明两个变量之间关系的密切程度,因此需要计算R2来描述两个变量之间的密切程度