1、教材习题点拨练习1解:作散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据2解:分析残差可以帮助我们解决以下几个问题:寻找异常点,就是残差特别大的样本点,考察相应的样本数据是否有错;分析残差图可以发现模型选择是否合适点拨:分析残差是回归分析的一部分内容,可以帮助发现样本数据中的错误,分析模型选择是否合适,是否有其他变量需要加入到模型中,模型的假设是否正确等3解:(1)解释变量与预报变量的关系是线性函数关系,残差平方和等于0.(2)解释变量和预报变量之间的相关指数是1.点拨:如果所有的样本点都在一条直线上,建立的线性回归模型一定是这条直
2、线,所以每个样本点的残差均为0,所以残差平方和也为0,即此时的模型为ybxa,没有随机误差项,所以是严格的一次函数关系通过计算可以证明解释变量和预报变量之间的相关指数是1.习题1.11解:(1)从表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近似呈现线性关系(2)用yt表示GDP值,t表示年份根据截距和斜率的最小二乘计算公式得14 292 537.729 089 9,7 191.969 090 908 61,从而得线性回归方程7 191.969 090 908 61t14 292 537.729 089 9.残差计算结果见下表:GDP值与年份线性拟合残差表年份19931994199
3、519961997残差6 422.2691 489.2383 037.4935 252.0244 638.055年份19981999200020012002残差1 328.6852 140.9841 932.3531 277.622993.791(3)2003年的GDP预报值为112 976.4,根据国家统计局2004年的统计,2003年实际GDP值为117 251.9,预报与实际相差4 275.5.(4)上面建立的回归方程的R20.974,说明年份能够解释97%的GDP值变化,因此所建立的模型能够很好地刻画GDP和年份的关系2略3解:由表中数据可得散点图(1)如下:从散点图中可以看出震级x与
4、大于该震级的地震次数N之间不是线性相关的随着x的减少,所考察的地震数N近似地以指数形式增长作变换yln N,得到的数据见下表:图(1)x33.23.43.63.844.24.44.64.85.0y4.4534.3094.174.0293.8833.7413.5853.4313.2833.1322.988x5.25.45.65.866.26.46.66.87y2.8732.7812.6382.4382.3142.1701.9911.7561.6131.398由上表可作散点图(2),图(2)从图中可以看出x和y之间有很强的线性相关性,因此可以用线性回归模型拟合它们之间的关系根据截距和斜率的最小二乘计算公式得6.704,0.741,从而线性回归方程为6.7040.741x,其相关指数R20.997,说明x可以解释y的99.7%的变化因此可以用回归方程106.7040.741x描述x与N之间的关系