1、8最小二乘估计1了解最小二乘法的思想及意义(重点)2会求线性回归方程并进行简单应用(难点)教材整理最小二乘法及线性回归方程阅读教材P54P59“信息技术应用”以上部分,完成下列问题1最小二乘法利用最小二乘法估计时,要先做出数据的散点图如果散点图呈现一定的规律性,我们再根据这个规律进行拟合如果散点图呈现出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的工具进行拟合2线性回归方程用表示,用表示,由最小二乘法可以求得b,ab.这样得到的直线方程yabx称为线性回归方程,a、b是线性回归方程的系数判断(正确的打“”,错误的打“”)(1)回归直线总经过
2、样本中的所有点()(2)由回归直线求出的值不是一个准确值()(3)任何一组数据,都可以由最小二乘法得出线性回归方程()【解析】(1),回归直线不一定经过样本中的点,若经过所有点,则两变量为函数关系(2),求出的值是一个估计值(3),只有线性相关的数据才有线性回归方程【答案】(1)(2)(3)线性回归方程的应用某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析200
3、7年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘法估计公式分别为:b,ab.【精彩点拨】(1)借助最小二乘法求回归直线的斜率和截距(2)根据b的值判断20072013年的人均收入情况,令t9求出y的值即为2015年的收入情况【自主解答】(1)因为4,4.3,设回归方程为ybta,代入公式,经计算得b,ab4.342.3,所以,y关于t的回归方程为y0.5t2.3.(2)因为b0,所以2007年至2013年该地区农村居民家庭人均纯收入稳步增长,预计到2015年,该地区农村居民家庭人均纯收入y0.592.36.8
4、(千元),所以,预计到2015年,该地区农村居民家庭人均纯收入约6.8千元用线性回归方程估计总体的一般步骤:(1)做出散点图,判断散点是否在一条直线附近.(2)如果散点在一条直线附近,用公式求出a,b,并写出线性回归方程(否则求出回归方程是没有意义的).(3)根据线性回归方程对总体进行估计.12014年元旦前夕,某市统计局统计了该市2013年10户家庭的年收入和年饮食支出的统计资料如下表: 【导学号:63580015】年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)如果已知y与x是线性相关的,求线性回归方程;(2)若某
5、家庭年收入为9万元,预测其年饮食支出(参考数据:xiyi117.7,x406)【解】依题意可计算得6,1.83,236, 10.98,又xiyi117.7,x406,b0.17.ab0.81,y0.17x0.81.所求的线性回归方程为y0.17x0.81.(2)当x9时,y0.1790.812.34.可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元最小二乘法 探究1一个好的线性关系与散点图中各点的位置应具有怎样的关系?【提示】整体上最接近探究2设直线方程为yabx,任意给定一个样本点A(xi,yi),用什么样的方法刻画点与直线的距离更方便有效?【提示】如图:法一点到直线的距离公式d
6、.法二2.显然法二比法一更方便计算,所以我们用它表示二者之间的接近程度探究3如果有5个样本点,其坐标分别为(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),怎样刻画这些样本点与直线yabx的接近程度?【提示】22222.探究4任给一组数据,我们都可以由最小二乘法得出线性回归方程吗?【提示】用最小二乘法求回归直线的前提是先判断所给数据具有线性相关关系,否则求出的线性回归方程是无意义的探究5线性回归方程是否经过一定点?【提示】线性回归方程恒过定点(,)关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据:年龄x2327394145495053脂肪y9.51
7、7.821.225.927.526.328.229.6(1)判断它们是否有相关关系,若有相关关系,请作一条拟合直线;(2)用最小二乘法求出年龄关于脂肪的线性回归方程【精彩点拨】(1)做出散点图,通过散点图判断它们是否具有相关关系,并做出拟合直线; (2)利用公式求出线性回归方程的系数a,b即可【自主解答】(1)以x轴表示年龄,y轴表示脂肪含量(百分比),画出散点图,如下图进一步观察,发现上图中的点分布在一条直线附近,这说明这一正相关可以用这一直线来逼近,根据图中分析,人体的脂肪含量(百分比)和年龄具有相关关系(2)设回归直线为ybxa,那么结合题中数据,可得40.875,23.25,xiyi8
8、 092.8,x14 195,则b,0.591 2,ab23.250.591 240.8750.915 3,所以所求的线性回归方程是y0.591 2x0.915 3.1最小二乘法的适用条件:两个变量必须具有线性相关性,若题目没有说明相关性,必须先对两个变量进行相关性检验2注意事项:(1)利用求回归方程的步骤求线性回归方程的方法实质是一种待定系数法(2)计算a,b的值时,用列表法理清计算思路,减少计算失误同时,计算时,尽量使用计算机或科学计算器2已知变量x,y有如下对应数据:x1234y1345(1)做出散点图;(2)用最小二乘法求关于x,y的回归直线方程【解】(1)散点图如下图所示(2),xi
9、yi16122039,x1491630,b,a0,故所求回归直线方程为yx.1变量y对x的回归方程的意义是()A表示y与x之间的函数关系B表示y与x之间的线性关系C反映y与x之间的真实关系D反映y与x之间的真实关系达到最大限度的吻合【解析】线性回归直线方程最能代表观测值x、y之间的线性相关关系,反映y与x之间的真实关系达到最大限度的吻合【答案】D2下表是x与y之间的一组数据,则y关于x的线性回归方程ybxa必过()x0123y1357A.点(2,2)B点(1.5,2)C点(1,2)D点(1.5,4)【解析】回归方程必过样本点(,),经计算得(1.5,4)【答案】D3设有一个回归方程为y1.5x
10、2,则变量x增加一个单位时()Ay平均增加1.5个单位By平均增加2个单位Cy平均减少1.5个单位Dy平均减少2个单位【解析】回归方程斜率为1.5,所以变量x增加一个单位,y平均减少1.5个单位【答案】C4某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下:x3528912y46391214则_,_,x_,xiyi_,回归方程为_【解析】根据公式代入即可求得,也可以利用计算器求得6.5,8,x327.xiyi396,回归方程为y1.14 x0.59.【答案】6.58327396y1.14x0.595某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356已知记忆力x和判断力y是线性相关的,求线性回归方程【解】9,4,x6282102122344,xiyi6283105126158,b0.7,ab40.792.3.则所求的线性回归方程为y0.7x2.3.