1、8最小二乘估计知识点最小二乘法及回归直线方程 填一填1最小二乘法设x、y的一组观察值为(xi,yi),i1,2,n,且回归直线方程为abx,当x取值xi(i1,2,n)时,的观察值为yi,差yii(i1,2,n)刻画了实际观察值yi与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即Q作为总离差,并使之达到最小这样,回归直线就是所有直线中Q取最小值的那一条,由于平方又叫二乘方,所以这种使“离差平方和为最小”的方法,叫作最小二乘法2回归直线方程的系数计算公式答一答利用最小二乘法的思想求得线性回归方程的步骤是什么?提示:第一步:先求,2,.第二步:求,第三步:求iyi.第四步:代入公式
2、求b.第五步:代入公式ab.代入直线方程得:ybxa.对回归直线方程的几点说明(1)(xi,yi)(i1,2,n)的中心点(,)在回归直线上(2)由回归直线方程知x处的估计值为yabx.(3)回归直线使得样本数据中的点到它的距离的平方和最小(4)求回归直线方程,计算量大,一般应学会使用计算器求解(5)利用回归直线方程可以对总体进行估计类型一最小二乘法与回归直线方程的理解 【例1】下列有关线性回归方程的系数a,b的公式正确的是()【思路探究】符号i表示n个实数a1,a2,an的和【解析】由线性回归方程的概念我们知道,线性回归方程的系数公式b,ab,易知A正确【答案】A回归直线方程的系数a,b,用
3、最小二乘法估计a,b使函数Q(a,b)最小,Q(a,b)(A)A.(yiabxi)2 B.yiabxi|C(yiabxi)2 D|yiabxi|解析:由最小二乘法的定义知通过求Q(y1bx1a)2(y2bx2a)2(ynbxna)2的最小值而得到回归直线的方法,叫作最小二乘法,故Q(a,b)(yibxia)2,故选A.类型二求回归直线方程 【例2】某市近5年的煤气消耗量与使用煤气户数如下表:年份20142015201620172018x/万户11.11.51.61.8y/百万立方米6791112(1)检验是否线性相关;(2)求y对x的回归直线方程【思路探究】【解】(1)作出散点图,观察呈线性相
4、关,如图所示(1),9,121.121.521.621.8210.26,iyi161.171.591.6111.81266.4. b,ab9,y对x的回归直线方程为yx.规律方法 求回归直线方程的步骤:(1)先把数据制成表,从表中计算出i,i,iyi;(2)计算回归系数a,b.公式为(3)写出回归直线方程ybxa.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356已知记忆力x和判断力y是线性相关的,求线性回归方程解:9,4,6282102122344,iyi6283105126158,b0.7,ab40.792.3.则所求的线性回归方程为y0.7x2.3
5、.类型三回归直线方程的应用 【例3】假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系试求:(1)回归直线方程ybxa;(2)估计使用年限为10年时,维修费用是多少?【思路探究】先求回归直线方程,若回归直线方程为ybxa,则在xx0处的估计值为y0bx0a.【解】(1)制表如下:于是有b1.23.ab51.2340.08.故回归直线方程是y1.23x0.08.(2)根据回归直线方程是y1.23x0.08,当x10年时,y1.23100.0812.38(万元),即估计使用10年时
6、,维修费用是12.38万元规律方法 (1)知道x与y呈线性相关关系,无需进行相关性检验否则,应首先进行相关性检验如果本身两个变量不具备相关关系,或者说,它们之间相关关系不显著即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的(2)在求方程时,由于一步代入很烦琐,所以要分步求解,即分别求得,2,iyi,再代入公式求a,b.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求线性回归方程;(3)预测当广告费支出为7百万元时的销售额解:(1)(2)从散点图可以发现,y与x具有线性相关关系,
7、利用计算器求得:5,50,145,iyi1 380,设回归方程为ybxa,则b6.5,ab506.5517.5,故所求线性回归方程为y6.5x17.5.(3)当x7时,y6.5717.563.所以,当广告费支出为7百万元时,销售额约为6 300万元规范解答数形结合在线性相关性中的应用【例4】(12分)下表数据是退水温度x()对黄硐延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.x()300400500600700800y(%)405055606770(1)画出散点图;(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的线性回归方程;(4)
8、估计退水温度是1 000 时,黄硐延长性的情况【思路点拨】根据所给数据画出散点图,然后可借助函数的思想分析【满分样板】(1)散点图如图所示:4分(2)由散点图可以看出样本点分布在一条直线的附近,可见y与x线性相关.5分(3)列出下表,并用科学计算器进行有关计算.于是可得:【思维启迪】(1)在研究两个变量是否存在某种关系时,必须从散点图入手,对于散点图,可以做出如下判断:如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;如果所有的样本点都落在某一函数曲线附近,那么变量之间具有相关关系;如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系
9、(2)利用散点图判断两个变量之间是否具有线性相关关系,体现了数形结合思想的作用,而用回归直线方程进行估计又体现了函数与方程思想的应用下表是某机构记载的某市5月1号到5月12号每天某传染病治愈者的数据,并根据这些数据绘制了散点图,如图.下列说法正确的是(填序号)根据此散点图,可以判断人数与日期具有线性相关关系;根据此散点图,可以判断人数与日期具有一次函数关系;后三天治愈者人数占这12天治愈者总人数的30%多;后三天中每天治愈者人数均超过这12天内治愈者总人数的20%.解析:由散点图可以明显看出日期与人数具有线性相关关系,故正确,不正确这12天治愈者总人数为1001092031 722,而后三天治
10、愈者人数为175186203564,后三天治愈者人数占这12天治愈者总人数的30%还多,故正确,不正确一、选择题1下列叙述中:变量间关系有函数关系,又有相关关系;回归函数即用函数关系近似地描述相关关系;ix1x2xn;线性回归方程ybxa中,b,ab;线性回归方程一定可以表示相关关系其中正确的有(C)A BC D解析:线性回归方程只能近似地表示线性相关关系2线性回归方程ybxa必过(D)A(0,0)点 B(,0)点C(0,)点 D(,)点解析:回归直线系数a、b有公式ab ,所以ab ,故直线必过定点(,)3实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之
11、间的回归直线方程为(A)Ayx1 Byx2Cy2x1 Dyx1解析:本题中x与y完全线性相关二、填空题4用身高x(cm)预测体重y(kg)满足y0.849x85.712,若要找到41.638 kg的人,不一定是在150 cm中(填“一定”或“不一定”)解析:因为统计的方法是可能犯错误的利用线性回归方程预测变量的值不是精确值但一般认为实际测量值应在预测值左右5某地区近10年居民的年收入x与支出y之间的关系大致符合y0.8x0.1(单位:亿元),预计今年该地区居民收入为15亿元,则年支出的估计是12.1亿元解析:因为居民年收入x与支出y之间的大致关系为y0.8x0.1.所以当收入为x15时,y0.8150.112.1.三、解答题6某个服装店经营某种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x之间的一组数据关系见下表:x3456789y66697381899091已知280,iyi3 487.(1)求,;(2)画出散点图;(3)求纯利润y与每天销售件数x之间的回归直线方程解:(1)6(件),79.86(元)(2)散点图如下:(3)由散点图知,y与x有线性相关关系设回归直线方程为ybxa.由280,iyi3 487,6,得b4.75,a64.7551.36,故回归直线方程为y4.75x51.36.