1、【课标要求】1.了解最小二乘法的思想.2.能根据给出的线性回归方程的系数公式,建立线性回归方程.自主学习 基础认识|新知预习|1最小二乘法的定义如果有n个点:(x1,y1),(x2,y2),(xn,yn),可以用下面的表达式来刻画这些点与直线yabx的接近程度:y1(abx1)2y2(abx2)2yn(abxn)2.使得上式达到最小值的直线yabx就是我们所要求的直线,这种方法称为最小二乘法2线性回归方程用 x表示x1x2xnn,用 y表示y1y2ynn,由最小二乘法可以求得bx1y1x2y2xnynn x yx21x22x2nn x2,a ybx,这样得到的直线方程yabx称为线性回归方程,
2、a,b是线性回归方程的系数|自我尝试|1已知一组观测值(xi,yi),作出散点图后确定具有线性相关关系,若对于ybxa,求得b0.51.x61.75,y38.14,则线性回归方程为()Ay0.51x6.65 By6.65x0.51Cy0.51x42.30 Dy42.30 x0.51解析:因为b0.51,a yb x6.65,所以y0.51x6.65.故选A.答案:A2已知x与y之间的一组数据:x0123 y1357则y与x的线性回归方程ybxa必过点()A(2,2)B(1.5,0)C(1,2)D(1.5,4)解析:线性回归方程ybxa必过样本中心(x,y),x 12341.5,y135744.
3、答案:D3一位母亲记录了儿子39岁的身高,由此确立的身高y(单位:cm)关于年龄x(单位:岁)的线性回归方程为y7.19x73.93,则这个孩子10岁时,下列叙述正确的是()A身高在145.83 cm左右B身高在145.83 cm以上C身高在145.83 cm以下D身高一定是145.83 cm解析:当x10时,y145.83,利用线性回归方程预测时,估计值会存在偏差 答案:A4设有一个线性回归方程y43x,当变量x增加1个单位时,y平均_个单位解析:当x增加到x1时,yy43(x1)(43x)3,所以y平均减少3个单位 答案:减少3课堂探究 互动讲练类型一求线性回归方程例1 假设关于某设备的使
4、用年限x和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456 维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系,试求线性回归方程ybxa的回归系数a,b.【解析】列表如下:i12345合计 xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x2i4916253690 x4;y5;i15x2i 90;i15xiyi112.3b112.35459054212.310 1.23,a yb x51.2340.08.方法归纳用公式法求线性回归直线方程的步骤第一步:列表xi,yi,xiyi.第二步:计算 x,
5、y,i1nx 2i,i1ny 2i,i1nxiyi.第三步:代入公式计算b,a的值第四步:写出直线方程.跟踪训练 1 某种产品的广告费支出x(千万元)与销售额y(千万元)之间有如下对应数据:x24568 y34657(1)画出散点图,判断变量x与y是否具有线性相关关系;(2)如果x与y具有线性相关关系,求回归直线方程解析:(1)散点图如图 由图可以看出,各点都在一条直线附近,所以广告费支出x与销售额y之间有线性相关关系(2)设回归直线方程为yabx.列出下列,并用科学计算器进行有关计算.i12345 xi24568yi34657xiyi616303056 x5;y5,i15x2i 145;i1
6、5xiyi138 于是可得bi15xiyi5 x yi15x2i5 x2138555145552 0.65,a yb x50.6551.75.所求的回归直线方程是y1.750.65x.类型二线性回归方程的应用例2 一台机器由于使用时间较长,生产的零件有一些缺损按不同转速生产出来的零件有缺损的统计数据如表所示:转速x(转/秒)1614128 每小时生产有缺损零件数y(个)11985(1)作出散点图;(2)如果y与x线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?【思路点拨】(1)x表示横坐标,y表示纵坐标,进行描
7、点即可;(2)根据最小二乘法公式“bi1nxi xyi yi1nxi x2i1nxiyin x yi1nx2in x2,a yb x”求解回归直线方程;(3)令y10,求解x,则机器的运转速度应控制在这个x之内【解析】(1)作散点图如图所示 (2)由散点图可知y与x线性相关 故可设回归直线方程为ybxa.依题意,用计算器可算得:x12.5,y8.25,i14x2i660,i14xiyi438.所以b438412.58.25660412.520.73,a yb x8.250.7312.50.875 所以所求回归直线方程为y0.73x0.875.(3)令y10,得0.73x0.87510,解得x1
8、5.即机器的运转速度应控制在15转/秒内.方法归纳(1)求回归直线方程的关键是求a,b.(2)知道x与y有线性相关关系,无需进行相关性检验(课本对此不作要求)只有两个变量之间存在线性相关关系,才能求其线性回归方程,才能用其估计和预测否则即使求出其线性回归方程,也是毫无意义的,而且用其估计和预测的量也是不可信的.跟踪训练 2 提倡节约,反对浪费。2016年元旦前夕,某市统计局统计了该市10户家庭的年收入和年饮食支出的统计资料如下表:年收入x(万元)24466677810 年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)若y与x是线性相关的,求回归方程,否则请
9、说明理由;(2)若某家庭年收入为9万元,预测其年饮食支出(参考数据:i110 xiyi117.7,i110 x2i 406)解:(1)散点图如图:由散点图可知,年收入越高,年饮食支出越高,图中点的趋势表明两个变量间确实存在着线性相关关系 依题意可计算得:x6,y1.83,x236,x y10.98,又因为 i110 x iyi117.7,i110 x 2i 406,所以 b i110 xiyi10 x yi110 x2i10 x20.17,a yb x0.81,所以y0.17x0.81.所以所求的回归方程为y0.17x0.81.(2)当x9时,y0.1790.812.34(万元)可估计年收入为
10、9万元的家庭,每年饮食支出约为2.34万元|素养提升|1求回归直线方程时应注意的问题(1)知道x与y成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的(2)用公式计算a、b的值时,要先计算b,然后才能算出a.2利用回归方程,我们可以进行估计和预测若回归直线方程为ybxa,则xx0处的估计值为y0bx0a.|巩固提升|1设一个线性回归方程为y21.2x,则变量x增加1个单位时()Ay平均增加1.2个单位By平均减少1.2个单位Cy平均增加2个单位Dy
11、平均减少2个单位解析:根据系统b的意义可得b1.20,因此变量x增加1个单位时,y平均增加1.2个单位 答案:A2设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是()A直线l过点(x,y)B回归直线必通过散点图中的多个点C直线l的斜率必在(0,1)D当n为偶数时,分布在l两侧的样本点的个数一定相同解析:A是正确的;回归直线可以不经过散点图中的任何点,故B错误;回归直线的斜率不确定,故C错误;分布在l两侧的样本点的个数不一定相同,故D错误 答案:A3一般来说,一个人脚掌越长,他的身高就越高,
12、现对10名成年人的脚掌长x与身高y进行测量,得到数据(单位均为cm)如表,作出散点图后,发现散点在一条直线附近,经计算得到一些数据:i110(xi x)(yi y)577.5,i110(xi x)282.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5 cm,则估计案发嫌疑人的身高为_ cm.脚长20212223242526272829 身高141146154160169176181188197203 解析:回归方程的斜率bi110 xi xyi yi110 xi x2577.782.5 7,x24.5,y171.5,截距a yb x0,即回归方程为y7x,当x26.5时,y185.5.答案:185.5