1、2.4线性回归方程学 习 目 标核 心 素 养1.了解两个变量之间的相关关系并与函数关系比较2会作散点图,并利用散点图判断两个变量之间是否具有线性相关关系3能根据给出的线性回归方程系数公式建立线性回归方程,并能由回归方程对总体进行预测、估计(重点、难点)通过对已有数量的分析、运算培养学生数据分析、数学运算的核心素养.1变量之间的两类常见关系在实际问题中,变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示另一类是相关关系,变量之间有一定的联系,但不能完全用函数表示2相关关系的分类相关关系分线性相关和非线性相关两种3线性回归方程系数公式能用直线方程bxa近似表示的相关
2、关系叫做线性相关关系,该方程叫线性回归方程给出一组数据(x1,y1),(x2,y2),(xn,yn),线性回归方程中的系数a,b满足上式还可以表示为1有下列关系:人的年龄与其拥有的财富之间的关系;曲线上点与该点的坐标之间的关系;苹果的产量与气候之间的关系;森林中的同一树木,其横截面直径与高度之间的关系;学生与其学号之间的关系其中具有相关关系的是_为确定关系不是相关关系2下面四个散点图中点的分布状态,直观上判断两个变量之间具有线性相关关系的是_散点图中的点无规律的分布,范围很广,表明两个变量之间的相关程度很小;中所有的点都在同一条直线上,是函数关系;中点的分布在一条带状区域上,即点分布在一条直线
3、的附近,是线性相关关系;中的点也分布在一条带状区域内,但不是线性的,而是一条曲线附近,所以不是线性相关关系,故填.3工人工资y(元)依劳动生产率x(千元)变化的线性回归方程为5080x,下列判断正确的是_劳动生产率为1 000元时,工资为130元;劳动生产率提高1 000元时,工资提高80元;劳动生产率提高1 000元时,工资提高130元;当月工资为250元时,劳动生产率为2 000元回归直线斜率为80,所以x每增加1,增加80,即劳动生产率提高1 000元时,工资提高80元4下表是广告费用与销售额之间的一组数据:广告费用(千元)1461014销售额(千元)1944405253销售额y(千元)
4、与广告费用x(千元)之间有线性相关关系,回归方程为2.3xa(a为常数),现要使销售额达到6万元,估计广告费用约为_千元157,41.6,则a2.341.62.3725.5.当y6万元60千元时,602.3x25.5,解得x15(千元)变量间相关关系的判断【例1】在下列两个变量的关系中,具有相关关系的是_正方形边长与面积之间的关系;作文水平与课外阅读量之间的关系;人的身高与年龄之间的关系;降雪量与交通事故发生率之间的关系两变量之间的关系有两种:函数关系与带有随机性的相关关系正方形的边长与面积之间的关系是函数关系作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系人的
5、身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系降雪量与交通事故的发生率之间具有相关关系1函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系2准确理解变量间的相关关系是解答本题的关键要准确区分两个变量间的相关关系和函数关系,事实上,现实生活中相关关系是处处存在的,从某种意义上讲,函数关系可以看作一种理想的关系模型,而相关关系是一种普遍的关系两者区别的关键点是“确定性”还是“不确定性”1下列两个变量中具有相关关系的是_(填写相应的序号)正方体
6、的棱长和体积;单产为常数时,土地面积和总产量;日照时间与水稻的亩产量正方体的棱长x和体积V存在着函数关系Vx3;单产为常数a公斤/亩,土地面积x(亩)和总产量y(公斤)之间也存在着函数关系yax.日照时间长,则水稻的亩产量高,这只是相关关系,应选.2下列命题:任何两个变量都具有相关关系;圆的周长与该圆的半径具有相关关系;某商品的需求量与该商品的价格是一种非确定性关系;根据散点图求得的回归直线方程可能是没有意义的;两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究其中正确的命题为_两个变量不一定是相关关系,也可能是确定性关系,故错误;圆的周长与该圆的半径具有函数关系,故
7、错误;都正确散点图的画法及应用【例2】现有5个同学的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462利用散点图判断它们是否具有线性相关关系?如果有线性相关关系,是正相关还是负相关?思路点拨:本题涉及两个变量(数学成绩与物理成绩),以x轴表示数学成绩、y轴表示物理成绩,可得相应的散点图,再观察散点图得出结论解把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在平面直角坐标系中描点(xi,yi)(i1,2,5)从图中可以直观地看出数学成绩和物理成绩具有线性相关关系,且当数学成绩减小时,物理成绩也由大变小,即它们正相关1判断两个变量x和y之间是否具有线性相关关
8、系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响如果变量的对应点分布没有规律,我们就可以认为这两个变量不具有相关关系2正相关、负相关线性相关关系又分为正相关和负相关正相关是指两个变量具有相同的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变大从散点图上看,因变量随自变量的增大而增大,图中的点分布在左下角到右上角的区域负相关是指两个变量具有相反的变化趋势,即从整体上来看,一个变量会随另一个变量变大而变小从散点图上看,因变量随自变量的增大而减小,图中的点分布在左上角到右下角的区域提醒:画散点图时应
9、注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论3如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?思路点拨:观察图中点的分布情况作出判断从散点图上看,点的分布散乱无规律,故不具有相关关系解不具有相关关系,因为散点散乱地分布在坐标平面内,不呈线形4有个男孩的年龄与身高的统计数据如下:年龄(岁)123456身高(cm)788798108115120画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?思路点拨:描点(1,78),(2,87),(3,98),(4,108),(5,115),(6,120)观察点
10、的分布,作出判断解作出散点图如图:由图可见,具有线性相关关系,且是正相关线性回归方程的求法及应用【例3】某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据广告支出x/万元1234销售收入y/万元12284256(1)画出表中数据的散点图;(2)求出y对x的回归直线方程bxa,并解释b的意义;(3)若广告费为9万元,则销售收入约为多少万元?思路点拨:解(1)散点图如图(2)观察散点图可知各点大致分布在一条直线附近,列出下列表格,以便计算回归系数a,B序号xyx2y2xy11121144122228478456334291 7641264456163 13622410
11、138305 828418于是,30,5 828,iyi418,代入公式得,b,ab2.故y对x的回归直线方程为x2,其中回归系数b,它的意义是:广告支出每增加1万元,销售收入y平均增加万元(3)当x9万元时,92129.4(万元),即若广告费为9万元,则销售收入约为129.4万元1求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数,;第二步,求和iyi,;第三步,计算b,ab;第四步,写出线性回归方程bxA2对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的因此,对一组样本数据,应先作
12、散点图,在具有线性相关关系的前提下再求回归方程提醒:(1)对一组数据进行线性回归分析时,应先画出其散点图,判断变量之间是否线性相关,再由系数a,b的计算公式,计算出a,b,由于计算量较大,在计算时应借助计算器,仔细计算,以防出现错误(2)为了方便,常制表对应算出xiyi,x,以便于求和(3)研究变量间的相关关系,求得回归直线方程能帮助我们发现事物发展的一些规律,估计、预测某些数据,为我们的判断和决策提供依据5如图是我国2012年至2018年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20122018.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加
13、以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量参考数据: yi9.32, tiyi40.17,0.55,2.646.参考公式:相关系数r,回归方程abt中斜率和截距的最小二乘估计公式分别为b,ab .思路点拨:(1)(2)解(1)由折线图中的数据和附注中的参考数据得4, (ti)228,0.55, (ti)(yi)tiyiyi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当大,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得b0.103.ab 1.3310.10340
14、.92.所以y关于t的回归方程为0.920.10t.将2016年对应的t9代入回归方程得0.920.1091.82. 所以预测2020年我国生活垃圾无害化处理量约为1.82亿吨1本节课的重点是会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系,能根据给出的线性回归方程系数公式建立线性回归方程难点是了解相关关系、线性相关、回归直线的概念2本节课要掌握以下几类问题(1)准确区分相关关系与函数关系(2)会利用散点图判断两个变量间的相关关系(3)掌握用线性回归方程估计总体的一般步骤.1在如图所示的四个散点图中,两个变量具有相关性的是()ABCDD由图可知中变量间是一次函数关系,不是相关
15、关系;中的所有点在一条直线附近波动,是线性相关的;中的点杂乱无章,没有什么关系;中的所有点在某条曲线附近波动,是非线性相关的故两个变量具有相关性的是.2四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号有()ABCDB由正、负相关性的定义知一定不正确3某工厂生产某种产品的产量x(吨)与相应的生产能耗y(吨标准煤)有如下几组样本数据:x3456y2.5344.5据相关性检验
16、,这组样本数据具有线性相关关系,通过线性回归分析,求得其回归直线的斜率为0.7,则这组样本数据的线性回归方程是_0.7x0.354.5,3.5,ab3.50.74.50.35.线性回归方程为0.7x0.35.42019年元旦前夕,某市统计局统计了该市2018年10户家庭的年收入和年饮食支出的统计资料如下表:年收入x(万元)24466677810年饮食支出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)如果已知y与x是线性相关的,求线性回归方程;(2)若某家庭年收入为9万元,预测其年饮食支出(参考数据:iyi117.7,406)思路点拨:按照求线性回归方程的一般步骤,求出线性回归方程,再根据回归方程作出预测解(1)依题意可计算得:6,1.83,236, 10.98,又iyi117.7,406,b0.17,ab0.81,0.17x0.81.所求的线性回归方程为0.17x0.81.(2)当x9时,0.1790.812.34(万元),可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元