1、12.3变量间的相关关系与线性回归方程1会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)在高考中,本节以考查相关关系、线性回归方程的相关概念和简单应用为主在学习时,应明确各概念的含义及其联系,并能在此基础上进行简单应用1变量间的相关关系常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是_;与函数关系不同,相关关系是一种_关系,带有随机性2两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有_,这条直线叫_(2)从
2、散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为_;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为_. (3)相关系数r,当r0时,表示两个变量正相关;当r0时,表示两个变量负相关r的绝对值越接近_,表示两个变量的线性相关性越强;r的绝对值越接近_,表示两个变量的线性相关性越弱通常当r的绝对值大于0.75时,认为两个变量具有很强的线性相关关系3回归直线方程(1)通过求Q的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做_该式取最小值时的,的值即分别为,.(2)两个具有线性相关关系的变量的一组数据:(x1,
3、y1),(x2,y2),(xn,yn),其回归方程为,则【自查自纠】1相关关系非确定性2(1)线性相关关系回归直线(2)正相关负相关(3)103最小二乘法在下列量与量的关系中,是相关关系的是()正方体的体积与棱长间的关系;一块农田的水稻产量与施肥量的关系;人的身高与年龄的关系;家庭的支出与收入的关系A B C D解:是函数关系,皆为相关关系故选D.观察下列各图形:其中两个变量x,y具有很强相关关系的图是()A B C D解:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关的相关性较弱,中两变量几乎没有什么关系而相
4、关性很强故选C.()设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解:由回归方程为0.85x85.71知y随x的增大而增大,所以y与x具有正的线性相关关系,由最小二乘法建立的回归方程的过程知bxabxb (ab),所以回归直线过样本点的中心(,),利用回归方
5、程可以预测估计总体,但不能为准确值,所以D不正确 .故选D.下列命题:线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归直线,可以估计和预测变量的取值和变化趋势其中正确命题的序号是_解:易知均正确,故填.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为_万元解:由统计数据计算得3.5,42,代入9.4,得9.1.当x6时,9.469.165.5(万元)故填65.5.类型一相关
6、关系的判断下列变量之间的关系不是相关关系的是()A已知二次函数yax2bxc,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式b24acB光照时间和果树亩产量C降雪量和交通事故发生率D每亩施用肥料量和粮食亩产量解:由函数关系和相关关系的定义可知,A中b24ac,因为a,c是已知常数,b为自变量,所以给定一个b的值,就有唯一确定的与之对应,所以与b之间是一种确定的关系,是函数关系B,C,D中两个变量之间的关系都是相关关系故选A.【评析】要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的下列说法中正确的是()A任何两个变量之间都有相关关系B球的体积与该球
7、的半径具有相关关系C农作物的产量与施化肥量之间是一种确定性的关系D某商品的生产量与该商品的销售价格之间是一种非确定性的关系解:A概念错误,B是函数关系,C中“确定性”说法错误故选D.类型二线性回归方程的有关概念为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得到的试验数据中,变量x的平均值都等于s,变量y的平均值都等于t,那么下列说法正确的是()A直线l1和l2一定有公共点(s,t)B直线l1和l2相交,但交点不一定是(s,t)C必有直线l1l2D直线l1和l2必定重合解:线性回归直线方程为x,而,
8、即ts.ts.(s,t)在回归直线上,即直线l1和l2必有公共点(s,t)故选A.【评析】回归方程一定通过样本点的中心(,);中心相同的样本点的回归方程不一定相同由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到回归直线方程,那么下面说法错误的是()A直线必经过点(,)B直线至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点C直线的斜率D直线和各点(x1,y1),(x2,y2),(xn,yn)的偏差是该坐标平面上所有直线与这些点的偏差中最小的解:回归直线方程经过样本点的中心(,),可能不经过(x1,y1),(x2,y2),(xn,yn)中的任何一点,这些点都分布在
9、这条直线附近.故选B.类型三散点图(1)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图1;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图2.由这两个散点图可以判断()图1图2A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关解:由这两个散点图可以判断,变量x与y负相关,u与v正相关,故选C.【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区域时,两个变量的相关关系为负相关(2)下面是一块田的水稻产量与施化肥量的一组观测数据(单位:kg
10、):施化肥量15 20253035 4045水稻产量 320 330 360 410 460 470 480()将上述数据制成散点图;()你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解:()散点图如下:()从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会一直随化肥施用量的增加而增长【评析】任何一组数据(二元数据)都可以作出散点图,散点图可以直观地观察两个变量间的关系
11、(1)从左至右,观察下列三个散点图,变量x与y的关系依次为_(正相关记作;负相关记作;不相关记作)解:散点图在左上角至右下角区域则负相关,反之,则正相关,散乱则不相关故填.(2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,),并作了统计:年平均气温12.5112.8412.8413.6913.3312.7413.05年降雨量748542507813574701432()试画出散点图;()判断两个变量是否具有线性相关关系解:()作出散点图如图所示()由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系类型四求回归方
12、程及用回归方程进行估计下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考值32.5435464.566.5)解:(1)散点图如下:(2)由系数公式可知,4.5,3.5,0.7,3.50.74.50.35,所以线性回归方程为0.7x0.35.(3)x100
13、时,0.7x0.3570.35,所以预测生产100吨甲产品的生产能耗比技术改造前降低19.65吨标准煤【评析】牢记求线性回归方程的步骤:(1)列表;(2)计算,;(3)代入公式求,再利用求,(4)写出回归方程.(2013重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得=80, =20,=184,=720. (1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,其中,为样本平均值,线性回归方程也
14、可写为x.解:(1)由题意知n10,8,2,又- n2 =720 -1082=80,-n184108224,由此得b0.3,ab20.380.4,故所求回归方程为y0.3x0.4.(2)由于变量y的值随x的值增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)1在研究两个变量之间是否存在某种关系时,必须从散点图入手对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系2分析两个变量相关关系的常用方法:(1)利用散点图进行判断;(2)利用相关系数r进行判断3在复习本节内容时应注意:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值(3)用最小二乘法求回归方程,关键在于正确求出系数,由于,的计算量大,计算时应仔细小心,分层进行(最好列出表格),避免因计算而产生错误