1、2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关 必备知识自主学习 1.变量间的相关关系(1)相关关系 如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系.导思1.什么是相关关系?2.如何求线性回归方程?(2)散点图 将样本中n个数据点(xi,yi)(i=1,2,n)描在平面直角坐标系中得到的图形叫做散点图.(3)正相关与负相关 正相关:散点图中的点散布在从左下角到右上角的区域.负相关:散点图中的点散布在从左上角到右下角的区域.【思考】(1)与函数关系比较相关关系有何特征?提示:相关关系带有随机性,
2、不具备函数关系的确定性.(2)你能举例说明你对正相关与负相关的理解吗?提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少变多.随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就越短.2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称 这两个变量之间具有线性相关关系,这条直线叫做_.(2)回归方程:回归直线的方程,简称回归方程.(3)回归方程的推导过程:假设已经得到两个具有
3、线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn).回归直线 设所求回归方程为 ,其中 ,是待定参数.由最小二乘法得 其中:是回归方程的斜率,是截距.y=bxabanniiiii 1i 1nn222iii 1i 1xx yyx ynx ybxxxnxaybx()()()ba【思考】(1)具有相关关系的两个变量之间一定存在回归直线吗?提示:具有线性相关关系的两个变量才有回归直线.(2)对于同一总体中的数据,利用最小二乘法求出的回归方程是确定不变的吗?提示:同一总体中,不同的样本数据对应不同的回归方程,同一样本的回归方程是确定的.【基础小测】1.辨析记忆(对的打“”,错的打
4、“”)(1)两个变量要么具有确定的函数关系,要么具有线性相关关系.()(2)回归直线一定至少过散点图中的一个点.()(3)由回归直线方程求出的 值都是准确值.()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程.()y2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归 直线方程,分别得到以下四个结论:y与x负相关且 =2.347x-6.423;y与x负相关且 =-3.476x+5.648;y与x正相关且 =5.437x+8.493;y与x正相关且 =-4.326x-4.578.其中一定不正确的结论的序号是()A.B.C.D.yyyy3.(教材
5、二次开发:例题改编)过(3,10),(7,20),(11,24)三点的回归方程 是()A.=1.75+5.75x B.=-1.75+5.75x C.=5.75+1.75x D.=5.75-1.75x【解析】选C.=7,=18,回归方程一定过点(,),代入A,B,C,D选 项可知.yyyyxyyx关键能力合作学习 类型一 相关关系及其判断(数学抽象、直观想象)【题组训练】1.下列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式=b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量 2.
6、观察下列关于两个变量x和y的三个散点图,它们从左到右对应的关系依次 为()A.正相关、负相关、不相关 B.负相关、不相关、正相关 C.负相关、正相关、不相关 D.正相关、不相关、负相关 3.以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x/m211511080135105销售价格y/万元49.643.238.858.444(1)画出数据对应的散点图;(2)判断房屋的销售价格和房屋面积之间是否具有相关关系,如果有相关关系,是正相关还是负相关?【解题策略】1.相关关系是两个变量间一种不完全确定的关系.它不一定是因果关系,也可能是伴随关系.2.判
7、断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.【补偿训练】某个男孩的年龄与身高的统计数据如表所示.年龄x(岁)123456身高y(cm)788798108115120判断y与x是否具有线性相关关系.类型二 求回归直线方程(数学运算、数学建模)【典例】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求回归方程.x24568y3040605070【解题策略】求回归直线方程的一般步骤(1)收集样本数据,设为
8、(xi,yi)(i=1,2,n).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格.(4)计算 ,xynn2iiii 1i 1xx y,(5)代入公式计算 ,公式为 (6)写出回归直线方程 =x+.b a,niii 1n22ii 1x ynxybxnxaybx.,bay【跟踪训练】已知变量x,y有如下对应数据:(1)作出散点图.(2)用最小二乘法求关于x,y的回归直线方程.x1234y1345类型三 回归直线方程的应用(数学运算,数学建模)角度1 利用回归直线方程求值 【典例】对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,8),其线性回归方程是 =x
9、+,且x1+x2+x3+x8=2(y1+y2+y3+y8)=6,则实数 的值是()y13aa1111A.B.C.D.16842【思路导引】利用回归直线方程必过样本点的中心求解.【解析】选B.依题意可知样本点的中心为 ,则 =+,解得 =.3 3(,)4 8343813aa18【拓展延伸】相关关系的强弱(1)若相应于变量x的取值xi,变量y的观测值为yi(1in),称r=即 为变量x与y的相关系数,通常用r来衡量x,y之间的线性关系的强弱.niii 1nn22iii 1i 1xxyy.xxyyniii 1nn2222iii 1i 1x ynx yr(xnx)(yny)(2)r的范围为-1r1,|
10、r|越接近于1,x与y的相关程度越大,|r|越接近于0,二者的相关程度越小,当|r|=1时,所有数据点都在一条直线上.当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.【拓展训练】变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10 B.0r2r1 C.r20r1 D.r2=r1 角度2 利用回归直线方程对总体进行估计 【典
11、例】下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出回归方程 =.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?ybxa【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图.(2)应用计算公式求得线性相关系数 ,的值.(3)实际上就是求当x=100时,对应的 的值.bay【解题策略】(1)
12、只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.(2)根据回归直线进行预测时估计值不是实际值,两者会有一定的误差.【题组训练】已知某产品连续4个月的广告费用为xi(i=1,2,3,4)千元,销售额为yi(i=1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:x1+x2+x3+x4=18,y1+y2+y3+y4=14;广告费用x和销售额y之间具有较强的线性相关关系;回归直线方程 =x+中的 =0.8(用最小二乘法求得),那么,当广告费 用为6千元时,
13、可预测销售额约为()A.3.5万元 B.4.7万元 C.4.9万元 D.6.5万元 bayb课堂检测素养达标 1.下列各图中所示的两个变量具有线性相关关系的是()A.(1)(2)B.(1)(3)C.(2)(3)D.(2)2.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如表:平均气温/-2-3-5-6销售额/万元20232730则该商品销售额与平均气温有()A.确定性关系 B.正相关关系 C.负相关关系 D.函数关系【解析】选C.由表中数据可知:y随x的减小而增大,是负相关关系.3.已知一个回归直线方程为 =1.5x+45,x1,7,5,13,19,则 =_.【解析】因为 =(1+
14、7+5+13+19)=9,且回归直线过样本点的中心(,),所以 =1.59+45=58.5.答案:58.5 yyx15xyy4.(教材二次开发:练习改编)小学生身高y与年龄x之间的线性回归直线方程为 =8.8x+65,预测一名10岁的小学生的身高为_.【解析】当x=10时,=8.810+65=153.答案:153 yy5.如图是我国2013年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图:(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2021年我国生活垃圾无 害化处理量.参考数据:参考公式:相关系数r=回归方程 =+t中斜率和截距的最小二乘估计公式分别为 7772iiiii 1i 1i 1y9.32t y40.17yy0.5572.646.,(),niii 1nn22iii 1i 1ttyyttyy()(),()()ybaniii 1n2ii 1tt yybaybt.tt()(),()