1、2.3变量间的相关关系23.1变量之间的相关关系23.2两个变量的线性相关1理解两个变量的相关关系的概念2会作散点图,并利用散点图判断两个变量之间是否具有相关关系3会求线性回归方程1变量之间常见的关系函数关系变量之间的关系可以用函数表示相关关系变量之间有一定的联系,但不能完全用函数表示2.相关关系与函数关系的区别与联系3.散点图将样本中n个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图4正相关与负相关(1)正相关:散点图中的点散布在从左下角到右上角的区域(2)负相关:散点图中的点散布在从左上角到右下角的区域5回归直线与回归方程如
2、果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线回归直线对应的方程叫做回归直线的方程,简称回归方程6最小二乘法求回归直线方程x时,使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法7用最小二乘法求回归方程中的,有下面的公式其中i,i.这样,回归方程的斜率为,纵截距为,即回归方程为x.判断正误(正确的打“”,错误的打“”)(1)已知变量x的值,可由回归方程x得到变量y的精确值()(2)回归方程x必经过点(,)()(3)由一组数据(x1,y1),(x2,y2),(xn,yn)得到的回归直线方程x至少经过(x1,y1),(x2,y
3、2),(xn,yn)中的一个点()(4)选取一组数据中的部分点得到的回归方程与由整组数据得到的回归方程是同一个方程()提示(1)(2)(3)(4)题型一 相关关系的判定【典例1】(1)下列变量之间的关系不是相关关系的是()A二次函数yax2bxc中,a,c是已知常数,取b为自变量,因变量是判别式b24acB光照时间和果树亩产量C降雪量和交通事故发生率D每亩田施肥量和粮食亩产量(2)以下是在某地搜集到的不同楼盘房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据:房屋面积x/m211511080135105销售价格y/万元49.643.238.858.444画出数据对应的散点图;判断房
4、屋的销售价格和房屋面积之间是否具有相关关系,如果有相关关系,是正相关还是负相关?解析(1)在A中,若b确定,则a,b,c都是常数,b24ac也就唯一确定了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系故选A.(2)数据对应的散点图如图所示通过以上数据对应的散点图可以判断,房屋的销售价格和房屋面积之间具有相关关系,并且是正相关答案(1)A(2)见解析判断两个变量的相关性的常用方法(1)散点图法:通过画散点图,观察图中点的分布特征,直观给出判断(2)表格、关系式法:通过表格或关系式直
5、接进行判断针对训练1在下列两个变量的关系中,判断是否具有相关关系?正方形边长与面积之间的关系;作文水平与课外阅读量之间的关系;人的身高与年龄之间的关系;解两变量之间的关系有三种:函数关系、相关关系和不相关正方形的边长与面积之间的关系是函数关系作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.题型二 求回归直线方程【典例2】某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070
6、(1)画出散点图;(2)求回归方程解(1)散点图如图所示(2)列出下表,并用科学计算器进行有关计算I12345xi24568yi3040605070xiyi60160300300560x4162536645,50,145,iyi1380于是可得,6.5, 506.5517.5.于是所求的回归方程是6.5x17.5.引申探究1:若典例2的条件不变,利用例2中所求得的回归方程,计算若广告费支出增加一个单位,销售额增加多少?解由回归方程6.5x17.5可知,当x增加一个单位时,y大约增加6.5.引申探究2:若典例2的条件不变,要使销售额提升到100(单位:百万元),则广告费至少要支出多少?解由6.5
7、x17.5100,解得x12.7,即广告费至少要支出12.7(单位:百万元)(1)求线性回归方程的步骤第一步,计算平均数,;第二步,求和iyi,;第三步,计算, ;第四步,写出回归直线方程x.(2)求线性回归方程的注意事项利用散点图判定两个变量是否具有线性相关关系,注意不要受个别点的位置的影响求回归方程,关键在于正确求出系数,由于,的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生的错误针对训练2已知变量x,y有如下对应数据:x1234y1345(1)作出散点图;(2)用最小二乘法求关于x,y的回归直线方程解(1)散点图如图所示:(2),iyi16122039.1491630,0,所以x
8、为所求的回归直线方程.题型三 利用回归方程对总体进行估计【典例3】某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20082010201220142016需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程x;(2)利用(1)中所求出的直线方程预测该地2020年的粮食需求量解(1)由所给数据看出,年需求量与年份之间是近似直线上升的对数据预处理如下:年份201242024需求量257211101929对预处理后的数据,容易算得0,3.2,6.5. 3.2.由上述计算结果,知所求回归直线方程为257(x2012)6.5(x2012)3.2.即6.5
9、(x2012)260.2.(2)利用直线方程,可预测2020年的粮食需求量为6.5(20202012)260.26.58260.2312.2(万吨)用线性回归方程估计总体的一般步骤(1)作出散点图,判断散点是否在一条直线附近(2)如果散点在一条直线附近,用公式求出,并写出线性回归方程(3)根据线性回归方程对总体进行估计针对训练3下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据20
10、10年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2020年的环境基础设施投资额的预测值(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,可得该地区2020年的环境基础设施投资额的预测值为30.413.521313.9(亿元)利用模型,可得该地区2020年的环境基础设施投资额的预测值为9917.511291.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线
11、性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠. 课堂归纳小结1判断变量之间有无相
12、关关系,简便可行的方法就是绘制散点图根据散点图,可看出两个变量是否具有相关关系,是否线性相关,是正相关还是负相关2求回归直线的方程时应注意的问题(1)知道x与y呈线性相关关系,无需进行相关性检验,否则应首先进行相关性检验如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的(2)用公式计算,的值时,要先算出,然后才能算出.3利用回归方程,我们可以进行估计和预测若回归方程为x,则xx0处的估计值为0x0.1下列语句所表示的事件中的因素不具有相关关系的是()A瑞雪兆丰年B上梁不正下梁歪C吸烟有害健康D喜鹊叫喜,乌鸦叫
13、丧解析选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据答案D2下列图形中,两个变量具有线性相关关系的是()解析线性相关关系要求两个变量的散点图大致在一条直线上,且不是函数关系答案B3已知x,y的取值如表所示:x234y645如果y与x线性相关,且线性回归方程为x,则等于()A B. C D.解析3,5,回归直线过点(3,5),53,故选A.答案A4某旅行社为迎节日搞活动旅游,经市场调查,某旅游线路销量y(人)与旅游单价x(元/人)负相关,则其回归方程可能是()A.80x1600B.80x1600C.80x1600D.80x1600解析y与x负相关,排除B,D;而C中
14、,x0时,80x1600b,a B.b,aC.a D.b,a解析由两组数据(1,0)和(2,2)可求得直线方程为y2x2,从而b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得, ,所以a.答案C课后作业(十五)(时间45分钟)学业水平合格练(时间25分钟)1如图所示是具有相关关系的两个变量的一组数据的散点图,去掉哪个点后,两个变量的相关关系更明显()AD BECF DA解析A、B、C、D、E五点分布在一条直线附近且贴近该直线,而F点离得远,故去掉点F.答案C2已知变量x和y满足关系0.1x1,变量y与z正相关下列结论中正确的是()Ax与y正相关,x与z负相关 Bx与y正相关,x与
15、z正相关Cx与y负相关,x与z负相关 Dx与y负相关,x与z正相关解析因为0.1x1的斜率小于0,故x与y负相关因为y与z正相关,可设zy,0,则zy0.1x,故x与z负相关答案C3下列有关回归方程x的叙述正确的是()反映与x之间的函数关系;反映y与x之间的函数关系;表示与x之间的不确定关系;表示最接近y与x之间真实关系的一条直线A B C D解析x表示与x之间的函数关系,而不是y与x之间的函数关系,且它所反映的关系最接近y与x之间的真实关系故选D.答案D4设有一个回归方程为1.5x2,则变量x增加一个单位时()Ay平均增加1.5个单位By平均增加2个单位Cy平均减少1.5个单位Dy平均减少2
16、个单位解析两个变量线性负相关,变量x增加一个单位,y平均减少1.5个单位答案C5已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为x必过点()A(2,2) B(1,2)C(1.5,0) D(1.5,4)解析易得1.5,4,由于回归直线过样本点的中心(,),故选D.答案D6有五组变量:汽车的重量和汽车每消耗1升汽油所行驶的平均路程;平均日学习时间和平均学习成绩;某人每日吸烟量和其身体健康情况;正方形的边长和面积;汽车的重量和百公里耗油量其中两个变量成正相关的是_解析汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关的关系;平均日学习时间和平均学习成绩的关系成正相关;某人每
17、日吸烟量和其身体健康情况是负相关的关系;正方形的边长和面积之间是函数关系;汽车的重量和百公里耗油量是正相关的故两个变量成正相关的是.答案7为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76, .据此估计,该社区一户年收入为15万元家庭的年支出为_万元解析因为10.0,8.0,0.76,所以8.00.7610.00.4,所以回归直线方程为0.76x0.4,把x15代入上式得,0.76150.411.8.答案11.88对某台机
18、器购置后的运营年限x(x1,2,3,)与当年利润y的统计分析知具备线性相关关系,线性回归方程为10.471.3x,估计该台机器使用_年最合算解析只要预计利润不为负数,使用该机器就算合算,即0,所以10.471.3x0,解得x8.05,所以该台机器使用8年最合算答案89某班40名学生,按某课程的学习时数每8人为一组进行分组,其对应的学习成绩如下表:学习时数(x小时)学习成绩(y分)10401450206025703690试根据上述资料建立学习成绩y与学习时间x的直线回归方程(要求列表计算所需数据资料,写出公式和计算过程,结果保留两位小数)解根据已知数据,可以计算出:21,62.根据资料列表计算如
19、下表:学生xiyixi2xiyiA1040100400B1450196700C20604001200D25706251750E369012963240合计10531026177290进而,可以求得1.89,621.892122.31,所以,学习成绩y与学习时间x的直线回归方程为1.89x22.31.10从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程x;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月
20、储蓄附:线性回归方程x中, ,其中,为样本平均值 .解(1)由题意知n10,i8,i2,0.3, 20.380.4,故所求回归方程为0.3x0.4.(2)由于变量y的值随x值的增加而增加(0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)应试能力等级练(时间20分钟)11某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:x1020304050y62758189由最小二乘法求得回归方程为0.67x54.9,现发现表中有一个数据模糊不清,请推断该数据的值为()A60 B62 C68 D68.3解析由题意可得30,代入回归方程得75
21、.设看不清处的数为a,则62a758189755,a68.答案C12为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系设其回归直线方程为x.已知i225,i1600,4.该班某学生的脚长为24,据此估计其身高为()A160 B163 C166 D170解析i225,i22.5.i1600,i160.又4, 160422.570.回归直线方程为4x70.将x24代入上式得42470166.故选C.答案C13今年一轮又一轮的寒潮席卷全国某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x()之间的
22、关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:月平均气温x/171382月销售量y/件24334055由表中数据算出线性回归方程x中的2.气象部门预测下个月的平均气温约为6,据此估计该商场下个月该品牌羽绒服的销售量约为_件解析10,38,3810(2),58,2x58.当x6时,265846.答案46142019年,我国政府加强了对高耗能企业的监管,采取多种方式促进企业向节能型企业转变,某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(吨)与相应的生产能耗y(吨汽油)有如下几组样本数据x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过
23、线性回归分析,求得回归直线的斜率为0.7,已知该工厂在2020年能耗计划中汽油不超过8.75吨,则该工厂2020年的计划产量最大约为_吨解析4.5,3.5,故样本点的中心为A(4.5,3.5),由题意,设回归直线方程是0.7x,代入A点坐标得3.50.74.5,求得0.35,故回归直线方程为0.7x0.35.由题意得0.7x0.358.75,解得x12.所以该工厂2020年的计划产量最大约为12吨答案1215为了分析某高三学生的学习状态,对其下一阶段的学习提供指导性建议现对某学生前7次考试的数学成绩x、物理成绩y进行分析下表是该学生7次考试的成绩:数学成绩x888311792108100112
24、物理成绩y949110896104101106(1)他的数学成绩与物理成绩哪个更稳定?请说明理由(2)已知该学生的数学成绩x与物理成绩y是线性相关的,若该学生的物理成绩达到115分,请你估计他的数学成绩大约是多少分?(参数数据:88948391117108939610810410010111210670497,882832117292210821002112270994)解(1)100100,100100,s142,s,从而ss,该学生的物理成绩更稳定(2)由于x与y之间具有线性相关关系,则0.5, 1000.510050.线性回归方程为0.5x50.当115时,x130,即该学生物理成绩达到115分时,他的数学成绩大约为130分