1、2.3 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关【知识提炼】1.两个变量的线性相关(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,n)描在平面 直角坐标系中得到的图形.(2)正相关与负相关:正相关:散点图中的点散布在从_到_的区域.负相关:散点图中的点散布在从_到_的区域.左下角右上角左上角右下角2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在_ 附近,就称这两个变量之间具有_关系,这条直线叫做回归 直线.(2)回归方程:_对应的方程叫做回归直线的方程,简称回 归方程.一条直线线性相关回归直线(3)最小二乘法:求回归直线
2、方程 时,使得样本数据的点到回归直线的_最小的方法叫做最小二乘法._,其中,是回归方程的_,是回归方程在y轴上的_.距离的平方和ybxanniiiii 1i 1nn222iii 1i 1xxyyx ynxyb.xxxnxaybx斜率截距ba【即时小测】1.思考下列问题:(1)任意两个统计数据是否均可以作出散点图?提示:可以,不管这两个统计量是否具备相关性,以一个变量值作为横坐标,另一个作为纵坐标,均可画出它的散点图.(2)任何一组数据都可以由最小二乘法得出回归直线方程吗?提示:用最小二乘法求回归直线方程的前提是先判断所给数据具有线性相关关系(可利用散点图来判断),否则求出的回归直线方程是无意义
3、的.2.下列两个变量之间的关系,哪个不是函数关系()A.正方体的棱长和体积 B.圆半径和圆的面积 C.正n边形的边数和内角度数之和 D.人的年龄和身高【解析】选D.A,B,C都是函数关系.而对于年龄确定的不同的人可以有不同的身高.3.下列有关回归方程 的叙述正确的是()反映与x之间的函数关系;反映y与x之间的函数关系;表示与x之间的不确定关系;表示最接近y与x之间真实关系的一条直线.A.B.C.D.【解析】选D.表示 与x之间的函数关系,而不是y与x之间 的函数关系.但它所反映的关系最接近y与x之间的真实关系.ybxaybx2y4.设有一个回归方程为 =-1.5x+2,则变量x增加一个单位时
4、()A.y平均增加1.5个单位 B.y平均增加2个单位 C.y平均减少1.5个单位 D.y平均减少2个单位【解析】选C.因为两个变量线性负相关,所以变量x增加一个单位,y平均减少1.5个单位.y5.如图是两个变量统计数据的散点图,则两个变量之间 相关关系.(填“有”或“无”)【解析】不具有相关关系,因为散点图散乱地分布在坐标平面内,不呈线形.答案:无【知识探究】知识点 变量间的相关关系 观察图形,回答下列问题:俗语说“冬天麦盖三层被,来年枕着馒头睡”,“庄家一枝花,全靠肥当家”.问题1:下雪与小麦丰收、肥料与庄家丰收之间有关系吗?问题2:若有关系,是函数关系吗?若不是,则又是什么关系?【总结提
5、升】1.两个变量间的分类关系(1)确定性的函数关系,如正方形的边长与面积的关系.(2)相关关系,不具备函数关系所要求的确定性,它们的关系是带有随机性的,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系.(3)不相关,即两个变量间没有任何关系.2.相关关系与函数关系的异同点(1)相同点:两者均是指两个变量的关系.(2)不同点:函数关系是一种确定性关系,而相关关系是一种非确定性关系;函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.【题型探究】类型一 相关关系的判断【典例】1.下列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a
6、,c是已知常数,取b为自变量,因变量是判别式=b2-4ac B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量 2.有个男孩的年龄与身高的统计数据如下:画出散点图,并判断它们是否有相关关系?如果有相关关系,是正相关还是负相关?年龄(岁)1 2 3 4 5 6 身高(cm)78 87 98 108 115 120【解题探究】1.典例1中判断两个变量之间具有相关关系的关键是什么?提示:关键是看它们之间的关系是否带有相关性.2.典例2中利用散点图判断两个变量是否具有相关关系的依据是什么?提示:散点图形象地体现了数据的密切程度,因此可用散点图来判断两个变量有没有线性关系
7、.【解析】1.选A.在A中,若b确定,则a,b,c都是常数,=b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.2.散点图是分析变量相关关系的重要工具.作出散点图如图:由图可见,具有线性相关关系,且是正相关.【方法技巧】两个变量x与y相关关系的判断方法(1)判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.(2)画散点图时应注
8、意合理选择单位长度,避免图形过大或偏小,或者使点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.【变式训练】(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图,以下结论不正确的是 ()A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关【解析】选D.由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关.类型二 回归方程的求法【典例】1.(2014重庆高考)已知变量x与y正
9、相关,且由观测数据 算得样本平均数 =3,=3.5,则由该观测数据算得的线性回归方 程可能是()A.=0.4x+2.3 B.=2x-2.4 C.=-2x+9.5 D.=-0.3x+4.4 yxyyyy2.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器的运转的速度的变化而变化,下表为抽样试验的结果:转速x(转/秒)16 14 12 8 每小时生产有缺点的零件数y(件)11 9 8 5(1)画出散点图.(2)如果y对x有线性相关关系,请画出一条直线近似地表示这种线性 关系.(3)在实际生产中,若它们的近似方程为 允许每小时生产 的产品中有缺点的零件最多为
10、10件,那么机器的运转速度应控制在什 么范围内?516y=x707【解题探究】1.典例1中样本中心点(,)与回归直线有什么关系?提示:典例1中回归直线必过样本中心点(,),即点(3,3.5)在 回归直线上.2.从总体上看,典例2中每小时生产的有缺点的零件数随机器转速的增加是增加还是减少?提示:随转速的增加而减少.xyxy【解析】1.选A.依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B选项得A正确.2.(1)散点图如图所示:(2)近似直线如图所示:(3)由y10得 解得x14.9,所以机器的运转速度应控 制在14转/秒内.516x10707,【延伸探究】1
11、.(改变问法)典例2(3)中近似方程不变,若每增加一个单位的转速,生产有缺点的零件数近似增加多少?【解析】因为 所以当x增加一个单位时,y大约增加 .516yx707,51702.(改变问法)典例2(3)中近似方程不变,每小时生产有缺点的零件个数是7,估计机器的转速.【解析】因为 所以当y=7时,解得x11.516yx707,5167x,707【方法技巧】求回归直线方程的一般步骤(1)收集样本数据,设为(xi,yi),(i1,2,n)(数据一般由题目给出)(2)作出散点图,确定x,y具有线性相关关系 (3)把数据制成表格xi,yi,xiyi.(4)计算 2ix,nn2iiii 1i 1x yx
12、x y,(5)代入公式计算 公式为(6)写出回归直线方程 a,b,niii 1n22ii 1x ynxyxnxa yx.b,byybx【补偿训练】(2015渭南高一检测)某种木材体积与树木的树龄之间有如下的对应关系:(1)请作出这些数据的散点图.(2)你能从散点图中发现木材体积与树木的树龄近似成什么关系吗?树龄 2 3 4 5 6 7 8 体积 30 34 40 60 55 62 70【解析】(1)以x轴表示树木的树龄,y轴表示树木的体积,可得相应的散点图如图所示:(2)由散点图中发现木材体积随着树龄的增加而呈增加的趋势.所以木材的体积与树龄成线性相关关系.【延伸探究】1.(改变问法)若近似成
13、线性关系,请画出一条直线来近似地表示这种线性关系.【解析】近似拟合直线如图所示:2.(变换条件,改变问法)若该种木材每单位体积的价值是80元,作出木材的价值与树龄之间关系的散点图.【解析】木材的价值与树龄之间关系如图所示 树龄 2 3 4 5 6 7 8 体积 30 34 40 60 55 62 70 价值(元)2 400 2 720 3 200 4 800 4 400 4 960 5 600 以x轴表示树木的树龄,y轴表示树木的价值,可得相应的散点图如图所示:类型三 利用回归方程对总体进行估计【典例】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准
14、煤)的几组对照数据:x 3 4 5 6 y 2.5 3 4 4.5(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程 (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:32.5+43+54+64.5=66.5)ybxa.【解题探究】典例(3)中如何预测能耗比技改前降低多少吨标准煤?提示:在题(2)中求出的回归直线方程中令x=100,即可求出技改后消耗的量,再求差即可求出能耗比技改前降低的吨数.【解析】(1)散点图如图:(2)所以 所以所
15、求的线性回归方程为 0.7x0.35.3 4 5 62.5 3 4 4.5x4.5 y3.544 ,4iii 1x y3 2.5 4 3 5 4 6 4.5 66.5,422222ii 1x345686 ,4iii 14222ii 1x y4x y66.5 4 3.5 4.50.786 4 4.5x4xb,x 3.50.7 4.50.35.yyb y(3)当x100时,0.71000.3570.35(吨标准煤),9070.3519.65(吨标准煤)即生产100吨甲产品的生产能耗比技改前降低了19.65吨标准煤 y【方法技巧】回归分析的三个步骤(1)判断两个变量是否线性相关:可利用经验,也可以画
16、散点图.(2)求回归直线方程,注意运算的准确性.(3)根据回归直线进行预测:估计值不是实际值,两者会有一定的误差.【变式训练】(2015重庆高考)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2010 2011 2012 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y/千亿元 5 6 7 8 10(1)求y关于t的回归方程(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程 中,ybta.niii 1n22ii 1t ynt yb,aybt.tnt【解题指南】(1)直接利用回归系数公式求解即可.(
17、2)利用回归方程代入直接进行计算即可.【解析】(1)列表计算如下:i ti yi tiyi 1 1 5 1 5 2 2 6 4 12 3 3 7 9 21 2iti ti yi tiyi 4 4 8 16 32 5 5 10 25 50 15 36 55 120 2it这里n=5,又 从而 故所求回归方程为 =1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为 =1.26+3.6=10.8(千亿元).nniii 1i 1115136tt3,yy7.2.n5n5n222ii 1tnt555 310,niii 1t ynty1205 3 7.212,12b1.2,
18、ay bt7.2 1.2 33.6,10 yy【补偿训练】某个体服装店经营某种服装在某周内所获纯利y(元)与该周每天销售这种服装的件数x(件)之间有一组数据如下表:每天销售服装 件数x/件 3 4 5 6 7 8 9 该周内所获 纯利y/元 66 69 73 81 89 90 91(1)求(2)若纯利y与每天销售这种服装的件数x之间是线性相关的,求回归方程.(3)若该店每周至少要获纯利200元,请你预测该店每天至少要销售这种服装多少件?(以下数据供选择:)x y.,77722iiiii 1i 1i 1x280y45 309x y3 487,【解析】(1)(2)因为 所以纯利与每天销售件数x之间
19、的回归方程为 51.364.75x.(3)当 200时,2004.75x51.36,所以x31.29.因此若该店每周至少要获纯利200元,则该店每天至少要销售这种服 装32件.3456789x67 ,666973 81 899091y79.86.723 4877 6 79.864.752807 6 b,a 79.86 4.75 6 51.36,yy易错案例 判断两变量之间的关系【典例】下列关系中是相关关系的有_.(1)光照时间与果树的亩产量的关系.(2)圆柱体积与其底面直径的关系.(3)自由下落的物体的质量与落地时间的关系.(4)球的表面积与球的半径之间的关系.【失误案例】【错解分析】分析解题
20、过程,你知道错在哪里吗?提示:本题错误的根本原因是对相关关系和函数关系的本质把握不准.实际上,圆柱的体积除了与底面直径有关,还与圆柱的高有关,是由这两个量共同决定的,所以圆柱的体积与底面直径之间只有相关关系.【自我矫正】(1)光照时间与果树的亩产量之间的关系是相关关系;(2)圆柱体积与两个变量相关,一是底面面积,一是高,这里直径决定了底面面积,而高还是一个可变量,因此在高没有确定的情况下,圆柱体积与底面直径只具有相关关系,而不是函数关系;(3)自由下落的物体的质量与落地时间无关,它们不具有相关关系;(4)球的表面积与球的半径满足S=4R2,故它具有函数关系.答案:(1)(2)【防范措施】判断两变量间关系的关键 关键是分清两个变量之间的关系是确定性关系还是非确定性关系,若是确定的,则是函数关系,若是不确定的,则是相关关系.