1、第二章 统 计23 变量间的相关关系 2.3.1 变量之间的相关关系 2.3.2 两个变量的线性相关 第二章 统 计 1.理解两个变量的相关关系的概念 2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系 3会求回归直线方程1两个变量的线性相关(1)散点图:将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中得到的图形(2)正相关与负相关正相关:散点图中的点散布在从_到_的区域;负相关:散点图中的点散布在从_到_的区域左下角右上角左上角右下角2回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在_附近,我们就称这两个变量之间具有_关系,这条直线叫做回归
2、直线(2)回归方程:_对应的方程叫回归直线的方程,简称回归方程一条直线线性相关回归直线(3)最小二乘法求回归直线方程ybxa时,使得样本数据的点到回归直线的_最小的方法叫做最小二乘法其中b是回归方程的_,a是回归方程在 y 轴上的截距.距离的平方和斜率1散点图的作用散点图形象地反映了各对数据的密切程度根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论2回归直线的性质由a yb x可知回归直线一定经过点(x,y),因此点(x,y)通常称为样本点的中心,其中,x,y分别是变量 x1,x2,xn 和 y1,y2,yn 的平均数3线性相关关系强弱的定性分析线性相关关系的强弱体现在散
3、点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱判断正误(对的打“”,错的打“”)(1)线性回归方程必经过点(x,y)()(2)对于方程ybxa,x 增加一个单位时,y 平均增加b个单位()(3)样本数据中 x0 时,可能有 ya.()(4)样本数据中 x0 时,一定有 ya.()解析:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据 x0 时,y 的值可能为a,也可能不是a,故(3)正确 下列各图中所示的两个变量具有相关关系的是()A(1)(2)B(1)(3)C(2)(4)D(2)(3)解析:选 D.
4、(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系5 位学生的数学成绩和物理成绩如下表:学科ABCDE 数学8075706560 物理7066686462则数学成绩与物理成绩之间()A是函数关系B是相关关系,但相关性很弱C具有较好的相关关系,且是正相关D具有较好的相关关系,且是负相关解析:选 C.数学成绩 x 和物理成绩 y 的散点图如图所示 从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关设有一个回归方程为y21.5x,则变量 x 每增加 1 个单位时,y 平均减少_个单位解析:因为y21.5x,所以变量 x 每增加 1 个单位时,y1
5、y221.5(x1)(21.5x)1.5,所以 y 平均减少 1.5 个单位答案:1.5探究点 1 相关关系的判断(1)下面哪些变量是相关关系()A.出租车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁的体积与质量(2)判断下列图形中具有相关关系的两个变量是()【解析】(1)A,B,D 都是函数关系,其中 A 一般是分段函数,只有 C 是相关关系,(2)A、B 为函数关系,D 无相关关系【答案】(1)C(2)C相关关系的判断方法(1)两个变量 x 和 y 具有相关关系的判断方法散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;表格、关系式法:结合表格或关系式进行判断;
6、经验法:借助积累的经验进行分析判断(2)判断两个变量 x 和 y 之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响 下列对相关关系的理解:变量与变量之间只有函数关系,不存在相关关系;两个变量之间存在相关关系的原因受许多不确定的随机因素的影响;需要通过样本来判断变量之间是否存在相关关系;相关关系是一种因果关系,具有确定性其中正确的有_(填序号)解析:变量与变量之间的常见关系有函数关系和相关关系,故不正确;相关关系是一种非确定性关系,故不正确故填.答案:探究点 2 线性回归方程的求法 下
7、表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据:x3456 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程ybxa.【解】(1)散点图如图(2)x345644.5,y2.5344.543.5,a yb x3.50.74.50.35.所以所求的线性回归方程为y0.7x0.35.如果把例题中的 y 的值 2.5 及 4.5 分别改为 2 和 5,如何求回归直线方程?解:散点坐标分别为(3,2),(4,3),(5,4),(6,5)可验证这四点共线,斜率 k32
8、431,所以直线方程为 y2x3,即回归直线方程为yx1.求线性回归方程的步骤(1)计算平均数 x,y.(2)计算 xi与 yi的积,求xiyi.(3)计算x2i(4)将结果代入公式(5)用a yb x,求a.(6)写出回归方程.某化工厂为预测某产品的回收率 y,需要研究它和原料有效成分含量 x 之间的相关关系,现取了 8 对观测值,计算得:则 y 关于 x 的回归直线方程是()A.y11.472.62xB.y11.472.62xC.y2.6211.47xD.y11.472.62x解析:选 A.利用题目中的已知条件可以求出 x6.5,y28.5,然后利用回归直线方程的计算公式得 a yb x1
9、1.47,因此回归直线方程为y11.472.62x.探究点 3 线性回归方程的应用(1)某单位为了解用电量 y(度)与气温 x()之间的关系,随机抽查了某 4 天的用电量与当天气温,并制作了对照表:气温()1813101 用电量(度)24343864由表中数据得回归方程ybxa中b2,预测当气温为4 时,用电量为()A58 度B66 度C68 度D70 度(2)在某种产品表面进行腐蚀刻线实验,得到腐蚀深度 y(单位:m)与腐蚀时间 x(单位:s)之间相应的一组观察值,如下表:腐蚀时间 x5101520304050607090 120 腐蚀深度 y610101316171923252946画出散
10、点图;从散点图中发现腐蚀深度与腐蚀时间之间关系的一般规律;求回归方程;估计腐蚀时间为 100 s 时的腐蚀深度【解】(1)选 C.由表知 x1813101410,y24343864440,因为回归直线一定过点(10,40),则 40210a,则a60,所以y2x60,当 x4时,y2(4)6068.(2)散点图如图所示 由图可知,各点散布在从左下角到右上角的区域内,因此,腐蚀深度与腐蚀时间成正相关,即腐蚀时间越长,腐蚀深度越深 从散点图可以看出,这些点大致分布在一条直线的附近,因此,两变量成线性相关关系利用计算器求得回归 方程为y0.304x5.344.由知,当腐蚀时间为 100 s 时,y0
11、.3041005.34435.744(m),即此时腐蚀深度约是 35.744 m.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据(2)利用回归方程中系数b的意义,分析实际问题(3)利用回归直线进行预测,此时需关注两点:所得的值只是一个估计值,不是精确值;变量 x 与 y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的 随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份2013 2014 2015 2016 2017
12、 时间代号 t12345 储蓄存款 y(千亿元)567810(1)求 y 关于 t 的回归方程ybta.(2)用所求回归方程预测该地区 2018 年(t6)的人民币储蓄存款解:(1)列表计算如下:itiyit2itiyi 11515 226412 337921 4481632 55102550 153655120 这里 n5,t1ni1nti155 3,y1ni1nyi365 7.2.从而b12101.2,a yb t7.21.233.6,故所求回归方程为y1.2t3.6.(2)将 t6 代入回归方程可预测该地区 2018 年的人民币储蓄存款为y1.263.610.8(千亿元)1我们常说“吸烟
13、有害健康”,吸烟与健康之间的关系是()A正相关B负相关C无相关D不确定解析:选 B.烟吸得越多,则健康程度越差2关于回归直线方程yabx 的叙述正确的是()反映y与 x 之间的函数关系;反映 y 与 x 之间的函数关系;表示y与 x 之间的不确定关系;表示最接近 y 与 x 之间真实关系的一条直线ABCD解析:选 D.yabx 表示y与 x 之间的函数关系,而不是 y与 x 之间的函数关系,它反映的关系最接近 y 与 x 之间的真实关系故正确3在最小二乘法中,用来刻画各个样本点到直线 yabx的“距离”的量是()A|yi y|B(yi y)2C|yi(abxi)|Dyi(abxi)2解析:选
14、D.最小二乘法的定义明确给出,用yi(abxi)2 来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度4已知工厂加工零件的个数 x 与花费时间 y(h)之间的线性回归方程为y0.01x0.5,则加工 200 个零件大约需要_小时解析:将 200 代入线性回归方程y0.01x0.5,得y2.5.答案:2.5知识结构深化拓展 1.利用回归方程对总体进行估计对于具有线性相关关系的两个变量,通过样本数据求出回归直线方程之后,就可以对总体的数据进行估计或者由已知数据的趋势去预测未知数据的值若回归直线方程为ybxa,则 xx0 处的估计值为y0bx0a.估计值并不是精确值,允许有误差存在深化拓展 2线性相关关系强弱的定量分析(1)若相应于变量 x 的取值 xi,变量 y 的观测值为 yi(1in),则变量 x 与 y 的相关系数 r通常用 r 来衡量 x,y 之间的线性关系的强弱(2)r 的范围为1r1,r 为正时,x,y 正相关;r 为负时,x,y 负相关;|r|越接近于 1,x 与 y 的相关程度越大;|r|越接近于 0,二者的相关程度越小;当|r|1 时,所有数据点都在一条直线上.本部分内容讲解结束 按ESC键退出全屏播放