1、23 变量间的相关关系23.1 变量之间的相关关系23.2 两个变量的线性相关第二章 统计考点学习目标核心素养相关关系的概念理解两个变量的相关关系的概念数学抽象散点图会作散点图,并利用散点图判断两个变量之间是否具有相关关系逻辑推理、数学建模回归直线方程会求回归直线方程数学运算第二章 统计问题导学(1)相关关系分为哪两种?(2)什么叫散点图?(3)什么叫回归直线?求回归直线的方法及步骤是什么?1两个变量的线性相关(1)散点图:将样本中 n 个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中得到的图形(2)正相关与负相关正相关:散点图中的点散布在从_到_的区域;负 相 关:散 点 图 中
2、的 点 散 布 在 从 _ 到_的区域左下角右上角左上角右下角2回归直线的方程(1)回 归 直 线:如 果 散 点 图 中 点 的 分 布 从 整 体 上 看 大 致 在_附近,我们就称这两个变量之间具有_关系,这条直线叫做回归直线(2)回归方程:_对应的方程叫回归直线的方程,简称回归方程一条直线线性相关回归直线(3)最小二乘法求回归直线方程ybxa时,使得样本数据的点到回归直线的_最小的方法叫做最小二乘法 其中b是回归方程的_,a是回归方程在 y 轴上的截距距离的平方和斜率名师点拨(1)散点图的作用散点图形象地反映了各对数据的密切程度根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判
3、断并得出结论(2)回归直线的性质由a yb x可知回归直线一定经过点(x,y),因此点(x,y)通常称为样本点的中心,其中,x,y分别是变量 x1,x2,xn和 y1,y2,yn 的平均数(3)线性相关关系强弱的定性分析线性相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关关系越强;样本点在某条直线附近越分散,两变量的线性相关关系越弱判断正误(对的打“”,错的打“”)(1)线性回归方程必经过点(x,y)()(2)对于方程ybxa,x 增加一个单位时,y 平均增加b个单位()(3)样本数据中 x0 时,可能有 ya.()(4)样本数据中 x0 时,一定有 ya.()解析
4、:根据回归直线方程的意义知,(1)(2)都正确,而(3)(4)中,样本数据 x0 时,y 的值可能为a,也可能不是a,故(3)正确 答案:(1)(2)(3)(4)下列各图中所示的两个变量具有相关关系的是()A(1)(2)B(1)(3)C(2)(4)D(2)(3)解析:选 D.(1)为函数关系;(2)(3)为相关关系;(4)中,因为点分布得比较分散,两者之间无相关关系5 位学生的数学成绩和物理成绩如下表:学科ABCDE 数学8075706560物理7066686462则数学成绩与物理成绩之间()A是函数关系B是相关关系,但相关性很弱C具有较好的相关关系,且是正相关D具有较好的相关关系,且是负相关
5、解析:选 C.数学成绩 x 和物理成绩 y 的散点图如图所示 从图上可以看出数学成绩和物理成绩具有较好的相关关系,且成正相关设有一个回归方程为y21.5x,则变量 x 每增加 1 个单位时,y 平均减少_个单位解析:因为y21.5x,所以变量 x 每增加 1 个单位时,y1y221.5(x1)(21.5x)1.5,所以 y 平均减少 1.5 个单位答案:1.5以下是在某地搜集到的不同楼盘新房屋的销售价格 y(单位:万元)和房屋面积 x(单位:m2)的数据:房屋面积 x(m2)11511080135105销售价格 y(万元)24.821.619.429.222(1)画出数据对应的散点图;(2)判
6、断新房屋的销售价格和房屋面积之间是否具有相关关系?如果有相关关系,是正相关还是负相关?相关关系的判断【解】(1)数据对应的散点图如图所示:(2)通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关关系,且是正相关相关关系的判断方法(1)两个变量 x 和 y 具有相关关系的判断方法 散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;表格、关系式法:结合表格或关系式进行判断;经验法:借助积累的经验进行分析判断(2)判断两个变量 x 和 y 之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线
7、性相关的,注意不要受个别点的位置的影响 易错警示 在解答本题过程中,易出现如下错误:虽然五点中有四点大致分布在一条直线附近,但第二个点离这条直线太远,所以两个变量不相关,导致错误的原因是没有看主流点,而过分关注了不影响大局的个别点 对变量 x,y 有观测数据(xi,yi)(i1,2,10),得散点图如图所示由这个散点图可以判断()A变量 x 与 y 正相关 B变量 x 与 y 不相关C变量 x 与 y 负相关D变量 x 与 y 是函数关系解析:选 C.由这个散点图可以判断,变量 x 与 y 负相关,故选 C.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗
8、y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程ybxa.线性回归方程的求法【解】(1)散点图如图(2)x345644.5,y2.5344.543.5,i14xiyi32.5435464.566.5,i14x2i3242526286,所以b4i1xiyi4 x y4i1x2i4 x2 66.544.53.58644.520.7,a yb x3.50.74.50.35.所以所求的线性回归方程为y0.7x0.35.如果把例题中的 y 的值 2.5 及 4.5 分别改为 2 和 5,如何
9、求回归直线方程?解:散点坐标分别为(3,2),(4,3),(5,4),(6,5)可验证这四点共线,斜率 k32431,所以直线方程为 y2x3,即回归直线方程为yx1.求线性回归方程的步骤(1)计算平均数 x,y.(5)用a yb x,求a.(6)写出回归方程.某化工厂为预测某产品的回收率 y,需要研究它和原料有效成分含量 x 之间的相关关系,现取了 8 对观测值,计算得:则 y 关于 x的回归直线方程是()A.y11.472.62xB.y11.472.62xC.y2.6211.47xD.y11.472.62x解析:选 A.利用题目中的已知条件可以求出 x6.5,y28.5,然后利用回归直线方
10、程的计算公式得 b8i1xiyi8 x y8i1x2i8 x2 1 84986.528.547886.522.62,a yb x11.47,因此回归直线方程为y11.472.62x.(2019黑龙江省大庆铁人中学期末考试)某班主任为了对本班学生的月考成绩进行分析,从全班 40 名同学中随机抽取一个容量为 6 的样本进行分析随机抽取 6 位同学的数学、物理分数对应如表:学生编号123456数学分数 x607080859095物理分数 y728088908595线性回归方程的应用(1)根据上表数据用散点图说明物理成绩 y 与数学成绩 x 之间是否具有线性相关性?(2)如果具有线性相关性,求出线性回
11、归方程(系数精确到 0.1);如果不具有线性相关性,请说明理由;(3)如果班里的某位同学数学成绩为 50,请预测这位同学的物理成绩【解】(1)画出散点图:通过图象可以看出物理成绩 y 与数学成绩 x 之间具有线性相关性(2)x16(607080859095)80,y16(728088908595)85,故b0.6,a37.故回归方程是 y0.6x37.(3)当 x50 时,解得 y67.故数学成绩为 50,预测这位同学的物理成绩是 67.利用线性回归方程解题的常见思路及注意点(1)利用回归直线过样本点的中心,可以求参数问题,参数可涉及回归方程或样本点数据(2)利用回归方程中系数b的意义,分析实
12、际问题(3)利用回归直线进行预测,此时需关注两点:所得的值只是一个估计值,不是精确值;变量 x 与 y 成线性相关关系时,线性回归方程才有意义,否则即使求出线性回归方程也是毫无意义的,用其估计和预测的量也是不可信的 (2019江西省临川第一中学期末考试)我国西部某贫困地区 2011 年至 2017 年农村居民家庭人均年收入 y(千元)的数据如下表:年份2011201220132014201520162017年份代号 x1234567人均年收入y2.93.33.64.44.85.25.9(1)求 y 关于 x 的线性回归方程;(2)利用(1)中的回归方程,预测该地区 2019 年农村居民家庭人均
13、年收入将达到多少千元解:(1)依题意 x4,y4.3,从而b0.5,a yb x4.30.542.3,故所求线性回归方程为y0.5x2.3.(2)令 x9,得y0.592.36.8.预测该地区在 2019 年农村居民家庭人均年收入为 6.8 千元1我们常说“吸烟有害健康”,吸烟与健康之间的关系是()A正相关 B负相关C无相关D不确定解析:选 B.烟吸得越多,则健康程度越差2关于回归直线方程yabx 的叙述正确的是()反映y与 x 之间的函数关系;反映 y 与 x 之间的函数关系;表示y与 x 之间的不确定关系;表示最接近 y 与 x 之间真实关系的一条直线A BC D解析:选 D.yabx 表
14、示y与 x 之间的函数关系,而不是 y 与 x之间的函数关系,它反映的关系最接近 y 与 x 之间的真实关系故正确3在最小二乘法中,用来刻画各个样本点到直线 yabx 的“距离”的量是()A|yi y|B(yi y)2C|yi(abxi)|Dyi(abxi)2解析:选 D.最小二乘法的定义明确给出,用yi(abxi)2 来刻画各个样本点与这条直线之间的“距离”(即二者之间的接近程度),用它们的和表示所有样本点与这条直线的接近程度4已知工厂加工零件的个数 x 与花费时间 y(h)之间的线性回归方程为y0.01x0.5,则加工 200 个零件大约需要_小时解析:将 200 代入线性回归方程y0.01x0.5,得y2.5.答案:2.5本部分内容讲解结束 按ESC键退出全屏播放