1、相关关系相关关系正相关负相关第四节变量间的相关关系 统计案例线性相关关系回归直线ybxayb x121niiiniixxyybxx(3)通过求Qi1nyibxia2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法(4)相关系数:当 r0 时,表明两个变量_;当 r0 时,表明两个变量_r 的绝对值越接近于 1,表明两个变量的线性相关性_r 的绝对值越接近于 0 时,表明两个变量之间_通常|r|大于_时,认为两个变量有很强的线性相关性正相关负相关越强几乎不存在线性相关关系0.75K2nadbc2abacbdcd(其中 nabcd 为样本容量)1
2、(教材习题改编)已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关,且回归方程为y0.95xa,则a()x0134y2.24.34.86.7A3.25 B2.6C2.2 D0解析:回归直线必过样本点的中心(x,y),又 x2,y4.5,代入回归方程,得a2.6.答案:B 2(教材习题改编)从某大学中随机选取 8 名女大学生,其身高和体重数据如表:身高/cm 165 165 157 170 175 165 155 170体重/kg4857505464614359则女大学生的身高预测体重的回归方程为_答案:y0.849x85.7123(教材习题改编)为研究吸烟是否对患肺癌有影响,某
3、肿瘤研究所随机地调查了 9 965 人,得出如下结果(单位:人):不患肺癌患肺癌总计不吸烟7 775427 817吸烟2 099492 148总计9 874919 965则患肺癌与吸烟_(填“有关”或“无关”)答案:有关1易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系2回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(x,y)点,可能所有的样本数据点都不在直线上3利用回归方程分析问题时,所得的数据易误认为是准确值,而实质上是预测值(期望值)1设某大学的女生体重 y(单
4、位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为y0.85x85.71,则下列结论中不正确的是()Ay 与 x 具有正的线性相关关系B回归直线过样本点的中心(x,y)C若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kgD若该大学某女生身高为 170 cm,则可断定其体重必为58.79 kg解析2为了考察两个变量 x 和 y 之间的线性相关性,甲、乙两位同学各自独立地做 10 次和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1 和 l2,已知两个人在试验中发现对变量 x 的观测数据的平均
5、值都是 s,对变量 y 的观测数据的平均值都是 t,那么下列说法正确的是()Al1 和 l2 必定平行Bl1 与 l2 必定重合Cl1 和 l2 一定有公共点(s,t)Dl1 与 l2 相交,但交点不一定是(s,t)解析:注意到回归直线必经过样本中心点答案:C 1(易错题)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()解析:由相关系数的定义,以及散点图所表达的含义可知r2r40r3r1.答案:A Ar2r40r3r1Br4r20r1r3Cr4r20r3r1Dr2r40r1r32(2015湖北高考)已知变量 x 和 y 满足关系 y0.1x1,变量 y 与 z 正相
6、关下列结论中正确的是()Ax 与 y 正相关,x 与 z 负相关Bx 与 y 正相关,x 与 z 正相关Cx 与 y 负相关,x 与 z 负相关Dx 与 y 负相关,x 与 z 正相关解析:因为 y0.1x1 的斜率小于 0,故 x 与 y 负相关因为 y 与 z 正相关,可设 zbya,b0,则 zbya0.1bxba,故 x 与 z 负相关答案:C 由某种设备的使用年限 xi(年)与所支出的维修费 yi(万元)的数据资料算得如下结果,i15x2i 90,i15xiyi112,i15xi20,i15yi25.(1)求所支出的维修费 y 对使用年限 x 的线性回归方程ybxa;(2)判断变量
7、x 与 y 之间是正相关还是负相关;当使用年限为 8 年时,试估计支出的维修费是多少(附:在线性回归方程ybxa中,bi1nxiyin x yi1nx2in x 2,ayb x,其中 x,y为样本平均值)解析(2016唐山一模)为了研究某种细菌在特定环境下随时间变化的繁殖情况,得如下实验数据:天数t(天)34567繁殖个数y(千个)2.5344.56(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,预测 t8 时,细菌繁殖个数附:回归直线的斜率和截距的最小二乘法估计公式分别为:bi1nti t yi yi1nti t 2,a yb t.解析(2016广西玉林、贵港联考)某市
8、地铁即将于 2015 年 6 月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了 50 人,他们的收入与态度如下;月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,75赞成定价者人数123534认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留 2 位小数);(2)由以上统计数据填下面 22 列联表分析是否有 99%的把握认为“月收入以 55 百元为分界点对地铁定价的态度有差异”.月收入低于55百元的人数月收入不低于55
9、百元的人数总计认为价格偏高者赞成定价者总计附:K2nadbc2abcdacbd P(K2k0)0.050.01k03.8416.635 解析解独立性检验的应用问题的关注点(1)两个明确:明确两类主体明确研究的两个问题(2)两个关键:准确画出 22 列联表;准确计算 K2.提醒 准确计算 K2 的值是正确判断的前提由题悟法(2016辽宁五校联考)某班主任对全班 50 名学生学习积极性和参加社团活动情况进行调查,统计数据如表所示:参加社团活动不参加社团活动总计学习积极性高17825学习积极性一般52025总计222850(1)如果随机从该班抽查一名学生,抽到参加社团活动的学生的概率是多少?抽到不参加社团活动且学习积极性一般的学生的概率是多少?(2)运用独立性检验的思想方法分析:学生的学习积极性与参加社团活动情况是否有关系?并说明理由附:K2nadbc2abcdacbdP(K2k)0.050.010.001k3.8416.63510.828 解析结 束 “课后三维演练”见“课时跟踪检测(六十一)”(单击进入电子文档)结 束 “板块命题点专练(十五)”(单击进入电子文档)