1、第七节变量间的相关关系与统计案例授课提示:对应学生用书第189页基础梳理1相关关系与回归方程(1)相关关系的分类正相关:从散点图上看,点分布在从左下角到右上角的区域内;负相关:从散点图上看,点分布在从左上角到右下角的区域内(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫作回归直线(3)回归方程最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为ybxa,则b,ab.其中,b是回归方程的斜率
2、,a是在y轴上的截距(4)样本相关系数r,用它来衡量两个变量间的线性相关关系当r0时,表明两个变量正相关;当r0.75时,认为两个变量有很强的线性相关关系2独立性检验(1)22列联表:假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd(2)2统计量2(其中nabcd为样本容量)1两种关系函数关系与相关关系(1)区别函数关系是一种确定性关系,相关关系是一种非确定性关系函数关系是一种因果关系,相关关系不一定是因果关系,也可能是伴随关系(2)联系:对线性相关关系求回归方程后,可以通过确定的函数
3、关系对两个变量间的取值进行估计2回归直线方程的两个关注点(1)样本数据点不一定在回归直线上,回归直线必过(,)点(2)在回归直线方程ybxa中,b0时,两个变量呈正相关关系;b0时,两个变量呈负相关关系3回归分析的意义回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法在线性回归模型ybxae中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为解释变量,因变量y称为预报变量4独立性检验利用独立性假设、随机变量2来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验两个分类变量X和Y是否有关系的判断标准:统
4、计学研究表明:当22.706时,认为没有充分证据显示X与Y有关系;当23.841时,有95%的把握说X与Y有关;当26.635时,有99%的把握说X与Y有关;当210.828时,有99.9%的把握说X与Y有关四基自测1(基础点:回归分析的相关指数)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是 ()A模型1的相关指数R2为0.98B模型2的相关指数R2为0.80C模型3的相关指数R2为0.50D模型4的相关指数R2为0.25答案:A2(基础点:回归直线方程的特征)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:x681
5、012y2356则y对x的线性回归直线方程为()Ay2.3x0.7By2.3x0.7Cy0.7x2.3 Dy0.7x2.3答案:C3(基础点:独立性检验)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下22列联表:理科文科男1310女720已知P(23.841)0.05,P(25.024)0.025.根据表中数据,得到24.844.则认为选修文科与性别有关系出错的可能性为_答案:5%4(基础点:散点图与线性相关)为了研究某班学生的脚长x(cm)与身高y(cm)的关系,从该班中抽取10名学生,其脚长x和身高y的散点图如图所示,则y与x间_(有、没有)相关关系答案:有授
6、课提示:对应学生用书第190页考点一回归分析挖掘1相关关系的判断/ 互动探究例1(1)(2020镇江模拟)如图所示,有A,B,C,D,E 5组数据,去掉_组数据后,剩下的4组数据具有较强的线性相关关系解析由散点图知呈带状区域时有较强的线性相关关系,故去掉D组数据答案D(2)下列两变量中不存在相关关系的是()人的身高与视力;曲线上的点与该点的坐标之间的关系;某农田的水稻产量与施肥量;某同学考试成绩与复习时间的投入量;匀速行驶的汽车的行驶距离与时间;商品的销售额与广告费ABC D解析人的身高与视力无任何关系,故不存在相关关系;曲线上的点与该点的坐标之间,存在一一对应的关系,故不存在相关关系;某农田
7、的水稻产量与施肥量,两变量有关系,但不确定,故存在相关关系;某同学考试成绩与复习时间的投入量,两变量有关系,但不确定,故存在相关关系;匀速行驶的汽车的行驶距离与时间,它们之间的关系是函数关系,故不存在相关关系;商品的销售额与广告费,两变量有关系,但不确定,故存在相关关系答案A(3)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar2r40r3r1Br4r20r1r3Cr4r20r3r1 Dr2r40r1r3解析易知题中图与图是正相关,图与图是负相关,且图与图中的样本点集中分布在一条直线附近,则r2r40r33.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异破题技法1.独立性检验的原理独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信度,首先假设该结论不成立即假设结论“两个分类变量没有关系”成立在该假设下构造的随机变量2应该很小如果由观测数据计算得到的2的观测值k很大,则在一定程度上说明不合理2独立性检验的两个关键(1)根据样本数据列出22列联表(2)计算随机变量2.