1、第三节 变量间的相关关系与统计案例知识点一 变量间的相关关系1变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是;与函数关系不同,是一种非确定性关系(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为,点散布在左上角到右下角的区域内,两个变量的相关关系为相关关系相关关系正相关负相关2两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有,这条直线叫做线性相关关系回归直线正相关负相关r的绝对值越接近于1,表明两个变量的线性相关性r的绝对值越接近于0时,表明两个变量之间通常|r|大于
2、时,认为两个变量有很强的线性相关性越强几乎不存在线性相关关系075B C 3(易错题)(2021兰州市高三实战考试)已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示,若y关于x的回归方程为1.3x1,则m_.答案:3.1知识点二 独立性检验假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2合计x1ababx2cdcd合计 ac bdabcd1下面是22列联表:则表中a,b的值分别为()A94,72B52,50C52,74D74,52C 2为考察某种药物预防疾病的效果,对100只某种动物进行试验,得到如下的列联表:患病 未
3、患病 合计服用药104050没服用药203050合计3070100B 题型一 相关关系的判断 自主探究1(2021昆明市诊断测试)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:根据表中数据,下列说法正确的是()A利润率与人均销售额成正相关关系B利润率与人均销售额成负相关关系C利润率与人均销售额成正比例函数关系D利润率与人均销售额成反比例函数关系A 2甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A甲 B乙C丙D丁甲乙丙丁r 0.82 0.78 0.
4、69 0.85m 106 115 124 103D 3(2020高考全国卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()AyabxByabx2CyabexDyabln xD 1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系若点散布在从左下角到右上角的区域,则正相关2.利用相关系数判
5、定,当|r|越趋近于1,相关性越强当残差平方和越小,相关指数R2越大,相关性越强若r0,则正相关;r0时,则负相关题型二 回归分析 合作探究例(2020高考全国卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,
6、yi)(i1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计对点训练随着我国经济的发展,居民的储蓄存
7、款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份2016 2017 2018 2019 2020时间代号t12345储蓄存款y(千亿元)567810解析:(1)列表计算如下:题型三 独立性检验合作探究例(2020新高考高考卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的22列联表:1.在22列联表中,如果两个变量没有关系,则应满足adbc0.|adbc|越小,说明
8、两个变量之间关系越弱;|adbc|越大,说明两个变量之间关系越强.对点训练(2021惠州调研)在某校举行的航天知识竞赛中,参与竞赛的女生与男生人数之比为13,且成绩分布在40,100,分数在80以上(含80)的同学获奖按性别用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如下数学建模、数学运算非线性回归的应用问题例为了研究一种昆虫的产卵数y(单位:个)和温度x(单位:)是否有关,现收集了7组观测数据列于下表中,并作出了如图所示的散点图,发现样本点没有分布在某个带状区域内,两个变量不呈线性相关关系,现分别用模型:yC1x2C2与模型:yeC3xC4作为产卵数y和温度x的回归方
9、程来建立两个变量之间的关系.温度x/20222426283032产卵数y/个610212464113322tx24004845766767849001 024zln y1.792.303.043.184.164.735.77(1)分别在下图(1)(2)中画出y关于t的散点图和z关于x的散点图,根据散点图判断哪一个模型更适宜作为昆虫的产卵数y关于温度x的回归方程类型?(给出判断即可,不必说明理由)(1)(2)解析(1)画出y关于t的散点图,如图所示画出z关于x的散点图,如图所示非线性回归方程的求法(1)根据原始数据作出散点图;(2)根据散点图,选择恰当的拟合函数;(3)作恰当变换,将其转化成线性函数,求线性回归方程;(4)在(3)的基础上通过相应变换,即可得非线性回归方程对点训练(2021汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:下面是z关于x的折线图:课时作业 巩固提升