1、8.1 成对数据的统计相关性(精讲)思维导图常见考法考点一 相关关系的辨析【例1】(2021全国高二单元测试)下列说法错误的是( )A正方体的体积与棱长之间的关系是函数关系B人的身高与视力之间的关系是相关关系C汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关D体重与学习成绩之间不具有相关关系【答案】B【解析】正方体的体积与棱长之间的关系是函数关系,故A正确;人的身高与视力之间不具有相关关系,故B错误;汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关,故C正确;体重与学习成绩之间不具有相关关系,故D正确.故选:B.【一隅三反】1(2021全国高一课时练习)有五组变量:汽车的重量和汽车每消
2、耗一升汽油所行驶的距离;平均日学习时间和平均学习成绩;某人每天的吸烟量和身体健康状况;圆的半径与面积;汽车的重量和每千米的耗油量其中两个变量成正相关的是( )ABCD【答案】C【解析】中,汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关的关系;中,平均日学习时间和平均学习成绩的关系是一个正相关;中,某人每日吸烟量和其身体健康情况是负相关的关系;中,圆的半径与面积是函数关系;中,汽车的重量和百公里耗油量关系是一个正相关;,所以中的两个变量属于线性正相关故选:C2(2021全国高一课时练习)最新交通安全法实施后,某市管理部门以周为单位,记录的每周查处的酒驾人数与该周内出现的交通事故数量如下:
3、酒驾人数801471211009610387交通事故19313023252420通过如表数据可知,酒驾人数与交通事故数之间是( )A正相关B负相关C不相关D函数关系【答案】A【解析】由表格中的数据,在直角坐标系中描出数据的散点图,如图所示,直观判断散点从左向右成带状分布,在一条直线附近,所以具有线性相关关系,且是正相关故选:A3(2021全国高一课时练习)某公司年的年利润(单位:百万元)与年广告支出(单位:百万元)的统计资料如表所示:年份200620072008200920102011利润12.214.6161820.422.3支出0.620.740.810.8911.11根据统计资料,则利润
4、中位数( )A是16,与有正线性相关关系B是17,与有正线性相关关系C是17,与有负线性相关关系D是18,与有负线性相关关系【答案】B【解析】由题意,利润中位数是,而且随着利润的增加,支出也在增加,故与有正线性相关关系故选:B4(2021全国高一课时练习)从统计学的角度看,下列关于变量间的关系说法正确的是( )A人体的脂肪含量与年龄之间没有相关关系B汽车的重量和汽车每消耗汽油所行驶的平均路程负相关C吸烟量与健康水平正相关D气温与热饮销售好不好正相关【答案】B【解析】从统计学的角度看:在一定年龄段内,人体的脂肪含量与年龄之间有相关关系,A错误;汽车的重量和汽车每消耗汽油所行驶的平均路程是负相关关
5、系,B正确;吸烟量与健康水平是负相关关系,C错误;气温与热饮销售好不好是负相关关系,D错误故选:B考点二 相关系数的理解【例2-1】(2021安徽定远县育才学校高二期中(文)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )A0.2B0.8C0.98D0.7【答案】C【解析】相关系数的绝对值越大,越具有强大相关性,C相关系数的绝对值最大约接近1,C拟合程度越好故选:C【例2-2】(2021全国高二课时练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )ABCD【答案】A【解析】由给出的四组数据的散点图可以看出,题图1
6、和题图3是正相关,相关系数大于0,题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以接近于1,接近于,由此可得故选:A【一隅三反】1(2021宁夏海原县第一中学)在建立两个变量与的回归模型中,分别选择了个不同的模型,模型的相关指数为,模型的相关指数为,模型的相关指数为,模型的相关指数为,其中拟合效果最好的模型是( )A模型B模型C模型D模型【答案】C【解析】因为个不同的模型,模型的相关指数最大且最接近1,所以拟合效果最好的模型是模型,故选:C2(2021安徽淮南第一中学)如果发现散点图中所有的样本点都落在一条斜率为非0实数的直线上,则下列说法错误的是(
7、 )A解释变量和预报变量是一次函数关系B相关系数C相关指数D残差平方和为0【答案】B【解析】散点图中所有的样本点都落在一条斜率为非0实数的直线上,所以解释变量和预报变量是一次函数关系,且残差平方和为0,因此选项AD正确;由题意可知,若直线的斜率为正,则,若直线的斜率为负,则.故选:B.3(2021广西玉林市育才中学高二月考)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r10.837,r20.957,则( )A变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性B变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性C变量U
8、与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性D变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性【答案】C【解析】因为线性相关系数r10.837,r20.957,所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,X与Y之间的相关性弱于U与V之间的相关性.故选:C4(2021全国高二课时练习)相关变量,的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到回归直线方程,相关系数为;方案二:剔除点,根据剩下的数据得到回归直线方程,相关系数为.则( )ABCD【答案】D【解析】由题中散点图可知两变量负相关,所以,因为剔除点后
9、,剩下的数据线性相关性更强,更接近1,所以.故选D.5(2021山东威海市第一中学高二月考)对变量X,Y有观测数据(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)对变量U,V有观测数据(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),表示变量X,Y之间的线性相关系数,表示受最U,V之间的线性相关系数,则( )ABCD【答案】C【解析】由条件可知:第一组中的数据负相关,相关系数小于零;第二组中的数据正相关,相关系数大于零.所以有.故选:C6(2021全国高一课时练习)如图,个数据,去掉后,下列说法错误的是( )A与的相关性变强B残差
10、平方和变大C相关指数变大D解释变量与预报变量的相关性变强【答案】B【解析】由散点图知,去掉后,与的线性相关性加强,A正确;残差平方和变小,B错误;相关系数变大,相关指数变大,C正确;解释变量与预报变量的相关性变强,D正确故选:B考点三 相关系数的应用【例3】(2021全国高二课时练习)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第年与年销量(单位:万件)之间的关系如表:123412284256在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度附注:参考数据:,参考公式:相关系数【答案】作图见解析;与的相关系数近似为0.99
11、97,可以推断该公司的年销量与第年呈正线性相关,且线性相关程度很强【解析】作出散点图如图:由散点图可知,各点大致分布在一条直线附近,由此推断与线性相关由题中所给表格及参考数据得:,与的相关系数近似为0.9997,可以推断该公司的年销量与第年呈正线性相关,且线性相关程度很强【一隅三反】1(2021全国高二课时练习)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);附:相关系数公式.参考数据:,
12、.【答案】0.95,答案见解析.【解析】由已知数据可得,所以,所以相关系数.因为,所以可用线性回归模型拟合y与x的关系.2(2021全国高二课时练习)某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量(件)与相应的生产总成本(万元)的五组对照数据:产量(件)12345生产总成体(万元)3781012试求与的相关系数,并利用相关系数说明与是否具有较强的线性相关关系(若,则线性相关程度很高,可用线性回归模型拟合)参考公式:【答案】0.98,与具有较强的线性相关关系,可用线性回归方程拟合与的关系【解析】,相关系数,与具有较强的线性相关关系,
13、可用线性回归方程拟合与的关系3(2021贵州威宁高二期末(理)2021年4月20日我校高三学生参加了高考体检,为了解我校高三学生中男生的体重(单位:)与身高(单位:)是否存在较好的线性关系,体检机构搜集了7位我校男生的数据,得到如下表格:序号1234567身高166173185183178180174体重57627875716759根据表中数据计算得到关于的线性回归方程为(1)求;(2)已知,且当时,回归方程的拟合效果非常好;当时,回归方程的拟合效果良好试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由(的结果保留到小数点后两位)参考数据:【答案】(1);(2)该线性回归方程的拟合效果是良好的.【解析】(1)由题意可得,,又关于的线性回归方程为,所以 (2)由题意,所以,所以该线性回归方程的拟合效果是良好的.