1、第十章算法初步、统计、统计案例第四节 变量间的相关关系与统计案例命题分析预测学科核心素养对于回归分析,高考考查较多,主要考查求线性回归方程、利用回归方程进行预测,一般以解答题的形式出现,难度中等,有时也会以小题的形式考查变量的相关性;对于独立性检验,一般以解答题的第一问进行考查,常与概率知识相交汇命题.本节通过回归分析、独立性检验考查考生分析解决问题的能力,提升数学运算、直观想象、数据分析、逻辑推理、数学建模等核心素养.知识点一 变量间的相关关系1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是_;与函数关系不同,_是一种非确定性关系.(2)从散点图上看,点散布在
2、从左下角到右上角的区域内,两个变量的这种相关关系称为_,点散布在左上角到右下角的区域内,两个变量的相关关系为_.相关关系相关关系正相关负相关2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有_,这条直线叫做_.线性相关关系回归直线ybxa(4)相关系数:当r0时,表明两个变量_;当r0,则正相关;r0时,正相关;b0时,负相关.题型二 回归分析例(2021福州市模拟)随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y(单位:个)与一定范
3、围内的温度x(单位:)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:日期2日7日15日22日30日温度x/101113128产卵数y/个2325302616(1)从这5天中任选2天,记这2天药用昆虫的产卵数分别为m,n,求事件“m,n均不小于25”的概率;(2)科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y关于x的线性回归方程;若由线性回归方程得到的估计数据与所选出的检验
4、数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问中所得的线性回归方程是否可靠?题型三 独立性检验例(2021洛阳市统考)某共享单车经营企业欲向甲市投放单车,为制定适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比例随机抽取了300份,进行数据统计,具体情况如下表:(1)先用分层抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60人的样本,再用分层抽样的方法
5、将“年龄达到35岁”的被抽个体分配到“经常使用单车”和“偶尔使用单车”中去,求这60人中“年龄达到35岁且偶尔使用单车”的人数;为听取对发展共享单车的建议,调查小组专门组织所抽取的“年龄达到35岁且偶尔使用单车”的人员召开座谈会.会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列和数学期望.(2)从统计数据可直观得出“经常使用共享单车与年龄达到m岁有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,年龄m应取25还是35?请通过比较2的大小加以说明.经常使用单车偶尔使
6、用单车合计未达到25岁6733100达到25岁11387200合计180120300对点训练3(2021惠州调研)在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为13,且成绩分布在40,100,分数在80以上(含80)的同学获奖.按文理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如下.文科生理科生合计获奖5不获奖合计200(2)填写22列联表如下:文科生理科生合计获奖53540不获奖45115160合计50150200非线性回归问题中的核心素养数学建模、数学运算非线性回归的应用问题例为了研究一种昆虫的产卵数y(单位:个)和温度x(单位:)是否有关,现收集
7、了7组观测数据列于下表中,并作出了如图所示的散点图,发现样本点没有分布在某个带状区域内,两个变量不呈线性相关关系,现分别用模型:yC1x2C2与模型:yeC3xC4作为产卵数y和温度x的回归方程来建立两个变量之间的关系.温度x/20222426283032产卵数y/个610212464113322tx24004845766767849001 024zln y1.792.303.043.184.164.735.77(1)分别在下图(1)(2)中画出y关于t的散点图和z关于x的散点图,根据散点图判断哪一个模型更适宜作为昆虫的产卵数y关于温度x的回归方程类型?(给出判断即可,不必说明理由)(2)根据
8、表中数据,分别在两个模型下建立y关于x的回归方程,并在两个模型下分别估计温度为30 时的产卵数;(参考数据:e4.65104.58,e4.85127.74,e5.05156.02)解析:(1)画出y关于t的散点图,如图所示.画出z关于x的散点图,如图所示.非线性回归方程的求法(1)根据原始数据作出散点图;(2)根据散点图,选择恰当的拟合函数;(3)作恰当变换,将其转化成线性函数,求线性回归方程;(4)在(3)的基础上通过相应变换,即可得非线性回归方程.对点训练(2021汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:使用年数
9、x234567售价y201286.44.43zln y3.002.482.081.861.481.10下面是z关于x的折线图:(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少;(b、a小数点后保留两位有效数字)(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.z与x的线性回归方程是z0.36x3.62,又zln y,y关于x的回归方程是ye0.36x3.62.令x9,得ye0.3693.62e0.38,ln 1.460.38,y1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元.课时作业 巩固提升点击进入word.