1、温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。十七一元线性回归模型及其应用(20分钟40分)一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全的得3分,有选错的得0分)1.(多选题)研究变量x,Y得到一组样本数据,进行回归分析,以下说法正确的是()A.残差平方和越小的模型,拟合的效果越好B.用相关指数R2来刻画回归效果,R2越小说明拟合效果越好C.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量平均增加0.2个单位D.若变量Y和x之间的相关系数为r=-0.946 2,则变量Y
2、和x之间的负相关性很强【解析】选ACD.A可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故A正确;B用相关指数R2来刻画回归效果,R2越大说明拟合效果越好,故B错误;C在经验回归方程=0.2x+0.8中,当解释变量x每增加1个单位时,响应变量平均增加0.2个单位,故C正确;D若变量Y和x之间的相关系数为r=-0.946 2,r的绝对值趋向于1,则变量Y和x之间的负相关性很强,故D正确.2.为研究某种细菌在特定环境下随时间变化的繁殖情况,得到如表实验数据:天数x/天3456繁殖个数Y/千个2.5344.5由最小二乘法得Y与x的经验回归方程为=x+0.35,则样本在(4,3
3、)处的残差为()A.-0.15B.0.15C.-0.25D.0.25【解析】选A.因为=4.5,=3.5,所以有3.5=4.5+0.35=0.7,当x=4时,=0.74+0.35=3.15,所以样本在(4,3)处的残差为:3-3.15=-0.15.3.在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg、64 kg、58 kg、60 kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与响应变量的回归方程为=x+,其中=0.5,据此模型预测他的孙子的体重约为()A.58 kgB.61 kgC.65 kgD.68 kg【
4、解析】选B.由于体重是隔代遗传,且呈线性相关,则取数据(58,58),(64,62),(58,60),得=60,=60,即样本点的中心为(60,60),代入=x+,得=60-0.560=30,则=0.5x+30,取x=62,可得=0.562+30=61 kg.故预测他的孙子的体重约为61 kg.4.某养殖场需要通过某装置对养殖车间进行恒温控制,为了解用电量Y(kWh)与气温x()之间的关系,随机统计了某5天的用电量与当天气温,并制作了对照表:气温/34567用电量/kWh2.5344.56若利用经验回归方程预测x=10时的用电量为8.25 kWh,则预测x=12时的用电量为()A.8.75 k
5、WhB.9.86 kWhC.9.95 kWhD.12.24 kWh【解析】选C.由表中数据得=5,=4,设经验回归方程为=x+,所以,解得=0.85,=-0.25,所以经验回归方程为=0.85x-0.25,当x=12时,=0.8512-0.25=9.95(kWh).二、填空题(每小题5分,共10分)5.某数学老师身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.【解析】设父亲身高为x cm,儿子身高为Y cm,则x173170176Y170176182=173,=176,=
6、1,=-=176-1173=3,所以=x+3,当x=182时,=185.答案:1856.已知变量x,Y线性相关,由观测数据算得样本的平均数=4,=5,经验回归方程=x+中的系数,满足+=4,则经验回归方程为.【解析】由题知,点(4,5)在回归直线上,则4+=5,又+=4,所以=,=,即经验回归方程为=x+.答案:=x+三、解答题7.(10分)光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能,近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如表:年份2012年2013年2014年2015年2016年2017年2018年2019年年份代码12345678新增光伏发
7、电装机量Y兆瓦0.40.81.63.15.17.19.712.2某位同学分别用两种模型:=x2+;=x+进行拟合,得到相应的经验回归方程并进行残差分析,残差图如表(注:残差等于yi-).经过计算得=72.8,=42,=686.8,=3 570,其中ti=,=ti.(1)根据残差图,比较模型,的拟合效果,应该选择哪个模型?并简要说明理由.(2)根据(1)的判断结果及表中数据建立Y关于x的经验回归方程,并预测该地区2021年新增光伏装机量是多少.(在计算回归系数时精确到0.01)附:回归直线的斜率和截距的最小二乘估计公式分别为:=,=-.【解析】(1)选择模型.理由如下:根据残差图可以看出,模型的
8、估计值和真实值比较相近,模型的残差值相对较大一些,所以模型的拟合效果相对较好.(2)由(1)可知,Y关于x的经验回归方程为=x2+,令t=x2,则=t+.由所给数据可得=ti=(1+4+9+16+25+36+49+64)=25.5.=yi=(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,所以=0.19,=-5-0.1925.50.16,所以Y关于x的经验回归方程为=0.19x2+0.16预测该地区2021年新增光伏发电装机量为=0.19102+0.16=19.16(兆瓦).(20分钟40分)一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全的得3分,有
9、选错的得0分)1.已知变量x,Y的取值如表:x12345Y1015304550由散点图分析可知Y与x线性相关,且求得经验回归方程为=x-3,据此可预测:当x=8时,的值为()A.63B.74C.85D.96【解析】选C.由题得=3,=30.故样本点的中心的坐标为(3,30),代入=x-3,得=11.所以=11x-3,取x=8,得=118-3=85.2.两个线性相关变量x与Y的统计数据如表:x99.51010.511Y1110865其经验回归方程是=x+40,则相对应于点的残差e为()A.0.1B.0.2C.-0.1D.-0.2【解析】选B.=10,=8,所以8=10+40,所以=-3.2,故=
10、-3.2x+40.当x=11时,=-3.211+40=4.8,故e=5-4.8=0.2.3.(多选题)设某大学的女生体重Y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(i=1,2,n),用最小二乘法建立的经验回归直线方程为=0.85x-85.71,则下列结论中正确的是()A.Y与x具有正的线性相关关系B.回归直线过样本中心点(,)C.若该大学某女生身高增加2 cm,则其体重约增加1.70 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg【解析】选ABC.根据Y与x的经验回归直线方程为=0.85x-85.71,其中0.850说明y与x具有正的
11、线性相关关系,A正确;回归直线过样本中心点(,),B正确;由回归直线方程知,若该大学某女生身高增加1 cm,则其体重约增加0.85 kg,那么若该大学某女生身高增加2 cm,则其体重约增加1.70 kg,故C正确;若该大学某女生身高为170 cm,则可预测其体重为58.79 kg,不可断定其体重必为58.79 kg,D错误.4.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归直线方程=0.2x+3,则c,k的值分别是()A.e2,0.6B.e2,0.3C.e3,0.2D.e4,0.6【解析】选C.因为y=cekx,等式两边同时取对数可得ln y=
12、ln(cekx)=ln c+ln ekx=kx+ln c,设z=ln y,则上式可化为z=kx+ln c,因为z=0.2x+3,则k=0.2,ln c=3,所以c=e3,k=0.2.二、填空题(每小题5分,共10分)5.某公司调查了商品A的广告投入费用x(万元)与销售利润Y(万元)的统计数据,如表:广告费用x(万元)2356销售利润Y(万元)57911由表中的数据得经验回归直线方程为=x+,则当x=7时销售利润y的估值为万元.【解析】由题表中数据可得=4,=8,所以=1.4,所以=-=8-1.44=2.4,故经验回归方程为=1.4x+2.4,所以当x=7时,=1.47+2.4=12.2.答案:
13、12.26.在研究两个变量的相关关系时,观察散点图,发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得经验回归方程=0.25x-2.58,则该模型的经验回归方程为.【解析】由经验回归方程=0.25x-2.58得ln =0.25x-2.58,整理得=e0.25x-2.58,所以该模型的经验回归方程为=e0.25x-2.58.答案:=e0.25x-2.58三、解答题7.(10分)生物学家预言,21世纪将是细菌发电造福人类的时代.说起细菌发电,可以追溯到1910年,英国植物学家利用铂作为电极放进大肠杆菌的培养液里,成功地制造出世界上第一个细菌电池.然而各种细菌都需在最适生长温度的范
14、围内生长.当外界温度明显高于最适生长温度,细菌被杀死;如果在低于细菌的最低生长温度时,细菌代谢活动受抑制.为了研究某种细菌繁殖的个数Y是否与在一定范围内的温度x有关,现收集了该种细菌的6组观测数据如表:温度x/212324272932繁殖个数Y/个71121245877经计算得=550,=3 946,线性回归模型的残差平方和=345.其中xi,yi分别为观测数据中的温度与繁殖数,i=1,2,3,4,5,6.参考数据:e7.4461 713,e8.06053 167,(1)求Y关于x的经验回归方程=x+a(精确到0.1);(2)若用非线性回归模型求得Y关于x回归方程为=0.075e0.219x,
15、且非线性回归模型的残差平方和=319.()用决定系数R2说明哪种模型的拟合效果更好;()用拟合效果好的模型预测温度为34时,该种细菌的繁殖数(结果取整数).附:一组数据,其回归直线=x+的斜率和截距的最小二乘法估计为=,=-;决定系数R2=1-【解析】(1)由题意得=xi=26,=yi=33,=84,=6.5,=33-6.526=-136,所以y关于x的经验回归方程为=6.5x-136.(2)()经验回归方程=6.5x-136对应的决定系数为=1-=1-.非线性回归模型=0.075e0.219x对应的决定系数为=1-=1-.因为345319,所以,所以回归方程=0.075e0.219x比经验回归方程=6.5x-136拟合效果更好.()由()得当温度x=34时,=0.075e0.219340.0751 713128,即当温度x=34时,该种细菌的繁殖数估计为128个.关闭Word文档返回原板块