1、第七章统计案例1一元线性回归1.1直线拟合1.2一元线性回归方程课后篇巩固提升合格考达标练1.(2021江苏常州一模)如果在一次试验中,测得(X,Y)的四组数值分别是(1,2.2),(2,3.3),(4,5.8),(5,6.7),则Y关于X的线性回归方程是()A.Y=0.15X+4.05B.Y=X+1.45C.Y=1.05X+1.15D.Y=1.15X+1.05答案D解析 x=14(1+2+4+5)=3,y=14(2.2+3.3+5.8+6.7)=4.5,b=i=1nxiyi-nxyi=1nxi2-nx2=2.2+6.6+45.8+56.7-434.51+4+16+25-49=11.510=1
2、.15,a=y-b x=4.5-1.153=1.05,线性回归方程为Y=1.15X+1.05.故选D.2.已知X与Y之间的一组数据如表:X3456Y30406050若Y与X线性相关,根据上表求得Y与X的线性回归方程Y=bX+a中的b为8,据此模型预测X=7时,Y的值为()A.70B.63C.65D.66答案C解析 x=14(3+4+5+6)=4.5,y=14(30+40+60+50)=45,则样本点的中心的坐标为(4.5,45),代入Y=bX+a中,得45=84.5+a,可得a=9.Y=8X+9.取X=7,可得Y=87+9=65.3.已知两个具有线性相关关系的变量的一组数据(x1,y1),(x
3、2,y2),(xn,yn),且线性回归方程为Y=a+bX,则最小二乘法的思想是()A.使得i=1nyi-(a+bxi)最小B.使得i=1n|yi-(a+bxi)|最小C.使得i=1nyi2-(a+bxi)2最小D.使得i=1nyi-(a+bxi)2最小答案D解析最小二乘法是通过最小化误差的平方和寻找数据的最佳函数匹配,利用最小二乘法使得这组数据与实际数据之间误差的平方和为最小,即使得i=1nyi-(a+bxi)2最小.4.某学校的课外活动兴趣小组对两个相关变量收集到5组数据如下表:X1020304050Y62758189由最小二乘法求得线性回归方程为Y=0.67X+54.9,现发现表中有一个数
4、据模糊不清,请推断该点数据的值为()A.67B.68C.69D.70答案B解析由题意可得x=15(10+20+30+40+50)=30,设模糊不清的数据为t,则有y=15(62+t+75+81+89)=15(t+307),因为线性回归方程Y=0.67X+54.9过样本点的中心(x,y),所以15(t+307)=0.6730+54.9,解得t=68.5.患感冒与昼夜温差大小相关,某居民小区诊所的张医生记录了四月份四个周一的温差情况与因患感冒到诊所看病的人数如下表:昼夜温差X/1113128感冒就诊人数Y/人25292616用最小二乘法求出Y关于X的线性回归方程为.参考公式:b=i=1n(xi-x
5、)(yi-y)i=1n(xi-x)2,a=y-b x.答案Y=187X-307解析由数据得x=11+13+12+84=11,y=25+29+26+164=24,由参考公式,得b=(11-11)(25-24)+(13-11)(29-24)+(12-11)(26-24)+(8-11)(16-24)(11-11)2+(13-11)2+(12-11)2+(8-11)2=187,a=24-18711=-307.所以Y关于X的线性回归方程为Y=187X-307.6.在调查某社区居民的月收入X(单位:元)和其月消费Y(单位:元)的关系时,抽取了一个样本容量为100的样本,用最小二乘法求得线性回归方程Y=0.
6、6X+300.若居民张先生月收入为3 000元,则他的月消费一定为2 100元,这种说法对吗?为什么?解这种说法错误.由线性回归方程计算得Y=0.63 000+300=2 100,只能说月收入3 000元的居民的月消费的估计值为2 100元.等级考提升练7.(2021广东潮州一模)为了研究某班学生的脚长X(单位:厘米)和身高Y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出Y与X之间有线性相关关系,设其线性回归方程为Y=bX+a,已知i=110xi=220,i=110yi=1 610,b=4,若该班某学生的脚长为24厘米,据此估计其身高为()厘米.A.165B.16
7、9C.173D.178答案B解析由题意可得x=22010=22,y=1 61010=161,线性回归方程经过样本中心点,则161=422+a,故a=73,线性回归方程为Y=4X+73,据此可预测其身高为424+73=169(厘米).8.如表是关于某设备的使用年限X(单位:年)和所支出的维修费用Y(单位:万元)的统计表:X/年23456Y/万元3.44.25.15.56.8由上表可得线性回归方程Y=0.81X+a,若规定:维修费用Y不能超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为()A.7年B.8年C.9年D.10年答案D解析由已知表格,得x=15(
8、2+3+4+5+6)=4,y=15(3.4+4.2+5.1+5.5+6.8)=5,因为线性回归直线恒过样本点的中心(x,y),所以5=0.814+a,解得a=1.76,所以线性回归方程为Y=0.81X+1.76,由Y10,得0.81X+1.7610,解得X8248110.17,由于XN+,所以据此模型预测,该设备使用年限的最大值为10年.9.(多选题)两个相关变量X,Y的5组对应数据如表:X8.38.69.911.112.1Y5.97.88.18.49.8根据上表,可得线性回归方程Y=bX+a,求得b=0.78.据此估计,以下结论正确的是()A.x=10B.y=9C.a=0.2D.当X=15时
9、,Y=11.95答案AC解析由题意可知x=15(8.3+8.6+9.9+11.1+12.1)=10,所以A正确;y=15(5.9+7.8+8.1+8.4+9.8)=8,所以B不正确;可得a=y-bx=8-0.7810=0.2,所以C正确;当X=15时,Y=0.7815+0.2=11.90,所以D不正确.10.已知一组数据点:Xx1x2x8Yy1y2y8用最小二乘法得到其线性回归方程为Y=-2X+4,若数据x1,x2,x8的平均数为1,则i=18yi=.答案16解析由题意,x=1,设样本点的中心为(1,y),又线性回归方程为Y=-2X+4,则y=-21+4=2,i=18yi=82=16.11.2
10、019年末至2020年初,某在线教育公司为了适应线上教学的快速发展,近5个月加大了对该公司的网上教学使用软件的研发投入,过去5个月资金投入量X(单位:百万元)和收益Y(单位:百万元)的数据如下表:月份2019年11月2019年12月2020年1月2020年2月2020年3月资金投入量/百万元2481012收益/百万元14.2120.3131.1837.8344.67若Y与X的线性回归方程为Y=3X+a,则资金投入量为16百万元时,该月收益的预测值为百万元.答案56.04解析由题意得,x=2+4+8+10+125=7.2,y=14.21+20.31+31.18+37.83+44.675=29.6
11、4,所以a=y-b x=29.64-37.2=8.04.所以Y关于X的线性回归方程为Y=3X+8.04.把X=16代入线性回归方程得Y=316+8.04=56.04,故预测值为56.04百万元.12.某地区2014年至2020年农村居民家庭人均纯收入Y(单位:万元)的数据如表:年份2014201520162017201820192020年份代号X1234567人均纯收入Y2.93.33.64.44.85.25.9(1)用最小二乘法求线性回归方程Y=bX+a;(2)利用(1)中的线性回归方程,分析2014年至2020年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2021年农村居民家庭人均
12、纯收入.参考公式:b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nx yi=1nxi2-nx2,a=y-b x.解(1)由表中数据,得x=17(1+2+3+4+5+6+7)=4,y=17(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,故b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.69+4+1+0+1+4+9=0.5,a=y-b x=4.3-0.54=2.3,Y关于X的线性回归方程为Y=0.5X+2.3;(2)由(1)可知b=0.5
13、0,故2014年至2020年该地区农村居民家庭人均纯收入在逐年增加,平均每年增加0.5万元;当X=8时,Y=0.58+2.3=6.3(万元),预测该地区2021年农村居民家庭人均纯收入为6.3万元.新情境创新练13.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为X(单位:小时),大棚蔬菜产量为Y(单位:千斤每亩),记w=ln X.(1)根据散点图判断,Y=a+bX与Y=c+dln X,哪一个适宜作为大棚蔬菜产量Y关于光照时
14、长X的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立Y关于X的回归方程;(3)根据实际种植情况,发现上述回归方程在光照时长位于614小时内拟合程度良好,利用(2)中所求方程估计当光照时长为e2小时(自然对数的底数e2.718 28)时,大棚蔬菜亩产约为多少(结果保留两位小数).参数数据:i=120xii=120yii=120wii=120xi2i=120yi2i=120wi2i=120xiyii=120wiyi290102.4524 870540.281371 578.2272.1参考公式:Y关于X的线性回归方程Y=bX+a,b=i=1nxiyi-nx
15、yi=1nxi2-nx2,a=y-b x.解(1)由散点图可知,Y=c+dln X适宜作为大棚蔬菜产量Y关于光照时长X的回归方程类型;(2)记w=ln X,则Y=c+dln X化为Y=dw+c,由表中数据可知,w=120i=120wi=2.6,y=120i=120yi=120102.4=5.12,d=i=120wiyi-20wyi=120wi2-20w2=272.1-202.65.12137-202.62=5.861.83.26,c=y-d w=5.12-3.262.6-3.36.Y关于X的回归方程为Y=3.26ln X-3.36;(3)在Y=3.26 ln X-3.36中,取X=e2,可得Y=3.26ln e2-3.36=6.52ln e-3.36=6.521-3.36=3.16.估计当光照时长为e2小时时,大棚蔬菜亩产约为3.16千斤.