1、十七一元线性回归模型及其应用(25分钟50分)一、选择题(每小题5分,共20分)1.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:甲乙丙丁R20.980.780.500.85哪位同学建立的回归模型拟合效果最好()A.甲B.乙C.丙D.丁【解析】选A.相关指数R2越大,表示回归模型的效果越好.2.2020年初,新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:周数(x)12345治愈人数(Y)21736103142由表格可得Y关于
2、x的非线性经验回归方程为=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为()A.5B.-13C.13D.0【解析】选C.因为=(1+4+9+16+25)=11,=(2+17+36+103+142)=60,所以a=60-611=-6,则Y关于x的非线性经验回归方程为=6x2-6.取x=4,得=642-6=90,所以此回归模型第4周的预报值为90,则此回归模型第4周的残差为103-90=13.3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x/万元8.28.610.011.311.9支出Y/万元6.27.58.08.59.8根据上表可
3、得经验回归方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元的家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元【解析】选B.由题意可得=(8.2+8.6+10.0+11.3+11.9)=10,=(6.2+7.5+8.0+8.5+9.8)=8,所以=8-0.7610=0.4,所以线性经验回归方程为=0.76x+0.4,把x=15代入,可得=0.7615+0.4=11.8.【加练固】已知具有线性相关关系的变量x,Y满足一组数据如表所示.若Y关于x的经验回归方程为=3x-1.5,则m的值为()x0123Y-11m8A.4B.C.5D.6【解析】选
4、A.由题意可知,样本点的中心一定在回归直线上,所以代入方程可得m=4.4.已知x与Y之间的几组数据如表:x123456Y021334假设根据上表数据所得经验回归方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.b,aB.b,aC.aD.b,a.二、填空题(每小题5分,共10分)5.已知具有线性相关的变量x,y,设其样本点为Pi(xi,yi)(i=1,2,6),经验回归方程为=2x+,若+=(12,18)(O为坐标原点),则=_.【解析】由题意可得,=(x1+x2+x3+x4+x5+x6)=2,=(y1+y2+y6)=3.经
5、验回归方程为=2x+,所以3=22+,解得=-1.答案:-16.已知n组成对样本数据确定的经验回归方程为=-x+2且=4,通过残差分析,发现两组成对样本数据(-1.7,2.9),(-2.3,5.1)误差较大,除去这两组成对样本数据后,重新求得经验回归直线的斜率估计值为-1.5,则当x=-4时,=_.【解析】由样本数据点集(xi,yi)|i=1,2,n求得的经验回归方程为=-x+2,且=4,所以=-2,故数据的样本中心点为(-2,4),去掉(-1.7,2.9),(-2.3,5.1),重新求得的经验回归直线的斜率估计值为-1.5,经验回归方程设为:=-1.5x+,代入(-2,4),求得=1,所以经
6、验回归直线的方程为:y=-1.5x+1,将x=-4代入经验回归方程,求得y的估计值为-1.5(-4)+1=7.答案:7三、解答题(每小题10分,共20分)7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:单价x(元)88.28.48.68.89销量Y(件)908483807568(1)求经验回归方程=x+,其中=-20,=-;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(1)=(8+8.2+8.4+8.6+8.8+9)=8.5.=
7、(90+84+83+80+75+68)=80.=+20=80+208.5=250,所以经验回归方程为=-20x+250.(2)工厂获得的利润z=(x-4)y=-20x2+330x-1 000,由二次函数知识可知当x=时,zmax=361.25(元).故该产品的单价应定为8.25元.8.在一段时间内,某淘宝网店一种商品的销售价格x(元)和日销售量Y(件)之间的一组数据为:价格x(元)2220181614日销售量Y(件)3741435056求出Y关于x的经验回归方程,并说明该方程拟合效果的好坏.参考数据:xiyi=3 992,=1 660.【解析】作出散点图(此处略),观察散点图,可知这些点散布在
8、一条直线的附近,故可用线性回归模型来拟合数据.因为=18,=45.4.所以=-2.35,=45.4-(-2.35)18=87.7.所以经验回归方程为=-2.35x+87.7.yi-i与yi-的值如表:yi-i10.3-2.4-0.11.2yi-8.4-4.4-2.44.610.6计算得(yi-i)2=8.3,(yi-)2=229.2,所以R2=1-0.964.因为0.964很接近于1,所以该模型的拟合效果比较好.(15分钟30分)1.(5分)若一函数模型为y=sin2+2sin +1,为将y转化为t的经验回归方程,则需作变换t等于()A.sin2B.(sin +1)2C.D.以上都不对【解析】
9、选B.因为y是关于t的经验回归方程,实际上就是y是关于t的一次函数,又因为y=(sin +1)2,若令t=(sin +1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.2.(5分)在生物学上,有隔代遗传的现象.已知某数学老师的体重为62 kg,他的曾祖父、祖父、父亲、儿子的体重分别为58 kg、64 kg、58 kg、60 kg.如果体重是隔代遗传,且呈线性相关,根据以上数据可得解释变量x与预报变量的回归方程为=x+,其中=0.5,据此模型预测他的孙子的体重约为()A.58 kgB.61 kgC.65 kgD.68 kg【解析】选B.由于体重是隔代遗传,且呈线性相关,
10、则取数据(58,58),(64,62),(58,60),得=60,=60,即样本点的中心为(60,60),代入=x+,得=60-0.560=30,则=0.5x+30,取x=62,可得=0.562+30=61 kg.故预测他的孙子的体重约为61 kg.3.(5分)对某台机器购置后的运行年限x(x=1,2,3,)与当年利润Y的统计分析知x,Y具备线性相关关系,经验回归方程为=10.47-1.3x,估计该台机器最为划算的使用年限为_年.【解析】当年利润小于或等于零时应该报废该机器,当y=0时,令10.47-1.3x=0,解得x8,故估计该台机器最为划算的使用年限为8年.答案:84.(5分)以模型y=
11、cekx去拟合一组数据时,为了求出非经验回归方程,设z=ln y,其变换后得到经验回归方程=0.3x+4,则c=_.【解析】由题意,得ln(cekx)=0.3x+4,所以ln c+kx=0.3x+4,所以ln c=4,所以c=e4.答案:e45.(10分)如表为收集到的一组数据:x21232527293235Y711212466115325试建立Y与x之间的回归方程.【解析】作出散点图,如图.从散点图中可以看出x与Y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线的周围.令Z=ln Y,则变换后的样本点分布在直线=x+的周围,这样就可以利用线性经验回归模型来建立非线性经验
12、回归方程了,数据可以转化为:x21232527293235Z1.9462.3983.0453.1784.1904.7455.784求得经验回归方程为=0.272x-3.849,所以=e0.272x-3.849.5 G网络是一种先进的高频传输技术,我国的5 G技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款5 G手机,现调查得到该款5 G手机上市时间x和市场占有率Y(单位:%)的几组相关对应数据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月,5代表2019年12月,根据数据得出Y关于x的经验回归方程为=0.042x-.若用此方程分析并预测该款手机市场占有率的变化趋势,则最早何时该款5 G手机市场占有率能超过0.5%(精确到月)()A.2020年6月B.2020年7月C.2020年8月D.2020年9月【解析】选C.根据表中数据,得=3,=(0.02+0.05+0.1+0.15+0.18)=0.1,所以0.1=0.0423-,=0.026,所以经验回归方程为y=0.042x-0.026,由0.042x-0.0260.5,得x13,预计上市13个月时,即最早在2020年8月,市场占有率能超过0.5%.