1、高考资源网() 您身边的高考专家4.3统计模型4.3.1一元线性回归模型课后篇巩固提升必备知识基础练1.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线方程的回归系数为,回归截距是,那么必有()A.与r的符号相同B.与r的符号相同C.与r的符号相反D.与r的符号相反答案A解析由公式可知与r的符号相同.2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x/cm174176176176178儿子身高y/cm175175176177177则y对x的回归直线方程为()A.=x-1B.=x+1C.=88+xD.=176答案C解析设y对x的回归直线方
2、程为x,因为=176-176=88,所以y对x的回归直线方程为=88+x.3.下列说法正确的是()当相关系数r0时,表明变量x和y正相关;用相关系数r来衡量两个变量之间线性关系的强弱时,|r|越接近于1,相关性越弱;回归直线过样本点的中心();若回归直线方程为=0.85x-85.71,则当x=170时,y的值必为58.79.A.B.C.D.答案D解析由相关系数的意义知,当相关系数r0时,表明变量x和y正相关,故正确;用相关系数r来衡量两个变量之间线性关系的强弱时,|r|越接近于1,相关性越强,故错误;回归直线过样本点的中心(),故正确;若回归直线方程为=0.85x-85.71,则当x=170时
3、,y的预测值为58.79,故错误.故选D.4.某工厂的每月各项开支x与毛利润y(单位:万元)之间有如下关系,y与x的回归直线方程=6.5x+,则=()x24568y3040605070A.17.5B.17C.15D.15.5答案A解析由题意,根据表中的数据,可得=5,=50,即样本中心为(5,50),代入y与x的回归直线方程=6.5x+,解得=17.5.故选A.5.某商店为了了解热饮销售量y(单位:杯)与气温x(单位:)之间的关系,随机统计了某4天卖出的热饮的杯数与当天气温,并制作了表格:气温/181310-1销售量/杯24343864由表中数据算得回归直线方程x+中的-2,预测当气温为-5
4、时,热饮销售量大约为杯.已知回归系数-答案70解析根据表格中的数据可求得(18+13+10-1)=10,(24+34+38+64)=40.所以=40-(-2)10=60.所以=-2x+60.当x=-5时,=-2(-5)+60=70(杯).6.若回归直线方程中的回归系数=0,则相关系数r=.答案0解析相关系数r=的分子相同,故r=0.7.已知x,y的取值如下表:x2345y2.23.85.56.5从散点图分析,y与x线性相关,且回归直线方程为=1.42x+,则的取值为.答案-0.47解析由已知得=3.5,=4.5.又因为回归直线过(),所以4.5=3.51.42+,所以=-0.47.8.(201
5、8全国)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:y=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.519=226
6、.1(亿元).利用模型,该地区2018年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t
7、可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)关键能力提升练9.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到回归直线方程=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程=b2x+a2,相关系数为r2.则()A.0r1
8、r21B.0r2r11C.-1r1r20D.-1r2r10答案D解析由散点图得负相关,所以r1,r20.因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r|更接近1,所以-1r2r10.10.一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下:零件数x/个2345加工时间y/分钟26m4954根据上表可得回归直线方程=9.4x+9.1,则实数m的值为()A.37.3B.38C.39D.39.5答案C解析根据题意可得,=3.5,根据回归直线过中心点()可得=9.43.5+9.1,解得m=39.故选C.11.某工厂为了对新研发的一种产品进行合理定价,将
9、该产品事先拟定的价格进行试销,得到如下数据.单价x/元456789销量y/件908483807568由表中数据求得回归直线方程=-4x+,则=,当x=10元时预测销量为件.答案10666解析由题得(4+5+6+7+8+9)=,(90+84+83+80+75+68)=80,=80+4=106,x=10=106-40=66.12.在研究两个变量的线性相关关系时,观察散点图发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得回归直线方程=0.25x-2.58,则该模型的回归方程为.答案=e0.25x-2.58解析由回归直线方程=0.25x-2.58得ln y=0.25x-2.58,整
10、理得y=e0.25x-2.58,所以该模型的回归方程为=e0.25x-2.58.13.(2020山东沂水模拟)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大.某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如表:流量包的定价/(元/月)3035404550购买人数/万人18141085(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模
11、型拟合y与x的关系?并指出是正相关还是负相关;(2)求出y关于x的回归方程;若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求回归方程预测该市一个月内购买该流量包的人数能否超过20万人.参考数据:158,161,164.参考公式:相关系数r=,回归直线方程x+,其中.解(1)根据题意,得(30+35+40+45+50)=40,(18+14+10+8+5)=11.可列表如下i12345xi-10-50510yi-73-1-3-6(xi-)(yi-)-70-150-15-60根据表格和参考数据,得(xi-)(yi-)=-160,161.因而相关系数r=-0.99.由于|
12、r|0.99很接近1,因而可以用线性回归方程模型拟合y与x的关系.由于r0,故其关系为负相关.(2)=-0.64,=11+0.6440=36.6,因而y关于x的回归方程为=-0.64x+36.6.由知,若x=25,则=-0.6425+36.6=20.6,故若将流量包的价格定为25元/月,可预测该市一个月内购买该流量包的人数会超过20万人.学科素养拔高练14.(2020山东蒙阴实验中学高三期末)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,经统计得到如下数据:x12345678y1126144.53530.
13、5282524根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+和指数函数模型y=cedx分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为=96.54e-0.2x,ln y与x的相关系数r1=-0.94.参考数据其中ui=:uiyiyie-2183.40.340.1151.5336022 385.561.40.135(1)用反比例函数模型求y关于x的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;(3)该企业采取订单生产模式(根据订单数量进行生产,即
14、产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由.参考公式:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线u的斜率和截距的最小二乘估计分别为,相关系数r=.解(1)令u=,则y=a+可转化为y=a+bu,因为=45,所以=100,则=45-1000.34=11,所以=11+100u,所以y关于x的回
15、归方程为=11+.(2)y与的相关系数为r2=0.99,因为|r1|r2|,所以用反比例函数模型拟合效果更好,当x=10时,y=+11=21(元),所以当产量为10千件时,每件产品的非原料成本为21元.(3)()若产品单价为100元,记企业利润为X(千元),订单为9千件时,每件产品的成本为元,企业的利润为611(千元),订单为10千件时,每件产品的成本为31元,企业的利润为690(千元),企业利润X(千元)的分布列为X611690P0.80.2所以E(X)=6110.8+6900.2=626.8(千元).()若产品单价为90元,记企业利润为Y(千元),订单为10千件时,每件产品的成本为31元,企业的利润为590(千元),订单为11千件时,每件产品的成本为元,企业的利润为659(千元),企业利润Y(千元)的分布列为Y590659P0.30.7所以E(Y)=5900.3+6490.7=638.3(千元),因为626.8638.3,故企业要想获得更高利润,产品单价应选择90元.- 7 - 版权所有高考资源网