1、第三章1 A级基础巩固一、选择题1关于回归分析,下列说法错误的是(D)A回归分析是研究两个具有相关关系的变量的方法B散点图中,解释变量在x轴,预报变量在y轴C回归模型中一定存在随机误差D散点图能明确反映变量间的关系解析用散点图反映两个变量间的关系时,存在误差2由变量x与y相对应的一组数据(1,y1)、(5,y2)、(7,y3)、(13,y4)、(19,y5)得到的线性回归方程为2x45,则(D)A135B90 C67 D63解析(1571319)9,245,294563,故选D3观测两个相关变量,得到如下数据:x1234554321y0.923.13.95.154.12.92.10.9则两变量
2、之间的线性回归方程为(B)A0.5x1 BxC2x0.3 Dx1解析因为0,0,根据回归直线方程必经过样本中心点(,)可知,回归直线方程过点(0,0),所以选B4一位母亲记录了儿子39岁的身高,数据(略),由此建立的身高与年龄的回归模型为7.19x73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(C)A身高一定是145.83cm B身高在145.83cm以上C身高在145.83cm左右 D身高在145.83cm以下解析将x的值代入回归方程7.19x73.93时,得到的值是年龄为x时,身高的估计值,故选C5(2019深圳一模)其食品研究部门为了解一种酒品的储藏年份与芳香度之间的相
3、关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表).年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到回归方程1.03x1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为(A)A6.1 B6.28C6.5 D6.8解析由表中数据:(014568)4,回归方程1.03x1.13,1.0341.135.25,(1.31.85.6?7.49.3)5.25,解得:?6.1.故选A6设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为
4、0.85x85.71,则下列结论中不正确的是(D)Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1cm,则其体重约增加0.85kgD若该大学某女生身高为170cm,则可断定其体重必为58.79kg解析本题考查线性回归方程D项中身高为170cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系二、填空题7下列五个命题,正确命题的序号为_.任何两个变量都具有相关关系;圆的周长与该圆的半径具有相关关系;某商品的需求量与该商品的价格是一种非确定性关系;根据散点图求得的回归直线方程可能是没有意义的;两个变量间的相关关系可以通过回
5、归直线,把非确定性问题转化为确定性问题进行研究解析变量的相关关系是变量之间的一种近似关系,并不是所有的变量都有相关关系,而有些变量之间是确定的函数关系例如,中圆的周长与该圆的半径就是一种确定的函数关系;另外,线性回归直线是描述这种关系的有效方法;如果两个变量对应的数据点与所求出的直线偏离较大,那么,这条回归直线的方程就是毫无意义的8在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg)由散点图初步判定其具有线性相关关系,则由此得到的回归方程的斜率是_4.75_.施化肥量x15202530354045水稻产量y33034536540544545
6、0455解析列表如下,i1234567xi15202530354045yi330345365405445450455xiyi4 9506 9009 12512 15015 57518 00020 47530,399.3,7 000,iyi87 175则4.75.回归方程的斜率即回归系数.9以下是某地区的降雨量与年平均气温的一组数据:年平均气温()12.5112.8412.8413.6913.3312.7413.05年降雨量(mm)542507813574701432464根据这组数据可以推断,该地区的降雨量与年平均气温_不具有_相关关系(填“具有”或“不具有”)解析画出散点图,观察可知,降雨量
7、与年平均气温没有相关关系三、解答题10为了迎接2019年世界男篮世界杯,某协会组织了一次“迎2019世界杯,手工制作助威旗”活动,将男篮世界杯的标志以手工刺绣的方式刺绣到红色的三角形的旗子上面,来为世界杯加油在10次制作中测得的数据如下:助威旗数x(个)102030405060708090100加工时间Y(小时)626875818995102108115122试问:(1)x与Y是否具有线性相关关系?(2)如果x与Y具有线性相关关系,求出Y对x的回归直线方程,并根据回归直线方程,预测加工2 010个助威旗需多少天(精确到1)?注:每天工作8小时(参考数据:55,91.7,38 500,87 77
8、7,iyi55 950,38 500105528 250,91,61)解析(1)作散点图如图所示从图中可以看出,各点都散布在一条直线附近,即它们线性相关(2)由所给数据求得b0.668ab91.70.6685554.96Y对x的回归直线方程为54.960.668x当x2 010时,54.960.6682 0101 397.64(小时)又1 397.648174.705(天)加工2 010个助威旗所需时间约为175天B级素养提升1已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为x.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程
9、为ybxa,则以下结论正确的是(C)Ab,a Bb,aCa Db,a解析本题考查线性回归方程,考查运算能力由公式求得,代入(,)求得,而由两点确定的方程为y2x2,a.2(2019武汉高二检测)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄2327394145495053565860脂肪9.517.821.225.927.526.328.229.631.433.535.2通过计算得到回归方程为0.577x0.448,利用这个方程,我们得到年龄37岁时体内脂肪含量为20.90%,那么数据20.90%的意义是(D)A某人年龄37岁,他体内脂肪含量为20.90%B某人年龄3
10、7岁,他体内脂肪含量为20.90%的概率最大C某人年龄37岁,他体内脂肪含量的期望值为20.90%D20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计解析利用回归方程0.577x0.448,可得x37时,20.901,即到年龄37岁时体内脂肪含量约为20.90%,故20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计,故选D二、填空题3已知两个变量x和y之间有线性相关性,5次试验的观测数据如下表:x100120140160180y4554627592那么变量y关于x的回归方程是_0.575x14.9_.解析根据公式计算可得0.575,14.9,所以回归
11、直线方程是0.575x14.9.4某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x()之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x()381217旬销售量y(件)55m3324由表中数据算出线性回归方程bxa中的b2,样本中心点为(10,38)(1)表中数据m_40_;(2)气象部门预测三月中旬的平均气温约为22,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为_14件_.解析(1)由38,得m40.(2)由ab得a58,故2x58,当x22时,14,故三月中旬的销售量约为14件三、解答题5以下是某地搜集到的新房屋
12、的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150m2时的销售价格解析(1)数据对应的散点图如下图所示:(2)xi109,lxx (xi)21 570,23.2,lxy (xi)(yi)308.设所求回归直线方程为x,则0.196 2,1.816 6.故所求回归直线方程为0.196 2x1.816 6.(3)据(2),当x150m2时,销售价格的估计值为0.196 21501.816 631.246
13、 6(万元)6下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程yx;(3)已知该 厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)解析(1)由题设所给数据,可得散点图如图:(2)由对照数据,计算得86,4.5,3.5,已知iyi66.5,所以,由最小二乘法确定的回归方程的系数
14、0.7, 3.50.74.50.35.因此,所求的线性回归方程为y0.7x0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,知降低的生产能耗为90(0.71000.35)19.65(吨标准煤)C级能力拔高(2018全国卷理,18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t
15、.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值(2)你认为用哪个模型得到的预测值更可靠?并说明理由解析(1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,可得该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠