1、第三章3.1请同学们认真完成练案17A级基础巩固一、选择题1(2020重庆模拟)某公司为确定明年投入某产品的广告支出,对近5年的广告支出m(单位:百万元)与销售额y(单位:百万元)进行了初步统计,得到下列表格中的数据:y3040p5070m24568经测算,年广告支出m与年销售额y满足线性回归方程6.5m17.5,则p的值为(D)A45B50C55D60解析5,6.5517.550,50,解得p60故选D2为了解某城镇居民的家庭年收入与年支出的相关关系,随机抽查5户家庭得如下数据表,根据数据表可得回归直线方程为0.76x0.4,则m(D)收入x(万元)8.28.610.011.311.9支出y
2、(万元)6.2m8.08.59.8A6.8 B7.0C7.1D7.5解析计算(8.28.61011.311.9)10,(6.2m8.08.59.8)6.5,回归直线方程0.76x0.4,650.76100.4解得m7.5故选D3(2020深圳一模)某食品研究部门为了解一种酒品的储藏年份与芳香度之间的相关关系,在市场上收集到了一部分不同年份的该酒品,并测定了其芳香度(如表).年份x014568芳香度y1.31.85.67.49.3由最小二乘法得到回归方程1.03x1.13,但不小心在检测后滴到表格上一滴检测液,污损了一个数据,请你推断该数据为(A)A6.1B6.28C6.5D6.8解析由表中数据
3、:(014568)4,回归方程1.03x1.13,1.0341.135.25,(1.31.85.6?7.49.3)5.25,解得:?6.1故选A4观测两个相关变量,得到如下数据:x1234554321y0.923.13.95.154.12.92.10.9则两变量之间的线性回归方程为(B)A0.5x1BxC2x0.3Dx1解析因为0,0,根据回归直线方程必经过样本中心点(,)可知,回归直线方程过点(0,0),所以选B5一位母亲记录了儿子39岁的身高,数据(略),由此建立的身高与年龄的回归模型为7.19x73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(C)A身高一定是145.83
4、 cmB身高在145.83 cm以上C身高在145.83 cm左右D身高在145.83 cm以下解析将x的值代入回归方程7.19x73.93时,得到的值是年龄为x时,身高的估计值,故选C6已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为x.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是(C)Ab,aBb,aCaDb,a解析本题考查线性回归方程,考查运算能力由公式求得,代入(,)求得,而由两点确定的方程为y2x2,a二、填空题7在一组样本数据(x1,y1)、(x2,y2)、(xn,yn)(n2,x
5、1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为_1_解析因为所有的样本点都落在一条直线上,所以相关系数|r|1,又由回归方程为yx1,说明x与y正相关,即r0,所以r18面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:,71,79,iyi1481则销量每增加1 000箱,单位成本约下降_1.818_2_元解析由题意知,1.818 2,71(1.818 2)77.36,所以1.8
6、18 2x77.36,所以销量每增加1 000箱,单位成本约下降1.818 2元9某种商品的广告费支出x与销售额y之间有如下关系:(单位:万元)x24568y3040605070y与x的线性回归方程为6.5x17.5,当广告费支出5万元时,残差为_10_解析当广告费x5时,6.5517.550,残差为605010三、解答题10(2020全国卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i1,2,20),其中xi和yi分别表示第i
7、个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,i60,i1 200,(xi)280,(yi)29 000,(xi)(yi)800(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i1,2,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由附:相关系数r,1.414解析(1)样区野生动物平均数为i1 20060,地块数为200,该地区这种野生动物的估
8、计值为2006012 000(2)样本(xi,yi)(i1,2,20)的相关系数为r0.94(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计B级素养提升1如图所示的是四张残差图,其中回归模型的拟合效果最好的是(B)解析四张残差图中,只有选项A,B中的残差图是水平带状区域分布,且选项B中的残差点散点分布集中在更狭窄的范围内,所以选项B中回归模型的拟合效果最好2(多选题)已知由
9、样本数据点集合(xi,yi)|i1,2,n,求得的回归直线方程为1.5x0.5,且3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的回归直线l的斜率为1.2,则(AB)A变量x与y具有正相关关系B去除后的回归方程为1.2x1.4C去除后y的估计值增加速度变快D去除后相应于样本点(2,3.75)的残差为0.05解析3,代入1.5x0.5,5,因为重新求得的回归直线l的斜率为1.2,故正相关,设新的数据所以横坐标的平均值,则(n2)n(1.24.8)3n63(n2),故3,纵坐标的平均数为,则(n2)n(2.27.8)n105n105(n2),5,设新的线性回归方
10、程为y1.2xb,把(3,5)代入51.23b,b1.4,故新的线性回归方程为y1.2x1.4,故A,B正确,因为1.51.2,所以去除后y的估计值增加速度变慢,C错误,把x2代入,y3.8,3.753.80.05,故D错误,故选AB二、填空题3在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线yebxa的周围,令ln y,求得回归直线方程为0.25x2.58,则该模型的回归方程为_ye0.25x2.58_解析因为0.25x2.58,ln y,所以ye0.25x2.584某品牌服装专卖店为了解保暖衬衣的销售量y(件)与平均气温x()之间的关系,随机统计了连续四旬的销售量与当旬
11、平均气温,其数据如表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x()381217旬销售量y(件)55m3324由表中数据算出线性回归方程bxa中的b2,样本中心点为(10,38)(1)表中数据m_40_;(2)气象部门预测三月中旬的平均气温约为22 ,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为_14_件解析(1)由38,得m40(2)由ab得a58,故2x58,当x22时,14,故三月中旬的销售量约为14件三、解答题5以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.821.618.429.222(1)画出数
12、据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格解析(1)数据对应的散点图如下图所示:(2)xi109,lxx (xi)21 570,23.2,lxy (xi)(yi)308设所求回归直线方程为x,则0.196 2,1.814 2故所求回归直线方程为0.196 2x1.814 2(3)据(2),当x150 m2时,销售价格的估计值为0.196 21501.814 231.244 2(万元)6(2018全国卷理,18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环
13、境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值(2)你认为用哪个模型得到的预测值更可靠?并说明理由解析(1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,可得该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠
14、理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠