1、第一章 统计案例1.1 回归分析的基本思想及其初步应用A级基础巩固一、选择题1下列两个变量之间的关系不是函数关系的是()A角度和它的余弦值B正方形的边长和面积C正n边形的边数和内角度数和D人的年龄和身高解析:函数关系就是一种变量之间的确定性的关系A,B,C三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f()cos ,g(a)a2,h(n)n2.D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高答案:D2设一个线性回归方程为21.5x,则变量x增加一个单位时()A.平均增加1.5个单位B.平均增加2个单位C.平均减少1.5个单位D.平均减少2个单位解析
2、:由线性回归方程21.5x中x的系数为1.5,知C项正确答案:C3甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:甲乙丙丁R20.980.780.500.85建立的回归模型拟合效果最好的同学是()A甲 B乙C丙 D丁解析:相关指数R2越大,表示回归模型的效果越好答案:A4已知x与y之间的一组数据如下表:x0123ym35.57已求得y关于x的线性回归方程为2.1x0.85,则m的值为()A1 B0.85C0.7 D0.5解析:因为,.所以这组数据的样本中心点是.因为y关于x的线性回归方程为2.1x0.85,所以2.10.85,解得
3、m0.5.答案:D5为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为()A11.4万元 B11.8万元C12.0万元 D12.2万元解析:先求,再利用回归直线方程预测由题意知,10,8,80.76100.4,当x15时,0.76150.411.8(万元)答案:B二、填空题6如果散点图中的所有的点都在一条斜率不为0的直线上,则残差为_,相关指数R2_解析:由题意知,yi
4、i相应的残差iyii0.相关指数R21答案:0 17某脑科研究机构对高中学生的记忆力x和判断力y进行统计分析,得到下表数据:x681012y2356根据上表可得回归直线方程x,其中2.3,则_解析:由表格中数据得9,4,故样本中心点的坐标为(9,4),因为线性回归方程为x2.3,所以492.3,解得0.7.答案:0.78已知方程0.85x85.71是根据女大学生的身高预报她的体重的回归直线方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是_解析:将x160代入0.85x85.71,得0.8516085.7150.29所以残差y5350.293.29.答案:3.298
5、已知方程0.85x82.71是根据女大学生的身高预报她的体重的回归直线方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是_解析:将x160代入0.85x82.71,得0.8516082.7153.29,所以残差y5353.290.29.答案:0.29三、解答题9某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:单位x(元)88.28.48.68.89销售y(件)908483807568(1)求回归直线方程x,其中20,;(2)预计在今后的销售中,销售与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,
6、该产品的单价应定为多少元?(利润销售收入成本)解:(1)由于(88.28.48.68.89)8.5,(908483807568)80,又20,所以80208.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1 00020(x8.25)2361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润10某企业每天由空气污染造成的经济损失y(单位:元)与空气污染指数(API)x的数据统计如下:空气污染指数(API)x150200250300经济损失y200350550800(1)求出
7、y与x的线性回归方程x;(2)若该地区某天的空气污染指数为800,预测该企业当天由空气污染造成的经济损失;(3)若相关指数R20.958 7,请说明其含义解:(1)(150200250300)225,(200350550800)475.所以4,4754225425,所以4x425.(2)当x800时,48004252 775.即当空气污染指数为800时,预测该企业当天造成的经济损失是2 775元(3)R20.9587,说明该企业每天空气污染造成经济损失的95.87%是由空气污染指数API引起的,所以回归模型的拟合效果较好B级能力提升1如图所示的是四个残差图,其中回归模型的拟合效果最好的是()解
8、析:残差图中,只有A,B是水平带状区域分布,且B中残差点散点分布集中在更狭窄的范围内,所以B项中回归模型的拟合效果最好答案:B2在研究硝酸钠的溶解度时,观察它在不同温度(x)的水中溶解度(y)的结果如下表:温度x010205070溶解度y66.776.085.0112.3128.0由此得到回归直线的斜率是_解析:(010205070)30,(66.776.085.0112.3128.0)93.6,则公式=,可得陇望蜀0.880 9.3.如图是x和y的一组样本数据的散点图,去掉一组数据_后,剩下的4组数据的相关指数最大解析:由图可知:去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大答案:D(3,10)4已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753(1)画出y关于x的散点图;(2)求出回归直线方程;(3)计算R2的值,并说明回归模型拟合程度的好坏解:(1)散点图如图所示:(2)因为18,7.4,1 660,327,xiyi620,所以R210.994,故回归模型的拟合效果较好