1、03第三章统计案例3.1回归分析的基本思想及其初步应用课时过关能力提升基础巩固1如图所示的四个散点图中,适合用线性回归模型拟合两个变量的是()A.B.C.D.答案:B2设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析:当b0时,两变量正相关,此时r0;当b0时,两变量负相关,此时r0.故选A.答案:A3对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系是非确定性关系,因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是
2、负的C.回归分析中,如果R2=1,那么说明x与y之间完全相关D.样本R2(0,1)解析:R20,1,选项D错误.答案:D4已知x,y取值如下表:x014568y1.31.85.66.17.49.3从所得的散点图分析可知y与x线性相关,且y=0.95x+a,则a等于()A.1.30B.1.45C.1.65D.1.80解析:依题意,得x=16(0+1+4+5+6+8)=4,y=16(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线y=0.95x+a必过中心点(x,y),即点(4,5.25),于是5.25=0.954+a,解得a=1.45.答案:B5已知某地的财政收入x与支出y满足
3、线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|0.5,若今年该地区财政收入为10亿元,则年支出预计不会超过 ()A.10亿B.9亿C.10.5亿D.9.5亿解析:当x=10时,y=0.810+2+e=10+e,且|e|0.5,y10.5.答案:C6已知某车间加工零件的个数x与所花费时间y(单位:h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件大约需要()A.6.5 hB.5.5 hC.3.5 hD.0.5 h解析:将x=600代入y=0.01x+0.5中得y=6.5.答案:A7如图有5组数据,去掉点后,剩下的4组数据的线性相关性更强.答案:D8在对
4、两个变量进行回归分析时,甲、乙分别给出两个不同的回归方程,并对回归方程进行检验.对这两个回归方程进行检验时,与实际数据(个数)对比结果如下:与实际相符数据个数与实际不符合数据个数总计甲回归方程32840乙回归方程402060总计7228100则从表中数据分析,回归方程更好(即与实际数据更贴近).答案:甲9某品牌服装专卖店为了解保暖衬衣的销售量y(单位:件)与平均气温x(单位:)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x/381217旬销售量y/件55m3324由表中数据算出线性回归方程y=bx+a中的b=-2,样本中心点为
5、(10,38).(1)表中数据m=;(2)气象部门预测三月中旬的平均气温约为22 ,据此估计,该品牌的保暖衬衣在三月中旬的销售量为.解析:(1)由y=38,得m=40.(2)由a=y-bx,得a=58,则y=-2x+58,当x=22时,y=14,故三月中旬的销售量约为14件.答案:(1)40(2)14件10对两个变量x,y取得4组数据:(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得一个数学模型.甲:y=0.1x+1,乙:y=-0.05x2+0.35x+0.7,丙:y=-0.8(0.5)x+1.4,试判断三人谁的数学模型更接近于客观实际.解:对甲模型:残差平
6、方和i=14(yi-yi)2=0.010 9;对乙模型:残差平方和i=14(yi-yi)2=0.004 9;对丙模型:残差平方和i=14(yi-yi)2=0.000 4.显然丙的残差平方和最小,故丙模型更接近于客观实际.能力提升1由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到的回归直线方程为y=bx+a,那么下面说法不正确的是()A.直线y=bx+a必经过点(x,y)B.直线y=bx+a至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点C.直线y=bx+a的斜率为i=1nxiyi-nx yi=1nxi2-nx2D.直线y=bx+a和各点(x1,y1),(x2,
7、y2),(xn,yn)的残差平方和i=1nyi-(bxi+a)2是该坐标平面上所有直线与这些点残差平方和中最小的直线解析:回归直线体现了大多数数据点的排列趋势,并不一定经过其中的点.答案:B2对变量x,y,由观测数据(xi,yi)(i=1,2,10)得散点图;对变量u,v,由观测数据(ui,vi)(i=1,2,10)得散点图.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:由题图可知,各点整体呈递减趋势,x与y负相关,由题图可知,各点整体呈递增趋势,u与v正相关.答案:C3若
8、对于变量y与x的10组统计数据的回归模型中,R2=0.95,又知残差平方和为120.53,则i=110(yi-y)2的值为()A.241.06B.2 410.6C.253.08D.5 530.8解析:由R2=1-i=110(yi-y)2i=110(yi-y)2=1-120.53i=110(yi-y)2=0.95知,i=110(yi-y)2=2 410.6.故选B.答案:B4某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得y=0.577x-0.448(x为年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是()A.年龄为37岁的人体内脂肪
9、含量都为20.90%B.年龄为37岁的人体内脂肪含量为21.01%C.年龄为37岁的大部分人的体内脂肪含量为20.90%D.年龄为37岁的大部分的人体内脂肪含量为31.5%解析:当x=37时,y=0.57737-0.448=20.90120.90,由此估计年龄为37岁的大部分人的体内脂肪含量为20.90%.答案:C5下列说法中表述恰当的个数为()R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好;在线性回归模型中,R2表示解释变量对于预报变量的贡献率,R2越接近于1,表示解释变量和预报变量的线性相关关系越强;若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人
10、为的错误或模型是否恰当.A.0B.1C.2D.3解析:由回归分析的相关概念知都正确,故选D.答案:D6甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则同学的试验结果体现A,B两变量更强的线性相关性.解析:由题表可知,丁同学的相关系数r最大且残差平方和m最小,故丁同学的试验结果体现A,B两变量更强的线性相关性.答案:丁7面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位
11、成本y(单位:元)的资料进行线性回归分析,结果如下:x=72,y=71,i=16xi2=79,i=16xiyi=1 481.b=1 481-6727179-6722-1.818 2,a=71-(-1.818 2)7277.36,则销量每增加1 000箱,单位成本下降元.解析:由已知条件可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.答案:1.818 28高二(3)班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下数据:x/h24152319161120161713y/分92799789644783687159若某同学每周用于
12、数学学习的时间为18 h,试预测该同学的数学成绩.解:显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i12345678910xi24152319161120161713yi92799789644783687159xiyi2 2081 1852 2311 6911 0245171 6601 0881 207767i=110xi2=3 182,i=110xiyi=13 578设回归方程为y=bx+a,于是可得b=i=110xiyi-10x yi=110xi2-10x2=545.4154.43.53,a=y-bx=74.9-3.5317.413.5.因此可求得回归直线方
13、程为y=3.53x+13.5.当x=18时,y=3.5318+13.577.故预计该同学可得77分.9假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如下表的统计资料:使用年限x/年23456维修费用y/万元2.23.85.56.57.0若由资料知y对x呈线性相关关系,试求:(1)线性回归方程y=bx+a.(2)估计使用年限为10年时,维修费用是多少?(3)计算残差平方和.(4)求R2并说明模型的拟合效果.解: (1)将已知条件制成下表:i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3xi
14、24916253690x=4;y=5;i=15xi2=90;i=15xiyi=112.3设回归方程为y=bx+a,于是有b=i=15xiyi-5xyi=15xi2-5x2=112.3-54590-542=1.23,a=y-bx=5-1.234=0.08,回归直线方程是y=1.23x+0.08.(2)当x=10时,y=1.2310+0.08=12.38,即估计使用10年时维修费用是12.38万元.(3)残差平方和:y1=2.46+0.08=2.54,y2=3.77,y3=5,y4=6.23,y5=7.46,i=15(yi-yi)2=0.651.(4)R2=1-i=15(yi-yi)2i=15(yi-y)2=1-0.65115.780.958 7,模型的拟合效果较好,使用年限解释了95.87%的维修费用支出.