1、第1课时回 归 分 析1.会对两个变量的相关关系进行分析、判断.2.了解回归分析的基本思想,会对两个变量的具体问题进行回归分析.3.掌握运用最小二乘法建立回归模型的基本步骤和方法.重点:熟练掌握回归分析,建立回归模型,求各相关指数的步骤.难点:如何求回归直线方程以及对相关系数r的理解和运用.我们每个人都有自己的身高和体重,那么如果把身高和体重分别作为变量,它们能够构成函数关系吗?问题1:散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.问题2:相关关系与线性回归相关关系:对于两个变量
2、,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系称为相关关系.相关关系分为线性相关和非线性相关.函数关系中的两个变量间是一种确定性关系,相关关系是一种非确定性关系.线性回归:对具有相关关系的两个变量进行统计分析的一种常用方法.问题3:线性相关系数r=称为两个变量数据(xi,yi)(i=1,2,n)的线性相关系数.r用来刻画两个变量的线性回归效果:当r0时,表明两个变量正相关;当r0,不可能负相关;在中,斜率为-4.3260,不可能正相关,故一定不正确.选D.【答案】D1.下列两个变量之间的关系是相关关系的是().A.圆的面积与半径B.球的体积与半径C.角度与它的正弦值D.一
3、个考生的数学成绩与物理成绩【解析】由题意知A表示圆的面积与半径之间的关系S=r2;B表示球的体积与半径之间的关系V=r2;C表示角度与它的正弦值y=sin ,以上所说的都是确定的函数关系,相关关系不是确定性的关系,故选D.【答案】D2.在对两个变量x,y进行线性回归分析时有下列步骤:对所求出的回归方程作出解释;收集数据(xi,yi),其中i=1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,那么在下列操作顺序中正确的是().A.B.C.D.【解析】根据线性回归分析思想可知,两个变量x,y进行线性回归分析时,应先收集数据(x
4、i,yi),然后绘制散点图,再求相关系数和线性回归方程,最后对所求的回归方程作出解释,因此选D.【答案】D3.如图所示有5组数据,去掉后,剩下的4组数据的线性相关性更强.【解析】根据散点图判定两变量的线性相关性,样本数据点越集中在某一直线附近,这两变量的线性相关性越强,显然去掉D(3,10)后,其余各点更能集中在某一直线附近,即线性相关性更强.【答案】D(3,10)4.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.7
5、52.923.033.143.263.363.50(1)画出散点图;(2)检验相关系数r的显著性水平;(3)求月总成本y与月产量x之间的回归直线方程.【解析】i123456789101112xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.143.263.363.50xiyi2.432.6542.8563.2643.5904.074.6435.0905.6526.0966.6537.245=,=,=29.808,=99.2081,xiyi=54.243(1)画出散点图,如图
6、所示.(2)r=0.99,这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在显著的线性相关关系.(3)设回归直线方程y=bx+a,利用计算a,b,得b1.215, a=-b0.974,即回归直线方程为y=1.215x+0.974.5.设一个回归方程为y=3-5x,当变量x增加一个单位时().A.y平均增加3个单位B.y平均减小5个单位C.y平均增加5个单位D.y平均减小3个单位【解析】-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.【答案】B6.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其回归方程的截距为().A.a=y+bxB.a=
7、+bC.a=y-bxD.a=-b【解析】回归直线方程中的截距即为a,由公式=b+a得a=-b,故选D.【答案】D7.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为y=0.8x+4.6,则成年人受过9年或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数.(填“大于0”或“小于0”)【解析】一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左
8、右.【答案】大于08.假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料知y对x呈线性相关关系.试求:(1)线性回归方程y=bx+a的回归系数a,b;(2)估计使用年限为10年时的维修费用.【解析】(1)制表如下:i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.34916253690=4,=5,=90,xiyi=112.3于是b=1.23,a=-b=5-1.234=0.08.(2)由(1)知回归直线方程为y=1.23x+0.08
9、,当x=10时,y=1.2310+0.08=12.3+0.08=12.38,即估计使用10年时的维修费用是12.38万元.9.若y与x之间的一组数据如下:x01234y13556则拟合这5对数据的回归直线一定经过的点是.【解析】根据回归直线y=bx+a一定过样本中心点(,),且=2,=4,知点(2,4)一定在回归直线上.【答案】(2,4)10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:产量x(千件)费用y(千元)4015042140481605517065150产量x(千件)费用y(千元)791628818510016
10、5120190140185完成下列要求:(1)计算x与y的相关系数;(2)这两个变量之间是否线性相关?若线性相关,求回归直线方程y=bx+a.【解析】(1)制表如下:ixiyixiyi1401501600225006000242140176419600588034816023042560076804551703025289009350565150422522500975067916262412624412798788185774434225162808100165100002722516500912019014400361002280010140185196003422525900合计777165770903277119132938=77.7,=165.7,=70903,=277119,xiyi=132938r=0.808.即x与y的相关系数r0.808.(2)因为r较接近1,所以x与y之间具有很强的线性相关关系.则b=0.398,a=165.7-77.7b134.8,所以回归直线方程为y=0.398x+134.8.