1、3.1回归分析的基本思想及其初步应用问题导学一、求线性回归方程活动与探究1某工厂18月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)5.66.06.16.47.07.58.08.2成本(万元)130136143149157172183188以产量为x,成本为y(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程迁移与应用1(2013海南海口模拟)在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()Ax1 Bx2C2x1 Dx12某商场经营一批进价是30元/台的小商品,在市场
2、试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:x35404550y56412811(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程(方程的斜率精确到个位)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方
3、程毫无意义二、线性回归分析活动与探究2某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义迁移与应用1某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元B65.5万元C67.7万元 D72.0万元2在一段时间内,某种商品的价格x(元)和需求量y(件)之间的一组数据为:x
4、(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R21可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高, 回归方程预报精度越高三、非线性回归分析活动与探究3下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x
5、与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值迁移与应用1在彩色显影中,由经验知形成染料光学密度y与析出银的光学密度x由公式y(b0)表示,现测得试验数据如下:xi0.050.060.250.310.070.100.380.430.140.200.47yi0.100.141.001.120.230.371.191.250.590.791.29则y对x的回归方程是_2在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521试建立y与x之间的回归方程非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数
6、(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决答案:课前预习导学【预习导引】1(1)确定性非确定性(2)相关(3)样本点的中心(4)随机误差解释变量预报变量预习交流1D2yibxiayiiyixi31解释变量预报变量1预习交流2提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R2能精确地描述两个变量之间的密切程度预习交流3提示:(1)回归方程只适用于所研究的样本的总体(2)所建立的回归方程一般都有时间性(3)样本的取值范围会影响回归方程的适用范围(4
7、)不能期望回归方程得到的预报值就是预报变量的精确值事实上,它是预报变量的可能取值的平均值课堂合作探究【问题导学】活动与探究1思路分析:画出散点图,观察图形的形状得x与y是否具有线性相关关系把数值代入回归系数公式求回归方程解:(1)由表画出散点图,如图所示(2)从上图可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表序号xiyixi2yi2xiyi15.613031.3616 900728.026.013636.0018 496816.036.114337.2120 449872.346.414940.9622 201953.657.01574
8、9.0024 6491 099.067.517256.2529 5841 290.078.018364.0033 4891 464.088.218867.2435 3441 541.654.81 258382.02201 1128 764.56.85,157.2522.17,157.2522.176.855.39,故线性回归方程为22.17x5.39迁移与应用1A解析:方法一:,故1,1因此,x1,故选A方法二:也可由回归直线方程一定过点(,),即,代入验证可排除B,C,D故应选A2解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关设回归直线为x,由题知
9、42.5,34,则求得334(3)42.5161.53x161.5(2)依题意有P(3x161.5)(x30)3x2251.5x4 845324 845当x42时,P有最大值,约为426即预测销售单价为42元时,能获得最大日销售利润活动与探究2思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)39.25,40.875,12 656,13 731,iyi13 180,1.041 5,0.003 875,线性回归方程为1.04
10、1 5x0.003 875(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适(4)计算得相关指数R20.985 5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的迁移与应用1B解析:9.49.1,回归方程为9.4x9.1令x6,得9.469.165.5(万元)2解:(1416182022)18,(1210753)7.4,1421621822022221 660,122102725232327,iyi14121610187205223620,1.157.41.151828.1,回归直线方程为1.15x28.1列出残差表为:yii00.30.
11、40.10.2yi4.62.60.42.44.4(yii)20.3,(yi)253.2,R210.994故R20.994说明拟合效果较好活动与探究3思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数解:(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线的周围,其中c1,c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以
12、转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为0.272x3.849,e0.272x3.849残差yi711212466115325i6.44311.10119.12532.95056.770128.381290.325i0.5570.1011.8758.9509.2313.38134.675(3)当x40时,ye0.272x3.8491 131迁移与应用1解析:由题给的经验公式y,两边取自然对数,便得ln yln A与线性回归直线方程相对照,只要取u,vln y,aln A,就有vabu,这是v对u的线性回归方
13、程对此我们已经掌握了一套相关性检验,求a与回归系数b的方法题目所给数据经变量置换u,vln y变成如下表所示的数据:ui20.00016.6674.0003.22614.28610.000vi2.3031.96600.1131.4700.994ui2.6322.3267.1435.0002.128vi0.1740.2230.5280.2360.255|r|0.9980.75,故v与u之间具有很强的线性相关关系,求回归直线方程是有意义的由表中数据可得0.15,0.55,即0.550.15u把u与v换回原来的变量x与y,即u,vln y,故ln 0.55,即e0.55这就是y对x的回归曲线方程2解
14、:画出散点图如图所示根据散点图可知y与x近似地呈反比例函数关系,设y,令t,则ykt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系列表如下:序号tiyitiyity141664162562212244144315512540.5210.25450.2510.250.062517.753694.2521.312 5430所以1.55,7.2所以4.134 4,0.8所以4.134 4t0.8所以y与x的回归方程是0.8当堂检测1(2012湖南高考,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相
15、关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案:D解析:D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.8517085.7158.79(kg)故D不正确2为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x(cm)174176176176178儿子身高y(cm)17517517
16、6177177则y对x的线性回归方程为()Ayx1 Byx1Cy88 Dy176答案:C解析:法一:由线性回归直线方程过样本中心(176,176),排除A,B答案,结合选项可得C为正确答案法二:将表中的五组数值分别代入选项验证,可知y88最适合3在两个变量y与x的回归模型中,分别选择了4个不同的模型通过计算得R2的值如下,其中拟合效果最好的模型是()A模型1的R2为0.98B模型2的R2为0.80C模型3的R2为0.50D模型4的R2为0.25答案:A解析:R2越接近于1,则该模型的拟合效果就越好,精度越高4若对于变量y与x的10组统计数据的回归模型中,R20.95,又知残差平方和为120.5
17、3,那么(yi)2的值为_答案:2 410.6解析:依题意有0.951,所以2 410.65假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计数据x23456y2.23.85.56.57.0若由此资料可知y对x呈线性相关关系,试求:(1)回归直线方程;答案:解:由题表中数据列成下表:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0xi2491625364,5,90,112.3于是,51.2340.08,所以回归直线方程为1.23x0.08(2)估计使用年限为10年时,维修费用为多少?答案:当x10时,1.23100.0812.38(万元),估计使用10年时的维修费用为12.38万元提示:用最精练的语言把你当堂掌握的核心知识的精华部分和基本技能的要领部分写下来并进行识记