1、课堂讲练互动课前探究学习1.2 回归分析课堂讲练互动课前探究学习【课标要求】1了解随机误差、残差、残差分析的概念;2会用残差分析判断线性回归模型的拟合效果;3掌握建立回归模型的步骤;4通过对典型案例的探究,了解回归分析的基本思想方法和初步应用【核心扫描】1利用散点图分析两个变量是否存在相关关系,求线性回归方程(重点)2回归模型的选择,特别是非线性回归模型(难点、易错点)课堂讲练互动课前探究学习自学导引1回归分析函数关系是一种确定性关系,而相关关系是一种非确定性关系回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法课堂讲练互动课前探究学习2线性回归模型(1)线性模型已知 n 对数据(x
2、1,y1),(x2,y2),(xn,yn),yiabxii称为线性模型iyiabxi 称为随机误差(2)对 a 和 b 的估计我们可求出 a 与回归系数 b 的估计值a,b,使得全部误差 1,2,n 的平方和达到最小,这是一种很好的估计由数学3 的知识可知,最小二乘估计a和b就是未知参数 a 和 b 的最好估计,其计算公式如下:课堂讲练互动课前探究学习bi1nxi x yi y i1nxi x 2i1nxiyin x yi1nx2in x 2,a y b x,其中 x 1ni1nxi,y 1ni1nyi,(x,y)称为样本点的中心课堂讲练互动课前探究学习(3)建立线性回归模型的基本步骤作出两个
3、变量的散点图;求出回归系数a,b,写出回归直线方程ybxa;用回归直线方程进行预测课堂讲练互动课前探究学习试一试:下表是 x 和 y 之间的一组数据,则 y 关于 x 的线性回归方程必过().x123 4y135 7 A点(2,3)B点(1.5,4)C点(2.5,4)D点(2.5,5)提示 选 C.线性回归方程必过样本点的中心(x,y),即(2.5,4)课堂讲练互动课前探究学习3相关系数对于变量 x 与 y 随机抽到的 n 对数据(x1,y1),(x2,y2),(xn,yn),检测统计量是样本相关系数ri1nxi x yi y i1nxi x 2i1nyi y 2i1nxiyin x yi1n
4、x2in x 2i1ny2in y 2.课堂讲练互动课前探究学习4相关性检验(1)对x与y作线性相关性检验,简称相关性检验(2)检验的步骤如下:作统计假设:x与y不具有线性相关关系;根据小概率0.05与n2在附表中查出r的一个临界值r0.05;根据样本相关系数计算公式算出r的值;作统计推断:如果|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系课堂讲练互动课前探究学习4相关性检验(1)对x与y作线性相关性检验,简称相关性检验(2)检验的步骤如下:作统计假设:x与y不具有线性相关关系;根据小概率0.05与n2在附表中查出r的一个临界值r0.05;根据样本相关系数计算公式算出r的值
5、;作统计推断:如果|r|r0.05,表明有95%的把握认为x与y之间具有线性相关关系课堂讲练互动课前探究学习想一想:回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等课堂讲练互动课前探究学习6非线性回归分析回归曲线方程也可以线性化(1)将幂函数型函数yaxn(a为常数,a,x,y均取正值)化为线性函数:将yaxn两边取常用对数,则有lg ynlg xlg a,令lg y,vlg x,blg a,代入上式得n
6、vb(其中n、b是常数),其图象是一条直线课堂讲练互动课前探究学习(2)将指数型函数ycax(a0,c0,a,c为常数)化为线性函数:将ycax两边取常用对数,则有lg yxlg alg c,令lg y,blg c,dlg a,代入上式得dxb(d,b是常数),它的图象是一条直线课堂讲练互动课前探究学习名师点睛1线性回归方程(1)在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程(2)求线性回归方程ybxa的关键是求未知参数a和b,其中b可借助于计算器求出,因为a y b x,即 y b x a,所以点(x,y)一定满足线性回归
7、方程,即回归直线一定过点(x,y)课堂讲练互动课前探究学习(3)求线性回归方程的步骤:先把数据制成表,从表中计算出 x,y,x21x22x2n,x1y1x2y2xnyn 的值;计算未知参数a,b;写出线性回归方程ybxa.课堂讲练互动课前探究学习2线性回归分析(1)由线性回归方程给出的是一个预报值而非精确值(2)随机误差的主要来源线性回归模型与真实情况引起的误差;省略了一些因素的影响产生的误差;观测与计算产生的误差(3)残差分析是回归分析的一种方法(4)用相关指数R2来刻画回归效果R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差课堂讲练互动课
8、前探究学习3建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等课堂讲练互动课前探究学习题型一 求线性回归方程【例1】某班5名学生的数学和物理成绩如下表:学生学科 ABCDE数学成绩(x)88 76 73 66
9、63物理成绩(y)78 65 71 64 61课堂讲练互动课前探究学习(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩思路探索 先利用散点图分析物理成绩与数学成绩是否线性相关,若相关再利用线性回归模型求解课堂讲练互动课前探究学习解(1)散点图如图(2)x 15(8876736663)73.2,y 15(7865716461)67.8.课堂讲练互动课前探究学习i15xiyi8878766573716664636125 054.i15x2i88276273266263227 174.所以bi15xiyi5 x yi15x2i5 x
10、225 054573.267.827 174573.220.625.课堂讲练互动课前探究学习a y b x 67.80.62573.222.05.所以 y 对 x 的回归直线方程是y0.625x22.05.(3)x96,则y0.6259622.0582,即可以预测他的物理成绩是 82.课堂讲练互动课前探究学习规律方法(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义课堂
11、讲练互动课前探究学习【变式1】以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格房屋面积/m211511080135 105销售价格/万元24.8 21.6 18.4 29.222课堂讲练互动课前探究学习解(1)数据对应的散点图如下图所示:(2)x 15i15xi109,i15(xi x)21 570,y 23.2,i15(xi x)(yi y)308.课堂讲练互动课前探究学习设所求回归直线方程为ybxa,则bi15xi x yi y i15xi x
12、2 3081 5700.196 2,a y b x 0.181 42.故所求回归直线方程为y0.196 2x1.814 2.回归直线如上图所示(3)据(2),当 x150 m2 时,销售价格的估计值为y0.196 21501.814 231.244 2(万元)课堂讲练互动课前探究学习题型二 线性回归分析【例2】为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析x51015202530y 7.25 8.12 8.95 9.90 10.9 11.8课堂讲练互动课前探究学习解(1
13、)散点图如图x 16(51015202530)17.5,y 16(7.258.128.959.9010.911.8)9.487,课堂讲练互动课前探究学习i16x2i2 275,i16xiyi1 076.2计算得,b0.183,a6.285,所求回归直线方程为y0.183x6.285.(2)列表如下:yiyi0.050.0050.080.0450.040.025yi y2.241.370.540.411.412.31课堂讲练互动课前探究学习所以i16(yiyi)20.013 18,i16(yi y)214.678 4.所以,R210.013 1814.678 40.999 1,回归模型的拟合效果
14、较好课堂讲练互动课前探究学习(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系规律方法 当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面课堂讲练互动课前探究学习【变式2】已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x 14 16 18 20 22y 12 10753求y对x的回归直线方程,并说
15、明回归模型拟合效果的好坏课堂讲练互动课前探究学习解 x 15(1416182022)18,y 15(1210753)7.4,i15x2i1421621822022221 660,i15xiyi14121610187205223620,课堂讲练互动课前探究学习所以bi15xiyi5 x yi15x2i5 x 26205187.41 6605182 1.15.a7.41.151828.1,所以所求回归直线方程是:y1.15x28.1.列出残差表:yiyi00.30.40.10.2yi y4.62.60.42.44.4课堂讲练互动课前探究学习所以,i15(yiyi)20.3,i15(yi y)253
16、.2,R21i15yiyi2i15yi y 20.994,所以回归模型的拟合效果很好课堂讲练互动课前探究学习题型三 非线性回归分析【例3】下表为收集到的一组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x40时y的值x 21 23 25 27 293235y711 21 24 66 115 325课堂讲练互动课前探究学习 (1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关由散点图得x、y之间的回归模型(2)进行拟合,预报回归模型,求回归方程规范解答(1)作出散点图如下图,从散点图可以看出x与y不具有线
17、性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线的周围,其中c1、c2为待定的参数(4分)课堂讲练互动课前探究学习(2)两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784课堂讲练互动课前探究学习求得回归直线方程为z0.272x3.849,ye0.272x3.849.(8 分)残差yi711212466115325yi6.44
18、311.10119.12532.95056.770128.381290.325ei0.5570.1011.8758.9509.2313.38134.675(10 分)(3)当 x40 时,ye0.272x3.8491 131.(12 分)课堂讲练互动课前探究学习【题后反思】解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;(4)分析拟合效果:通过计算相关指数等来判断拟合效果;(5)写出非线性回归方程
19、课堂讲练互动课前探究学习【变式3】为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数天数x/天123456繁殖个数y/个 6 12 25 49 95 190课堂讲练互动课前探究学习解(1)所作散点图如图所示课堂讲练互动课前探究学习(2)由散点图看出样本点分布在一条指数函数三的周围,于是令 zln y,则x123456z1.792.483.223.894.555.25由计算器得:z0.69x1.115,则有ye0.69x1.115.课堂讲练互动课前探究
20、学习(3)yi6.0812.1224.1748.1896.06191.52yi612254995190y 3776,i1ne2ii1n(yiy)24.816 1,i1n(yi y)224 642.8,R21 4.816 124 642.80.999 8,即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.课堂讲练互动课前探究学习误区警示 对相关指数 R2 理解不当致误【示例】关于 x 与 y 有如下数据:x24568y3040605070为了对 x、y 两个变量进行统计分析,现有以下两种线性模型:甲模型y6.5x17.5,乙模型y7x17,试比较哪一个模型拟合的效果更好课堂讲练互动课前探
21、究学习错解 R211i15yiyi2i15yi y 21 1551 0000.845.R221i15yiyi2i15yi y 21 1801 0000.82.又84.5%82%,乙选用的模型拟合的效果更好课堂讲练互动课前探究学习用相关指数R2来比较模型的拟合效果,R2越大,模型的拟合效果越好,并不是R2越小拟合效果更好课堂讲练互动课前探究学习正解 R211i15yiyi2i15yi y 21 1551 0000.845,R221i15yiyi2i15yi y 21 1801 0000.82,845%82%,所以甲选用的模型拟合效果更好课堂讲练互动课前探究学习 R21i1n yiyi2i1n yi y 2,R2越大,残差平方和越小,从而回归模型的拟合效果越好在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率,R2越接近 1,表示回归的效果越好(因为 R2越接近 1,表示解释变量和预报变量的线性相关性越强)