1、第3章 统计案例课标领航本章概述本章内容的重点是回归分析和独立性检验的基本思想与方法;难点是回归分析和独立性检验的初步应用.学法指导本章内容实践性强,学习时应结合具体案例,了解几种统计方法的基本思想及初步应用,避免单纯记忆和机械套用公式.31 回归分析的基本思想及其初步应用学习目标1.了解随机误差、残差、残差图的概念2会通过分析残差判断线性回归模型的拟合效果3掌握建立回归模型的步骤4通过对典型案例的探究,了解回归分析的基本思想方法和初步应用 课堂互动讲练 知能优化训练 31课前自主学案 课前自主学案 1我们在必修3中已经学习了统计的知识,还记得抽样方法吗?三种随机抽样方法是_、_和_2我们还学
2、习了用样本的频率分布估计_,用样本的数字特征估计_温故夯基简单随机抽样系统抽样分层抽样总体分布总体的数字特征3对于具有线性相关关系的变量 x 和 y,其回归直线方程为y2x1,当 x0.5时,其估计值为_.01线性回归模型(1)在线性回归方程yabx 中b_,a yb x.其中 x_,y_,_称为样本点的中心,回归直线过样本点的中心i1nxi x yi y i1nxi x 21ni1nxi1ni1nyi(x,y)知新益能(2)线性回归模型ybxae,其中a和b为模型的未知参数,e称为_(3)随机误差产生的原因主要有以下几种:所用的确定性函数不恰当引起的误差;忽略了某些因素的影响;存在观测误差随
3、机误差残差图:作图时_为残差,_可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图残差点比较_地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度_,说明模型拟合精度越高2刻画回归效果的方式(1)残差分析残差:把随机误差的估计值ei 称为相应于点(xi,yi)的残差纵坐标横坐标均匀越窄(2)利用 R2 刻画回归效果R21i1nyiyi2i1nyi y2;R2 表示_变量对_变量变化的贡献率R2越接近_,表示回归的效果越好解释预报1回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示:不一定是真实值利用线性回归方程求的值,在很多时候是个预报值,
4、例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等问题探究 课堂互动讲练 线性回归分析 考点突破 该类问题属于线性回归问题,先通过散点图来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程某班5名学生的数学和物理成绩如下表:例1 学生 学科成绩 A B C D E 数学成绩(x)88 76 73 66 63 物理成绩(y)78 65 71 64 61(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩【思路点拨】先画散点图,分析物理与数学成绩是否有线性相关关系
5、,若相关再利用线性回归模型求解预报变量【解】(1)散点图如图:(2)x15(8876736663)73.2,y15(7865716461)67.8.i15xiyi8878766573716664636125054.i15x2i88276273266263227174.所以bi15xiyi5x yi15x2i5 x225054573.267.827174573.220.625.a yb x67.80.62573.222.05.所以 y 对 x 的回归直线方程是y0.625x22.05.(3)x96,则y0.6259622.0582,即可以预测他的物理成绩约是 82.【题后小结】解这类题主要是三步
6、变式训练 有下列数据x 3 4 5 6 y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程ybxa.(参考数值:32.5435464.566.5)解:(1)散点图如图所示:(2)x345644.5,y2.5344.543.5,i14xiyi32.5434564.566.5,i14x2i3242526286,bi14xiyi4x yi14x2i4x 266.543.54.58644.520.7,a yb x3.50.74.50.35,y0.7x0.35.通过散点图,与幂函数、指数函数、对数函数图象作比较,挑选一种跟这
7、些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决非线性回归分析 在彩显影中,由经验可知:形成染料光学密度 y 与析出银的光学密度 x 由公式 yAebx(b0)表示现测得试验数据如下:例2xi0.050.060.250.310.070.100.380.430.140.200.47yi0.100.141.001.120.230.371.191.250.590.791.29试求y对x的回归方程【思路点拨】由于题目中已给定了要求的曲线为 yAebx类型,我们只要通过所给出的 11 对样本数据,求出 A 和 b 的值即可确定 x 与 y 的相关关系的曲线方程【解】
8、由题意知,对于给定的公式 yAe (b0)两边取自然对数,得 lnylnAbx.与线性回归方程相对照可以看出,只要取 u1x,vlny,alnA,就有 vabu.这是 v 关于 u 的线性回归直线方程,对此我们再套用相关性检验,求出回归系数 b 和 a.题目中所给出的数据由变量置换 u1x,vlny,得到如下数据:ui20.00016.6674.0003.22614.28610.0002.6322.3267.1435.0002.128vi2.3031.9660.0000.1131.4700.9940.1740.2230.5280.2360.255【思维总结】对于非线性问题,求其有关系数时,关键
9、是变量替换,转化为线性方程形式通过对残差图的分析,得出模型的拟合效果已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:残差分析 例3x 14 16 18 20 22 y 12 10 7 5 3 求y对x的回归直线方程,并说明回归模型拟合效果的好坏【思路点拨】回归模型拟合效果的好坏可以通过计算R2来判断,其值越大,说明模型的拟合效果越好【解】x15(1416182022)18,y15(1210753)7.4,i15x2i1421621822022221660,i15y2i122102725232327,i15x iyi 1412 1610 187 205223620,所以,bi
10、15xiyi5xyi15x2i5x 26205187.416605182 1.15,a7.41.151828.1,所以所求回归直线方程是:y1.15x28.1.列出残差表:yiyi00.3 0.4 0.10.2yi y4.62.6 0.4 2.4 4.4所以,i15(yiyi)20.3,i15(yi y)253.2,R21i15yiyi2i15yi y 20.994,所以回归模型的拟合效果很好【思维总结】这类题目的数据运算繁琐,通常采用分步计算的方法,由R2可以看出回归模型的拟合效果很好,也可以计算相关系数r,看两个变量的相关关系是否很强方法技巧1对具有相关关系的两个变量进行统计分析时,首先进行相关关系的判断(可作散点图),在确认具有线性相关关系后,再求回归直线方程对于非线性回归问题,可以转化为线性回归问题去解决如例1、例22刻画回归效果,关键是计算R2.如例3方法感悟 失误防范1刻画回归效果时,区分残差平方和i1n(yiy)2 与总偏差平方和i1n(yi y)2.2残差平方和越小,等价于 R2 值越大,说明模型拟合效果也越好知能优化训练