1、数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动第 三 章统计案例数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动3.1 回归分析的基本思想及其初步应用数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动自主学习 新知突破数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动1通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用2了解线性回归模型与函数模型的差异,了解判断模型拟合效果的方法:相关指数和残差分析3体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法数学选修2-3第
2、三章 统计案例自主学习 新知突破合作探究 课堂互动下列变量关系是相关关系的是(1)学生的学习时间与学习成绩之间的关系;(2)某家庭的收入与支出之间的关系;(3)学生的身高与视力之间的关系;(4)球的体积与半径之间的关系数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动提示 对于(1),学习时间影响学生的学习成绩,但是学生学习的刻苦程度、学习方法、教师的授课水平等其他因素也影响学习成绩,因此学生的学习时间与学习成绩之间具有相关关系;对于(2),也是相关关系;对于(3),身高与视力之间没有关系;对于(4),球的体积与半径之间是函数关系数学选修2-3第三章 统计案例自主学习 新知突破
3、合作探究 课堂互动线性回归模型1回归直线方程:_,其中:bi1nxi x yi y i1nxi x 2,a_,x _,y _.ybxay b x1ni1nxi1ni1nyi 数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动2变量样本点中心:_,回归直线过样本点的中心3线性回归模型y_,其中_和_是模 型 的 未 知 参 数,_ 称 为 随 机 误 差 自 变 量 x 又 称 为_,因变量y又称为_(x,y)bxaeabe解释变量预报变量数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动4随机误差产生的原因数学选修2-3第三章 统计案例自主学习 新知突破合作探究
4、 课堂互动回归直线的特征及引起预报值与真实值之间的误差的原因(1)回归直线过样本点的中心(x,y)(2)在线性回归模型中,随机误差 e 的方差 2 越小,通过回归直线ybxa预报真实值 y 的精确度越高数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(3)引起预报值y与真实值 y 之间的误差的原因:一是随机误差 e,它引起预报值y与真实值 y 之间的误差;另一方面,由于a和b为截距和斜率的估计值,它们与真实值 a 和 b 之间也存在着误差,它们引起了预报值y和真实值 y之间的差异数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动刻画回归效果的方式残差把随机误差
5、的估计值ei 称为相应于点(xi,yi)的残差残差图作图时纵坐标为_,横坐标可以选为_,或_,或_等,这样作出的图形称为残差图残差样本编号身高数据体重估计值数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和残差平方和为i1nyiyi2,残差平方和_,模型拟合效果越好相关指数R2 R21i1nyiyi2i1nyi y 2,R2 表示_变量对_变量变化的贡献率,R2 越接近于 1,表示回归的效果越好越小解释预报数学选修2-3第三章 统计案例自主学习 新知突破
6、合作探究 课堂互动残差图的缺点(1)残差e受许多条件的影响,也受我们所选用的线性模型的影响(2)作残差图有时不够精确,也难于区分拟合效果的好坏,因此多数情况下,选用计算相关指数R2来说明拟合数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动1两个变量之间的相关关系是一种()A确定性关系B线性关系C非线性关系D可能是线性关系也可能不是线性关系数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:变量之间的相关关系是一种非确定性的关系,如果所有数据点都在一条直线附近,那么它们之间就是一种线性相关关系,否则不是线性相关关系故选D.答案:D数学选修2-3第三章 统计案
7、例自主学习 新知突破合作探究 课堂互动2某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回归方程可能是()A.y10 x200 B.y10 x200C.y10 x200 D.y10 x200数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:由于销售量y与销售价格x成负相关,故排除B,D.又当x10时,A中y100,而C中y300,C不符合题意,故选A.答案:A数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动3下表是x和y之间的一组数据,则y关于x的线性回归方程必过点_.x1234y1357解析:线性回归方程必过样本点的中心(x,y),即(2.5
8、,4)答案:(2.5,4)数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动4关于x与y有如下数据:x24568y3040605070为了对 x,y 两个变量进行统计分析,现有以下两种线性模型:甲模型y6.5x17.5,乙模型y7x17,试比较哪一个模型拟合的效果更好数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:R2甲1i15yiyi2i15yi y 21 1551 0000.845,R2乙1i15yiyi2i15yi y 21 1801 0000.82,84.5%82%,甲模型拟合的效果更好.数学选修2-3第三章 统计案例自主学习 新知突破合作探究
9、课堂互动合作探究 课堂互动数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动线性回归分析某班5名学生的数学和物理成绩如下表:(1)画出散点图;(2)求物理成绩y对数学成绩x的回归直线方程;(3)一名学生的数学成绩是96,试预测他的物理成绩学生学科 ABCDE数学成绩(x)8876736663物理成绩(y)7865716461数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动思路点拨 数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(1)散点图如图(2)x 15(8876736663)73.2,y 15(7865716461)67.8.数学选修2
10、-3第三章 统计案例自主学习 新知突破合作探究 课堂互动i15xiyi8878766573716664636125 054.i15x2i88276273266263227 174.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动所以bi15xiyi5 xyi15x2i5 x 225 054573.267.827 174573.220.625.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动a y b x 67.80.62573.222.05.所以 y 对 x 的回归直线方程是y0.625x22.05.(3)x96,则y0.6259622.0582,即可以预测
11、他的物理成绩是 82.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动规律方法 1.求线性回归方程的基本步骤:数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动2需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动1某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程ybxa;(2)利用(1)中所求出的直线方程
12、预测该地 2014 年的粮食需求量数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,先将数据预处理如下:年份200642024需求量257211101929由预处理后的数据,容易算得x 0,y 3.2,b42121121942942222242260406.5.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动a y b x 3.2.由上述计算结果,知所求回归直线方程为:y257b(x2 006)a6.5(x2 006)3.2.即y6.5(x2 006)260.2.(2)利用所求
13、得的线性回归方程,可预测 2014 年的粮食需求量为:65(2 0142 006)260.26.58260.2312.2(万吨)312(万吨)数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动残差分析某运动员训练次数与运动成绩之间的数据关系如下:(1)作出散点图;(2)求出回归方程;(3)作出残差图;(4)计算相关指数R2;(5)试预测该运动员训练47次及55次的成绩次数(x)3033353739444650成绩(y)3034373942464851数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动思路点拨 作散点图 分析 线性相关关系 求线性回归方程 检验求相
14、关系数 残差分析 确定拟合效果预测数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如下图所示,由散点图可知,它们之间具有线性相关关系数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(2)列表计算:次数 xi成绩 yix2iy2ixiyi303090090090033341 0891 1561 12235371 2251 3691 29537391 3691 5211 44339421 5211 7641 63844461 9362 1162 02446482 1162 3042 20850512
15、 5002 6012 550数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动由上表可求得 x 39.25,y 40.875,i18x2i12 656,i18y2i13 731,i18xiyi13 180,数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动bi18xi x yi y i18xi x 2i18xiyi8 x yi18x2i8 x 2 1.041 5,a y b x 0.003 02,回归方程为y1.041 5x0.003 02.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(3)残差分析作残差图如下图所示,由图可知,残差点比较均
16、匀地分布在水平带状区域中,说明选用的模型比较合适数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(4)计算相关指数 R2计算相关指数 R20.985 5.说明了该运动员的成绩的差异有 98.55%是由训练次数引起的(5)做出预报由上述分析可知,我们可用回归方程y1.041 5x0.003 02作为该运动员成绩的预报值将 x47 和 x55 分别代入该方程可得y49 和y57.故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动规律方法 1.对于建立的回归模型进行残差分析,一般从以下几方面进行:
17、(1)残差图;(2)残差平方和;(3)相关指数2相关指数R2的作用利用相关指数R2可以刻画拟合效果的好坏在线性回归模型中,R2的取值越接近1,说明残差的平方和越小,即说明模型的拟合效果越好数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动2已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏x1416182022y1210753数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:x 15(1416182022)18,y 15(1210753)7.4,i15x2i142162182202222
18、1 660,i15xiyi14121610187205223620.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动所以,bi15xiyi5 xyi15x2i5 x 26205187.41 66051821.15,a7.41.151828.1,所以所求回归直线方程是:y1.15x28.1.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动列出残差表:yiyi00.30.40.10.2yi y4.62.60.42.44.4所以,i15(yiyi)20.3,i15(yi y)253.2,R21i15yiyi2i15yi y 20.994,所以回归模型的拟合效果很好
19、数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动非线性回归分析某地区不同身高的未成年男性的体重平均值如下表:身高x/cm60708090100110体重y/kg6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(1)试建立y与x之间的回归方程;(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175 cm,体重为82kg的在校男生体重是否正常
20、?(3)求相关指数R2.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动思路点拨 数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(1)根据上表中数据画出散点图如下图由图看出,样本点分布在某条指数函数曲线yc1ec2x的周围,于是令zln y.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动作出散点图如下图3分x60708090100 110 120 130 140 150 160 170z1.812.072.302.502.712.863.043.293.443.663.864.01数学选修2-3第三章 统计案例自主学习 新知突破合作探究
21、 课堂互动由表中数据可得 z 与 x 之间的回归直线方程:z0.6930.020 x,则有ye0.6930.020 x.4 分(2)当 x175 时,预测平均体重ye0.6930.2017566.22,由于 66.221.279.4782,所以这个男生偏胖.8 分数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(3)x60708090100110y6.137.909.9912.1515.0217.50y6.648.119.9012.1014.7818.05e0.51 0.210.090.050.240.55x120130140150160170y20.9226.8631.11
22、38.8547.2555.05y22.0426.9232.8840.1749.0659.91e1.12 0.06 1.77 1.32 1.81 4.86数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动相关指数:R21i1nyiyi2i1nyi y 20.988.12 分数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动规律方法 解决非线性回归问题(1)两个变量不具有线性相关关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如yc1ec2x,可通过对数变换把指数关系变为线性关系:令zln y,则变换后样本点应分布在直线zbx
23、a(alnc1,bc2)周围数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(2)求非线性回归方程的步骤:确定变量,作出散点图;根据散点图,选择恰当的拟合函数;变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程;分析拟合效果:通过计算相关指数或画残差图来判断拟合效果;根据相应的变换,写出非线性回归方程数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动3为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计
24、算相关指数天数x/天123456繁殖个数y/个612254995190数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动解析:(1)所作散点图如图所示 数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(2)由散点图看出样本点分布在一条指数函数yc1ec2x的周围,于是令zln y,则x123456z1.792.483.223.894.555.25由计算器得:z0.69x1.115,则有ye0.69x1.115.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动(3)y6.0812.1224.1748.1896.06191.52y61225499
25、5190y 3776,i1ne2i i1n(yiy)24.816 1,i1n(yi y)224 642.8,R21 4.816 124 642.80.999 8.即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程x0.250.5124y1612521数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动【错解】由已知条件制成下表:序号xiyixiyix2iy2i10.251640.062 525620.51260.2514431551
26、2542244454141617.75362321.312 5430数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动所以 x 1.55,y 7.2.所以bi15xiyi5 x yi15x2i5 x 2 3.53.a y b x 12.67.所求的 y 与 x 之间的回归方程是y3.53x12.67.数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动提示 本题直接取已知数据求线性回归方程,没有画出散点图或求相关系数 r,进行线性相关性的检验,而本题的样本点恰好不是线性相关的根据散点图可以发现 y 与 x 近似地呈反比例函数关系,即 ykx的关系,如下图所示,令
27、t1x,则 ykt,即 y 与1x呈线性相关的关系数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动【正解】根据散点图可知 y 与 x 近似地呈反比例函数关系,设 ykx,令 t1x,则 ykt,原数据变为:t4210.5 0.25y1612521数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动由散点图可以看出y与t呈近似的线性相关关系列表如下:序号tiyitiyit2iy2i141664162562212244144315512540.5210.25450.2510.250.062 517.753694.25 21.312 5430数学选修2-3第三章 统计案例自主学习 新知突破合作探究 课堂互动所以 t 1.55,y 7.2.所以bi15tiyi5 t yi15t2i5 t 2 4.134 4.a y b t 0.8,所以 y4.134 4t0.8.所以 y 与 x 的回归方程是y4.134 4x0.8.谢谢观看!