1、章末复习课整合网络构建警示易错提醒1回归分析:(1)回归分析是建立在两个具有相关性变量之间的一种模拟分析,因此必须先判断两变量是否具有相关性(2)线性回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(,)点,可能所有的样本数据点都不在直线上(3)利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值)2独立性检验:(1)通过独立性检验得到的结论未必正确,它只是对一种可靠性的预测(2)在22列联表中,当数据a,b,c,d都不小于5时,才可以用K2检测(3)独立性检验易错误理解假设检验原理,导致得到相反的结论专题一线性回归分析回归分析是对具有相关关系的两个变量进行统
2、计分析的一种方法根据两个变量的一组观测值,可以画出散点图,以判断两个变量是否具有线性相关关系,若具有线性相关关系,可求出线性回归直线方程求出线性回归模型后,可以借助残差、残差平方和以及相关指数R2等对模型进行评判相关指数R2刻画回归的效果,其计算公式:R21 , R2的值越大,模型的拟合效果越好.例1 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归
3、方程,预测技改后生产100吨甲产品比技改前少消耗多少吨标准煤.解:(1)散点图如图所示:(2) x iyi32.5435464.566.5,4.5,3.5,3242526286.0.7,3.50.74.50.35.因此,所求的线性回归方程为0.7x0.35.(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.71000.3570.35(吨),故耗能减少了9070.3519.65(吨标准煤)归纳升华1求线性回归方程的基本步骤2需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义变式训练已知某种商品的价格x(元)与需求量y(件)之间的
4、关系有一组数据:x1416182022y1210753(1)若y与x线性相关,求y关于x的回归直线方程;(2)在(1)的条件下,若R20.994,说明其含义解:(1)(1416182022)18,(1210753)7.4, x iyi14121610187205223620,7.41.151828.1,所以所求回归直线方程是1.15x28.1.(2)R20.994时,说明需求量的差异有99.4%的可能性由商品的价格影响的所以回归模型的拟合效果很好专题二独立性检验独立性检验是判断两个分类变量之间是否有关系的一种方法在判断两个分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否有
5、关系,而独立性检验可以精确地得到可靠的结论 例2电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性根据已知条件完成22列联表,并据此资料你是否认为“体育迷”与性别有关?分类非体育迷体育迷总计男女总计附:P(K2k0)0.050.01k03.8416.635解:由频率分布直方图可知,在抽取的100名观众中,“体育迷”有25名,“非体育迷”有75名,又已知100名观众中女性有55名,女“体育迷”
6、有10名所以男性有45名,男“体育迷”有15名从而可完成22列联表,如表:分类非体育迷体育迷总计男301545女451055总计7525100由22列联表中的数据,得K2的观测值为k3.030.因为3.0302.706.故有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关专题三化归转化思想在回归分析中的应用如果两个变量非线性相关,要进行回归分析,可以通过对变量进行代换,转化成线性相关问题,进而进行回归分析 例3电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式UAebt(b0)表示,现测得时间t(s)时的电压U(V)如下表:t(s)012
7、345678910U(V)100755540302015101055试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)解:对UAebt两边取对数得ln Uln Abt,令yln U,aln A,xt,则yabx,得y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根据表中数据作出散点图,如图所示,从图中可以看出,y与x具有较强的线性相关关系,由表中数据求得5,3.045,进而可以求得0.313,4.61.所以y对x的线性回归方程为y4.610.313x.由yln U,得Uey,Ue4.610.313xe4.16e0.313x.因此电压U对时间t的回归方程为Ue4.61e0.313x.归纳升华非线性回归分析的一般步骤:1确定变量,作出散点图2根据散点图,选择恰当的拟合函数3变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程4分析拟合效果:通过计算相关指数或画残差图来判断拟合效果5根据相应的变换,写出非线性回归方程变式训练对于曲线yae,令ln y,cln a,v,可变换为线性回归模型,其形式为()AyabvBabvCcbv Dycbx解析:由yae,两边取对数得ln yln a又ln y,cln a,vcbv.答案:C