1、1.3可线性化的回归分析明目标、知重点1.进一步体会回归分析的基本思想.2.通过非线性回归分析,判断几种不同模型的拟合程度1常见的非线性回归模型幂函数曲线yaxb,指数曲线yaebx.倒指数曲线yae,对数曲线yabln_x.2非线性函数可以通过变换转化成线性函数,得到线性回归方程,再通过相应变换得到非线性回归方程探究点一非线性回归模型思考1有些变量间的关系并不是线性相关,怎样确定回归模型?答首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,这时可以根据已有的函数知识,观察样本点是否呈指数函数关系或二次
2、函数关系,选定适当的回归模型思考2如果两个变量呈现非线性相关关系,怎样求出回归方程?答可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变量间的回归方程,再得到所求两个变量的回归方程例1 某地区不同身高的未成年男性的体重平均值如下表:身高x/cm60708090100110体重y/kg6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05试建立y与x之间的回归方程解根据表中数据画出散点图如图所示由图看出,样本点分布在某条指数函数曲线yc1ec2x的周围,于是令z
3、ln y.x60708090100110120130140150160170z1.812.072.302.502.712.863.043.293.443.663.864.01画出散点图如图所示由表中数据可得115,2.962 5,iyi4 370.5,173 000,b0.020,ab 0.663,z与x之间的线性回归方程为z0.6630.020x,则有ye0.6630.020x.反思与感悟根据已有的函数知识,可以发现样本分布在某一条指数型函数曲线yc1ec2x的周围,其中c1和c2是待定参数;可以通过对x进行对数变换,转化为线性相关关系跟踪训练1在彩色显影中,由经验知:形成染料光学密度y与析
4、出银的光学密度x由公式yAe (b0且a1)Dylogax(a0且a1)答案A1散点图在回归分析中的作用是()A查找个体个数B比较个体数据大小关系C探究个体分类D粗略判断变量是否相关答案D2变量x与y之间的回归方程表示()Ax与y之间的函数关系Bx与y之间的不确定性关系Cx与y之间的真实关系形式Dx与y之间的真实关系达到最大限度的吻合答案D3变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为()A1 B0.5C0 D0.5答案C4某种产品的广告费支出x与销售额y之间有下表关系,现在知道其中一个数据弄错了,则最可能错的数据是_.x/万元24568y/万元3040605070答
5、案(6,50)呈重点、现规律1对于确定具有非线性相关关系的两个变量,可以通过对变量进行变换,转化为线性回归问题去解决建立回归模型的步骤确定研究对象,明确变量关系;画出散点图,观察变量之间的关系;由经验确定回归方程的类型;按一定规则估计回归方程中的参数2常见曲线方程的变换公式曲线方程变换公式变换后的线性方程ay,xyabxyaxbyln y,xln xyAbx(Aln a)yabln xyy,xln xyabxyaebxyln y,xxyAbx(Aln a)一、基础过关1下列说法正确的是()线性回归方程适用于一切样本和总体;线性回归方程一般都有时间性;样本的取值范围会影响线性回归方程的适用范围;
6、根据线性回归方程得到的预测值是预测变量的精确值A B C D答案B2某商品销售量y(件)与销售价格x(元/件)负相关,则其线性回归方程可能是()Ay10x200 By10x200Cy10x200 Dy10x200答案A3在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1 B0 C. D1答案D4某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出下列拟合曲
7、线,其中拟合程度最好的是()Ay2x2 By()xCylog2x Dy(x21)答案D解析可以代入检验,当x取相应的值时,所求y与已知y相差最小的便是拟合程度最高的5对于指数曲线yaebx,令uln y,cln a,经过非线性化回归分析之后,可以转化成的形式为()Aucbx BubcxCybcx Dycbx答案A解析对方程yaebx两边同时取对数,然后将uln y,cln a代入,不难得出ucbx.6在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线yebxa的周围,令zln y,求得线性回归方程为z0.25x2.58,则该模型的回归方程为_答案ye0.25x2.58解析z0
8、.25x2.58,zln y,ye0.25x2.58.7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345(1)求年推销金额y关于工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额解(1)设所求的线性回归方程为ybxa,则b0.5,ab0.4.年推销金额y关于工作年限x的线性回归方程为y0.5x0.4.(2)当x11时,y0.5x0.40.5110.45.9(万元)可以估计第6名推销员的年推销金额为5.9万元二、能力提升8研究人员对10个家庭的儿童问题行为程度(X)及其母亲的
9、不耐心程度(Y)进行了评价结果如下,家庭1,2,3,4,5,6,7,8,9,10,儿童得分:72,40,52,87,39,95,12,64,49,46,母亲得分:79,62,53,89,81,90,10,82,78,70.下列哪个方程可以较恰当的拟合()Ay0.771 1x26.528By36.958ln x74.604Cy1.177 8x1.014 5Dy20.924e0.019 3x答案B解析可以通过画散点图观察知两个变量x、y之间大致呈现对数函数关系9已知x,y之间的一组数据如下表:x1.081.121.191.25y2.252.372.432.55则y与x之间的线性回归方程ybxa必过
10、点_答案(1.16,2.4)解析回归方程ybxa必过样本点的中心(,),1.16,2.4,样本点的中心为(1.16,2.4)10已知线性回归方程为y0.50x0.81,则x25时,y的估计值为_答案11.69解析当x25时,y0.50250.8111.69.11在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124y1612521如何建立y与x之间的回归方程解画出散点图如图(1)所示,观察可知y与x近似是反比例函数关系设y (k0),令t,则ykt.可得到y关于t的数据如下表:t4210.50.25y1612521画出散点图如图(2)所示,观察可知t和y有较强的线性相关性,因
11、此可利用线性回归模型进行拟合,易得:1.55,7.2,iyi94.25,21.312 5,b4.134 4,ab0.791 7,所以y4.134 4t0.791 7,所以y与x的回归方程是y0.791 7.12某地区六年来轻工业产品利润总额y与年次x的试验数据如下表所示:年次x123456利润总额y11.3511.8512.4413.0713.5914.41由经验知,年次x与利润总额y(单位:亿元)有如下关系:yabxe0.其中a、b均为正数,求y关于x的回归方程(保留三位有效数字)解对yabxe0两边取对数,得ln yln ae0xln b,令zln y,则z与x的数据如下表:x123456
12、z2.432.472.522.572.612.67由zln ae0xln b及最小二乘法公式,得ln b0.047 7,ln ae02.38,即z2.380.047 7x,所以y10.81.05x.三、探究与拓展13某商店各个时期的商品流通率y(%)和商品零售额x(万元)资料如下:x9.511.513.515.517.5y64.643.22.8x19.521.523.525.527.5y2.52.42.32.22.1散点图显示出x与y的变动关系为一条递减的曲线经济理论和实际经验都证明,流通率y决定于商品的零售额x,体现着经营规模效益,假定它们之间存在关系式:ya.试根据上表数据,求出a与b的估计值,并估计商品零售额为30万元时的商品流通率解设u,则yabu,得下表数据:u0.105 30.087 00.074 10.064 50.057 1y64.643.22.8u0.051 30.046 50.042 60.039 20.036 4y2.52.42.32.22.1进而可得n10,0.060 4,3.21,1020.004 557 3,iyi10 0.256 35,b56.25,ab0.187 5,所求的回归方程为y0.187 5.当x30时,y1.687 5,即商品零售额为30万元时,商品流通率为1.687 5%.