1、2.3 变量间的相关关系 2.3.2 线性回归方程 本课主要学习变量间的相关关系的相关内容,具体包括线性回归方程的求解。本课开始回顾了上节课所学变量间的相关关系与散点图的相关内容,紧接着引入回归直线的定义及特征,回归直线方程的定义及求法(最小二乘法),并且通过例题和习题进行讲解。最后通过习题进行加深巩固。1.理解线性回归。2.了解回归直线方程的求解方法。(3)如果所有的样本点都落在某一直线附近,变量之间就 有线性相关关系.(1)如果所有的样本点都落在某一函数曲线上,就用该函数来 描述变量之间的关系,即变量之间具有函数关系(2)如果所有的样本点都落在某一函数曲线附近,变量之间就 有相关关系。散点
2、图:用来判断两个变量是否具有相关关系.1、回归直线(1)回归直线的定义:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(2)回归直线的特征:如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解对应两个变量之间的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线也可以作为两个变量之间具有相关关系的代表.2、回归直线方程定义:一般地,设x与y是具有相关关系的两个变量,且相应于n组观测值的n个点(xi,yi)(i1,2,n)大致分布在一条直线附近,求在整体上与这n个最接近的一条直线.设此直线方程为y=b
3、x+a.这里在y的上方加记号“”,是为了区分实际值y,表示当x取值xi(i1,2,n)时,y相应的观察值为yi,而直线上对应于xi的纵坐标是yi=bxi+a.y=bx+a叫做y对x的回归直线方程,a、b叫做回归系数.注意:求回归直线方程的关键是如何用数学的方法来刻画“从整体上看各点与此直线的距离最小”,即最贴近已知的数据点,最能代表变量x与y之间的关系.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):施化肥量x 15 20 25 30 35 40 45 水稻产量y 330 345 365 405 445 450 455 y水稻产量x(
4、施化肥量)10 20 30 40 503003504004505003、最小二乘法假设我们已经得到两个具有线性相关的变量的一组数据(x1,y1),(x2,y2),(xn,yn).根据最小二乘法和上述公式可以求回归方程.1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxaybx 根据下表,求回归方程.分析:求线性回归直线方程的步骤:iiiixyx y第一步:列表,;nnn22iiiii1i1i1xyxyx y第二步:计算,;ba第三步:代入公式计算、的值;.第四步:写出直线方程1、列表2、代入公式计算3、写出回归直线方程解:2871757 30 399.34.75,70007 30399.34.75 30257,ba 故可得从而可得回归方程是y=4.75x+257求回归方程的一般方法:1、列表2、计算,x,y,12niixinii yx13、求 a,b4、代入回归直线方程Thank you!