1、hhzq_h1.6 线性回归(1)对于两个变量之间的关系,我们以前学过.现实生活中还存在着另一种非确定性关系函数关系是一种确定性关系.相关关系.阅读课本P3638 内容.课题引入正方形边长x面积S2x确定关系1正方形面积S与边长x之间的关系:2一块农田的水稻产量与施肥量之间的关系:水稻产量施肥量气候情况浇水除虫不确定关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。两个变量之间的关系:(1)函数关系(确定性关系)正方形面积S与边长x之间的关系:正方形边长x面积S2x确定关系一块农田的水稻产量与施肥量之间的关系:水稻产量施肥量气候浇水除虫不确定关系(2)相关关系(非确定性关系
2、):自变量取值一定时,因变量的取值带有一定随机性的两个 变量之间的关系叫做相关关系相关关系与函数关系的异同点:相关关系函数相同点不同点对具有相关关系的两个变量进行统计分析的方法叫回归分析均是指两个变量的关系非确定关系非随机变量与随机变量的关系 确定的关系 两个非随机变量的关系 回归分析:对具有相关关系的两个变量进行统计分析 的方法。通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性现实生活中的相关关系:人的身高与年龄、产品的成本与生产数量、商品的销售额与广告费、家庭的支出与收入等都是相关关系例如:在一个文娱网络中,点击观看某个节目的累积人次有如下数据:播放天数12345678910点击
3、观看的累积人次51134 213 235 262 294 330 378 457 533播放天数12345678910点击观看的累积人次51134 213 235 262 294 330 378 457 533将表中各对数据在平面直角坐标系中描点,得到:.发现:图中各点,大致分布在某条直线附近。哪条直线最能代表x与y之间的关系呢?播放天数12345678910点击观看的累积人次51134 213 235 262 294 330 378 457 533散点图形象地反映了各对数据的密切程度这样表示具有相关关系的两个变量的一组数据的图形,叫做散点图.你发现图象中的点有什么特点?设所求的直线方程为 ,
4、其中a、b是待定系数abxy),2,1.(niabxyii各偏差为:),2,1).(niabxyyyiiii 偏差 的符号有正有负,相加相互抵消,所以它们和不能代表n个点与相应直线在整体上的接近程度.iiyy采用n个偏差的平方和2222211)()()(abxyabxyabxyQnn表示n个点与相应直线在整体上的接近程度记作niiiabxyQ12)(一般地,设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在一条直线的附近,我们来求在整体上与这n个点最接近的一条直线.阅读课本P3738 内容.(在统计中,惯用b表示一次项系数,用a表示常数项.)(21nxxx如:niix111
5、22211()()()nniiiiiinniiiixxyyx ynx ybxxxnxaybx niiiabxyQ12)(展开后,是一个关于a、b的二次多项式,利用配方法,可求出使Q为最小值时的a、b的值,.1,111niiniiynyxnx(详细推导见书P43阅读材料)其中,所得到的直线方程:.)()(2121121xbyaxnxyxnyxxxyyxxbniiniiiniiniiiniiniiynyxnx111,1abxy叫做回归直线方程其中相应的直线叫做回归直线,对这两个变量所进行的统计分析叫做线性回归分析 例 一个工厂在某年里每月产品的总成线y(万元)与该月 产量x(万件)之间有如下一组对
6、应数据:x1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07y2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y与月总产量x之间的回归直线方程解:(1)画出的散点图如图所示(2)列出下表,并用科学计算器计算,于是可得12112222118.51254.243 122.8475121.21518.529.808 12()121218.52.8475 1.2150.97412iiiiix yxybxxaybx 因此,所求的回归直线方程是=1.215x+0.974.yP40练习:故所求回归直线方程是:课堂小结准确理解相关关系的概念,并在此基础上,了解回归分析与散点图的含义,了解回归直线方程推导的思路,会利用a、b的公式求出回归直线方程,利用回归直线方程去估值求线性回归方程的步骤:1计算平均数、计算的积,求、计算及;2将结果代入公式求b,用求a;3写出回归方程.yx,iiyx 与ii yx2ix2iyxbya作业:42P习题1.6 1.二教材 读书 P2830,完成分级训练