1、第三章 统计案例 1 回归分析1.1 回归分析自主整理假设样本点为(x1,y1),(x2,y2),(xn,yn),设线性回归方程为y=a+bx,使这n个点与直线y=a+bx的_最小,即使得Q(a,b)=_达到最小.利用最小二乘法的思想求得.当b=_,a=_时,Q(a,b)取最小值.高手笔记1.对具有相关关系的两个变量进行统计分析的方法叫回归分析.回归分析是寻找相关关系中非确定性关系的某种确定性.2.如果散点图中点的分布从整体上看大致在一条直线附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线,从整体上看各点与此直线的距离平方之和最小,即最贴近已知的数据点,最能代表变量x与y之间的关
2、系.名师解惑1.相关关系与函数关系有哪些相同点和不同点?剖析:相同点:两者均指两个变量的关系.不同点:(1)函数关系是一种确定的关系,相关关系是一种非确定的关系;(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.如何理解相关关系的不确定性?剖析:教材中利用始祖鸟的5个标本求出股骨长度x与肱骨长度y的回归直线方程为y=-3.660+1.197x,那么将第6个标本中股骨长度x=50代入回归直线方程,可以预测第6个标本中的肱骨长度的估计值约为56 cm.是不是当股骨长度x=50时,肱骨长度y一定为56呢?不一定.但如果有大量化石供研究时,股骨长度为50 cm的始祖鸟的肱
3、骨的平均值应为56 cm.讲练互动【例】关于人体的脂肪含量(百分比)和年龄关系的研究中,研究人员获得了一组数据:年龄x23273941454950脂肪y9.517.821.225.927.526.328.2年龄x53545657586061脂肪y29.630.231.430.833.535.234.6(1)求y与x之间的回归直线方程;(2)给出37岁人的脂肪含量的预测值.分析:两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值.解:设方程为y=a+bx,根据已知列表为:ixiyixi2xiyi1239.5529218.522717.8729480.633921.
4、21 521826.844125.91 6811 061.954527.52 0251 237.564926.32 4011 288.775028.22 5001 41085329.62 8091 568.895430.22 9161 630.8105631.43 1361 758.4115730.83 2491 755.6125833.53 3641 943136035.23 6002 112146134.63 7212 110.6673381.734 18119 403.2由表可得b=0.5765,a=-b-0.447 8.线性回归方程为y=0.576 5x-0.447 8.当x=37时,
5、y20.882 7.37岁人的脂肪含量的预测值为20.882 7.绿色通道:对于样本点较多时,可列表分项计算.变式训练某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系.从这个工业部门内随机抽取了10个企业作样本,有如下资料:产量x(千件)生产费用y(千元)40150421404816055170651507916288185100165120190140185求x、y之间的线性回归方程.解:x、y成线性相关关系.列表:ixiyixi2xiyi1401501 6006 0002421401 7645 8803481602 3047 6804551703 0259 3505651504 2259 7506791626 24112 7987881857 74416 280810016510 00016 500912019014 40022 8001014018519 60025 9007771 65770 903132 938=77.7,=165.7,b=0.398,a=-b=165.7-0.39877.7=134.8.线性回归方程为y=134.8+0.398x.