1、学习目标 1.了解用最小二乘法建立线性回归方程的思想,会用给出的公式建立线性回归方程.2.理解回归直线与观测数据的关系,能用线性回归方程进行估计和预测知识点一 最小二乘法思考 具有线性相关关系的散点大致分布在一条直线附近如何确定这条直线比较合理?知识点二 线性回归方程思考 数学上的“回归”是什么意思?梳理 用最小二乘法得到的直线方程称为_,a,b 是线性回归方程的系数如果用 x 表示x1x2xnn,用 y 表示y1y2ynn,则可以求得bx1 x y1 y x2 x y2 y xn x yn y x1 x 2x2 x 2xn x 2x1y1x2y2xnynn xyx21x22x2nn x 2.
2、a_.类型一 线性回归方程的求法例 1 下表为某地近几年机动车辆数与交通事故数的统计资料机动车辆数 x/千台95110112120129135150180交通事故数 y/千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否具有线性相关关系,如果不具有线性相关关系,请说明理由;(2)如果具有线性相关关系,求出线性回归方程 反思与感悟 即使散点图呈饼状,也可利用公式求出线性回归方程,但这种方程显然没什么价值故应先画出散点图,看是否呈直线形,再求方程跟踪训练 1 以下是某地搜集到的新房屋的销售价格 y 和房屋的面积 x 的数据:房屋面积 x(m2)11511
3、080135105销售价格 y(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线 类型二 线性回归方程的应用例 2 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间有什么关系;(3)求线性回归方程;(4)如果某天的气温是 2,预测这天卖出的热饮杯数;(5)气温为 2时,小卖部一定能够卖出 143
4、 杯左右热饮吗?为什么?反思与感悟 线性回归方程主要用于预测,但这种预测类似于天气预报,不一定与实际数据完全吻合跟踪训练 2 有人统计了同一个省的 6 个城市某一年的人均国民生产总值(即人均 GDP)和这一年各城市患白血病的儿童数,如下表:人均 GDP/万元1086431患白血病的儿童数/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的线性回归方程为 y23.25x102.15,假如一个城市的人均GDP 为 12 万元,那么可以断言,这个城市患白血病的儿童一定超过 380 人,请问这个断言是否正确?1下列有关线性回归的
5、说法,不正确的是()A自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫作散点图C线性回归方程最能代表观测值 x、y 之间的线性关系D任何一组观测值都能得到具有代表意义的线性回归方程2已知回归直线的斜率的估计值是 1.23,样本点中心(即(x,y)为(4,5),()Ay1.23x4By1.23x5Cy1.23x0.08Dy0.08x1.233某产品的广告费用 x 与销售额 y 的统计数据如下表:广告费用 x(万元)4235销售额 y(万元)49263954根据上表可得线性回归方程 ybxa
6、 中的 b 为 9.4,据此模型预报广告费用为 6 万元时销售额为()A63.6 万元B65.5 万元C67.7 万元D72.0 万元4设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的线性回归方程为 y0.85x85.71,则下列结论中不正确的是()Ay 与 x 具有正的线性相关关系B回归直线过样本点的中心(x,y)C若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kgD若该大学某女生身高为 170 cm,则可判定其体重必为 58.79 kg1求线性回归方程时应注意的问题(1)知道 x
7、与 y 成线性相关关系,无需进行相关性检验,否则应首先进行相关性检验,如果两个变量之间本身不具有相关关系,或者说,它们之间的相关关系不显著,即使求出线性回归方程也是毫无意义的,而且用其估计和预测的量也是不可信的(2)用公式计算 a、b 的值时,要先计算 b,然后才能算出 a.2利用线性回归方程,我们可以进行估计和预测若线性回归方程为 ybxa,则 xx0处的估计值为 y0bx0a.答案精析问题导学知识点一思考 应该使散点整体上最接近这条直线最小二乘法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离y1(abx1)2y2(abx2)2yn(abxn)2 最小知识点
8、二思考“回归”一词最早由英国统计学家(Francils Galton)提出的,本意是子女的身高会向一般人的均值靠拢现在这个概念引伸到随机变量有向回归线集中的趋势梳理 线性回归方程 y b x题型探究例 1 解(1)在平面直角坐标系中画出数据的散点图,如图直观判断散点在一条直线附近,故具有线性相关关系(2)计算相应的数据之和:i18xi1 031,i18yi71.6,i18x2i137 835,i18xiyi9 611.7,x 128.875,y 8.95,将它们代入公式计算得 b0.077 4,a1.024 9,所以,所求线性回归方程为 y0.077 4x1.024 9.跟踪训练 1 解(1)
9、数据对应的散点图如图所示:(2)x 15i15xi109,y 23.2,i15x2i60 975,i15xiyi12 952.设所求线性回归方程为 ybxa,则 bi15xiyi5 xyi15x2i5 x 20.196 2,a y b x 23.21090.196 21.814 2,故所求线性回归方程为 y0.196 2x1.814 2.回归直线如(1)中图所示例 2 解(1)散点图如图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出线性回
10、归方程的系数利用计算器容易求得线性回归方程为 y2.352x147.767.(4)当 x2 时,y143.063.因此,某天的气温为 2时,这天大约可以卖出 143 杯热饮(5)小卖部不一定能够卖出 143 杯左右热饮,原因如下:线性回归方程中的截距和斜率都是通过样本估计出来的,存在误差,这种误差可以导致预测结果的偏差即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于 x 的预报值,能够与实际值 y 很接近我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近跟踪训练 2 解(1)散点图如下:根据散点图可以看出,在 6 个点中,虽然第一个点离这条直线较远,但其余 5 个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系(2)断言是错误的,将 x12 代入 y23.25x102.15 得 y23.2512102.15381.15380,但 381.15 是对该城市人均 GDP 为 12 万元的情况下所作的一个估计,该城市患白血病的儿童可能超过 380 人,也可能低于 380 人当堂训练1D 2.C 3.B 4.D