1、第十节 相关性及最小二乘估计考纲点击 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.热点提示 1.以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系.2.以实际生活为背景,重在考查回归方程的求法.3.在高考题中本部分的命题主要是以选择、填空题为主,属于中档题目.1散点图在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这样的图为变量之间的2线性相关(1)从散点图上看,如果变量之间存在某种关系,这些
2、点有一个集中的大致趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为(2)若两个变量x和y的散点图中所有点看上去都在附近波动,则称变量间是的此时,我们可以用近拟散点图曲线拟合一条直线线性相关一条直线(3)若所有点看上去都在某条曲线(不是直线)附近波动,则称此相关为非线性相关的(4)如果所有的点的散点图中没有显示任何关系,则称变量间是 的 3回归方程(1)最小二乘法:使得样本数据的点到回归直线的 最小的方法叫做最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn)其回归方程为ybxa,则 不相关距离的平方和其中a,b是线性回归方程的系数
3、 bi1n(xi x)(yi y)i1n(xi x)2i1nxiyin x yi1nxi2n x2a yb x1下列选项中,两个变量具有相关关系的是()A正方形的面积与周长B匀速行驶车辆的行驶路程与时间C人的身高与体重D人的身高与视力【解析】A、B中的两个变量是函数关系,D中的两个变量不具有任何关系,C中人的身高与体重有相关关系【答案】C2有关线性回归的说法,不正确的是()A相关关系的两个变量是非确定关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D散点图中的点越集中,两个变量的相关性越强【解析】散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线
4、性分布时,两个变量相关关系越强【答案】D3已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的回归方程是()Ay1.23x4 By1.23x5Cy1.23x0.08 Dy0.08x1.23【解析】当x4时,y1.2340.085.故选C.【答案】C4下列关系:人的年龄与其拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关系;森林中的同一树木,其截面直径与高度之间关系;学生的身高与其学号之间的关系,其中有相关关系的是_【解析】是一一对应的关系,身高与学号无关系,、中变量有相关关系【答案】5若施化肥量x kg与水稻产量y kg在一定范围内线性相
5、关,若回归方程为y5x250.当施化肥量为80 kg时,预计水稻的产量为_【解析】当x80时,y580250650(kg)【答案】650 kg身高(cm)143 156 159 172 165 171 177 161 164 160 体重(kg)41 49 61 79 68 69 74 69 68 54 在某地区的1230岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系相关关系的判断【思路点拨】(1)用x轴表示身高,y轴表示体重,逐一描出各组值对应的点(2)分析两个变量是否存在相关关系【自主探究】以x轴表示身高,y轴表示体重
6、,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关【方法点评】在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关如年龄的值由小变大时,体内脂肪含量也在由小变大反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关学号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 1
7、04 103 110 104 105 99 108 y 84 64 84 68 69 68 69 46 57 71 1现随机抽取某校10名学生在入学考试中的数学成绩x与入学后的第一次数学成绩y,数据如表:问这10名学生的两次数学考试成绩是否具有相关关系?【解析】两次数学考试成绩散点图如图所示由散点图可以看出两个变量的对应点集中在一条直线的周围,且y随x的变大而变大,具有相关关系因此,这10名中学生的两次数学考试成绩具有相关关系x 2 4 5 6 8 y 30 40 60 50 70 某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据(1)画出散点图;(2)求回归直线方程;(3)
8、预测当广告费支出为7百万元时的销售额求回归方程【思路点拨】作散点图求出 x,y,5i1xi2,5i1xiyi求b,a得回归方程【自主探究】(1)由题设所给数据,可得散点图如图(3)当x=7时,y=6.57+17.5=63,即当广告费支出为7百万元时的销售额为63百万元【方法点评】1.最小二乘法是一种有效地求回归方程的方法,它保证了各点与此直线在整体上最接近,最能反映样本观测据数的规律2最小二乘法估计的一般步骤:(1)作出散点图,判断是否线性相关;(2)如果是,则用公式求a、b,写出回归方程;(3)根据方程进行估计家庭编号 1 2 3 4 5 6 7 8 9 10 xi(收入)千元 0.8 1.
9、1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8 yi(支出)千元 0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5 2随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归方程否则,说明理由【解析】(1)作出散点图:观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系a1.421.740.813 60.004 3,回归方程y0.813 6x0.004 3.x 45 42
10、46 48 42 35 58 40 39 50 y 6.53 6.30 9.52 7.50 6.99 5.90 9.49 6.20 6.55 7.72 已知10只狗的红细胞体积及红细胞数量的测量值如下,x(红细胞体积),y(红细胞数量):(1)画出散点图;回归方程的应用(3)由散点图判断能否用线性回归方程来刻画x与y之间的关系,若能,求出线性回归方程;若不能,请说明理由【思路点拨】(1)利用描点作出散点图,判断是否线性相关;(2)利用公式求出回归系数,得回归方程【自主探究】(1)散点图如图所示(2)由题中数据得,(45+42+46+48+42+35+58+40+39+50)=44.5;(6.5
11、3+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+7.72)=7.27;(3)由散点图可知,能用线性回归方程来刻画x与y之间的关系设回归直线为ybxa.线性回归方程为:y0.16x0.15.【方法点评】从本题可以看出,求回归方程,关键在于正确求出系数a,b,由于计算量较大,所以计算时要仔细谨慎,分层进行,避免因计算产生失误,特别注意,只有在散点图大体呈线性时,求出的回归方程才有意义母亲身高 x/cm 159 160 160 163 159 154 159 158 159 157 女儿身高 y/cm 158 159 160 161 161 155 162 157
12、 162 156 3为了了解某地母亲身高x与女儿身高y的相关关系,随机测得10对母女的身高,如表所示:(1)求出散点图(2)求出回归方程(3)预测当母亲身高为161 cm时,女儿的身高为多少?【解析】(1)散点图如图所示:a=159.1-0.78158.835.24.y=35.24+0.78x.(3)当x=161时,y=35.24+0.78161=160.82.预测当母亲身高为161 cm时女儿的身高大致也接近161 cm.1(2009年宁夏、海南高考)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图1;对变量u、v有观测数据(ui,vi)(i1,2,10),得散点图2.由这两
13、个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关【解析】由题图1可知,各点整体呈递减趋势,x与y负相关,由题图2可知,各点整体呈递增趋势,u与v正相关【答案】Cx 3 4 5 6 y 2.5 3 4 4.5 2(2007年广东高考)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据(1)请画出表中数据的散点图;(2)请根据表中提供的数据,用最小二乘法求出y关于x的回归直线方程ybxa.(3)已知该厂技改前100吨甲产品的生产能耗为90吨
14、标准煤试根据(2)求出的回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?【解析】(1)由题设所给数据,可得散点图如图(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7100+0.35)=19.65(吨标准煤)3(2009年河源模拟)回归方程ybxa必过()【解析】回归直线方程一定过样本点的中心【答案】DA(0,0)B(x,0)C(0,y)D(x,y)(x,y)1对相关关系的理解应当注意以下两点:(1)相关关系是非随机变量与随机变量之间的关系而函数关系可以看成是两个非随机变量之间的关系因此,不能把相关关系等同于函数关系(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系然而,学会新词并不能使脚变大,而是涉及到第三个因素年龄当儿童长大一些,他们的阅读能力会提高,而且由于长大,脚也变大2在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程3求线性回归方程ybxa的关键是求回归系数a,b其中回归系数b可借助于计算器完成,因为 a y b x,即 y b x a,所以点(x,y)一定满足线性回归方程,即回归直线一定过点(x,y)课时作业点击进入链接