1、2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关一、教材分析 变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实
2、际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.二、教学目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程三、重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量
3、之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.四、课时安排 2课时五、教学设计第1课时(一)导入新课思路1 在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢? 请同学们如实填写下表(在空格中打“” ):好中差你的数学成绩你的物理成绩 学生讨论:我们可以发现自己的数学成绩和物理成绩存在某种关系.(似乎就是数学好的,物理也好;数学差的,物理也差,但又不全对.
4、)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2 某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么
5、这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?(二)推进新课、新知探究、提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等. 我们还可以举出现
6、实生活中存在的许多相关关系的问题.例如: 商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关. 粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响. 人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关. 应当说,对于上述各种问题中的两个变量之间的相关关系,我们都
7、可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法. 在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变
8、量之间的关系分两类:确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:散点图.根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.正相关、负相关的概念.教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:年龄23273841454950脂肪9.517.821.225.927.526.32
9、8.2年龄53545657586061脂肪29.630.231.430.833.535.234.6 分析数据:大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加.我们可以作散点图来进一步分析.散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图. 从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系b.如果所有的样本点都落在某一函数曲线附近,变量
10、之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)(三)应用示例思路1例1 下列关系中,带有随机性相关关系的是_.正方形的边长与面积之间的关系水稻产量与施肥量之间的关系人的身高与年龄之间的关系降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.正方形的边长与面积之间的关系是函数关系.水稻产量与施肥量之间的关系
11、不是严格的函数关系,但是具有相关性,因而是相关关系.人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.降雪量与交通事故的发生率之间具有相关关系,因此填.答案:例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更
12、容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:品牌
13、所含热量的百分比口味记录A2589B3489C2080D1978E2675F2071G1965H2462I1960J1352(1)作出这些数据的散点图.(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.性别身高/cm右手一拃长/cm性别身高/cm右手一拃长/cm女15218.5女15316.0女15616
14、.0女15720.0女15817.3女15920.0女16015.0女16016.0女16017.5女16017.5女16019.0女16019.0女16019.0女16019.5女16116.1女16118.0女16218.2女16218.5女16320.0女16321.5女16417.0女16418.5女16419.0女16420.0女16515.0女16516.0女16517.5女16519.5女16619.0女16719.0女16719.0女16816.0女16819.0女16819.5女17021.0女17021.0女17021.0女17119.0女17120.0女17121.5女1
15、7218.5女17318.0女17322.0男16219.0男16419.0男16521.0男16818.0男16819.0男16917.0男16920.0男17020.0男17021.0男17021.5男17022.0男17121.5男17121.5男17122.3男17221.5男17223.0男17320.0男17320.0男17320.0男17320.0男17321.0男17422.0男17422.0男17516.0男17520.0男17521.0男17521.2男17522.0男17616.0男17619.0男17620.0男17622.0男17622.0男17721.0男17821
16、.0男17821.0男17822.5男17824.0男17921.5男17921.5男17923.0男18022.5男18121.1男18121.5男18123.0男18218.5男18221.5男18224.0男18321.2男18525.0男18622.0男19121.0男19123.0(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下. 从散点图上可以发现,身高与右手一拃长之间的
17、总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170
18、 cm以下的,一部分是身高在170 cm以上的;然后,每部分的点求一个“平均点”身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近
19、的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.(四)知能训练 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)102030405060708090100加工时间y(min)626875818995102108115122 画出散点图;关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系(五)拓展提升 以下是某地搜集到
20、的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系.(六)课堂小结 通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.(七)作业 习题2.3A组3、4(1).第2课时(一)导
21、入新课思路1 客观事物是相互联系的,过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系.比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说.事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度.所以说,函数关系存在着一种确定性关系,但还存在着另一种非确定性关系相关关系.为表示这种相关关系,我们接着学习两个变量的线性相关回归直线及其方程.思路2 某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:气温/261813104-1杯数202434385064 如果
22、某天的气温是-5 ,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?为解决这个问题我们接着学习两个变量的线性相关回归直线及其方程.(二)推进新课、新知探究、提出问题(1)作散点图的步骤和方法?(2)正、负相关的概念?(3)什么是线性相关?(4)看人体的脂肪百分比和年龄的散点图,当人的年龄增加时,体内脂肪含量到底是以什么方式增加的呢?(5)什么叫做回归直线?(6)如何求回归直线的方程?什么是最小二乘法?它有什么样的思想?(7)利用计算机如何求回归直线的方程?(8)利用计算器如何求回归直线的方程?活动:学生回顾,再思考或讨论,教师及时提示指导.讨论结果:(1)建立相应的平面直角坐标系,将各数据在平
23、面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)(2)如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关的关系.(4)大体上来看,随着年龄的增加,人体中脂肪的百分比也在增加,呈正相关的趋势,我们可以从散
24、点图上来进一步分析.(5)如下图: 从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线附近.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线(regression line).如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解年龄与体内脂肪含量的相关性.就像平均数可以作为一个变量的数据的代表一样,这条直线可以作为两个变量具有线性相关关系的代表.(6)从散点图上可以发现,人体的脂肪百分比和年龄的散点图,大致分布在通过散点图中心的一条直线. 那么,我们应当如何具体求出这个回归方程呢? 有的同学可能会想
25、,我可以采用测量的方法,先画出一条直线,测量出各点与它的距离,然后移动直线,到达一个使距离的和最小的位置,测量出此时的斜率和截距,就可得到回归方程了.但是,这样做可靠吗? 有的同学可能还会想,在图中选择这样的两点画直线,使得直线两侧的点的个数基本相同.同样地,这样做能保证各点与此直线在整体上是最接近的吗? 还有的同学会想,在散点图中多取几组点,确定出几条直线的方程,再分别求出各条直线的斜率、截距的平均数,将这两个平均数当成回归方程的斜率和截距. 同学们不妨去实践一下,看看这些方法是不是真的可行?(学生讨论:1.选择能反映直线变化的两个点.2.在图中放上一根细绳,使得上面和下面点的个数相同或基本
26、相同.3.多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.)教师:分别分析各方法的可靠性.如下图: 上面这些方法虽然有一定的道理,但总让人感到可靠性不强. 实际上,求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与此直线的距离最小”.人们经过长期的实践与研究,已经得出了计算回归方程的斜率与截距的一般公式其中,b是回归方程的斜率,a是截距.推导公式的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn),且所求回归方程是=b
27、x+a,其中a、b是待定参数.当变量x取xi(i=1,2,n)时可以得到=bxi+a(i=1,2,n),它与实际收集到的yi之间的偏差是yi-=yi-(bxi+a)(i=1,2,n).这样,用这n个偏差的和来刻画“各点与此直线的整体偏差”是比较合适的.由于(yi-)可正可负,为了避免相互抵消,可以考虑用来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2 来刻画n个点与回归直线在整体上的偏差.这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式给出.通过求式的最小值而得出
28、回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square).(7)利用计算机求回归直线的方程. 根据最小二乘法的思想和公式,利用计算器或计算机,可以方便地求出回归方程. 以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定“图表”中的“添加趋势线”选项,弹出“添加趋势线”对话框.单击“类型”标签,选定“趋势预测/回归分析类型”中的“线性”选项,单击“确定”按钮,得到回归直线.双击回归
29、直线,弹出“趋势线格式”对话框.单击“选项”标签,选定“显示公式”,最后单击“确定”按钮,得到回归直线的回归方程=0.577x-0.448.(8)利用计算器求回归直线的方程. 用计算器求这个回归方程的过程如下:所以回归方程为=0.577x-0.448.正像本节开头所说的,我们从人体脂肪含量与年龄这两个变量的一组随机样本数据中,找到了它们之间关系的一个规律,这个规律是由回归直线来反映的.直线回归方程的应用:描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系.利用回归方程进行预测;把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体Y值的容许
30、区间.利用回归方程进行统计控制规定Y值的变化,通过控制x的范围来实现统计控制的目标.如已经得到了空气中NO2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO2的浓度.(三)应用示例思路1例1 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度/-504712151923273136热饮杯数15615013212813011610489937654(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是2 ,预测这天卖出的热饮杯数.解:(1)散点图如
31、下图所示:(2)从上图看到,各点散布在从左上角到右下角的区域里,因此,气温与热饮销售杯数之间呈负相关,即气温越高,卖出去的热饮杯数越少.(3)从散点图可以看出,这些点大致分布在一条直线的附近,因此,可用公式求出回归方程的系数.利用计算器容易求得回归方程=-2.352x+147.767.(4)当x=2时,=143.063.因此,某天的气温为2 时,这天大约可以卖出143杯热饮. 思考 气温为2 时,小卖部一定能够卖出143杯左右热饮吗?为什么? 这里的答案是小卖部不一定能够卖出143杯左右热饮,原因如下:1.线性回归方程中的截距和斜率都是通过样本估计出来的,存在随机误差,这种误差可以导致预测结果
32、的偏差.2.即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x的预报值,能够与实际值y很接近.我们不能保证点(x,y)落在回归直线上,甚至不能百分之百地保证它落在回归直线的附近,事实上,y=bx+a+e=+e. 这里e是随机变量,预报值与实际值y的接近程度由随机变量e的标准差所决定. 一些学生可能会提出问题:既然不一定能够卖出143杯左右热饮,那么为什么我们还以“这天大约可以卖出143杯热饮”作为结论呢?这是因为这个结论出现的可能性最大.具体地说,假如我们规定可以选择连续的3个非负整数作为可能的预测结果,则我们选择142,143和144能够保证预测成功(即实际卖出的杯数是这3个数之一
33、)的概率最大.例2 下表为某地近几年机动车辆数与交通事故数的统计资料.机动车辆数x千台95110112120129135150180交通事故数y千件6.27.57.78.58.79.810.213(1)请判断机动车辆数与交通事故数之间是否有线性相关关系,如果不具有线性相关关系,说明理由;(2)如果具有线性相关关系,求出线性回归方程.解:(1)在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系(2)计算相应的数据之和:=1 031,=71.6,=137 835,=9 611.7.将它们代入公式计算得b0.077 4,a=-1.024 1,所以,所求线性回归方程
34、为=0.077 4x-1.024 1.思路2例1 给出施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出上表的散点图;(2)求出回归直线的方程.解:(1)散点图如下图(2)表中的数据进行具体计算,列成以下表格:i1234567xi15202530354045yi330345365405445450455xiyi4 9506 9009 12512 15015 57518 00020 475故可得到b=4.75,a=399.3-4.7530257.从而得回归直线方程是=4.75x+257.例2 一个车间为了规定工时
35、定额,需要确定加工零件所花费的时间为此进行了10次试验,测得数据如下:零件个数x(个)102030405060708090100加工时间y(分)626875818995102108115122 请判断y与x是否具有线性相关关系,如果y与x具有线性相关关系,求线性回归方程解:在直角坐标系中画出数据的散点图,如下图.直观判断散点在一条直线附近,故具有线性相关关系由测得的数据表可知:=38 500,=87 777,=55 950.b=0.668.a=91.7-0.6685554.96.因此,所求线性回归方程为=bx+a=0.668x+54.96.例3 已知10条狗的血球体积及红血球数的测量值如下:血
36、球体积x(mL)45424648423558403950红血球数y(百万)6.536.309.527.506.995.909.496.206.558.72(1)画出上表的散点图;(2)求出回归直线的方程.解:(1)散点图如下.(2)(45+42+46+48+42+35+58+40+39+50)=44.50,(6.53+6.30+9.52+7.50+6.99+5.90+9.49+6.20+6.55+8.72)=7.37.设回归直线方程为=bx+a,则b=0.175,a=-0.418,所以所求回归直线的方程为=0.175x-0.148.点评:对一组数据进行线性回归分析时,应先画出其散点图,看其是否
37、呈直线形,再依系数a,b的计算公式,算出a,b由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误,求线性回归方程的步骤:计算平均数;计算xi与yi的积,求xiyi;计算xi2;将结果代入公式求b;用a=求a;写出回归直线方程(四)知能训练1.下列两个变量之间的关系哪个不是函数关系( )A.角度和它的余弦值 B.正方形边长和面积C.正边形的边数和它的内角和 D.人的年龄和身高答案:2三点(3,10),(7,20),(11,24)的线性回归方程是( )A.=5.75-1.75x B.=1.75+5.75xC.=1.75-5.75x D.=5.75+1.75x答案:3已知关于某
38、设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限x23456维修费用y2238556570 设y对x呈线性相关关系试求:(1)线性回归方程=bx+a的回归系数a,b;(2)估计使用年限为10年时,维修费用是多少?答案:(1)b=1.23,a=0.08;(2)12.38.4我们考虑两个表示变量x与y之间的关系的模型,为误差项,模型如下:模型1:y=6+4x;模型2:y=6+4x+e(1)如果x=3,e=1,分别求两个模型中y的值;(2)分别说明以上两个模型是确定性模型还是随机模型解:(1)模型1:y=6+4x=6+43=18;模型2:y=6+4x+e=6+43+1=19.(
39、2)模型1中相同的x值一定得到相同的y值,所以是确定性模型;模型2中相同的x值,因的不同,所得y值不一定相同,且为误差项是随机的,所以模型2是随机性模型5以下是收集到的新房屋销售价格y与房屋大小x的数据:房屋大小x(m2)80105110115135销售价格y(万元)18.42221.624.829.2(1)画出数据的散点图;(2)用最小二乘法估计求线性回归方程.解:(1)散点图如下图.(2)n=5,=545,=109,=116,=23.2,=60 952,=12 952,b=0.199,a=23.2-0.1991091.509,所以,线性回归方程为y=0.199x+1.509(五)拓展提升
40、某调查者从调查中获知某公司近年来科研费用支出(Xi)与公司所获得利润(Yi)的统计资料如下表: 科研费用支出(Xi)与利润(Yi)统计表 单位:万元年份科研费用支出利润1998199920002001200220035114532314030342520合计30180 要求估计利润(Yi)对科研费用支出(Xi)的线性回归模型.解:设线性回归模型直线方程为:,因为:=5,=30,根据资料列表计算如下表:年份XiYiXiYiXi2Xi-Yi-(Xi-)2(Xi-)(Yi-)199819992000200120022003511453231403034252015544012017075402512
41、116259406-10-2-311004-5-100361049060001030合计301801 0002000050100 现求解参数0、1的估计值:方法一:=2,=30-25=20.方法二:=2,=30-25=20.方法三:=2,=30-25=20.所以利润(Yi)对科研费用支出(Xi)的线性回归模型直线方程为:=20+2Xi.(六)课堂小结1求线性回归方程的步骤:(1)计算平均数;(2)计算xi与yi的积,求xiyi;(3)计算xi2,yi2,(4)将上述有关结果代入公式求b,a,写出回归直线方程2.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(七)作业 习题2.3A组3、4,B组1、2.