1、1、变量之间的关系,常见的有两类,一类是确定性的函数关系,另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系叫做相关关系。例:(1)商品销售收入与广告支出经费之间的关系(2)粮食产量与施肥量之间的关系(3)人体内脂肪含量与年龄之间的关系(4)人的身高和体重相关关系与函数关系的异同点:相同点:均是指两个变量的关系不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系.2、两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响。3、需要通过样本来判断变量之间是否存在相关关系例1:5个学生的数学和物理成绩如下表:ABCDE数学80757065
2、60物理7066686462如何判断它们是否有相关关系。解:数学成绩散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图由散点图可见,两者之间具有正相关关系。如果两者之间是负相关关系,散点图有什么特点?根据上述数据,人体的脂肪含量和年龄之间有怎样的关系?观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?散点图中的点的分布有什么特点?这些点大致分布在一条直线附近,因此年龄和脂肪含量成线性相关关系根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,但是我们希望找出一条能够最
3、好的反应x和Y之间的关系,也就是说,我们要找出一条直线,使这条直线“最贴近”已知的数据点,这条直线叫做回归直线。记为回归系数回归直线的求法最小二乘法(x1,y1)(x2,y2)(xi,yi)(xn,yn)用最小二乘法求回归直线方程中的a,b有下面的公式:例2:观察两相关变量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程解:列表:i12345678910-1-2-3-4-553421-9-7-5-3-1153799141512551512149计算得:所求回归直线方程为 y=x小结:求线性回归直线方程的步骤:第一步:列表;第二步:计算;第三步:代入
4、公式计算b,a的值;第四步:写出直线方程。利用线性回归方程对总体进行估计例3:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:摄氏温度-5 0 4 7 12 15 19 23 27 31 36热饮杯数156 150 132 128 130 116 104 89 93 76 54(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律;(3)求回归方程;(4)如果某天的气温是C,预测这天卖出的热饮杯数。解:(1)散点图(2)气温与热饮杯数成负相关,即气温越高,卖出去的热饮杯数越少。温度热饮杯数(3)从散点图可以看出
5、,这些点大致分布在一条直线附近。Y=-2.352x+147.767(4)当x=2时,y=143.063,因此,这天大约可以卖出143杯热饮。小结作业1.求样本数据的线性回归方程,可按下列步骤进行:第一步,计算平均数,第二步,求和,第三步,计算第四步,写出回归方程2.回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.3.对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.4.利用回归方程,可以进行预测P79习题2.3 A组:2 B组:1.作业: