1、高考资源网() 您身边的高考专家20112012学年高三数学复习导学案58 变量间的相关关系、回归分析及独立性检验【考纲要求】1、会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系;了解最小二乘法的思想,能根据给出的系数公式建立线性回归方程;2、了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用3、了解回归分析、假设检验的基本思想、方法及其简单应用.【自主梳理】1. 变量间的相关关系(1)两个变量之间的关系包括 和 ,相关关系是指 (2)散点图是指 ,观察散点图可知,相关关系又包括 和 。(3)线性相关关系及回归直线:2.回归分析的基本思想及其初步应用(1)对具有 的两
2、个变量进行统计分析的方法叫 。回归分析的一般步骤为:(2)回归直线方程:设所求的直线方程为,其中, 称为样本点的中心,回归直线过 ,回归方程的截距和斜率是用 计算出来的,最小二乘法是指 (3)回归分析:如何检查所建立的回归模型拟合效果的好坏?3.独立性检验的基本思想及其初步运用(1)分类变量(并举例说明):(2)独立性检验的方法可根据 直观判断,其不足之处在于 (3)两个分类变量的独立性检验一般步骤: 2*2列联表总计+来源:学科网ZXXK+总计+提出假设:设与没有关系根据列联表中的数据计算的值根据计算得到的随机变量的观测值作出判断(借助给定的临界值表)【例题精讲】例1、下表提供了某厂节能降耗
3、技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗Y(吨标准煤)的几组对照数据 x 3 4 5 6 y 2.5 3 4 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出Y关于x的线性回归方程Y=bx+a; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:32.5+43+54+64.5=66.5) 例2、(2010年课标卷)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿 性别
4、 男女需要4030不需要160270(1) 估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2) 能否有99的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3) 根据(2)的结论,能否提供更好的调查方法来估计该地区老年人中,需要志愿帮助的老年人的比例?说明理由。【点击高考】1、2011广东理 某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.2、2011广东文 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号
5、每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系时间x, 1,2,3,4,5命中率y,0.4,0.5,0.6,0.6,0.4小李这5天的平均投篮命中率为_;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_3、2011辽宁文 调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y (单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元4、2011湖南文 通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:,
6、男,女,总计爱好,40,20,60不爱好,20,30,50总计,60,50,110由K2算得,K27.8.附表:P(K2k),0.050,0.010,0.001 k,3.841,6.635,10.828参照附表,得到的正确结论是()A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关”5、2011山东文 某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元),4,2,3,5销售额y(万元),49,26
7、,39,54根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元 C67.7万元 D72.0万元6、2011陕西卷 设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线,以下结论中正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(,)7、对变量 有观测数据(,)(),得散点图1;对变量有观测数据(,)(i=1,2,,10),得散点图2. 由这两个散点图可以判断( )(A)变量x
8、与y 正相关,u 与v 正相关 (B)变量x 与y 正相关,u 与v 负相关(C)变量x 与y 负相关,u 与v 正相关 (D)变量x 与y 负相关,u 与v 负相关来源:学*科*网8、2011安徽文 某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份,2002,2004,2006, 2008,2010需求量(万吨),236,246,257,276,286(1)利用所给数据求年需求量与年份之间的回归直线方程bxa;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量【课堂总结】1.建立回归模型的基本步骤:确定研究对象,明确哪个是解释变量,哪个是预报变量;画出确定好的解释变量和
9、预报变量的散点图,观察它们之间的关系(是否存在线性关系)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)按照公式计算回归方程中的参数(如最小二乘法)得出结果后检查数据模型是否合适检查数据模型拟合效果的好坏,一般有两种方法。方法一:通过残差分析,如果残差点比较均匀地落在水平的带状区域中,则说明选用的模型比较合适,反之,不合适) 方法二:用相关系数来刻画回归的效果,其计算公式是其中=真实值-预报值=残差,值越大,说明残差的平方和越小,也就是说模型的拟合效果越好。2. 独立性检验(1)独立性检验的必要性:为什么不能只凭列联表和图形下结论?原因是列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此需要用列联表检验这个方法来确认所得得结论在多大程度上适用于总体。(2)独立性检验的思想来自于统计上的假设性检验,它与反证法类似。假设检验和反证法都是先假设结论不成立,然后根据是否能够推出矛盾来确定结论是否成立。但是二者的矛盾的含义不同,反证法中的矛盾是指不符合逻辑的事情发生;而假设检验中的矛盾是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生。来源:Zxxk.Com- 5 - 版权所有高考资源网