1、 5年高考3年模拟A版高考数学11.5 变量间的相关关系、统计案例基础篇考点 一 变量间的相关关系1.线性相关一般地如果两个变量的取值呈现正相关或负相关而且散点落在一条直线附近称这两个变量线性相关.2.线性经验回归方程与最小二乘法设满足一元线性回归模型的两个变量的 对样本数据为()()()由()得 ()显然 越小表示样本数据点离直线 的竖直距离越小.通常用各散点到直线的竖直距离的平方之和 ()来刻画各样本观测数据与直线 的“整体接近程度”.当 的取值为 ()()()时 达到最小.将 称为 关于 的经验回归方程也称经验回归函数或经验回归公式其图形称为经验回归直线.这种求经验回归方程的方法叫做最小
2、二乘法求得的 叫做 的最小二乘估计.经验回归直线一定过点().3.样本相关系数)()()()()()().)表示成对样本数据正相关散点图中点的分布从左下角到右上角表示成对样本数据负相关散点图中点的分布从左上角到右下角.)越接近于 成对样本数据的线性相关程度越强.4.刻画回归效果的方式)残差图法在残差图中残差比较均匀地落在以取值为 的横轴为对称轴的水平带状区域内说明选用的模型比较合适这样的带状区域的宽度越窄说明模型拟合精度越高.)残差平方和法残差平方和为 ()残差平方和越小模型拟合效果越好.)利用 刻画拟合效果 ()().越大模型的拟合效果越好 越小模型的拟合效果越差.考点 二 独立性检验1.2
3、2 列联表假设两个分类变量 和 它们的可能取值分别为和其 列联表为合计合计 列联表给出了成对分类变量数据的交叉分类频数.专题十一概率与统计2.独立性检验)假定通过简单随机抽样得到了 和 的抽样数据列联表如表所示.合计 合计 则 ()()()()().)独立性检验中几个常用的小概率值和相应的临界值.综合篇考法 一 经验回归方程的求解与应用1.求经验回归方程的步骤)计算出、)计算、)写出经验回归方程 .2.经验回归方程的应用)若已知经验回归方程(方程中无参数)则把自变量代入经验回归方程即可对因变量进行预测.)若经验回归方程中有参数则根据经验回归直线一定经过点()求出参数值得到经验回归方程进而完成预
4、测.例 1(课标 分)下图是我国 年至 年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码 分别对应年份.()由折线图看出可用线性回归模型拟合 与 的关系请用相关系数加以说明()建立 关于 的回归方程(系数精确到.)预测 年我国生活垃圾无害化处理量.附注:参考 数 据:.().参考公式:相关系数 ()()()()回归方程 中斜率和截距的最小二乘估计公式分别为:()()().解析()由折线图中数据和附注中参考数据得 ()().()().(分)因为 与 的相关系数近似为.说明 与 的线性相关程度相当高从而可以用线性回归 5年高考3年模拟A版高考数学模型拟合 与 的关系.(分)()由 .及(
5、)得 ()()().所以 关于 的回归方程为 .(分)将 年对应的 代入回归方程得 .所以预测 年我国生活垃圾无害化处理量约为.亿吨.(分)考法 二 独立性检验的应用独立性检验的一般步骤1.提出零假设:和 相互独立并给出在问题中的解释.2.根据抽样数据整理出 列联表计算 的值并与临界值 比较.3.根据检验规则得出推断结论.4.在 和 不独立的情况下根据需要通过比较相应的频率分析 和 间的影响规律.例 2某高校男、女学生人数基本相当为了解该校英语四级考试情况随机抽取了该校首次参加英语四级考试的男、女各 名学生的成绩情况如下表:合格不合格男生女生()依据 .的独立性检验能否认为该校首次参加英语四级
6、考试的学生合格与性别有关?()从这 名男生中任意选 人求这 人中合格人数的分布列及数学期望()将抽取的这 名学生合格的频率视为该校首次参加英语四级考试的每位学生合格的概率.若学生首次考试不合格则经过一段时间的努力第二次参加考试合格的概率会增加.现从该校学生中任意抽取 名学生求至多两次英语四级考试后这两人全部合格的概率.附:()()()()().解析()零假设为:该校首次参加英语四级考试合格与性别无关.根据表中数据计算得到().根据小概率值 .的独立性检验没有充分证据推断 不成立因此可以认为 成立即认为该校首次参加英语四级考试的学生合格与性别无关.()设 人中合格人数为 则 的所有可能取值为()()()所以 的分布列为所以().()由已知得该校学生首次参加英语四级考试成绩合格的概率为 首次不合格第二次合格的概率为 所以两位同学都首次参加英语四级考试成绩合格的概率为 两位同学其中一位首次合格另一位同学首次不合格第二次合格的概率为 专题十一概率与统计两位同学都首次不合格第二次都合格的概率为 所以至多两次英语四级考试后这两人全部合格的概率为 .