收藏 分享(赏)

[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx

上传人:a**** 文档编号:784988 上传时间:2025-12-14 格式:DOCX 页数:7 大小:250.59KB
下载 相关 举报
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第1页
第1页 / 共7页
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第2页
第2页 / 共7页
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第3页
第3页 / 共7页
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第4页
第4页 / 共7页
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第5页
第5页 / 共7页
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第6页
第6页 / 共7页
[31990406]第8章 成对数据的统计分析(知识清单)-2021-2022学年高二数学考试满分全攻略(沪教版2020选修第二册).docx_第7页
第7页 / 共7页
亲,该文档总共7页,全部预览完了,如果喜欢就下载吧!
资源描述

1、第8章 成对数据的统计分析知识清单成对数据的统计相关分析一、相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系相关关系与函数关系的异同点(1)相同点:均是指两个变量的关系(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定关系相关关系中两个变量之间产生相关关系的原因是受许多不确定的随机因素的影响二、散点图1如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关2一般地,如果两个变量的取值呈现正相关或负相关,而且散点落

2、在一条直线附近,我们就称这两个变量线性相关3一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响三、散点图的应用四、样本的相关系数样本相关系数:r.样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映出成对样本数据的变化特征当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关五、相关关系的强弱样本相关系数r的取值范围为1,1当|r|越接近1时,成

3、对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱注意点:当|r|1时,表明成对样本数据都在一条直线上,即两个变量之间满足一种线性关系当r0时,表明成对数据间没有线性相关关系,但不排除它们之间有其他相关关系六、样本相关系数的实际应用当样本相关系数|r|越接近1时,两个变量的相关关系越强,当样本相关系数|r|越接近0时,两个变量的相关关系越弱一元线性回归分析一、一元线性回归模型与函数模型一元线性回归模型:我们称为Y关于x的一元线性回归模型,其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bxa之间

4、的随机误差二、最小二乘法和经验回归方程最小二乘法:我们将x称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中,.(1)经验回归方程x必过点(,)(2)的常用公式.三、利用经验回归方程进行预测 (1)判断两个变量是否线性相关:可以利用经验,也可以画散点图(2)求经验回归方程,注意运算的正确性(3)根据经验回归方程进行预测估计:估计值不是实际值,两者会有一定的误差四、残差及残差分析1残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残

5、差2残差分析:残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析五、对数函数模型yc1c2ln x对数函数模型yc1c2ln x的求法(1)确定变量,作出散点图(2)根据散点图,做出yc1c2ln x的函数选择(3)变量置换,令zln x,通过变量置换把问题转化为12z的经验回归问题,并求出经验回归方程12z.(4)根据相应的变换,写出12ln x的经验回归方程六、残差平方和与决定系数R21残差平方和法残差平方和(yii)2越小,模型的拟合效果越好2决定系数R2 可以用R21来比较两个模型的拟合效果,R2越大,模型

6、拟合效果越好,R2越小,模型拟合效果越差七、指数函数模型yex(0)指数函数型yebxa回归问题的处理方法(1)函数yebxa的图象,如图所示(2)处理方法:两边取对数得ln yln ebxa,即ln ybxa.令zln y,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.八、幂函数模型yx(0)列联表独立性检验一 数值变量与分类变量数值变量:数值变量的取值为实数,其大小和运算都有实际含义分类变量:这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值

7、可以用实数表示注意点:分类变量的取值可以用实数来表示,例如男性,女性可以用1,0表示,学生的班级可以用1,2,3来表示这些数值只作编号使用,并没有大小和运算意义分类变量是相对于数值变量来说的变量的不同“值”表示个体所属的不同类别,像这样的变量才是分类变量二 列联表(1)22列联表定义一对分类变量X和Y,我们整理数据如表所示:XY合计Y0Y1X0ababX1cdcd合计acbdnabcd上表是关于分类变量X和Y的抽样数据的22列联表:最后一行的前两个数分别是事件Y0和Y1的频数;最后一列的前两个数分别是事件X0和X1的频数;中间的四个数a,b,c,d是事件Xx,Yy(x,y0,1)的频数;右下角

8、格中的数n是样本容量(2)等高堆积条形图等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果作22列联表时,关键是对涉及的变量分清类别计算时要准确无误三 分类变量与列联表的实际应用利用22列联表分析两个分类变量间的关系时,首先要根据题中数据获得22列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣四 独立性检验的理解1独立性检验:利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验22,其中nabcd

9、.注意点:(1)卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强(2)当2x时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;当2x时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立根据所给的观测值,与所给的临界值表中的数据进行比较,即可得出结论五 有关“相关的检验”用2进行“相关的检验”步骤(1)零假设:即先假设两变量间没关系(2)计算2:套用2的公式求得2值(3)查临界值:结合所给小概率值查得相应的临界值x.(4)下结论:比较2与x的大小,并作出结论六 有关“无关的检验”运用独立性检验的方法(1)列出22列联表,根据公式计算2.(2)比较2与x的大小作出结论

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 语文

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1