1、8.1成对数据的统计相关性 (基础知识+基本题型)知识点一、成对数据间的相关关系1.相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.散点图:将样本中的每一个序号下的成对样本数据都用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.3.正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.4.线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变
2、量线性相关.5.非线性相关:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.知识点二 相关性检验(1)相关系数r的定义对于变量x与y随机抽取到的n对数据,称为x与y的样本相关系数。(2)相关系数r的作用样本相关系数r用于衡量两个变量之间是否具有线性相关关系,描述线性相关关系的强弱:越接近1,表明两个变量之间的线性相关程度越强;越接近0,表明两个变量之间的线性相关程度越弱。当r0时,表明两个变量正相关, 即x增加,y随之相应地增加,若x减少,y随之相应地减少当r0时,表明两个变量负相关, 即x增加,y随之相应地减少;若x减少,y随之相应地增加若r=0,
3、则称x与y不相关。考点一 利用散点图判断相关关系例1 某地10户家庭的年收入和年饮食支出的统计资料如下表:年收入/万元24466677810年饮食支出/万元09141620211918212223根据表中数据作出散点图,判断家庭的年收入与年饮食支出的相关关系解析:由题意知,以年收入为解释变量,年饮食支出为预报变量,作散点图如图所示 从图中可以看出,样本点呈条状分布,年收入和年饮食支出具有线性相关关系,因此,可以用线性回归方程刻画它们之间的关系一般地,作散点图时,横轴表示解释变量的取值,纵轴表示预报变量的取值类型二、运用样本相关系数r检验线性相关关系例2下表是随机抽取的对母女的身高数据,试根据这
4、些数据探讨与之间的关系母亲身高女儿身高【解析】所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近, 因为, ,所以,由检验水平及,在附录中查得,因为,所以可以认为与之间具有较强的线性相关关系【总结升华】(1)讨论x与y之间的线性相关关系,一般称之为相关性检验。一般地,相关性检验是讨论线性回归模型的第一步。当时,可以认为两个变量有很强的线性相关关系,此时,建立线性回归模型是有意义的,其他情况下,建立线性回归模型意义就不大了,基本上没有什么价值。(2)相关系数r的计算公式:(3)利用相关系数r检验两个变量之间的线性相关关系的强弱的步骤:运用公式求出相关系数r;比较与0.75的大小关系,得出统计结论。如果,认为x与y之间具有很强的线性相关关系。