1、高 考 总 复 习 艺考生山东版数学 第3节 变量间的相关关系与统计案例第八章 统计与统计案例考点层级突破第八章基础自主夯实课时分组冲关最新考纲核心素养考情聚焦1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用4.了解回归分析的基本思想、方法及其简单应用1.相关关系的判断,达成直观想象和数据分析的素养2.回归方程的求法及回归分析,增强逻辑推理、数据分析和数学运算的素养3.独立性检验,增强逻辑推理、数据分析和数学运算的素养 预计2020年的
2、高考将以选择题、填空题的形式考查线性回归系数或利用线性回归方程进行预测;在给出临界值的情况下判断两个变量是否相关;在解答题中与频率分布相结合,考察线性回归方程的建立及应用和独立性检验的应用,难度中等考点层级突破第八章基础自主夯实课时分组冲关1相关关系与回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是 散点图;统计量有相关系数与相关指数(1)在散点图中,点散布在从 左下角 到 右上角 的区域,对于两个变量的这种相关关系,我们将它称为正相关考点层级突破第八章基础自主夯实课时分组冲关(2)在散点图中,点散布在从 左上角 到 右下角 的区域,两个变量的这种
3、相关关系称为负相关(3)如果散点图中点的分布从整体上看大致在 一条直线 附近,称两个变量具有线性相关关系考点层级突破第八章基础自主夯实课时分组冲关2线性回归方程(1)最小二乘法:使得样本数据的点到回归直线的 距离的平方和 最小的方法叫做最小二乘法考点层级突破第八章基础自主夯实课时分组冲关3残差分析(1)残差:对于样本点(x1,y1),(x2,y2),(xn,yn),它们的随机误差为 eiyibxia,i1,2,n,其估计值为eiyiyiyibxia,i1,2,n.ei 称为相应于点(xi,yi)的残差考点层级突破第八章基础自主夯实课时分组冲关4独立性检验(1)利用随机变量 K2 来判断“两个分
4、类变量 有关系”的方法称为独立性检验(2)列联表:列出的两个分类变量的频数表,称为列联表假设有两个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(22 列联表)为考点层级突破第八章基础自主夯实课时分组冲关y1y2总计x1ab ab x2cdcd总计ac bd abcd 则随机变量 K2 nadbc2abacbdcd,其中 n abcd 为样本容量考点层级突破第八章基础自主夯实课时分组冲关(3)步骤如下计算随机变量 K2 的观测值 k,查表确定临界值 k0:P(K2k0)0.50.400.250.150.100.050.025 0.010 0.005 0.00
5、1k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828如果 kk0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 P(K2k0);否则,就认为在犯错误的概率不超过 P(K2k0)的前提下不能推断“X 与 Y 有关系”。考点层级突破第八章基础自主夯实课时分组冲关1.相关关系与函数关系的异同共同点:二者都是指两个变量间的关系;不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关系是一种非确定性关系,体现的不一定是因果关系,也可能是伴随关系2相关系数:,当 r0 时,两变量正相关,当 r0 时,两变量负相关,
6、当|r|1 且|r|越接近于 1,相关程度越高,当|r|1 且|r|越接近于 0,相关程度越低考点层级突破第八章基础自主夯实课时分组冲关思考辨析 判断下列说法是否正确,正确的在它后面的括号里打“”,错误的打“”(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()考点层级突破第八章基础自主夯实课时分组冲关(4)事件 X,Y 关系越密切,则由观测数据计算得到的 K2 的观测值越大()(5)任何一组数据都对应着一个回归直线方程()(6)由独立性检验
7、可知,在犯错误的概率不超过 1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有 99%的可能物理优秀()答案:(1)(2)(3)(4)(5)(6)考点层级突破第八章基础自主夯实课时分组冲关小题查验1(2019泉州市模拟)下列四个图象中,两个变量具有正相关关系的是()考点层级突破第八章基础自主夯实课时分组冲关解析:D A 中两个变量之间是函数关系,不是相关关系;在两个变量的散点图中,若样本点呈直线形带状分布,则两个变量具有相关关系,对照图形:B,D 样本点呈直线形带状分布,B 是负相关,D 是正相关,C 样本点不呈直线形带状分布所以两个变量具有正相关关系的图是 D.故选 D.考
8、点层级突破第八章基础自主夯实课时分组冲关2为调查中学生近视情况,测得某校男生 150 名中有 80 名近视,在 140 名女生中有 70 名近视在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力()A回归分析 B期望与方差C独立性检验D概率解析:C“近视”与“性别”是两类变量,其是否有关,应该用独立性检验判断故选 C.考点层级突破第八章基础自主夯实课时分组冲关3下面是 22 列联表:y1y2总计x1a2173x2222547总计b46120则表中 a,b 的值分别为()A94,72 B52,50C52,74 D74,52解析:C a2173,a52,又 a22b,b74.故选C.
9、考点层级突破第八章基础自主夯实课时分组冲关4在性别与吃零食这两个分类变量的计算中,下列说法正确的是 _.若 K2 的观测值为 k6.635,我们有 99%的把握认为吃零食与性别有关系,那么在 100 个吃零食的人中必有 99 人是女性;从独立性检验可知有 99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为 99%;若从统计量中求出有 99%的把握认为吃零食与性别有关系,是指有 1%的可能性使得出的判断出现错误解析:由独立性检验的基本思想可得,只有正确答案:考点层级突破第八章基础自主夯实课时分组冲关5(2019西安市模拟)某车间为了规定工时定额,需要确定加工零件所花
10、费的时间,为此进行了 5 次试验根据收集到的数据(如下表),由最小二乘法求得回归方程y0.67x54.9.零件数 x(个)1020304050加工时间 y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为 _.考点层级突破第八章基础自主夯实课时分组冲关解析:由 x30,得 y0.673054.975.设表中的“模糊数字”为 a,则 62a758189755,a68.答案:68考点层级突破第八章基础自主夯实课时分组冲关考点一 相关关系的判断(自主练透)题组集训1对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()考点层级突破第八章基础自主夯实课时
11、分组冲关Ar2r40r3r1 Br4r20r1r3Cr4r20r3r1Dr2r40r1r3考点层级突破第八章基础自主夯实课时分组冲关解析:A 易知题中图(1)与图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则 r2r40r3r1.考点层级突破第八章基础自主夯实课时分组冲关2(2019洛阳市模拟)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y 轴的单位长度相同),用回归直线方程ybxa 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()考点层级突破第八章基础自主夯实课时分组冲关
12、A线性相关关系较强,b 的值为 1.25B线性相关关系较强,b 的值为 0.83C线性相关关系较强,b 的值为0.87D线性相关关系较弱,无研究价值解析:B 由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比 yx 的斜率要小一些故选 B.考点层级突破第八章基础自主夯实课时分组冲关3已知变量 x 和 y 满足关系 y0.1x1,变量 y 与 z 正相关下列结论中正确的是()Ax 与 y 负相关,x 与 z 负相关Bx 与 y 正相关,x 与 z 正相关Cx 与 y 正相关,x 与 z 负相关Dx 与 y 负相关,x 与 z 正相关解析:A 由题意不妨设,zkyb(k0),y0.1x1,z0.1 kx(kb),0.10,0.1 k0 时,正相关;r0 时,正相关;b6.635.所以有 99%的把握认为两种生产方式的效率有差异考点层级突破第八章基础自主夯实课时分组冲关考点层级突破第八章基础自主夯实课时分组冲关