1、目 录 Contents 考情精解读 考点1考点2A.知识全通关 B.题型全突破C.能力大提升考法1考法2考法3专题1考情精解读 考纲解读 命题趋势 命题规律 考情精解读 1 考试大纲 011.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)了解独立性检验(只要求2 2列联表)的基本思想、方法及其简单应用.(2)了解回归分析的基本思想、方法及其简单应用.数学 第三讲 变量的相关关系与统计案例 考纲解读 命题规律 考情精解读 2
2、命题趋势 数学 第三讲 变量的相关关系与统计案例 考点 2016全国 2015全国 2014全国 自主命题区域 回归分析【20%】全国,18,12分 全国,19,12分 全国,19,12分 考纲解读 命题规律 考情精解读 3 命题趋势 数学 第三讲 变量的相关关系与统计案例 考点 2016全国 2015全国 2014全国 自主命题区域 独立性检验【10%】考纲解读 命题规律 考情精解读 4 返回目录 1.热点预测(1)散点图与相关关系;(2)线性回归方程的求解及其应用;(3)独立性检验的应用,以上三点是高考考查的热点,以选择题、解答题的形式呈现,分值分别为5分,12分.2.趋势分析 预测201
3、8年高考对本讲内容的考查仍以线性回归方程和独立性检验的应用为主,尤其是独立性检验与统计、概率的综合题目是高考的趋势,应引起重视.命题趋势 数学 第三讲 变量的相关关系与统计案例 知识全通关 知识全通关 1 考点1 回归分析 继续学习 数学 第三讲 变量的相关关系与统计案例 1.变量间的相关关系 当自变量取值一定时,因变量的取值带有一定的 随机性,则这两个变量之间的关系叫作相关关系.即相关关系是一种非确定性关系.当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.2.散点图 将样本中的n个数据点(xi,y
4、i)(i=1,2,n)描在平面直角坐标系中,所得图形叫作散点图.具有正相关关系的两个变量的散点图如图12-3-1(1)所示,具有负相关关系的两个变量的散点图如图12-3-1(2)所示.图12-3-1 知识全通关 2 高考帮数学 第三讲 变量的相关关系与统计案例 继续学习 3.两个变量的线性相关 如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫作回归直线.回归直线对应的方程叫作回归直线方程(简称回归方程).知识全通关 3 数学 第三讲 变量的相关关系与统计案例 继续学习【说明】回归直线 必过样本点的中心(,),这个结论既是检验所求回归直线方程是否准确
5、的依据,也是求参数的一个依据.4.回归方程的求解 求回归方程的方法是最小二乘法,即使样本数据的点到回归直线的距离的平方和最小.若变量x与y具有线性相关关系,有n个样本数据(xi,yi)(i=1,2,n),则回归方程 1122211(-)(-)-y=b=,a-(-)-,nniiiiiinniiiix x y yx y nxyy bxx xx nxbx+a中ybxa知识全通关 4 数学 第三讲 变量的相关关系与统计案例 继续学习 5.相关系数我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.|r|越接近于1,表明两个变
6、量的线性相关性越强;|r|越接近于0,表明两个变量之间几乎不存在线性相关关系.通常,当|r|大于0.75时,我们认为两个变量之间存在着很强的线性相关关系.ii1n22i 11(x-x)(y-y),1(-)?(-)niniiirrx xy y知识全通关 5 数学 第三讲 变量的相关关系与统计案例 继续学习 1.分类变量 可以用不同“值”表示个体所属的不同类别的变量称为分类变量.2.22列联表 设X,Y为两个变量,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(22列联表)如下:考点2 独立性检验 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b
7、+c+d 知识全通关 6 数学 第三讲 变量的相关关系与统计案例 继续学习 3.独立性检验 利用随机变量K2也可表示为 (其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.22(-)()()()()n ad bcXab cdac bd知识全通关 7 数学 第三讲 变量的相关关系与统计案例 继续学习 4.独立性检验的一般步骤(1)根据样本数据列出22列联表;(2)计算随机变量K2的观测值k,查下表确定临界值k0:(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有
8、关系”.P(K2k0)0.50 0.40 0.25 0.15 0.10 k0 0.455 0.708 1.323 2.072 2.706 P(K2k0)0.05 0.025 0.010 0.005 0.001 k0 3.841 5.024 6.635 7.879 10.828 知识全通关 8 返回目录 数学 第三讲 变量的相关关系与统计案例【名师提醒】1.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.2.通常认为k2.706时,样本数据就没有充分的证据显示“X与Y有关系”.3.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,
9、因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.题型全突破 考法1 频率分布直方图的绘制及应用 继续学习 数学 第三讲 变量的相关关系与统计案例 题型全突破 1 考法指导 1.求回归直线方程的步骤 2.利用回归直线方程进行预测是对总体的估计,此估计值不是准确值.进行预测时,把自变量代入回归直线方程即可对因变量进行估计.数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 2 考法示例1 随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份 2012 2013 2014
10、2015 2016 时间代号t 1 2 3 4 5 储蓄存款y(千亿元)5 6 7 8 10 ybxa(1)求y关于t的回归方程(2)用所求回归方程预测该地区2017年(t=6)的人民币储蓄存款 附:回归方程 1122211(-)(-)-y=b=,a-(-)-,nniiiiiinniiiix x y yx y nxyy bxx xx nxbx+a中 数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 3 【解析】(1)列表计算如下:i ti yi tiyi 1 2 3 4 5 1 2 3 4 5 5 6 7 8 10 1 4 9 16 25 5 12 21 32 50 15 36 5
11、5 120(1)先由题中表格数据求出的值,然后根据公式即可求得线性回归方程;(2)将t=6代入(1)中的线性回归方程即可预测该地区2017年的人民币储蓄存款.n2i 11,y,ni iiittt y 高考帮数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 4 (2)将t=6代入回归方程可预测该地区2017年的人民币储蓄存款为=1.26+3.6=10.8(千亿元).【点评】线性回归分析就是研究两组变量间线性相关关系的一种方法,通过对统计数据的分析,可以预测可能的结果,这就是线性回归方程的基本应用,因此利用最小二乘法求线性回归方程是关键,必须熟练掌握线性回归方程中两个重要估计量的计算.
12、考法2 相关系数的意义 继续学习 数学 第三讲 变量的相关关系与统计案例 题型全突破 5 考法指导线性相关系数是从数值上来判断变量间的线性相关程度,若|r|的值越接近于1,说明变量间的线性相关程度越高;|r|的值越接近于0,说明变量间的线性相关程度越低.当两个变量间的关系可用一次函数表示时,r=1,若斜率为正,r=1,否则r=-1,r为正时表示正相关,r为负时表示负相关.数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 6 考法示例2 2016全国卷图12-3-4是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.图12-3-4注:年份代码17分别对应年份200
13、82014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:7771111221129.32,40.17,0.55,72.(-)(-)(-)64(-)6iiiniiinniiiiiiit tyyt yyt ty yi参考数据:(y-y)参考公式:相关系数r=数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 7 解析 (1)由折线图中数据和附注中参考数据得 22i7711iii7771114,(tt)28,(yy)0.55(tt)2.890.990.5522(
14、yy)40.1749.322.689.64iiiiiiiitt ytyr因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系 数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 8【解析】由及(1)得所以,y关于t的回归方程为=0.92+0.10t.将2016年对应的t=9代入回归方程得=0.92+0.109=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.9.321.3317y 71721(-)(-)2.890.10328(-)iiiiit ty ybt t1.3310.103 40.92aybtyy考法3
15、 独立性检验 继续学习 高考帮数学 第三讲 变量的相关关系与统计案例 题型全突破 9 考法指导 1.在22列联表中,如果两个变量没有关系,则应满足ad-bc0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解独立性检验的应用问题的关注点(1)两个明确:明确两类主体;明确研究的两个问题.(2)两个关键:准确画出22列联表;准确理解K2.数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 10 考法示例3 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出
16、了500件,量其内径尺寸,得结果如下表.分组 29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)频数 12 63 86 182 分组 30.02,30.06)30.06,30.10)30.10,30.14)频数 92 61 4 分组 29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)频数 29 71 85 159 分组 30.02,30.06)30.06,30.10)30.10,30.14)频数 76 62 18 甲厂:乙厂:数学 第三讲 变量的相关关系与统计案例 继续学习 题型全突破 11 (1)试分
17、别估计两个分厂生产的零件的优质品率;(2)由以上统计数据完成下面22列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂 乙厂 总计 优质品 非优质品 总计【思想分析】(1)计算优质品的频率由频率估计概率(2)完成22列联表计算K2的观测值k作出判断 数学 第三讲 变量的相关关系与统计案例【解析】继续学习 题型全突破 12 (1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为(360/500)100%=72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为(320/500)100%=64%.(2)完成的22列联表
18、如下:甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计 500 500 1 000 由表中数据计算得K2的观测值所以有99%的把握认为“两个分厂生产的零件的质量有差异”.22(-)()()()()n ad bcKab cdac bd返回目录 数学 第三讲 变量的相关关系与统计案例 题型全突破 13【解析】独立性检验应注意以下几点:(1)在实际问题中,独立性检验的结论仅是一种数学关系的表述,表示结论成立的概率的大小;(2)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断.能力大提升 独立性检验与统计、概率的综合应用 继续学习
19、 数学 第三讲 变量的相关关系与统计案例 能力大提升 1【示例4】某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取100名工人,先统计他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均
20、生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?近几年高考中单独考查独立性检验的较少,多与统计、概率等知识综合考查,频率分布表与独立性检验融合在一起是一种常见的考查形式,一般需要根据条件列出22列联表,计算K2的观测值k,从而解决问题.继续学习 数学 第三讲 变量的相关关系与统计案例 能力大提升 2 P(k2k0)0.100 0.050 0.010 0.001 k0 2.706 3.841 6.635 10.828【解析】(1)由已知得,样本中有“25周岁以上组”工人60名,“25周岁以下组”工人40名.所以
21、样本中日平均生产件数不足60件的工人中,“25周岁以上组”工人有600.05=3(人),记为A1,A2,A3;“25周岁以下组”工人有400.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少抽到1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率为P=.7/1022
22、(-)()()()()n ad bcKab cdac bd附:返回目录 数学 第三讲 变量的相关关系与统计案例 能力大提升 3(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.25=15(人),“25周岁以下组”中的生产能手有400.375=15(人),据此可得22列联表如下:生产能手 非生产能手 合计 25周岁以上组 15 45 60 25周岁以下组 15 25 40 合计 30 70 100 222(-)100(15 25-15 45)25=1.786()()()()6040 30 7014n ad bcKab cdac bd所以得因为1.7862.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”