收藏 分享(赏)

11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt

上传人:高**** 文档编号:614242 上传时间:2024-05-29 格式:PPT 页数:55 大小:2.12MB
下载 相关 举报
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第1页
第1页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第2页
第2页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第3页
第3页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第4页
第4页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第5页
第5页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第6页
第6页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第7页
第7页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第8页
第8页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第9页
第9页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第10页
第10页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第11页
第11页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第12页
第12页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第13页
第13页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第14页
第14页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第15页
第15页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第16页
第16页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第17页
第17页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第18页
第18页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第19页
第19页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第20页
第20页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第21页
第21页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第22页
第22页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第23页
第23页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第24页
第24页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第25页
第25页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第26页
第26页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第27页
第27页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第28页
第28页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第29页
第29页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第30页
第30页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第31页
第31页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第32页
第32页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第33页
第33页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第34页
第34页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第35页
第35页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第36页
第36页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第37页
第37页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第38页
第38页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第39页
第39页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第40页
第40页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第41页
第41页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第42页
第42页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第43页
第43页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第44页
第44页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第45页
第45页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第46页
第46页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第47页
第47页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第48页
第48页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第49页
第49页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第50页
第50页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第51页
第51页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第52页
第52页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第53页
第53页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第54页
第54页 / 共55页
11-3变量间的相关关系与统计案例-2023届高三数学一轮复习考点突破课件(共55张PPT).ppt_第55页
第55页 / 共55页
亲,该文档总共55页,全部预览完了,如果喜欢就下载吧!
资源描述

1、11.3 变量间的相关关系与统计案例第一章集合与常用逻辑用语第十一章统 计1变量间的相关关系常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是_;与函数关系不同,相关关系是一种_关系,带有随机性2两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有_,这条直线叫_(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为_;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为_(3)相关系数 rnjjniiniiiyyxxyyxx12121)()()(,当 r0 时,表示两个变量正相关;当

2、 r0 时,表示两个变量负相关r 的绝对值越接近_,表示两个变量的线性相关性越强;r 的绝对值越接近_,表示两个变量的线性相关性越弱通常当 r 的绝对值大于 0.75 时,认为两个变量具有很强的线性相关关系 3回归直线方程(1)通过求 Q(,)niixy12i)(的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做该式取最小值时的,的值即分别为 a,b(2)两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为axby,则.xbyaxnxyxnyxxxyyxxbniiniiiniiniii,)()(1221121 其

3、中 x=11niixn,y=11niiyn,_称为样本点的中心.4回归分析(1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)线性回归模型用 ybxae 表示,其中 a 和 b 为模型的未知参数,e 称为_它的均值满足 E(e)_,D(e)2,2越小,精度越_(3)残差:ie=称为相应于点(ix,iy)的残差,残差平方和为 .(4)相关指数 R2=.R2 越大,说明残差平方和 ,即模型的拟合效果 ;R2 越小,残差平方和 ,即模型的拟合效果 .在线性回归模型中,R2 表示解释变量对于预报变量变化的 ,R2 越接近于 1,表示回归的效果 .5.独立性检验(1)变量的不同“值”

4、表示个体所属的不同类别,像这样的变量称为_.(2)像下表所示列出两个分类变量的频数表,称为_.假设有两个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为 y1y2总计 x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量 K2=_,其中 n=a+b+c+d 为样本容量.如果 K2 的观测值 kk0,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.我们称这样的 k0 为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过P(K2

5、k0).上面这种利用随机变量 K2 来判断“两个分类变量有关系”的方法称为_.自查自纠1相关关系 非确定性2(1)线性相关关系 回归直线(2)正相关 负相关(3)1 0 3(1)最小二乘法(2)(x,y)4.(2)随机误差 0 高(3)iiyy niiiyy12)(4)1niiniiiyyyy1212)()(越小 越好 越大 越差贡献率 越好5(1)分类变量(2)列联表 n(adbc)2(ab)(cd)(ac)(bd)独立性检验 1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是()A.人体脂肪

6、含量与年龄正相关,且脂肪含量的中位数等于 20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于 20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于 20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于 20%解:从散点图可以看出,年龄增大,脂肪含量也随之增加,故为正相关中间的两个点即第 5,6 两个点脂肪含量均低于 20%,故脂肪含量的中位数小于 20%.故选 B.2.某校学生会为了调查学生对 2022 年北京冬奥会的关注是否与性别有关,抽样调查了 100 人,得到如下数据.不关注关注总计 男生301545女生451055总计7525100根据表中数据,通过计算统计量 K2

7、n(adbc)2(ab)(cd)(ac)(bd),并参考以下临界数值:P(K2k0)0.150.100.050.0250.010 k02.0722.7063.8415.0246.635若由此认为“学生对 2022 年北京冬奥会的关注与性别有关”,则此结论出错的概率不超过()A.0.10B.0.05C.0.025D.0.01解:根据表中数据,计算统计量 K2100(30104515)2752545553.032.706,参考临界数据知,认为“学生对 2022 年北京冬奥会的关注与性别有关”,此结论出错的概率不超过 0.10.故选 A.3.(2019洛阳期末)有下列说法:若某商品的销售量 y(件)

8、关于销售价格 x(元/件)的线性回归方程为y5x350,当销售价格为 10 元时,销售量一定为 300 件;线性回归直线:ybxa一定过样本点中心(x,y);若两个随机变量的线性相关性越强,则相关系数 r 的值越接近于1;在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;在线性回归模型中,相关指数 R2 表示解释变量对于预报变量变化的贡献率,R2 越接近于 1,表示回归的效果越好.其中正确的结论个数为()A.1B.2C.3D.4解:对于,线性回归方程为y5x350,当销售价格为 10 元时,销售量近似为 300 件,故错误;对于,线性回归直线:yb

9、xa一定过样本点中心(x,y),故正确;对于,若两个随机变量的线性相关性越强,则相关系数 r 的绝对值越接近于 1,故错误;对于,与带状区域的宽度有关,带状区域越窄,说明回归方程的预报精确度越高,故错误;对于,R2 越接近于 1,表示回归的效果越好,故正确.所以正确的结论有 2 个.故选 B.4.(湖南省岳阳一中2020届高三上月考)已知具有线性相关的变量x,y,设其样本点为 Ai(xi,yi)(i1,2,6),回归直线方程为 yx3b,若OA1 OA2 OA6(9,6)(O 为坐标原点),则 b.解:计算x16(x1x2x6)9632,y16(y1y2y6)661,因为回归直线方程为 yx3

10、b,所以 11332b,解得 b12.故填12.5.(2017山东)为了研究某班学生的脚长 x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系,设其回归直线方程为ybxa.已知101iix=225,101iiy=1600,b=4.该班某学生的脚长为24,据此估计其身高为_厘米解:由已知得 x 22.5,y 160,则 a 160422.570,当 x24 时,y 42470166,故填 166.类型一 相关关系的判断例 1 下列变量间的关系,是相关关系的为()正方体的体积与棱长之间的关系;一块农田的水稻产量与

11、施肥量之间的关系;商品销售收入与其广告费支出之间的关系;人体内的脂肪含量与年龄之间的关系ABCD 解:由正方体的棱长和体积的公式可知,正方体的体积等于棱长的立方,所以是确定的函数关系(此时可排除 A、C、D,选B)易知中变量间的关系均为不确定的相关关系故选 B点 拨:要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的变式 1(2018春红岗校级月考)儿子的身高和父亲的身高是()A确定性关系B相关关系C函数关系D无任何关系解:由于儿子的身高和父亲的身高是不确定的关系,所以是相关关系故选 B 例 2(2018春镇安校级期中)下列说法中正确的是(填序号)相关关系是一种

12、确定性关系;变量间的线性相关系数 r 的取值范围为1,1;变量间的线性相关系数 r 的绝对值越近接 0,则变量间的线性相关程度越低;相关系数 r 与回归系数始终同号解:根据题意,依次分析四个说法:对于,在回归分析中,变量间的相关关系非函数关系,是一种不确定的关系,错误;对于,相关系数 r 满足|r|1,正确;对于,根据相关系数的性质:|r|1,且|r|越接近 1,相关程度越大;|r|越接近 0,相关程度越小,正确;对于,由 r 与 b 的计算公式知相关系数 r 与回归系数始终同号,正确故填 点 拨:用相关系数 r 可以衡量两个变量之间的相关关系的强弱,r 的绝对值越接近于 1,表示两个变量的线

13、性相关性越强,且 r 的正负即表示两个变量相关性的正负相关系数的取值范围是1,1变式 2(2016全国卷改编)下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码 17 分别对应年份 20082014.,由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明.附注:参考数据:71iiy=9.32,71iiit y40.17,71iiyy2(-)0.55,72.646.参考公式:相关系数 r12211()()()()niiinniiijttyyttyy 解:由折线图中数据和附注中参考数据得t=4,71iitt2(-)=28,71ii

14、yy2(-)=0.55,777111iiiiiiiittyyt yty()()=40.1749.322.89,r2.890.5522.6460.99.因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系类型二 散点图例 3(2018四川模拟)某中学的兴趣小组在某座山上测得海拔高度(km)、气压(kPa)和沸点()的六组数据绘制成的散点图如图所示,则下列说法错误的是()A.沸点与海拔高度呈正相关B.沸点与气压呈正相关C.沸点与海拔高度呈负相关D.沸点与海拔高度、沸点与气压的相关性都很强解:由图 1 知气压随海拔高度的

15、增加而减小,由图 2 知沸点随气压的升高而升高,所以沸点与气压呈正相关,B 正确;沸点与海拔高度呈负相关,C 正确,A 错误;由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,D 正确故选 A.评析 除了相关系数外,散点图也可以判断两个变量的相关关系.点分布在从左下角到右上角的区域时,两个变量呈现正相关;点分布在从左上角到右下角的区域时,两个变量呈负相关.变式 3 某次考试,班主任从全班同学中随机抽取一个容量为 8 的样本,他们的数学、物理分数对应如下表.学生编号12345678 数学分数 x6065707580859095物理分数 y72778084889093

16、95绘出散点图如下.根据以上信息,判断下列结论:根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;甲同学数学考了 80 分,那么,他的物理成绩一定比数学只考了 60 分的乙同学的物理成绩要高.其中正确的个数为()A.0B.1C.2D.3解:对于,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,正确;对于,根据此散点图,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,错误;对于,甲同学数学考了 80 分,他的物理成绩可能比数学只考了 60 分的乙同学的物理成绩低,所以

17、错误 综上,正确的结论是,只有 1 个故选 B.类型三 线性回归方程例 4(2018湖南三模)已知变量 x,y 之间的线性回归方程为y0.7x10.3,且变量 x,y 之间的一组相关数据如表所示,则下列说法错误的是()x681012 y6m32A.变量 x,y 之间呈现负相关关系B.可以预测,当 x20 时,y3.7C.m4 D.由表格数据可知,该回归直线必过点(9,4)解:对于 A,根据 b 的正负即可判断正负相关关系,b 0.70,负相关 对于 B,当 x20 时,代入可得 y3.7.对于 C,根据表中数据:x14(681012)9,可得y0.7910.34,即14(6m32)4,解得 m

18、5.对于 D,线性回归方程一定过点(x,y),即(9,4)故选 C.评析 回归直线一定通过样本点的中心(x,y);中心相同的样本点的回归方程不一定相同.变式 4(2019宜宾期末)普通高中课程标准指出,学科核心素养是育人价值的集中体现,并提出了数学学科的六个核心素养.某机构为了解学生核心素养现状,对某地高中学生数学运算素养 x 和数据分析素养 y进行量化统计分析,得到如下统计数据:数学运算素养 x23456 数据分析素养 y1.54.55.56.57由表中数据,求得线性回归方程为y1.3xa,若该地区某中学生的数学运算能力为 8,估计该中学生的数据分析能力为()A.6B.6.3C.10.2D.

19、10.6解:x2345654,y1.54.55.56.5755,则样本点的中心坐标为(4,5),代入y1.3xa,即 51.34a,解得a0.2,所以线性回归方程为y1.3x0.2,把 x8 代入线性回归方程y1.3x0.2,得y10.2.故选 C.例 5(2018德阳模拟)某商家欲将购进的一批成本价为 4 元/件的商品卖出,为了对这种产品制定合理售价,将该产品按事先拟定的价格进行试销,得到如下 6组数据.单价 x/元88.28.48.68.89 销量 y/件908483807568(1)若 90 xy100,就说产品“定价合理”,现从这 6 组数据中任意抽取 2组数据,求这 2 组数据均为“

20、定价合理”的概率;(2)求出 y 关于 x 的线性回归方程ybxa,预计在今后的销售中,销量与单价仍服从此关系,为了获得最大利润,该产品的销售单价应定为多少元?(利润销售收入成本,精确到 0.1 元)参考公式:b 121()()()niiiniixxyyxx=1221niiiniix ynxyxnx,a=y-bx 解:(1)从这 6 组数据中任意抽取 2 组数据有 15 种情况,“定价合理”的有:89098,8.28492.2,8.48391.4,从中任取 2 组有 3 种情况,则所求概率 P 31515.(2)因为x8.5,y80,21()niixx=0.7,21()()niiixxyy=-

21、14,则 b=140.7 20,a=y-bx 250 则 y 关于 x 的线性回归方程是 y20 x250,利润函数 L(x)x(20 x250)4(20 x250)20 x2330 x1 000,当 x3302(20)8.25 时,L(x)取得最大值 361.25,故当单价定为 8.2 元或 8.3 元时,可获得最大利润.评析 牢记求线性回归方程的步骤:第一步,列表;第二步,计算x,y,1niiix y,21niix或1()()niiixxyy,21()niixx;第三步,代入公式求 b,再利用 a=y-bx 求 a;第四步,写出回归方程.变式 5(2019哈尔滨道里区校级三模)某市出台了政

22、策:自 2020 年 1月 1 日起,在该市新登记并取得房屋不动产权证书的住房用于申请入学的,将不再对应一所学校,实施多校划片.有关部门调査了该市某名校对应学区内建筑面积不同的户型,得到了以下数据:建筑面积(平方米)80100120140 价格(万元)120150170200(1)试建立房屋价格 y 关于房屋建筑面积 x 的线性回归方程;(2)若某人计划消费不超过 100 万元购置学区房,根据你得到的回归方程估计此人选房时建筑面积最大为多少?(保留到小数点后一位数字)参考公式:b 121()()()niiiniixxyyxx,a=y-bx 解:(1)x14(80100120140)110,y1

23、4(120150170200)160,1 2001001001 200900100100900 1.3,a y b x1601.311017,所以回归直线方程为y1.3x17.(2)由题意令 1.3x17100,解得 x63.8,所以估计此人选房时建筑面积最大为 63.8 平方米.类型四 回归分析例 6(2018济宁高二下期末)某种农作物可以生长在滩涂和盐碱地,它的灌溉是将海水稀释后进行灌溉.某实验基地为了研究海水浓度 x(%)对亩产量 y(吨)的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.海水浓度 x(%)34567 亩产量 y(吨)0.570.530.440

24、.360.30残差ei0.010.02mn0绘制散点图发现,可以用线性回归模型拟合亩产量 y(吨)与海水浓度x(%)之间的相关关系,用最小二乘法计算得 y 与 x 之间的线性回归方程为y0.07xa.(1)求a,m,n 的值;(2)统计学中常用相关指数 R2 来刻画回归效果,R2 越大,回归效果越好,如假设 R20.85,就说明预报变量 y 的差异有 85%是解释变量 x 引起的.请计算相关指数 R2(精确到 0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?附:残差eiyiyi,相关指数 R212121()()niiiniiyyyy,其中521()iiyy0.051解:(1)因

25、为x15(34567)5.y15(0.570.530.440.360.30)0.44.所以 0.440.075a,即a0.79.所以线性回归方程为y0.07x0.79,所以y30.0750.790.44,my3y30.440.440.y40.0760.790.37,ny4y40.360.370.01.(2)521()iiiyy(0.01)20.02202(0.01)2020.000 6.所以相关指数 R210.000 60.051 0.99.故亩产量的变化有 99%是由海水浓度引起的.评析 用相关指数 R2 来刻画回归效果,R2 越大,说明模型拟合的效果越好.另外,计算也不能出错.变式 6 某

26、工厂为研究某种产品产量 x(吨)与所需某种原材料 y(吨)的相关性,在生产过程中收集 4 组对应数据(x,y)如下表所示.(残差真实值预测值)x3456 y2.534m根据表中数据,得出 y 关于 x 的线性回归方程为:y0.7xa.据此计算出在样本(4,3)处的残差为0.15,则表中 m 的值为.解:由题意可得y3.15,则在(4,3)处 3.150.74a,所以 a0.35.产量 x 的平均值x14(3456)4.5,则 y0.7 x0.35,即14(9.5m)0.74.50.35,解得 m4.5.故填 4.5.类型五 独立性检验例 7 下列说法中正确的是()独立性检验的基本思想是带有概率

27、性质的反证法;独立性检验就是选取一个假设 H0 条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝 H0 的推断;独立性检验一定能给出明确的结论.A.B.C.D.解:假设检验的基本思想是:“在一次试验中,小概率事件不可能发生”,若小概率事件发生了,则有理由认为原假设不成立,故正确,当小概率事件没有发生,则不能拒绝原假设但也不能够肯定原假设,此时结论不明确,不正确故选 A.评析 独立性检验的思想来自统计上的假设检验思想,它与反证法类似,它们都是先假设结论不成立,然后根据是否能推出“矛盾”来判定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”

28、是指不符合逻辑的事件发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生.变式 7(2019海珠区期末)近年来随着我国在教育科研上的投入不断加大,科学技术得到迅猛发展,国内企业的国际竞争力得到大幅提升.某品牌公司一直默默拓展海外市场,在海外设了多个分支机构,现需要国内公司外派大量中青年员工.该企业为了解这两个年龄层员工是否愿意被外派工作的态度,按分层抽样的方式从中青年员工中随机调查了 100 位,得到数据如表:愿意被外派不愿意被外派合计 中年员工202040青年员工402060合计6040100由 K2n(adbc)2(ab)(

29、cd)(ac)(bd)并参照附表,得到的正确结论是()附表:P(K2k0)0.100.010.001 k02.7066.63510.828 A.在犯错误的概率不超过 10%的前提下,认为“是否愿意外派与年龄有关”B.在犯错误的概率不超过 10%的前提下,认为“是否愿意外派与年龄无关”C.有 99%以上的把握认为“是否愿意外派与年龄有关”D.有 99%以上的把握认为“是否愿意外派与年龄无关”解:根据列联表中的数据,计算 K2100(20202040)260406040259 2.7782.706,所以在犯错误的概率不超过 10%的前提下,认为“是否愿意外派与年龄有关”.故选 A.例 8(2018

30、贵州黔东南州联考)近年来我国电子商务行业迎来发展的新机遇,与此同时,相关管理部门推出了针对电商商品和服务的评价体系.现从评价系统中选出 200 次成功的交易,并对其评价进行统计,对商品好评率为35,对服务好评率为34,其中对商品和服务都做出好评的交易为 80 次.(1)是否可以在犯错误概率不超过 0.1%的前提下,认为商品好评与服务好评有关?(2)若针对商品的好评率,采用分层抽样的方式从这 200 次交易中取出 5 次交易,并从中选择 2 次交易进行客户回访,求只有 1 次好评的概率.附:P(K2k0)0.100.050.0250.0100.0050.001 k02.7063.8415.024

31、6.6357.87910.828参考公式:K2n(adbc)2(ab)(cd)(ac)(bd),nabcd.解:(1)由题意可得关于商品评价和服务评价的 22 列联表:对服务好评对服务不满意合计 对商品好评8040120 对商品不满意701080 合计15050200 所以 K2200(80104070)2150501208011.11110.828,所以可以在犯错误概率不超过 0.1%的前提下,认为商品好评与服务好评有关(2)若针对商品的好评率,采用分层抽样的方式从这 200 次交易中取出 5 次交易,则好评的交易次数为 3,不满意的次数为 2.因此,只有 1 次好评的概率为C13C12C2

32、5 61035.评析 本题重点考查独立性检验、分层抽样及古典概型,这类题型在近年各地模拟题中出现频次较高.解独立性检验相关的应用题的关注点:两个明确:明确两类主体;明确研究的问题.两个准确:准确列出 22 列联表;准确理解 K2.变式 8(2019玉林期末)新高考的一大特点就是取消文理分科,除语文、数学、外语之外,从物理、化学、生物、政治、历史、地理这 6科中自由选择三门科目作为选考科目.某研究机构为了了解学生对全理(选择物理、化学、生物)的选择是否与性别有关,决定从某学校高一年级的 650 名学生中随机抽取男生、女生各 25 人进行模拟选科.经统计,选择全理的人数比不选全理的人数多 10 人

33、.(1)请完成下面的 22 列联表:选择全理不选择全理合计 男生 5 女生合计(2)估计有多大把握认为“选择全理与性别有关”,并说明理由.附:K2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd.P(K2k)0.150.100.050.0250.0100.0050.001 k2.0722.7063.8415.0246.6357.87910.828 解:(1)设不选择全理的女生为 x 人,则选择全理的女生为(25x)人,则有 20(25x)5x10.解得 x15.则可得列联表如下:选择全理不选择全理合计 男生20525 女生101525 合计302050(2)K250(2015

34、105)230202525253 8.3337.879,所以有 99.5%的把握认为“选择全理与性别有关”.1.用散点图判断相关关系(1)如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.2.回归分析中应注意的问题(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义.(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值.(3)用最小

35、二乘法求回归方程,关键在于正确求出系数a,b,由于a,b的计算量较大,计算应仔细小心.3.线性回归分析的方法、步骤(1)画出两个变量的散点图.(2)求相关系数 r,并确定两个变量的相关程度的高低.(3)用最小二乘法求回归直线方程ybxa.(4)利用回归直线方程进行预报.注:对于非线性(可线性化)的回归分析,一般是利用条件及我们熟识的函数模型,将题目中的非线性关系转化为线性关系进行分析,最后还原.4.独立性检验的一般步骤(1)假设两个分类变量 x 与 y 没有关系.(2)计算出 K2 的观测值.(3)把 K2 的值与临界值比较,作出合理的判断.5.独立性检验的注意事项(1)在列联表中注意事件的对应及相关值的确定,不可混淆.(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.(3)对判断结果进行描述时,注意对象的选取要准确无误.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿园

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3