ImageVerifierCode 换一换
格式:PPTX , 页数:42 ,大小:862.29KB ,
资源ID:773941      下载积分:5 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-773941-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2019-2020学年新培优同步北师大版高中数学选修1-2课件:第一章 §1 1-1 回归分析--1-2 相关系数 .pptx)为本站会员(高****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至service@ketangku.com或直接QQ联系客服),我们立即给予删除!

2019-2020学年新培优同步北师大版高中数学选修1-2课件:第一章 §1 1-1 回归分析--1-2 相关系数 .pptx

1、-1-1 回归分析-2-1.1 回归分析 1.2 相关系数目标导航 1.了解回归分析的概念和最小二乘法的作用.2.理解相关系数的含义及求法.3.了解回归分析的基本思想,会建立回归模型,并能利用回归分析进行有效的预测.知识梳理 一 二 一、回归分析 1.变量间的关系往往会表现出某种不确定性,回归分析就是研究这种变量之间的关系的一种方法,通过对变量之间关系的研究,从而发现蕴涵在事物或现象中的某些规律.2.假设样本点为(x1,y1),(x2,y2),(xn,yn),我们可用最小二乘法求变量之间的线性回归方程y=a+bx,即求a,b,使这n个点与直线y=a+bx的“距离”平方之和最小,即使得 Q(a,

2、b)=(y1-a-bx1)2+(2-2)2+()2达到最小.知识梳理 一 二 3.Q(a,b)=lyy+n (+)2+-22.其中=1+2+=1=1,y=y1+y2+ynn=1n i=1n,lxx=1()2=12 2,lxy=1()()=1 ,lyy=1()2=12 2.当 Q(a,b)取最小值时,b=1(-)(-)=1(-)2=1-=12-2,=.y 对 x 的线性回归方程为 y=a+bx,此直线一定过点(,).知识梳理 一 二 名师点拨 b=1xiyi-x yi=1n2-2,其统计学意义是:x 每增加(或减少)一个单位,y 平均改变 b 个单位.知识梳理 一 二【做一做1】设有一个线性回归

3、方程为y=3-5x,则当变量x每增加1个单位时()A.y平均增加3个单位 B.y平均减少5个单位 C.y平均增加5个单位 D.y平均减少3个单位 解析:因为线性回归直线的斜率是-5,所以说x每增加1个单位时,y平均减少5个单位.答案:B 知识梳理 一 二 二、相关关系与相关系数 1.判断两个变量之间的线性相关关系的方法有(1)画散点图;(2)计算线性相关系数r.2.相关系数的计算 公式 r=i=1n(xi-x)(yi-y)i=1n(xi-x)2 i=1n(yi-y)2=i=1nxiyi-nx y i=1nxi2-nx2 i=1nyi2-ny2 性质(1)范围:|r|1;(2)|r|越接近 1,

4、x,y 之间的线性相关程度越高;(3)|r|越接近 0,x,y 之间的线性相关程度越低 知识梳理 一 二 3.正相关、负相关与线性不相关 (1)正相关:当 r0 时,lxy0,从而 b=0,两个变量的值总体上呈现出同时增减的趋势,此时称两个变量正相关.(2)负相关:当r0时,b0,则两个变量正相关.()(2)两个变量的相关系数越大,它们的相关程度越高.()(3)若两个变量负相关,则其回归直线的斜率为负.()知识梳理 一 二【做一做3】根据如下样本数据:得到的回归方程为y=a+bx,则()A.a0,b0B.a0,b0 C.a0D.a0,b0 解析:由样本数据可知y值总体上是随x值的增大而减少的.

5、故b0,故a0.故选B.答案:B x 3 4 5 6 7 8 y 4.0 2.5-0.5 0.5-2.0-3.0 典例透析 题型一 题型二 题型三 题型四 求线性回归方程【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下表所示:零件数 x/个10 20 30 40 50 60 70 80 90 100 加工时间y/min62 68 75 81 89 95 102 108 115 122 (1)求y对x的线性回归方程;(2)据此估计加工200个零件所用的时间是多少.典例透析 题型一 题型二 题型三 题型四 解:(1)由题意得下表,并用科学计算器进

6、行计算.i 1 2 3 4 5 6 7 8 9 10 xi 10 20 30 40 50 60 70 80 90 100 yi 62 68 75 81 89 95 102 108 115 122 xiyi 620 1 360 2 250 3 240 4 450 5 700 7 140 8 640 10350 12200 x=55,y=91.7,i=110 xi2=38 500,i=110=55 950 b=110 xiyi-10 x yi=1102-102=55 950-105591.738 500-105520.668,a=91.7-0.66855=54.96,设所求的线性回归方程为y=a+

7、bx.同时,利用上表可得 故所求的线性回归方程为y=54.96+0.668x.典例透析 题型一 题型二 题型三 题型四 点评求线性回归方程的步骤:第一步:列表表示 xi,yi,xiyi.第二步:计算,=1xi2,i=1n.第三步:代入求值,计算 a,b.b=1-=12-2,=.第四步:写出线性回归方程,即 y=a+bx.(2)当x=200时,所用时间的估计值为 54.96+0.668200=188.56189(min).故加工200个零件所用的时间约为189 min.典例透析 题型一 题型二 题型三 题型四【变式训练1】某商场为了了解毛衣的月销售量y(件)与月平均气温x()之间的关系,随机统计

8、了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温 x/17 13 8 2 月销售量 y/件 24 33 40 55 由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温约为6,据此估计该商场下个月毛衣销售量约为()件.A.46 B.40C.38 D.58 典例透析 题型一 题型二 题型三 题型四 解析:由题设中数表提供的数据可得:=14 (17+13+8+2)=10,=14 (24+33+40+55)=38.将b=-2,=10,=38 代入y=bx+a,得a=58,即y对x的线性回归方程为y=-2x+58.将x=6代入y=-2x+58,得y=46.故选A

9、.答案:A 典例透析 题型一 题型二 题型三 题型四 使用年限 x/年 2 3 4 5 6 7 8 维修费用 y/万元 2.2 3.5 5.2 6.7 7.8 8.1 9.8 请用相关系数判断维修费用y与使用年限x之间是否具有线性相关关系?如果具有,请求出y对x的线性回归方程.分析:本题为探索两个变量之间是否具有线性相关关系的题型,通过计算线性相关系数来加以判断,由于数据比较多,可列表分项计算.计算线性相关系数【例2】某工厂有一大型机器设备,其使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下的统计资料:典例透析 题型一 题型二 题型三 题型四 解:列表:i xi yi xi2 y

10、i2 xiyi 1 2 2.2 4 4.84 4.4 2 3 3.5 9 12.25 10.5 3 4 5.2 16 27.04 20.8 4 5 6.7 25 44.89 33.5 5 6 7.8 36 60.84 46.8 6 7 8.1 49 65.61 56.7 7 8 9.8 64 96.04 78.4 35 43.3 203 311.51 251.1 典例透析 题型一 题型二 题型三 题型四 由此可得:=5,6.185 7,=17=251.1,i=172=203,=172=311.51.于是线性相关系数r=17-7 =172-72=172-72251.1-756.185 7 203

11、-752 311.51-76.185720.989 5.从而可知维修费用与使用年限之间存在线性相关关系.因为 b=17-7=172-72 251.1-756.185 7203-7521.235 7,a=6.185 7-1.235 75=0.007 2,所以线性回归方程为 y=0.007 2+1.235 7x.典例透析 题型一 题型二 题型三 题型四 反思对于两个变量的数据比较多的时候判断它们之间是否线性相关,可通过计算线性相关系数来判断.典例透析 题型一 题型二 题型三 题型四【变式训练2】关于两个变量x和y的一组数据如下表所示:x 21 23 25 27 29 32 35 y 7 11 21

12、 24 66 115 325 试用相关系数判断x与y之间是否有线性相关关系?i xi yi xi2 yi2 xiyi 1 21 7 441 49 147 2 23 11 529 121 253 3 25 21 625 441 525 4 27 24 729 576 648 5 29 66 841 4 356 1 914 6 32 115 1 024 13 225 3 680 7 35 325 1 225 105 625 11 375 192 569 5 414 124 393 18 542 解:列表:典例透析 题型一 题型二 题型三 题型四 由此可得27.4,81.3,=17xi2=5 414

13、,i=172=124 393,=17=18 542.所以 r=17-7 =172-72=172-7218 542-727.481.3 5 414-727.42 124 393-781.320.837 5.由于 r0.837 5 与 1 比较接近,故 x 与 y 具有线性相关关系.典例透析 题型一 题型二 题型三 题型四 利用回归分析进行有效预测【例3】为了了解某地区母亲身高x与女儿身高y的相关关系,现随机测得10对母女的身高,所得数据如下表所示:母亲身高 x/cm 159 160 160 163 159 154 159 158 159 157 女儿身高 y/cm 158 159 160 161

14、 161 155 162 157 162 156 (1)试对x与y进行线性回归分析,并预测当母亲身高为161 cm时,女儿的身高为多少?(2)求相关系数r,并分析模型的拟合效果.分析:通过观察两个变量对应的数据,可判断x与y之间存在线性相关关系,通过列表计算,求出回归方程,并通过计算线性相关系数来判断两个变量间的线性相关程度.典例透析 题型一 题型二 题型三 题型四 解:列表:i xi yi xi2 yi2 xiyi 1 159 158 25 281 24 964 25 122 2 160 159 25 600 25 281 25 440 3 160 160 25 600 25 600 25

15、600 4 163 161 26 569 25 921 26 243 5 159 161 25 281 25 921 25 599 6 154 155 23 716 24 025 23 870 7 159 162 25 281 26 244 25 758 8 158 157 24 964 24 649 24 806 9 159 162 25 281 26 244 25 758 10 157 156 24 649 24 336 24 492 1 588 1 591 252 222 253 185 252 688 典例透析 题型一 题型二 题型三 题型四(1)由此可得:=158.8,=159.1,

16、=110 xi2=252 222,i=1102=253 185,=110=252 688.进而可以求得 b=110-10=1102-102=252 688-10158.8159.1252 222-10158.820.78,a=159.1-0.78158.8=35.236,于是,y对x的线性回归方程为 y=35.236+0.78x.当x=161时,y161,即女儿的身高约为161 cm.典例透析 题型一 题型二 题型三 题型四(2)r=110-10 =1102-102=1102-102=252 688-10 158.8 159.1 252 222-10 158.82 253 185-10 159

17、.120.715,说明模型的拟合效果较好.典例透析 题型一 题型二 题型三 题型四【变式训练3】为了研究某地3月下旬的平均气温x(单位:)与4月20日前棉花害虫化蛹高峰日y的关系,某地观察了2013年至2018年间的情况,得到下列数据表:(1)求y对x的线性回归方程,并说明线性回归模型拟合的效果;(2)根据规律推断,若该地区2020年3月下旬平均气温为27,试估计2020年4月棉花害虫化蛹高峰日为哪一天?年份 2013 2014 2015 2016 2017 2018 平均气温x/24.4 29.5 32.9 28.7 30.3 28.9 高峰日 y 19 6 1 10 1 8 典例透析 题型

18、一 题型二 题型三 题型四 解:列表:i xi yi xi2 yi2 xiyi 1 24.4 19 595.36 361 463.6 2 29.5 6 870.25 36 177 3 32.9 1 1 082.41 1 32.9 4 28.7 10 823.69 100 287 5 30.3 1 918.09 1 30.3 6 28.9 8 835.21 64 231.2 174.7 45 5 125.01 563 1 222 典例透析 题型一 题型二 题型三 题型四(1)由此可得:29.12,=7.5,=16xi2=5 125.01,i=162=563,=16=1 222.进而可以求得b=1

19、6-6=162-62=1 222-629.127.55 125.01-629.122-2.4.a=7.5+2.429.12=77.388.于是,y 对 x 的线性回归方程为 y=77.388-2.4x.r=16-6 =162-62=162-621 222-629.127.5 5 125.01-629.122 563-67.52-0.966,由于|r|-0.966|与1较接近,说明模型的拟合效果较好.典例透析 题型一 题型二 题型三 题型四(2)当x=27时,y=77.388-2.427=12.588.据此估计该地2020年4月12日或13日为化蛹高峰日.典例透析 题型一 题型二 题型三 题型四

20、 易错辨析 易错点 忽略相关性检验而致误【例4】给出变量x,y的一组数据如下表所示:x 1 1 2 3 3 4 5 6 y 1 4 6 2 3 5 1 5 试对x,y进行线性回归分析.典例透析 题型一 题型二 题型三 题型四 错解列表:i xi yi xi2 yi2 xiyi 1 1 1 1 1 1 2 1 4 1 16 4 3 2 6 4 36 12 4 3 2 9 4 6 5 3 3 9 9 9 6 4 5 16 25 20 7 5 1 25 1 5 8 6 5 36 25 30 25 27 101 117 87 典例透析 题型一 题型二 题型三 题型四 由上表,得=258,=278.所以

21、 b=18xiyi-8x yi=182-82 0.114 8,a=278 0.114 8258 3.016.所以y对x的线性回归方程为y=3.016+0.114 8x.错因分析线性回归分析必须进行相关性检验,若忽略相关性检验,则所求线性回归方程没有实际意义.事实上,通过散点图或相关系数r可以判断y与x的相关性极弱,可认为变量x与y线性不相关.典例透析 题型一 题型二 题型三 题型四 正解:列表:i xi yi xi2 yi2 xiyi 1 1 1 1 1 1 2 1 4 1 16 4 3 2 6 4 36 12 4 3 2 9 4 6 5 3 3 9 9 9 6 4 5 16 25 20 7

22、5 1 25 1 5 8 6 5 36 25 30 25 27 101 117 87 典例透析 题型一 题型二 题型三 题型四 由上表,得=258,=278.r=18xiyi-8x y i=182-82=182-82=87-8258 278 101-8 258 2 117-8 278 20.107 9.因为 r 的值比较小,所以可认为 y 与 x 线性无关.1234561.已知某工厂车间加工零件的个数x与所花费的时间y(单位:h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件需要时间大约为()A.0.5 h B.3.5 h C.5.5 h D.6.5 h 解析:把x=600代入

23、y=0.01x+0.5,得y=6.5.故选D.答案:D 1234562.对于线性相关系数r,下列说法正确的是()A.r(-,+),r越大,相关程度越高;反之,相关程度越低 B.|r|(0,+),|r|越大,相关程度越高;反之,相关程度越低 C.|r|1,且|r|越大,相关程度越高;反之,相关程度越低 D.以上说法都不正确 解析:熟记关于线性相关系数r的重要结论是解决此类问题的关键.答案:C 1234563.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(

24、12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10B.0r2r1 C.r200;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r20.故r20r1.答案:C 1234564.由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到的线性回归方程为y=a+bx,下面说法中错误的是 .(只填序号)a=;直线 y=a+bx 至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个;直线 y=a+bx 的斜率为 b=1xiyi-x yi=1n2-2.答案:1234565.面对竞争日益激烈的消费市

25、场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行线性回归分析,结果如下:=72,=71,=16xi2=79,i=16=1 481.则销量每增加1 000箱,单位成本下降 元.解析:由题意知 b=1 481-6727179-6 72 2-1.818 2,a=71-(-1.818 2)7277.36,y=-1.818 2x+77.36,销量每增加 1 000 箱,则单位成本下降1.818 2元.答案:1.818 21234566.某商店统计了最近6个月某商品的进价x与售价y的对应数据如下表所示:求y关于x的线性回归方程.要使售价不超过16元,进价应不超过多少元?(精确到0.1)进价 x/元 3 5 2 8 9 12 售价 y/元 4 6 3 9 12 14 123456解:由表中数据可得:=6.5,=8,=16xi2=327,i=16=396.进而可以求得b=16-6=162-62=396-66.58327-66.52 1.143,a=8-1.1436.5=0.570 5,故所求的线性回归方程为y=0.570 5+1.143x.令y16,得0.570 5+1.143x16.令0.570 5+1.143x=16,解得x13.499.所以要使售价不超过16元,进价应不超过13.4元.

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3