ImageVerifierCode 换一换
格式:PPT , 页数:71 ,大小:3.76MB ,
资源ID:33266      下载积分:9 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-33266-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2014年人教A版数学理(广东用)配套课件:第九章 第四节变量间的相关关系与统计案例.ppt)为本站会员(高****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至service@ketangku.com或直接QQ联系客服),我们立即给予删除!

2014年人教A版数学理(广东用)配套课件:第九章 第四节变量间的相关关系与统计案例.ppt

1、第四节 变量间的相关关系与统计案例 1.相关关系与回归方程(1)相关关系的分类.正相关:从散点图上看,点散布在从_到_的 区域内;负相关:从散点图上看,点散布在从左上角到_的区 域内.左下角 右上角 右下角(2)线性相关关系.从散点图上看,如果这些点从整体上看大致分布在一条直线 附近,则称这两个变量之间具有线性相关关系,这条直线叫_(3)回归方程.最小二乘法:使得样本数据的点到回归直线的_ 最小的方法叫最小二乘法 回归直线 距离平方和 回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),(xn,yn),其回归方程为 =x+则 =-其中,是 回归方程的_,是在y轴上的

2、截距.nniiiii 1i 1nn222iii 1i 1xxyyx ynxyb,xxxnxyba,ayb x,b斜率 a(4)样本相关系数.r=用它来衡量两个变量间的线性相关 关系.当r0时,表明两个变量_;当r0时,表明两个变量_;niii 1nn22iii 1i 1xxyy,xxyy正相关 负相关 r的绝对值越接近1,表明两个变量的线性相关性_;r的 绝对值越接近于0,表明两个变量之间几乎不存在线性相关关 系通常当|r|0.75时,认为两个变量有很强的线性相关关 系 越强 2.独立性检验(1)22列联表.假设有两个分类变量X和Y,它们的取值分别为x1,x2和 y1,y2,其样本频数列联表(

3、称22列联表)为:y1 y2 总计 x1 a b _ x2 c d c+d 总计 a+c _ a+b+c+d a+b b+d(2)K2统计量.K2=(其中n=a+b+c+d为样本容量).2n adbcabcdac(bd)判断下面结论是否正确(请在括号中打“”或“”).(1)线性回归分析就是由样本点去寻找一条直线,使之贴近这 些样本点的方法.()(2)利用样本点的散点图可以直观判断两个变量的关系是否可 以用线性关系去表示.()(3)通过回归方程 =x+可以估计和观测变量的取值和变 化趋势.()ayb(4)因为由任何一组观测值都可以求得一个线性回归方程,所 以没有必要进行相关性检验.()(5)任意

4、两个变量之间都存在着线性相关关系.()(6)如果两个变量之间线性不相关,则这两个变量一定不存在 线性回归方程.()【解析】(1)正确.反映的是最小二乘法的思想.(2)正确.反映的是散点图的作用.(3)正确.解释的是回归方程 =x+的作用.yba(4)错误.在求回归方程之前必须进行相关性检验,以体现两变量的关系.(5)错误.变量之间还存在函数关系和非线性相关关系.(6)错误.任意两个变量都可以利用公式求出线性回归方程.答案:(1)(2)(3)(4)(5)(6)1.利用随机变量K2来判断“两个分类变量X,Y有关系”时,K2的 观测值k的计算公式为:k=则下列说法 正确的是()(A)ad-bc越小,

5、说明X与Y关系越弱(B)ad-bc越大,说明X与Y关系越强(C)(ad-bc)2越大,说明X与Y关系越强(D)(ad-bc)2越接近于0,说明X与Y关系越强【解析】选C.由K2的计算公式及其意义容易判断选C.2n adbc,abcdac(bd)2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归 直线方程可能是()(A)=-10 x+200 (B)=10 x+200(C)=-10 x-200 (D)=10 x-200【解析】选A.商品销售量y(件)与销售价格x(元/件)负相关,0,应选A.yyyyby3.一位母亲记录了儿子39岁的身高,数据(略),由此建立的身高与年龄的回归模型为y7

6、.19x73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()(A)身高一定是145.83 cm(B)身高在145.83 cm以上(C)身高在145.83 cm左右(D)身高在145.83 cm以下【解析】选C.用回归模型y7.19x73.93,只能作预测,其结果不一定是个确定值 4.给出下列关系:正方形的边长与面积之间的关系;某化妆品的销售量与广告宣传费之间的关系;人的身高与视力之间的关系;雾天的能见度与交通事故的发生率之间的关系;学生与其学号之间的关系 其中具有相关关系的是_.【解析】正方形的边长与面积之间的关系是函数关系;化妆品的销售量与广告宣传费之间的关系不是严格的函数关

7、系,但是具有相关性,因而是相关关系;人的身高与视力之间的关系既不是函数关系,也不是相关关系;能见度与交通事故的发生率之间具有相关关系;学生与其学号之间的关系是一种确定的对应关系 综合以上可知,具有相关关系,而是确定性的函数关系,两种关系都不具有 答案:5.某高校“统计初步”课程的教师随机调查了选该课程的一些 学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2 4.844,因为K23.841,所以判 定主修统计专业与性别有关系,那么这种判断出错的可能性不 超过_.专业性别 非统计专业 统计专业 男 13 10 女 7 20 250(13 20 10 7)2

8、3 27 20 30【解析】K24.8443.841,在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系,出错的可能性不超过5%.答案:5%考向 1 相关关系的判断【典例1】(1)对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()(A)变量x与y正相关,u与v正相关(B)变量x与y正相关,u与v负相关(C)变量x与y负相关,u与v正相关(D)变量x与y负相关,u与v负相关(2)(2012新课标全国卷)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n

9、2,x1,x2,xn不全相等)的散点图中,若所有 样本点(xi,yi)(i=1,2,n)都在直线y=x+1上,则这组样本 数据的样本相关系数为()(A)-1 (B)0 (C)(D)1 1212【思路点拨】(1)根据散点图的变化趋势判断.(2)理清相关系数与相关性强弱的关系是解决本题的关键.【规范解答】(1)选C.由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正 相关.(2)选D.样本相关系数越接近1,相关性越强,现在所有的样本 点都在直线y=x+1上,样本的相关系数应为1.12【拓展提升】线性相关关系与函数关系的区别(1)函数关系中的两个变量间

10、是一种确定性关系例如,正方形面积S与边长x之间的关系Sx2就是函数关系(2)相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系例如,商品的销售额与广告费是相关关系两个变量具有相关关系是回归分析的前提【变式训练】某公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):(1)画出散点图.(2)判断是否具有相关关系.施化肥量x 15 20 25 30 35 40 45 棉花产量y 330 345 365 405 445 450 455 【解析】(1)散点图如图所示 (2)由散点图知,各组数据对应点大

11、致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系.考向 2 线性回归方程及其应用 【典例2】(2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)8 8.2 8.4 8.6 8.8 9 销量y(件)90 84 83 80 75 68(1)求回归直线方程 =x+其中 =-20,=-(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的 单价应定为多少元?(利润=销售收入-成本)【思路点拨】(1)先求出 再利用 =-求出 的值.(2)利用“利润=销售收入成本”

12、列出函数关系式后再求解.yba,bayb x.x,y,ayb xa【规范解答】(1)由于 =8.5,=80 所以 =-=250,从而回归直线方程为 =-20 x+250(2)设工厂获得的利润为L元,依题意得 L=x(-20 x+250)-4(-20 x+250)=-20 x2+330 x-1000 =-20(x-)2+361.25,当且仅当x=8.25时,L取得最大值,故当单价定为8.25元时,工厂可获得最大利润 xyayb xy334【互动探究】在本例中条件不变,预测当单价为10元时,销量 是多少件?【解析】将x=10代入 =-20 x+250得,=50,即销量大约是50件.【拓展提升】最小

13、二乘法估计的三个步骤(1)作出散点图,判断是否线性相关.(2)如果是,则用公式求 写出回归方程.(3)根据方程进行估计【提醒】回归直线方程恒过点()yya,b,x,y【变式备选】某商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:其中i1,2,3,4,5,6,7.人数xi 10 15 20 25 30 35 40 件数yi 4 7 12 15 20 23 27(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出 散点图 (2)求回归直线方程(结果保留到小数点后两位).(参考数据:=3245,=25,=15.43,=5075,=4375,=2700)7iii 1x yxy72ii

14、 1x27x7xy(3)预测进店人数为80人时,商品销售的件数(结果保留整数)【解析】(1)散点图如图.(2)易知所有点在一条直线附近,=3245,=25,=15.43,=5075,=4375,=2700,=0.78,=-=-4.07,回归直线方程是 =0.78x-4.07.(3)进店人数为80人时,商品销售的件数 0.78804.0759(件)7iii 1x yxy72ii 1x27x7xy7iii 1722ii 1x y7xyx7xbayb xyy考向 3 独立性检验 【典例3】为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组10

15、0只,其中一组注射药物A,另一组注射药物B.完成下面22列联表,并回答能否在犯错误的概率不超过0.01的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.【思路点拨】(1)把握22列联表的意义,准确填入数据.(2)将数据代入K2的公式进行计算.(3)与临界值比较并得出结论.疱疹面积 小于70 mm2 疱疹面积不 小于70 mm2 总计 注射药物A a=b=30 a+b=注射药物B c=35 d=c+d=总计 a+c=b+d=a+b+c+d=【规范解答】22列联表如下:K2的观测值k=由于k6.635,因此 能在犯错误的概率不超过0.01的前提下认为“注射药物A后的疱 疹面积与

16、注射药物B后的疱疹面积有差异”.疱疹面积 小于70 mm2 疱疹面积不 小于70 mm2 总计 注射药物A a=70 b=30 a+b=100 注射药物B c=35 d=65 c+d=100 总计 a+c=105 b+d=95 a+b+c+d=200 220070 6535 3024.56,100 100 105 95【拓展提升】解独立性检验的应用问题的关注点(1)两个明确 明确两类主体,如“吸烟者”“不吸烟者”.明确研究的两个问题.如“患肺癌”“未患肺癌”.(2)解决问题的关键 准确画出22列联表;准确理解K2.(3)统计的基本思维模式是归纳,它的特征之一是由部分数据的性质推断全部数据的性质

17、.因此,由此推断所得结论可能是错误的,即从数据上体现的是统计关系,而不是因果关系.【变式训练】冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示:杂质高 杂质低 旧设备 37 121 新设备 22 202 根据以上数据,则()(A)含杂质的高低与设备改造有关(B)含杂质的高低与设备改造无关(C)设备是否改造不能决定含杂质的高低(D)以上答案都不对【解析】选A.由已知数据得到如下22列联表:由公式K2的观测值k=由于13.1110.828,故有99.9%的把握认为含杂质的高低与 设备是否改造有关 杂质高 杂质低 总计 旧设备 37 121

18、 158 新设备 22 202 224 总计 59 323 382 238237202 121 2213.11,158 224 59 323【满分指导】解答独立性检验与概率相结合的综合题【典例】(12分)(2012辽宁高考)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女总计

19、(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女 性观众的概率.附:K2=2n adbc,abcdacbd【思路点拨】已 知 条 件 条 件 分 析 频率分布直方图 计算各时间段内的人数 收看该体育节目时间不低于40分钟的观众称为“体育迷”确定“体育迷”的人数 收看该体育节目不低于50分钟的观众称为“超级体育迷”确定“超级体育迷”的人数【规范解答】(1)由所给的频率分布直方图知,“体育迷”人数为100(100.020+100.005)=25“非体育迷”人数为75,则据题意完成22列联表:3分 非体

20、育迷 体育迷 总计 男 30 15 45 女 45 10 55 总计 75 25 100 将22列联表的数据代入公式计算:K2的观测值k=因为3.0302.706,所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关 6分 2100 30 1045 153.03045 55 75 25(2)由所给的频率分布直方图知“超级体育迷”人数为100(100.005)=5,7分 记ai(i=1,2,3)表示男性,bj(j=1,2)表示女性,所有可能结果构成的集合为=(a1a2),(a1a3),(a2a3),(a1b1),(a2b1),(a3b1),(a1b2),(a2b2),(a3b2),(

21、b1b2),共由10个基本事件组成,且每个基本事件的出现是等可能的;10分 用A表示事件“任选2人,至少1名女性”,则A=(a1b1),(a2b1),(a3b1),(a1b2),(a2b2),(a3b2),(b1b2),共由7个基本事件组成,故“任选2人,至少1名女性”的概率为P(A)=12分 7.10【失分警示】(下文见规范解答过程)1.(2012湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本 数据(xi,yi)(i=1,2,n),用最小二乘法建立的 回归方程为 =0.85x-85.71,则下列结论中不正确的是()y(A)y与x具有正的线性相

22、关关系(B)回归直线过样本点的中心()(C)若该大学某女生身高增加1cm,则其体重约增加0.85kg(D)若该大学某女生身高为170cm,则可断定其体重必为58.79kg x,y【解析】选D.选项 具体分析 结论 A x的系数大于零,正相关 正确 B 回归直线一定过样本点中心().由回归直线方程的计算公式 =-可知直线必过点()正确 C 由一次函数的单调性知,x每增加 1cm,体重均增加0.85 kg,是估计值 正确 D 体重应约为58.79 kg,是估计值 不正确 x,yayb xx,y2.(2013三亚模拟)已知x,y之间的数据如表所示,则回归 直线过点()(A)(0,0)(B)(2,1.

23、8)(C)(3,2.5)(D)(4,3.2)【解析】选C.回归直线恒过定点(),且 3,2.5.故选C.x 1 2 3 4 5 y 1.2 1.8 2.5 3.2 3.8 x,yxy3.(2013江门模拟)某产品的广告费用x与销售额y的统计数 据如下表:根据上表可得回归方程 =x+中的 为9.4,据此模型预报 广告费用为6万元时销售额约为()(A)63.6万元 (B)65.5万元(C)67.7万元 (D)72.0万元 广告费用x(万元)4 2 3 5 销售额y(万元)49 26 39 54 ybab【解析】选B.由表可计算 因为点(42)在回归直线 =x+上,且 为9.4,所以42=9.4 +

24、解得 =9.1,故回归方程为 =9.4x+9.1,令x=6得 =65.5,选B.42357x,42 49263954y42,47,2ybab72a,ayy4.(2013汕头模拟)以下四个命题,其中正确的是()从匀速传递的产品生产流水线上,质检员每20分钟从中 抽取一件产品进行某项指标检测,这样的抽样是分层抽样 两个随机变量相关性越强,则相关系数的绝对值越接近于1 在回归直线方程 0.2x12中,当解释变量x每增加一个 单位时,预报变量y平均增加0.2个单位 y对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大(A)(B)(C)(D)【解析】选D.是系统抽

25、样;正确;对于,随机变量K2的观测值k越小,说明两个变量有关系的把握程度越小 5.(2013韶关模拟)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22列联表:喜爱打篮球 不喜爱打篮球 总计 男生 20 5 25 女生 10 15 25 总计 30 20 50 则在犯错误的概率不超过_的前提下认为喜爱打篮球 与性别有关(请用百分数表示)附:K2 2n adbcabcdac(bd)P(K2k0)0.10 0.05 0.025 0.010 0.005 0.001 k0 2.706 3.841 5.024 6.635 7.879 10.828【解析】K2=8.3

26、337.879,所以 在犯错误的概率不超过0.005的前提下认为喜爱打篮球 与性别有关.答案:0.5%2n adbcabcdac(bd)25020 155 1025 25 30 20 1.观察下列散点图,则正相关;负相关;不相关,它们的排列顺序与图形相对应的是()(A)a-,b,c (B)a,b,c(C)a,b,c (D)a,b,c【解析】选D.变量的相关性的图形表示法,在相关变量中,图a从左下角到右上角,是正相关;图c从左上角到右下角,是负相关;图b的点分布不规则,是不相关,故选D.2.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记

27、录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K2的观测值k3.918,经查对临界值表知P(K23.841)0.05.对此,四名同学得出了以下的判断:p:在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”,q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒,r:这种血清预防感冒的有效率为95%,s:这种血清预防感冒的有效率为5%,则下列结论中,真命题的序号是_(把你认为正确的命题 序号都填上).p ;q;()(rs);(p )(s).【解析】k3.9183.841,在犯错误的概率不超过0.05的前 提下认为“这种血清能起到预防感冒的作用”,即命题p正确.命题q,r,s均不正确,对依次进行判断,可知 正确.答案:qppqrq

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3