ImageVerifierCode 换一换
格式:PPT , 页数:43 ,大小:1.99MB ,
资源ID:739375      下载积分:8 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-739375-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2017年高考数学人教版理科一轮复习课件:第9章 算法初步、统计、统计案例 4变量间的相关关系与统计案例.ppt)为本站会员(高****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至service@ketangku.com或直接QQ联系客服),我们立即给予删除!

2017年高考数学人教版理科一轮复习课件:第9章 算法初步、统计、统计案例 4变量间的相关关系与统计案例.ppt

1、考纲要求1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用4了解回归分析的基本思想、方法及其简单应用考情分析1.以客观题的形式考查求线性回归方程系数或利用线性回归分析的方程进行预测,在给出临界值的情况下判断两个变量是否有关2在解答题中常与频率分布结合考查线性回归方程的建立及应用和独立性检验的应用 小题热身1思考辨析(正确的打“”,错误的打“”)(1)相关关系的两个变量是非确定关系。()(2)散点图中的点越集中,两个变量的线性相关性越强。(

2、)(3)对于分类变量 X 与 Y,它们的随机变量 K2 的观测值越小。“X与 Y 有关联”的把握程度越大。()解析:(1)正确。相关关系不是确定关系。(2)错误。散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强。(3)错误。K2 越大,“X 与 Y 有关联”的把握程度越大。2设(x1,y1),(x2,y2),(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()A直线 l 过点(x,y)Bx 和 y 的相关系数为直线 l 的斜率Cx 和 y 的相关系数在 0 到 1

3、之间D当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同A解析:由样本的中心(x,y)落在回归直线上可知 A 正确;x 和 y的相关系数表示为 x 与 y 之间的线性相关程度,不表示直线 l 的斜率,故 B 错;x 和 y 的相关系数应在1 到 1 之间,故 C 错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故 D 错。3设有一个回归直线方程为y21.5x,则变量 x 增加一个单位()Ay 平均增加 1.5 个单位By 平均增加两个单位Cy 平均减少 1.5 个单位Dy 平均减少两个单位解析:回归直线方程y21.5x 可以看作y是 x 的一次函数,且单

4、调递减,又 x 的系数为1.5,变量 x 增加一个单位,y 平均减少 1.5个单位。答案:C4若 8 名学生的身高和体重数据如下表:编号12345678身高/cm165165157170175165155170体重/kg48575464614359第 3 名学生的体重漏填,但线性回归方程是y0.849x85.712,则第 3 名学生的体重估计为_。解析:设第 3 名学生的体重为 a,根据样本点的中心一定在回归直线上,可得4857a546461435980.849165165157170175165155170885.712,解得 a50。答案:50 kg5为了解某班学生喜爱打篮球是否与性别有关

5、,对该班 50 名学生进行了问卷调查,得到了如下的 22 列联表:喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050则在犯错误的概率不超过_的前提下认为喜爱打篮球与性别有关。附:K2nadbc2abcdacbd。P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828 解析:由公式可得 K28.3337.879,故填 0.005。答案:0.005知识重温一、必记 4个知识点1两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关

6、。(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关。(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在_附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。一条直线2回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法。(2)回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程,其中a,b是待定参数。bni1 xi x yi y ni1 xi x 2ni1xiyin x yni1x2in x 2,a y b x。3回归分析(1

7、)定义:对具有相关关系的两个变量进行统计分析的一种常用方法。(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中_称为样本点的中心。(3)相关系数当 r0 时,表明两个变量_;当 r0 时,表明两个变量_。r 的 绝 对 值 越 接 近 于 1,表 明 两 个 变 量 的 线 性 相 关 性 _。r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系。通常|r|大于_时,认为两个变量有很强的线性相关性。(x,y)正相关负相关越强0.754独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量。(2)列联表:

8、列出两个分类变量的频数表,称为列联表。假设有两个分类变量 X 和 Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd构造一个随机变量 K2nadbc2abcdacbd,其中 nabcd 为样本容量。(3)独立性检验利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独立性检验。二、必明 4个易误点1回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。2根据回归方程进行预报,仅是一个预报值,而不是真实发

9、生的值。3r 的大小只说明是否相关,并不能说明拟合效果的好坏,R2 才是判断拟合效果好坏的依据,必须将二者区分开来。4独立性检验的随机变量 K22.706 是判断是否有关系的临界值,K22.706 应判断为没有充分依据显示 X 与 Y 有关系,而不能作为小于 90%的量化值来作出判断。考点一 相关关系的判断【典例 1】四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y 与 x 负相关且y2.347x6.423;y 与 x 负相关且y3.476x5.648;y 与 x 正相关且y5.437x8.493;y 与 x 正相关且y4.326x4.5

10、78。其中一定不正确的结论的序号是()A BC D解析:中,回归方程中 x 的系数为正,不是负相关;方程中的 x 的系数为负,不是正相关,一定不正确。答案:D悟技法在回归直线方程ybxa中,b代表 x 每增加一个单位,y 平均增加的单位数,一般来说,当回归系数b0 时,说明两个变量呈正相关关系;当回归系数b0 时,说明两个变量呈负相关关系。1对变量 x,y 有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量 u,v 有观测数据(ui,vi)(i1,2,10),得散点图(2)。由这两个散点图可以判断()图(1)图(2)A变量 x 与 y 正样关,u 与 v 正相关B变量 x 与

11、y 正相关,u 与 v 负相关C变量 x 与 y 负相关,u 与 v 正相关D变量 x 与 y 负相关,u 与 v 负相关解析:由图(1)可知,各点整体呈递减趋势,x 与 y 负相关;由图(2)可知,各点整体呈递增趋势,u 与 v 正相关。答案:C考点二 独立性检验【典例 2】某高校共有学生 15 000 人,其中男生 10 500 人,女生4 500 人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300 位学生每周平均体育运动时间的样本数据(单位:小时)。(1)应收集多少位女生的样本数据?(2)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图

12、(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12。估计该校学生每周平均体育运动时间超过 4 小时的概率;(3)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4小时,请完成每周平均体育运动时间与性别的列联表,并判断是否在犯错误的概率不超过 5%的前提下认为“该校学生的每周平均体育运动时间与性别有关”。附:K2nadbc2abcdacbdP(K2k0)0.100.050.0100.005k02.7063.8416.6357.879解析:(1)300 4 50015 00090,所以应收集 90 位女生的样本数据。(2)由频率分布直方

13、图得 2(0.1500.1250.0750.025)0.75,所以该校学生每周平均体育运动时间超过 4 个小时的概率的估计值为0.75。(3)由(2)知,300 位学生中有 3000.75225 人的每周平均体育运动时间超过 4 小时,75 人的每周平均体育运动时间不超过 4 小时。又因为样本数据中有 210 份是关于男生的,90 份是关于女生的。所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过 4 小时453075每周平均体育运动时间超过 4 小时16560225总计21090300结合列联表可算得 K2的观测值k3002 25

14、02752252109010021 4.7623.841。所以在犯错误的概率不超过 5%的前提下认为“该校学生的每周平均体育运动时间与性别有关”。悟技法解独立性检验的应用问题的关注点(1)两个明确:明确两类主体;明确研究的两个问题。(2)两个关键:准确画出 22 列联表;准确理解 K2。提醒:准确计算 K2 的值是正确判断的前提。通一类2为了调查某大学学生在周日上网的时间,随机对 100 名男生和100 名女生进行了不记名的问卷调查,得到了如下的统计结果:表 1:男生上网时间与频数分布表上网时间(分钟)30,40)40,50)50,60)60,70)70,80人数525302515表 2:女生

15、上网时间与频数分布表上网时间(分钟)30,40)40,50)50,60)60,70)70,80人数1020402010(1)若该大学共有女生 750 人,试估计其中上网时间不少于 60 分钟的人数。(2)完成表 3 的 22 列联表,并回答能否在犯错误的概率不超过0.1 的前提下认为“学生周日上网时间与性别有关”?表 3附:K2nadbc2abcdacbd,其中 nabcd。P(K2k0)0.500.400.250.150.100.05 0.025 0.010 0.005 0.001k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828解析:(1)设上网时间不少于 60 分钟的人数为 x。依据题意有 x750 30100,解得:x225,所以估计其中上网的时间不少于 60 分钟的人数是 225 人。(2)根据题目所给数据得到如下列联表,上网时间少于 60 分钟上网时间不少于 60 分钟总计男生6040100女生7030100总计13070200其中 K220060304070210010013070 20091 2.1985.024,所以在犯错误的概率不超过 0.025 的前提下认为该学校 15 至 16 周岁的男生的身高和体重之间有关系。

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3