ImageVerifierCode 换一换
格式:PPT , 页数:47 ,大小:2.33MB ,
资源ID:700038      下载积分:2 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-700038-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2018年数学同步优化指导(人教版选修1-2)课件:1-2 独立性检验的基本思想及其初步应用 .ppt)为本站会员(高****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至service@ketangku.com或直接QQ联系客服),我们立即给予删除!

2018年数学同步优化指导(人教版选修1-2)课件:1-2 独立性检验的基本思想及其初步应用 .ppt

1、第一章 统计案例 1.2 独立性检验的基本思想及其初步应用1了解独立性检验的基本思想、方法及其简单应用(重点)2通过收集数据,并依据独立性检验的原理作出合理推断,培养学生良好的思维习惯(难点)1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的_,像这样的变量称为_不同类别分类变量(2)列联表定义:列出的两个分类变量的_,称为列联表22列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:频数表22 列联表y1y2总计x1ababx2cdcd总计acbdabcd2.等高条形图(1)定义:将列联表中的_用高度相同的两个条

2、形图表示出来,其中两列的_分别对应不同的颜色,这就是等高条形图(2)特征:等高条形图与表格相比,更能直观地反映出两个分类变量间是否_,常用等高条形图展示列联表数据的_(3)用法:观察等高条形图发现 aab和 ccd相差很大,就判断两个分类变量之间有关系数据数据相互影响频率特征【想一想】1.如何理解分类变量?提示:(1)这里的“变量”和“值”都应作为“广义”的变量和值来理解例如:对于性别变量,其取值有“男”和“女”两种,这里的“变量”指的是“性别”,这里的“值”指的是“男”或“女”因此,这里说的“变量”和“值”不一定是取具体的数值(2)分类变量是大量存在的例如:吸烟变量有吸烟与不吸烟两种类别,而

3、国籍变量则有多种类别2利用等高条形图能否精确地判断两个分类变量是否有关系?为什么?提示:不能,因为通过等高条形图,可以粗略地判断两个分类变量是否有关系,但这种判断无法精确地给出所得结论的可靠程度3独立性检验定义利用随机变量 K2来判断“_”的方法称为独立性检验公式K2nadbc2abcdacbd,其中 n_为样本容量两个分类变量有关系abcd具体步骤根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界a.然后查表确定_.利用公式计算随机变量K2的_.如果_,就推断“X与Y有关系”,这种推断_不超过a,否则就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或者在样本

4、数据中_支持结论“X与Y有关系”临界值k0观测值kkk0犯错误的概率没有发现足够证据附:独立性检验临界值表:P(K2k0)0.500.400.250.150.100.05 0.025 0.010 0.0050.001k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828【想一想】3.从本质上说,独立性检验是对两个分类变量是否有关系的判断吗?提示:独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系4在判断两

5、个分类变量是否有关系时,等高条形图与独立性检验各有什么特点?提示:(1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度(2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判断的可靠程度,也常与图形分析法结合5在判断变量相关时,若K2的观测值k56.632,则P(K26.635)0.01和P(K210.828)0.001,哪种说法是正确的?提示:两种说法均正确P(K26.635)0.01的含义是在犯错误的概率不超过0.01的前提下,认为两变量相关;而P(K210.828)0.001的含义是在犯错误的概率不超过0.001的前提下,

6、认为两变量相关1在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A100个吸烟者中至少有99人患有肺癌B1个人吸烟,那么这个人有99%的概率患有肺癌C在100个吸烟者中一定有患肺癌的人D在100个吸烟者中可能一个患肺癌的人也没有解析:独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异答案:D2在调查中发现 480 名男人中有 38 名患有色盲,520 名女人中有 6 名患有色盲下列说法正确的是()A男、女患色盲的频率分别为 0

7、.038,0.006B男、女患色盲的概率分别为 19240,3260C男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D调查人数太少,不能说明色盲与性别有关答案:C解析:男人中患色盲的比例为 38480,要比女人中患色盲的比例 6520大,其差值为38480 6250 0.067 6,差值较大解析:a2173,a52,又a22b,b74.ab126.答案:1263下面是 22 列联表:y1y2总计x1a2173x2222547总计b46120则表中 ab 的值为_4若由一个22列联表中的数据计算得K2的观测值k4.013,那么在犯错误的概率不超过_的前提下认为两个变量有关系解析:

8、因为k4.0133.841,故在犯错误的概率不超过0.05的前提下认为两个变量有关系答案:0.051在22列联表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强2独立性检验的基本思想(1)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K26.635)0.01来评价假设不合理的程度

9、,由实际计算出k6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.(2)在实际问题中要记住以下几个常用值:k6.635有99%的把握认为“X与Y有关系”;k3.841有95%的把握认为“X与Y有关系”;k2.706有90%的把握认为“X与Y有关系”;k2.706就认为没有充分证据显示“X与Y有关系”(3)反证法原理与独立性检验原理的比较反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0不成立独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率3两个分类变量相关性检验方

10、法利用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a,然后查表确定临界值k0.计算随机变量K2的观测值k.如果kk0,就推断“X与Y”有关系,这种推断犯错误的概率不超过a,否则就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”用22列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了 124 人,其中六十岁以上的 70 人,六十岁以下的 54 人六十岁以上的人中有 43 人的饮食以蔬菜为主,另外 27 人则

11、以肉类为主;六十岁以下的人中有 21 人饮食以蔬菜为主,另外 33 人则以肉类为主请根据以上数据作出饮食习惯与年龄的列联表,并利用aab与 ccd判断二者是否有关系思路探究 作出22列联表 对比 aab与 ccd的结果判断两个分类变量是否有关自主解答 22 列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得 aab43640.671 875,ccd27600.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系1作 22 列联表时,关键是对涉及的变量分清类别注意应该是 4 行

12、4 列,计算时要准确无误2利用 22 列联表分析两变量间的关系时,首先要根据题中数据获得 22 列联表,然后根据频率特征,即将 aab与 ccd或bab与 dcd的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣1题中条件不变,尝试用|adbc|的大小判断饮食习惯与年龄是否有关解:将本例 22列联表中的数据代入可得|ad bc|43332127|852.相差较大,可在某种程度上认为饮食习惯与年龄有关系某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张作出等高条形图,利用图形判断考

13、前心情紧张与性格类别是否有关系用等高条形图分析两变量间的关系思路探究 作出22列联表 根据列联表数据作等高条形图 对比乘积的差距判断两个分类变量是否有关自主解答 作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关1利用列联表中数据计算出各类变量取值对应频率,作出等宽度且高度均为 1 的等高条形图2利用数形结合的思想,借助等

14、高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一一般地,在等高条形图中,aab与 ccd相差越大,两个分类变量有关系的可能性就越大作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,使对结论的判断不出现偏差2观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:在四幅图中,D图中两个阴影条的高度相差最明显,说明两个分类变量之间的关系最强答案:D下表是某地区的一种传染病与饮用水的调查表:独立性检验得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关?请说明理由;(2)若饮用干净水得病的有5

15、人,不得病的有50人;饮用不干净水得病的有9人,不得病的有22人按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异思路探究 求出k的值 与临界值作比较 作出判断自主解答(1)假设 H0:传染病与饮用水的卫生程度无关把表中数据代入公式得:K2 的观测值 k8305221846694214668451831254.21.在 H0 成立的情况下,P(K210.828)0.001,是小概率事件,所以拒绝 H0.因此我们有 99.9%的把握认为该地区这种传染病与饮用不干净水有关(2)依题意得22列联表:得病不得病总计干净水55055不干净水92231总计147286此时,K2 的

16、观测值 k865225092147255315.785.因为5.7855.024,P(K25.024)0.025,所以我们有97.5%的把握认为该地区这种传染病与饮用不干净水有关两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定 解决一般的独立性检验问题的步骤:(1)通过列联表确定 a、b、c、d、n 的值,根据实际问题需要的可信程度确定临界值 k0;(2)利用 K2nadbc2abcdacbd求出 K2 的观测值 k;(3)如果 kk0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过;否则

17、就认为在犯错误的概率不超过的前提下不能推断“两个分类变量有关系”3在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人进行问卷调查,只有80人志愿加入国家西部建设,而国家公布实施西部开发战略后,随机抽取1200名应届大学毕业生进行问卷调查,有400人志愿加入国家西部建设问:实施西部开发战略的公布是否对应届大学毕业生的选择产生了影响?解:据题意列出 22 列联表如下表:志愿者非志愿者总计开发战略公布前809201 000开发战略公布后4008001 200总计4801 7202 200由公式计算得 K2 的观测值k2 2008080092040024801 7201 0001 200 205.22.因为 205.2210.828,因此在犯错误的概率不超过 0.001的前提下认为实施西部开发战略的公布对应届大学毕业生的就业选择产生了影响1列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系2对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理K2值越大,两个分类变量有关系的可能性越大点击进入WORD链接谢谢观看!

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3