1、成才之路 数学路漫漫其修远兮 吾将上下而求索人教B版 选修2-3 统计案例 第三章 对流行病进行调查表明,吸烟是肺癌的重要致病因素之一,吸烟者患肺癌的危险性是不吸烟者的13倍,吸烟者肺癌死亡率比不吸烟者高1013倍肺癌死亡人数中约85%由吸烟造成吸烟可降低自然杀伤细胞的活性,从而削弱机体对肿瘤细胞生长的监视、杀伤和清除功能,这就进一步解释了吸烟是多种癌症发生的高危因素其他肺病像肺气肿亦与吸烟有关吸烟增加患心脏病的机会,吸烟与患肺病的关系如何?3.1 独立性检验第三章 第2课时 离散型随机变量的方差课堂典例探究 2课 时 作 业 3课前自主预习 1课前自主预习饮用水的质量是人类普遍关心的问题据统
2、计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人人的身体健康状况与饮用水的质量之间有关系吗?相互独立事件的概念与性质1定义:事件A是否发生对事件B发生的概率_,即P(B|A)_,这时,我们称两个事件A,B相互独立,并把这两个事件叫做相互独立事件2 性 质:当 事 件 A,B 相 互 独 立 时,_ 与_,_与_,_与_也相互独立没有影响P(B)ABABAB一、22列联表22列联表是传统的调查研究中最常用的手法之一,用于研究两个变量之间是相互独立还是存在某种关联性,它适用于分析两个变量之间的关系二、2 统计量的计算对于两个事件 A 和 B 给
3、出以下 22 列联表:BB合计An11n12n1An21n22n2合计n1n2n表中:n1n11n21,n2n12n22,n1n11n12,n2n21n22,nn11n21n12n22.事件 A 和 B 独立,这时应该有 P(AB)P(A)P(B)成立我们用字母 H0 来表示上式,即 H0:P(AB)P(A)P(B),称之为统计假设我们引入统计中一个非常有用的 2 的统计量,它的表达式是 2nn11n22n12n212n1n2n1n2.用它的大小可以决定是否拒绝原来的统计假设 H0.如果算出的 2 值较大,就拒绝 H0,也就是拒绝“事件 A 与 B 无关”,从而就认为它们是有关的了答案 C下面
4、是一个 22 列联表y1y2总计x1a2173x222527总计b46则表中 a,b 处的值分别为()A94、96 B52、50C52、54 D54、52导学号98570446解析 由题意得a2173a2b,a52b54.故选 C三、独立性检验的应用1经过对2统计量分布的研究,人们可以得到两个特别重要的临界值:3.841和6.635,当我们根据具体的数据计算出23.841时,我们就有95%的把握说事件A与B有关,当26.635时,我们有99%的把握说事件A与B有关,当23.841时,我们没有理由认为事件A与B有关,即可以认为A与B是无关的2使用 2 统计量作 22 列联表的独立性检验的步骤是:
5、检查 22 列联表中的数据是否符合要求;由公式 2nn11n22n12n212n1n2n1n2计算数值;将 2 的数值与两个临界值 3.841 与 6.635 进行对比通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由2 nadbc2abcdacbd 算 得,K2 110403020202605060507.8.导学号98570447附表:P(K2k)0.0500.0100.0013.8416.63510.828参照附表,得到的正确结论是()A有 99%以上的把握认为“爱好该项运动与性别有关”B有 99%以
6、上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”答案 A解析 根据独立性检验的定义,由27.86.635可知,有99%以上把握认为“爱好该项运动与性别有关”课堂典例探究调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表试问能有多大把握认为婴儿的性别与出生时间有关系.有关两个事件相互独立的判断出生时间性别晚上白天合计男婴243155女婴82634合计325789导学号98570448分析 利用表中的数据通过公式计算出2统计量,可以用它的取值大小来推断
7、独立性是否成立解析 由公式28924268312553432573.688 923.841.故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关)方法总结 计算出的统计量2的值要与两个临界值3.841与 6.635 做比较,从而得到答案,要特别注意最后结论的不同说法对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有关系又发作过心脏病未发作心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392
8、导学号98570449解析 这是一个 22 列联表的独立性检验问题,由公式知239239167157292196196683241.780.1.7803.841,我们没有理由说“心脏搭桥手术”与“又发作过心脏病”有关,可以认为病人又发作心脏病与否跟他做过何种手术无关.从发生汽车碰撞事故的司机中抽取2 000名司机根据他们的血液中是否含有酒精以及他们是否对事故是否负有责任,将数据整理如下:那么,司机对事故是否负有责任与血液中是否含有酒精是否有关系?若有关系,你认为在多大程度上有关系?有关两个事件不独立的判定责任酒精有责任无责任总计含有酒精650150800不含有酒精7005001200总计135
9、06502000导学号98570450分析 解答本题可直接计算2的值,再进行比较判断解析 根据列联表中的数据可以求得:22 00065050070015021 3506508001 200114.9.因为 114.96.635,所以我们有 99%的把握认为对事故是否负有责任与血液中是否含有酒精之间有关方法总结 1.判断两个研究对象是否有关的方法:可以利用独立性检验来考查两个研究对象是否有关,并且能较精确地给出这种判断的可靠程度具体做法是:根据观测数据计算由公式给出的检验统计量 2 的值,其值越大,说明“X 与 Y 有关”成立的可能性越大2本题是利用 2nn11n22n12n212n1n2n1n
10、2求出 2 的值,再利用 2与临界值的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断为调查吸烟与患肺癌的关系,某肿瘤研究院随机调查了9965人,得到22列联表如下:试问吸烟与患肺癌是否有关?用假设检验的思想给予说明患肺癌不患肺癌总计吸烟492 0992 148不吸烟4277757 817合计919 8749 965导学号98570451解析 根据列联表中的数据,得到29 9657 77549422 09927 8172 148919 87456.6326.635.因此有 99%的把握说患肺癌与有吸烟习惯有关系在某测试中,卷面满分为100分,60分为及
11、格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:分数段午休的考生成绩不午休的考生成绩29402317415047515160306761702115718014308190311791100143导学号98570452(1)请根据上述表格完成列联表.(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?分析 要正确给出列联表,首先要把表中的数据进行统计,分别计算出午休和不午休时对应的及格及不及格人数,然后填入相应表格即可;根据列联表可以粗略判断出变量之间是否有关系及格人数不及格人数总计午休不午休总计解析(1
12、)根据表中数据可以得出列联表中的数据如下:及格人数不及格人数总计午休80100180不午休65135200总计145235380(2)计算可知,午休的考生及格率为 P1 8018049,不午休的考生及格率为 P2 652001340,显然 P1P2.因此,可以粗略判断午休与考生考试及格有关系,并且午体的及格率高,所以,在以后的复习中考生应尽量适当午体,以保持最佳的学习状态方法总结 列联表是对数据的一种简单统计,也是对数据的一种整理,在列联表中可以看出每种变量对应的数据的频数和总计数量,进而可以计算对应变量的频率,再用频率代替概率,可以粗略估计两个分类变量是否有关系列联表是对相应数据频数的统计,
13、在判断两个分类变量是否有关系时不是看频数的大小,而是要结合列联表计算出频率,再对变量的关系进行估计,否则可能得出错误的结论;根据列联表进行的判断只是对两个变量之间的粗略估计,有时候可能是错误的,所以,还要进一步判断,否则也可能得出错误的结论研究某特殊药物有无副作用(比如恶心),给50个患者服用此药,给另外50个患者服用安慰剂,记录每类样本中出现恶心的数目如下表,试问此药物有无恶心副作用.有恶心无恶心合计给药 A153550给安慰剂 A44650合计1981100导学号98570453解析 由题意,问题可以归纳为独立检验假设 H0:服该药物(A)与恶心(B)独立为了检验假设 H0,首先计算统计量210015464352505019817.866.635.故拒绝 H0,即不能认为药物无恶心作用,也可以说:有 99%的把握说:该药物与副作用(恶心)有关为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表药物效果试验列联表请问有多大把握认为该药有效?患病未患病服用药1045没服用药2030导学号98570454错解 2105104520302555030750.381 83.841,有 95%的把握认为该药物有效独立性检验22列联表作法理解2统计量的计算理解独立性检验的思想了解课 时 作 业(点此链接)