1、2.2独立性检验23独立性检验的基本思想24独立性检验的应用1了解独立性检验的基本思想方法(重点)2了解独立性检验的初步应用(难点)教材整理1独立性检验阅读教材P21P24第1行部分,完成下列问题设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A21;变量B:B1,B21,有下面22列联表:BAB1B2总计A1ababA2cdcd总计acbdnabcd其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中
2、,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:_(填“是”或“否”)【解析】因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的【答案】是教材整理2独立性检验的基本思想阅读教材P24“练习”以下至P25“练习”以上部分,完成下列问题在22列联表中,令2,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:(1)当22.7
3、06时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当22.706时,有90%的把握判定变量A,B有关联;(3)当23.841时,有95%的把握判定变量A,B有关联;(4)当26.635时,有99%的把握判定变量A,B有关联对分类变量X与Y的统计量2的值说法正确的是()A2越大,“X与Y有关系”的把握性越小B2越小,“X与Y有关系”的把握性越小C2越接近于0,“X与Y无关系”的把握性越小D2越大,“X与Y无关系”程度越大【解析】2越大,X与Y越不独立,所以关联越大;相反,2越小,关联越小【答案】B预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:_解
4、惑:_疑问2:_解惑:_疑问3:_解惑:_,22列联表在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系【精彩点拨】【自主解答】22列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得0.671 875.0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯
5、与年龄有关系1作22列联表时,关键是对涉及的变量分清类别注意应该是4行4列,计算时要准确无误2利用22列联表分析两变量间的关系时,首先要根据题中数据获得22列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣1在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表【解】作列联表如下:喜欢甜食情况性别喜欢甜食不喜欢甜食总计男117413530女492178670总计6095911 200,独立性检验在500人身上试验某种血清预防感冒的作用,把
6、他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用. 未感冒感冒总计使用血清258242500未使用血清216284500 总计4745261 000【精彩点拨】独立性检验可以通过22列联表计算2的值,然后和临界值对照作出判断【自主解答】假设感冒与是否使用该种血清没有关系由列联表中的数据,求得2的值为27.075.27.0756.635,查表得P(26.635)0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用1熟练掌握2统计量的数值计算,根据计算得
7、出2值,对比三个临界值2.706,3.841和6.635,作出统计推断2独立性检验的一般步骤:(1)根据样本数据列22列联表;(2)计算2的值;(3)将2的值与临界值进行比较,若2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立2“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下: 【导学号:67720005】本地外地总计 去年1 4072 8424 249 今年1 3312 0653 396 总计2 7384 9077 645 能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?【解】按照独
8、立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系因为230.356.635.所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系,独立性检验的综合应用探究1当23.841时,我们有多大的把握认为事件A与B有关?【提示】由临界值表可知当23.841时,我们有95%的把握认为事件A与B有关探究2在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的我们是否可以判定100个心脏病患者中一定有打鼾的人?【提示】这是独立性检验,在犯错误的概率不超过0.01的前提下认为
9、“打鼾与患心脏病有关”这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?【精彩点拨】解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出22列联表,最后根据22列联表计算2,并进行判断【自主解答】由题意得22列联表如下:满意不满意
10、总计男生50555女生301545总计802010029.0916.635,所以我们有99%的把握认为学生对创建工作的满意情况与性别有关1独立性检验的基本思想是:要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量2应该很小,如果用观测数据计算的统计量2很大,则在一定程度上说明假设不合理由2与临界值的大小关系,作出判断2独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A与B有关,则推断结论为错误的可能性仅为5%(或1%)3有两个变量x与y,其一组观测值如下22列
11、联表所示:yxy1y2x1a20ax215a30a其中a,15a均为大于5的整数,则a取何值时,有95%的把握认为x与y之间有关系?【解】由题意2.有95%的把握认为x与y之间有关系,23.841,3.841,a7.7或a5,15a5,7.7a6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”【答案】C3在22列联表中,两个比值与_相差越大,两个分类变量有关系的可能性越大【解析】根据22列联表可知,比值与相差越大,则|adbc|就越大,那么两个分类变量有关系的可能性就越大【答案】4以下关于独立性检验的说法中,正确的是_.独立性检验依据小概率原理;独立性检验得到的结论一定正确;样
12、本不同,独立性检验的结论可能有差异;独立性检验不是判断两分类变量是否相关的唯一方法【解析】独立性检验得到的结论不一定正确,故错,正确【答案】5某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品总计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”【解】将22列联表中的数据代入公式计算,得24.762.因为4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”我还有这些不足:(1)_(2)_我的课下提升方案:(1)_(2)_