1、第4章 典型统计案例43 列联表独立性分析案例1理解列联表的意义,会根据列联表中的数据大致判断两个变量是否独立2通过典型案例的探究,理解统计量2的意义和独立性检验的基本思想一、阅读教材开始案例前的内容,完成下列问题122 列联表一般地,对于两个_X 和 Y,X 有两个_取值:A 和 A(如吸烟和不吸烟),Y 也有两个_取值:B 和 B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为 22 列联表.因素水平水平 YX BB合计AababAcdcd合计acbdabcd下面是一个22列联表:则表中a,b处的值分别为()A94,96 B52,50C52,54D54,52答案:Cy1y2总
2、计x1a2173x222527总计b46100(2)列出事件X与Y的列联表,由公式计算得2,2取值越小,X,Y的相关性_;相反,2取值越大,X,Y的相关性_.当根据具体的数据算出的23.841时,有95%的把握说事件X与Y _;当26.635时,有_的把握说事件X与Y _;当22.706时,认为事件X与Y是_的二、阅读教材案例及其后面的内容,完成下列问题2统计量 2(1)2nadbc2abcdacbd.越弱越强有关99%有关无关3独立性检验要推断“X与Y有关系”,可按下面的步骤进行:(1)提出假设H0:_;(2)根据22列联表计算_的值;(3)查对临界值,作出判断X与Y无关2某班生活委员为了了
3、解在春天本班同学患感冒与性别是否相关,收集了3月份本班同学患感冒的数据,并制出下面一个22列联表:感冒不感冒合计男生52732女生91928合计134760下面判断正确的是()A在犯错概率不超过1%的前提下认为该班“患感冒与性别有关”B在犯错概率不超过1%的前提下不能认为该班“患感冒与性别有关”C有15%的把握认为该班“患感冒与性别有关”D在犯错概率不超过10%的前提下认为该班“患感冒与性别有关”答案:B22列联表在某次调查中,480名男性中有38名患有色盲,520名女性中有6名患有色盲试作出性别与色盲的列联表解 根据题目所给的数据作出如下列联表.色盲性别 患色盲不患色盲总计男38442480
4、女6514520总计449561 000互动探究 利用本例的列联表:(1)计算男性人群中患色盲的百分比;(2)计算男性患色盲的人的频率;(3)估计色盲与性别是否有关解(1)男性人群中患色盲的百分比为 38480100%7.92%.(2)男性患色盲的人的频率为384805200.038.(3)0.038384421 000 6381 000,估计色盲与性别有关【点评】(1)分清类别是作列联表的关键步骤,要明确所给数据属于哪一类(2)利用列联表可初步判定两变量有无关联1某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的400名学生中有300人在考前心情紧张,性格外向的600名学生中
5、有200人在考前心情紧张试列出22列联表,并利用频率判断考前心情紧张与性格类别是否有关系解 作22列联表如下.考前心情紧张考前心情不紧张总计性格内向300100400性格外向200400600总计5005001 000 3001 0003001001 0002003001 000,考前心情紧张与性格类别有关系独立性检验同时抛掷两枚均匀的骰子,请回答以下问题:(1)求两枚骰子都出现2点的概率(2)若同时抛掷两枚骰子180次,其中甲骰子出现20次2点,乙骰子出现30次2点,问两枚骰子出现两点是否相关?解(1)每枚骰子出现 2 点的概率都为16,由相互独立事件同时发生的概率公式,得两枚骰子都出现 2
6、 点的概率为1616 136.(2)依题意,列22列联表如下:出现2点出现其他点总计甲骰子20160180乙骰子30150180总计50310360假设 H0:两枚骰子出现 2 点无关由公式计算得 236020150160302503101801802.323.因为 2.3232.706,所以我们不拒绝 H0.因此我们没有理由说两枚骰子出现 2 点相关【点评】两个分类变量独立性检验的步骤 提出统计假设H0:X与Y无关;根据22列联表与2计算公式计算出2的值;根据临界值,作出判断2有两个变量x与y,它们的一组观测值如下22列联表所示:其中a,15a均为大于5的整数,则a取何值时,有95%的把握认
7、为x与y之间有关系?yx y1y2总计x1a20a20 x215a30a45总计155065解 由题意 265a30a20a15a2204515506565a3002204515501313a6025 400.有 95%的把握认为 x 与 y 之间有关系,23.841.1313a6025 4003.841.解得 a7.7 或 a1.5.又 a5,15a5,7.7a10.又 aZ,a8 或 9.某 学 校 研 究性学习小组对该校高二学 生 视 力 情 况 进 行 调查,在高二的1 000名学生中随机抽取了100名学生的体检表,并得到如图所示的频率分布直方图:独立性检验的综合应用(1)若直方图中后
8、四组的频数成等差数列,试估计全年级学生中视力在5.0以下的人数(2)学习小组成员发现,学习成绩突出的学生近视的比较多,为了研究学生的视力与学习成绩是否有关系,对年级名次在150名和9511 000名的学生进行了调查,得到下表中数据根据表中的数据,能否在犯错的概率不超过0.05的前提下认为视力与学习成绩有关系?年级名次是否近视 1509511 000总计近视413273不近视91827总计5050100解(1)设各组的频率为 fi(i1,2,3,4,5,6)由已知可得,第一组有 3 人,第二组 7 人,第三组 27 人因为后四组的频数成等差数列,所以后四组的频数依次为27,24,21,18.所以
9、视力在 5.0 以下的频数为 3727242182.故全年级学生中视力在 5.0 以下的人数约为1 000 82100820.【点评】(1)独立性检验常与统计、概率等知识相结合进行综合考查(2)解决此类问题关键在于正确列出列联表,把2计算准确(2)2100411832925050732730073 4.1103.841.因此在犯错误的概率不超过 0.05 的前提下认为视力与学习成绩有关系3(2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各 箱 水 产 品 的 产 量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱
10、产量低于50 kg”,估计A的概率(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较箱产量50 kg箱产量50 kg旧养殖法新养殖法解(1)旧养殖法的箱产量低于50 kg的频率为0060.070.120.170.200.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得列联表如下:箱产量50 kg 箱产量50 kg总计旧养殖法6238100新养殖法3466100总计961042002 的观测值2006266343821001009610415.705.由于 15.7056
11、.635,故有 99%的把握认为箱产量与养殖方法有关(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法1独立性检验的思想:先假设两个事件无关,计算统计量2的值若2的值较大,则拒绝假设,认为两个事件有关2独立性检验的步骤:(1)画列联表;(2)计算2;(3)将得到的2值和临界值进行比较,得出结论.点击进入WORD链接点击进入WORD链接活页作业(三)谢谢观看!