1、第三章统计案例(选修2-3)人教A版数学32 独立性检验的基本思想及其初步应用第三章统计案例(选修2-3)人教A版数学第三章统计案例(选修2-3)人教A版数学1通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用2通过对数据的收集、整理和分析,增强学生的社会实践能力,培养学生分析问题、解决问题的能力第三章统计案例(选修2-3)人教A版数学第三章统计案例(选修2-3)人教A版数学本节重点、难点:独立性检验的思想方法与初步应用第三章统计案例(选修2-3)人教A版数学第三章统计案例(选修2-3)人教A版数学1两分类变量之间关联关系的定性分析(1)分类变量:取不同的“值”
2、表示个体所属不同类别的变量称为分类变量说明:对分类变量的正确理解:这里的“变量”和“值”都应作为广义的变量和值进行理解如:对于性别变量,其取值为男、女两种,所以这里的“变量”指的是“性别”,这里的“值”指的是“男”和“女”故这里所说的“变量”和“值”不一定是具体的数值第三章统计案例(选修2-3)人教A版数学分类变量是大量存在的,如吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别(2)频率分析:通过对样本中每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联第三章统计案例(选修2-3)人教A版数学(3)图形分析:利用三维柱形图及二维条形图来分析分类变量之间是否具有关联
3、分析,图形的形象直观更能说明相关数据的总体状况一般地,假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频率列联表(即22列联表)如下表:y1y2总计x1ababx2cdcd总计acbdabcd第三章统计案例(选修2-3)人教A版数学在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,说明X与Y有关的可能性越大,当ad与bc的差趋近于零时,X与Y几乎没有关系,可以说X与Y是相互独立的第三章统计案例(选修2-3)人教A版数学2独立性检验(1)定义:利用随机变量K2(其中nabcd)来确定是否能以一定把握认为“两个分类变量有关系”
4、的方法称为两个分类变量的独立性检验独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下随机变量K2应该很小第三章统计案例(选修2-3)人教A版数学如果由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理根据随机变量K2的含义,可以通过概率P(K2k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大第三章统计案例(选修2-3)人教A版数学(2)如何用K2的值判断X与Y之间是否有关?首先列22列联表,当得到的观测数据a,b,
5、c,d都不小于5时,由22列联表求出K2的观测值k.若k10.828,则我们有99.9%的把握认为X与Y有关,这种判断结果出错的可能性约为0.1%;若k6.635,则我们有99%的把握认为X与Y有关,这种判断结果出错的可能性约为1%;若k2.706,则我们有90%的把握认为X与Y有关,这种判断结果出错的可能性约为10%;若k2.706,则没有充分的证据显示X与Y有关,但也不能认为X与Y无关第三章统计案例(选修2-3)人教A版数学3独立性检验的基本方法一般地,假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:若要推断的结论为:H1:“X与
6、Y有关系”,可以按如下步骤判断结论H1成立的可能性:y1y2总计x1ababx2cdcd总计acbdabcd第三章统计案例(选修2-3)人教A版数学(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大第三章统计案例(选修2-3)人教A版数学第三章统计案例(选修2-3)人教A版数学第三章统计案例(选修2-3)人教A版数学如果k10.828,就有99.9%的把握认为“X与Y有关系”;如果k7.879,就有99.5%的把握
7、认为“X与Y有关系”;如果k6.635,就有99%的把握认为“X与Y有关系”;如果k5.024,就有97.5%的把握认为“X与Y有关系”;如果k3.841,就有95%的把握认为“X与Y有关系”;如果k2.706,就有90%的把握认为“X与Y有关系”;如果k10.828又P(K210.828)0.001,第三章统计案例(选修2-3)人教A版数学故在犯错误概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关第三章统计案例(选修2-3)人教A版数学点评 可以利用独立性检验来判断两个分类变量是否有关系,具体做法是:第三章统计案例(选修2-3)人教A版数学例2为了解铅中毒病人是否有
8、尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下,问铅中毒病人和对照组的尿棕色素阳性数有无差别?组别阳性数阴性数合计铅中毒病人29736对照组92837合计383573第三章统计案例(选修2-3)人教A版数学解析由上述列联表可知,在铅中毒病人中尿棕色素为阳性的占80.56%,而对照组仅占24.32%.说明他们之间有较大差别第三章统计案例(选修2-3)人教A版数学根据列联表作出三维柱形图(如图1),二维条形图(如图2),频率分布条形图(如图3所示),由上述三图可知,铅中毒病人中与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在关联关系第三章统计案例
9、(选修2-3)人教A版数学点评 由两个分类变量之间频率大小差异可说明这两个变量之间是有关联关系的而利用三维柱形图、二维条形图、频率分布条形图都能形象直观地反映它们之间差异的关系,进而推断它们之间是否具有关联关系其中作三维柱形图时应注意恰当的视角,使每个柱体都能看到而频率分布条形图由于是等高的,因此它与二维条形图相比较更能直观地反映它们之间的差异的大小,特别是当样本容量差异明显时更是如此第三章统计案例(选修2-3)人教A版数学第三章统计案例(选修2-3)人教A版数学一、选择题1调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是()A期望 B方差C正态分布D独立性检验答案D第三章
10、统计案例(选修2-3)人教A版数学210名学生在一次数学考试中的成绩如下表:要研究这10名学生成绩的平均情况,则最能说明问题的是()A概率B期望C方差D独立性检验答案B分数100115120125人数2431第三章统计案例(选修2-3)人教A版数学3下面是一个22列联表则表中a、b处的值分别为()A94、96 B52、50C52、59 D54、52答案Cy1y2合计x1a2173x272027合计b41100第三章统计案例(选修2-3)人教A版数学二、填空题4用K2统计量进行独立性检验时,使用的表称为_,要求表中的四个数据_答案22列联表 均大于5第三章统计案例(选修2-3)人教A版数学5若两个分类变量x和y的列联表为:则x与y之间有关系的概率约为_答案99%y1y2x1615x24010第三章统计案例(选修2-3)人教A版数学三、解答题6为调查学生对国家大事关心与否是否与性别有关,在学生中进行随机抽样调查,结果如下表,根据统计数据作出合适的判断分析.关心不关心合计男生18218200女生17624200合计35842400第三章统计案例(选修2-3)人教A版数学点评 根据随机变量K2的值判断两分类变量是否有关的步骤:第一,假设两分类变量无关,第二,由数据及公式计算K2的观测值k,第三,将k的值与临界值比较得出结论第三章统计案例(选修2-3)人教A版数学