1、32 独立性检验的基本思想及其初步应用学习目标1.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用2了解假设检验的基本思想、方法及其简单应用 课堂互动讲练 知能优化训练 32课前自主学案 课前自主学案 1上节学习了回归分析的基本方法线性回归模型ybxae不同于一次函数ybxa,含有_,其中x为_,y为_温故夯基2 回 归 直 线 一 定 过 点(x,y),此 为_样本点的中心随机误差e解释变量预报变量3R2 表达式中的i1n(yi y)2 为确定的数,i1n(yiyi)2 称为_残差平方和122列联表与等高条形图(1)分类变量的定义变量的不同“值”表示个体所属的_,像这样的变量称
2、为分类变量(2)22列联表的定义一般地,假设有两个分类变量X和Y,它们的取值分别为_和_,其样本频数列联表(称为22列联表)为:知新益能不同类别x1,x2y1,y2y1 y2 总计 x1 a b ab x2 c d cd 总计 ac bd abcd(3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用_展示列联表数据的频率特征2独立性检验 为了使不同样本容量的数据有统一的评判标准,我们构造一个 随机变量 K2nadbc2abcdacbd,其 中n _为样本容量abcd等高条形图先假设两个分类变量X与Y无关系,利用上述公式根据观测数据求出K2的观测值k,再得出X与Y有关系的程度(
3、1)如果k10.828,就有_的把握认为“X与Y有关系”;(2)如果k7.879,就有_的把握认为“X与Y有关系”;99.9%99.5%(3)如果k_,就有99%的把握认为“X与Y有关系”;(4)如果k5.024,就有97.5%的把握认为“X与Y有关系”;(5)如果k3.841,就有_的把握认为“X与Y有关系”;(6)如果k2.706,就有_的把握认为“X与Y有关系”6.63595%90%在判断两变量相关时,若K2的观测值k56.632,则P(K26.635)0.01和P(K210.828)0.001,哪种说法是正确的?提示:两种说法均正确 P(K26.635)0.01的含义是:在犯错误的概率
4、不超过0.01的前提下,认为两变量相关;而P(K210.828)0.001的含义是:在犯错误的概率不超过0.001的前提下,认为两变量相关问题探究 课堂互动讲练 考点突破“相关”的检验问题 等高条形图更加形象直观地反映两个分类变量之间的差异,进而推断它们之间是否具有关联关系22列联表中,|adbc|越小,关系越弱;|adbc|越大,关系越强某校对学生的课外活动进行调查,结果整理成下表:例1体育 文娱 总计 男生 21 23 44 女生 6 29 35 总计 27 52 79 试用你所学过的知识分析:能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?【思路点拨】可
5、用表中所给的数据绘制等高条形图进行分析,也可用数据计算K2,再确定其中的具体关系【解】其等高条形图如图所示:由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略判断,具体判断方法如下:假设“喜欢体育还是喜欢文娱与性别没有关系”,a21,b23,c6,d29,n79,K2nadbc2abcdacbd7921292362443527528.106,且 P(K27.879)0.005,即我们得到的K2的观测值k8.106超过7.879这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢
6、文娱与性别有关”【方 法 小 结】利 用K2 nadbc2abcdacbd求出 K2 的观测值 k.再利用临界值的大小来判断假设是否成立根据22列联表,运用独立性检验的方法进行某省2011年高中招生不再文理分科,为了探究学生对此的赞同情况是否与性别有关某机构调查了361名高二在校学生,结果如下:男生赞同的有138人,不赞同的有98人,女生赞同的有73人,不赞同的有52人,试分析对这项政策的赞同是否与性别有关?“无关”的检验问题 例2【思路点拨】先列出22列联表,再计算K2的值,运用独立性检验得出结论【解】列22列联表男 女 总计 赞同 138 73 211 不赞同 98 52 150 总计 2
7、36 125 361【误区警示】计算K2的值要准确,并找准比较的值代入公式得 K2 的观测值k36113852739822361252111501.871104.1.8711042.706,即可以认为对此项政策的赞同与性别无关变式训练 某县城区常见在合法的广告牌上又贴有违法的黑广告,城管对此进行了清理,并下了通告一周后,城管对某街道进行了检查作了如下统计:贴有黑广告 未贴有黑广告 总计 通告前 39 157 196 通告后 29 167 196 总计 68 324 392 请你判断,城管下通告对减少黑广告数是否有效?解:根据题中的数据计算:k39239167157292196196683241.78.因为 1.782.706,所以我们没有理由说下通告对减少黑广告数有效方法技巧1列联表与等高条形图列联表由两个分类变量之间频率大小差异可说明这两个变量之间是否有关联关系而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系如例12在列联表中,可通过|adbc|的大小粗略判断关系的强弱方法感悟 失误防范P(K26.635)0.01是指在犯错误的概率不超过0.01的前提下进行变量判断,或者K26.635是指两个分类变量有关系这一结论成立的可信度为99%,不是指两个分类变量有关系的概率为99%.知能优化训练