1、1分类变量的概念变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量222列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)如下:构造随机变量K2,其中nabcd为样本容量3独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验临界值表:1下面说法正确的是(B)A统计方法的特点是统计推断准确、有效B独立性检验的基本思想类似于数学上的反证法C任何两个分类变量有关系的可信度都可以通过查表得到D不能从等高条形图中看出两个分类变量是否相关解析:根据独立性检验的概念知,选项B正确故选B.2对于分类变量X与Y的
2、随机变量K2的观测值k,下列说法正确的是(B)Ak越大,推断“X与Y有关系”,犯错误的概率越大Bk越小,推断“X与Y有关系”,犯错误的概率越大Ck越接近于0,推断“X与Y无关”,犯错误的概率越大Dk越大,推断“X与Y无关”,犯错误的概率越小3在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(C)A若K2的观测值为k6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得
3、推断出现错误D以上三种说法都不正确解析:根据独立性检验的概念知,选项C正确故选C.【典例】调查者通过询问男女大学生在购买食品时是否看营养说明得到的数据如下表所示请估计看营养说明是否与性别有关系.看营养说明不看营养说明总计男大学生来源:学&科&网104555女大学生82735总计187290解析:由表中数据得K2的观测值为: k0.2920.455,所以我们没有充分的证据认为看营养说明与男女性别有关【易错剖析】本题若不用独立性检验,会有如下错解:由表中数据可知,55名男大学生中有10名看营养说明,而35名女大学生中有8名看营养说明,显然男性看营养说明的比例比女性的要低,因此看营养说明与性别有关来
4、源:学科网ZXXK 1.下列关于K2的说法正确的是(C)AK2在任何相互独立问题中都可以用来检验有关还是无关BK2的值越大,两个事件的相关性越大CK2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合DK2的观测值的计算公式为K2解析:A中K2的使用范围是四个数据中每个数据都必须大于5,故A错;B中过于确定,不正确;C正确;D中公式有错2在22列联表中,两个比值_相差越大,两个分类变量之间的关系越强 (A)A.与 B.与C.与 D.与解析:与相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强3下面是22列联表:y1y2总计x1a2173x222527总计b46则表中a
5、、b的值分别为(C)A94、96 B52、50C52、54 D54、52解析:a2173,a52.又a2b,b54.4某大学在研究性别与职称(分正教授,副教授)之间是否有关系,你认为应该收集的数据是男正教授人数,男副教授人数,女正教授人数,女副教授人数 5.考察棉花种子经过处理跟生病之间的关系得到如下表数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据,则(A)A没有充分的理由说明种子经过处理跟是否生病有关B种子经过处理跟是否生病有关C种子是否经过处理决定是否生病D以上都是错误的解析:由公式得K2的观测值为k0.1642.706,而K2,要使
6、K22.706得a7.19或a5且15a5,aZ,所以a8或9,故当a取8或9时在犯错误的概率不超过0.1的前提下,认为“x与y之间有关系”7某高校统计初步课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为k4.844.因为k3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为_解析:因为随机变量K2的观测值k3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”故这种判断出现错误的可能性为5%.答案:5%
7、8. 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据计算K2_,比较这两种手术对病人又发作心脏病的影响有没有差别_.解析:提出假设H0:两种手术对病人又发作心脏病的影响没有差别根据列联表中的数据,可以求得K2的观测值k1.78.当H0成立时,K21.78,而K22.072的概率为0.85.所以,不能否定假设H0.也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论答案:1.78不
8、能作出这两种手术对病人又发作心脏病的影响有差别的结论9为了解决初二平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测验成绩统计表的一部分,试分析研究实验结果70分以上70及70分以下合计实验班321850对照班123850合计4456100解析:k16.23410.828,故有99.9%的把握认为“在初一加强概念和推理教学,对初二平面几何的测试成绩”有关系10. 甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:零件尺寸x1.011.021.031.041.05零件个数y甲37893乙7444a由表中数据得y关于x的线性回归方程为y91100x(1.01x1.05),其中合格零件尺寸为1.030.01(cm)完成下面列联表,并判断是否有99%的把握认为加工零件的质量与甲、乙有关.合格零件数不合格零件数合计甲乙合计解析:(1)1.03,由y91100x知,911001.03,所以,a11,由于合格零件尺寸为1.030.01 cm,故甲、乙加工的合格与不合格零件的数据表为:合格零件数不合格零件数合计甲24630乙121830合计362460所以,K210,因K2106.635,故有99%的把握认为加工零件的质量与甲、乙有关