1、活页作业(二)独立性检验的基本思想及其初步应用1有两个分类变量X与Y的一组数据,由其列联表计算得k4.523,则认为“X与Y有关系”犯错误的概率为()A95%B90%C5% D10%解析:P(K23.841)0.05,而k4.5233.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.答案:C2对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()Ak越大,“X与Y有关系”的可信程度越小Bk越小,“X与Y有关系”的可信程度越小Ck越接近于0,“X与Y没有关系”的可信程度越小Dk越大,“X与Y没有关系”的可信程度越大解析:k越大,“
2、X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小故选B.答案:B3下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A性别与喜欢理科无关B女生中喜欢理科的比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为60%解析:从图中可以分析,男生喜欢理科的可能性比女生大一些答案:C4关于随机变量K2的判断中,有以下几种说法:K2在任何问题中都可以用来检验两个变量有关还是无关;K2的值越大,两个分类变量的相关性就越大;K2是用来判断两个分类变量是否有关系的随机变量,当K2的值很小时可以判定
3、两个分类变量不相关其中说法正确的是_(填序号)解析:K2只适用于22列联表问题,故错误K2只能判断两个分类变量相关,故正确当K2的值很小时,只能说两个变量的相关程度低,不能判定两个变量不相关,故错误答案:5某校对学生课外活动进行调查,结果整理成下表:运用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱合计男生212344女生62935合计275279解:其等高条形图如图所示由图可以直观地看出喜欢体育还是喜欢文娱与性别在某种程度上有关系,但只能作粗略判断,具体判断方法如下:假设“喜欢体育还是喜欢文娱与性别没有关系”,a21,b23
4、,c6,d29,n79,K2的观测值为k8.106.且P(K27.879)0.005,即我们得到的K2的观测值k8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”6在验证吸烟与否与患肺炎与否有关的统计中,根据计算结果,认为这两件事情无关的可能性不足1%,那么 K2的一个可能取值为()P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.845.0246.6
5、357.87910.83A.6.635 B5.024C7.897 D3.841解析:由表格知P(K26.635)0.010,则K2的取值应大于6.635,故选C.答案:C7通过随机询问110性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2,算得K27.8附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握
6、认为“爱好该项运动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关”解析:因为K27.86.635,所以有不超过1%的机会错误,即有99%以上的把握认为“爱好这项运动与性别有关”,故选C.答案:C8某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:_(填“是”或“否”)解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即,两者
7、相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的答案:是9某高校统计初步课程的教师随机调查了选该课的一些学生的情况,具体数据如下表: 专业性别 非统计专业统计专业男生1310女生720为了检验主修统计专业是否与性别有关系,根据表中的数据得到随机变量K2的观测值为k4.844.因为k3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为_解析:因为随机变量K2的观测值k3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”故这种判断出现错误的可能性为5%.答案:5%10有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外
8、国人邮箱名称里含有数字的比较少为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的有70个,外国人的有54个,中国人的邮箱中有43个含数字,外国人的邮箱中有21个含数字(1)根据以上数据建立一个22列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里是否含有数字有无关系,你能帮他判断一下吗?解:(1)22列联表如下: 邮箱情况国籍情况 有数字无数字合计中国人432770外国人213354合计6460124(2)假设“国籍和邮箱名称里是否含有数字无关”由表中数据得K26.201.因为K25.024,所以有理由认为“国籍和邮箱名
9、称里是否含有数字无关”是不合理的,即有97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”11某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数12638618292614乙厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3
10、010)30.10,3014)频数297185159766218(1)试分别估计两个分厂生产零件的优质品率;(2)由以上统计数据填下面22列联表,并判断是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂乙厂合计优质品非优质品合计附:K2P(K2k0)0.050.01k03.8416.635解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为64%.(2)甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000k7.3536.635,因此,在犯错误的概率不超过0.01的前提下,即有99%的把握认为“两个分厂生产的零件的质量有差异”