1、1.2独立性检验的基本思想及其初步应用课时过关能力提升基础巩固1在独立性检验中,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.假设检验的思想D.以上都不对解析等高条形图可以粗略地判断两个分类变量是否有关,但无法精确地给出结论的可靠程度.故选B.答案B2判断两个分类变量是彼此相关还是相互独立的常用的方法中,最为精确的是()A.22列联表B.独立性检验C.等高条形图D.其他答案B3在列联表中,相差越大,两个分类变量之间的关系越强的两个比值是()A.aa+b与cc+dB.ac+d与ca+bC.aa+d与cb+cD.ab+d与ca+c解析aa+b与cc+d相差越大,说明ad与b
2、c相差越大,两个分类变量之间的关系越强.故选A.答案A4对服用某种维生素对婴儿头发稀疏与稠密的影响调查如下:服用的60人中头发稀疏的有5人,不服用的60人中头发稀疏的有46人,作出如下列联表:头发稀疏头发稠密总计服用维生素5a60不服用维生素46b60总计51a+b120则表中a,b的值分别为()A.9,14B.55,14C.55,24D.69,14解析根据列联表知a=60-5=55,b=60-46=14.答案B5有22列联表如下:BB总计A544094A326395总计86103189由上表可计算K2的观测值k.解析k=189(5463-3240)294958610310.759.答案10.
3、7596为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k9.643,根据临界值表,在犯错误的概率不超过的前提下认为课外阅读量大与作文成绩优秀有关.解析根据临界值表,9.6437.879,因此,在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关.答案0.0057为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:无效有效总计男性患者153550女性患者64450总计2179
4、100设H0:服用此药的效果与患者的性别无关,则K2的观测值k,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为.解析由公式计算得K2的观测值k4.882,由于k3.841,故在犯错误的概率不超过0.05的前提下认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.答案4.8825%8哈尔滨冰雪大世界每年冬天都会吸引大批游客前来,现准备在景区内开设经营热饮等食品的店铺若干.根据以往对500名40岁以下(含40岁)人员和500名40岁以上人员的统计调查,有如下一系列数据:40岁以下(含40岁)人员购买热饮等食品的有260人,不购买热饮等食品的有240人;40岁以上人员购
5、买热饮等食品的有220人,不购买热饮等食品的有280人,请根据以上数据作出22列联表,并运用独立性检验思想,能否在犯错误的概率不超过0.001的前提下认为购买热饮等食品与年龄(按上述统计中的年龄分类方式)有关系?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k0)0.5000.4000.1000.0100.001k00.4550.7082.7066.63510.828解由题意得22列联表:购买热饮等食品不购买热饮等食品总计40岁以下(含40岁)26024050040岁以上220280500总计4805201 000K2的观测值k=1 000(260280-220
6、240)25005004805206.4103.841.因此,在犯错误的概率不超过0.05的前提下认为喜欢吃零食与性别有关.能力提升1假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其22列联表为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d对同一样本,以下数据能说明X与Y有关的可能性最大的一组为()A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=3,b=2,c=4,d=5解析对于同一样本,|ad-bc|越小,说明X与Y相关性越弱,而|ad-bc|越大,说明X与Y相关性越强.通过计算知,对
7、于选项A,B,C,都有|ad-bc|=|10-12|=2;对于选项D,有|ad-bc|=|15-8|=7,显然72.答案D2在一次独立性检验中得到如下列联表:AA总计B2008001 000B180a180+a总计380800+a1 180+a且最后发现,两个分类变量A和B没有关系,则a的可能值是()A.200B.720C.100D.180解析|ad-bc|越小,A和B有关的可能性越小,故选B.答案B3某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩性别不及格及格总计男61420女1
8、02232总计163652表2视力性别好差总计男41620女122032总计163652表3智商性别偏高正常总计男81220女82432总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量解析根据K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),代入题中数据计算得D选项K2的观测值k最大.故选D.答案D4某班主任为了调查学生的性别与认为作业量的大小是否有关,对50名学生进行了调查,数据如下:认为作业量大认为作业量不大总计男生18927女生81523总计262450则进行统计分析时的统计假设为.答案学生的
9、性别与认为作业量的大小无关5在吸烟与患肺病是否相关的判断中,有下列的说法:若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;由独立性检验可知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是(填序号).答案6有两个分类变量X,Y,其观测值如下22列联表所示:y1y2x1a20-ax215-a30+a其中a,15-a均为大于5的整数,则a
10、取何值时,在犯错误的概率不超过0.10的前提下认为X与Y之间有关系?分析先查表,在犯错误的概率不超过0.10的前提下得出k所满足的不等式,由K2的公式转化为解关于a的不等式,探索满足已知条件的整数a.解查表可知,要使X与Y之间在犯错误的概率不超过0.10的前提下认为有关系,则k2.706,由题意,得k=65a(30+a)-(20-a)(15-a)220451550=65(65a-300)220451550=13(13a-60)26090.由k2.706,解得a7.19或a2.04.又a5,且15-a5,aZ,则a=8,9.故当a等于8或9时,在犯错误的概率不超过0.10的前提下认为X与Y之间有
11、关系.7为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:P(K2k)0.0500.0100.001k 3.8416.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)K2=500(40270-30160)2200300704309.967.由于9.9676.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.