1、温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。十九独立性检验的基本思想及其初步应用基础全面练(15分钟30分)1与表格相比,能更直观地反映出相关数据总体状况的是()A列联表 B散点图C残差图 D等高条形图【解析】选D.对于A,列联表需要计算K2的值,不是直观地分析;对于B,散点图体现的是变量间相关性的强弱;对于C,残差图体现预报变量与实际值之间的差距,对于D,等高条形图能直观地反映两个分类变量是否有关系2某班主任对全班50名学生进行了作业量的调查,数据如表:认为作业量大认为作业量不大总计男生18927女生81523总
2、计262450则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过()A0.01 B0.005 C0.025 D0.001【解析】选C.k5.0595.024.因为P(K25.024)0.025,所以犯错误的概率不超过0.025.3假设有两个分类变量X与Y,它们的可能取值分别为x1,x2和y1,y2,其22列联表为:y1y2x11018x2m26则当m取下面何值时,X与Y的关系最弱()A8 B9 C14 D19【解析】选C.由102618m,解得m14.4,所以当m14时,X与Y的关系最弱4某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清
3、的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列结论中,正确结论的序号是_在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.【解析】K23.9183.841,而P(K23.841)0.05,所以在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不
4、是同一个问题,不要混淆答案:5为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?附:P(K2k0)0.0500.0100.001k03.8416.63510.828K2【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为14%.(2)由列联表中数据,得K2的观测值为k9.967.由于9.9676
5、.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关综合突破练(25分钟50分)一、选择题(每小题5分,共20分)1某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)月收入2 000元以下月收入2 000元及以上总计高中文化以上104555高中文化及以下203050总计3075105由上表中数据计算得K2的观测值k6.109,请估计认为“文化程度与月收入有关系”,其犯错误的概率为()A1% B99% C2.5% D97.5%【解析】选C.由于6.1095.024,故在犯错误的概率不超过0.025
6、的前提下,认为“文化程度与月收入有关系”2下列说法正确的有()分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有其他的含义;22列联表是两个分类变量的频数汇总统计表;22列联表和等高条形图都能反映出两个分类变量间是否相互影响A BC D【解析】选A.由分类变量的定义可知正确;由22列联表的定义可知正确;22列联表和等高条形图都能展示样本的频率特征,若在一个分类变量所取值的群体中,另一个分类变量所取值的频率相差较小,则说明这两个变量不相互影响,否则就相互影响故正确3下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示
7、喜欢理科的百分比,从图中可以看出()A性别与喜欢理科无关B女生中喜欢理科的比例为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比例为60%【解析】选C.由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确还可知男生比女生喜欢理科的可能性大些4为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是()【解析】选D.分析四个等高条形图得选项D中,不服用药物患病的概率最大,服用药物患病的概率最小,所以最能体现该药物对预防禽流感有显著效
8、果二、填空题(每小题5分,共10分)5某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为_【解析】列出22列联表:发病不发病总计阳性家族史1693109阴性家族史17240257总计33333366所以随机变量K2的观测值k6.0675.024,所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关答案:0.9756在研究性别(是否为女性)与是否爱吃零食这两个分类变量是否有关系时,下列说法中正确的是_若K2的观测值k6.635,则我们在犯错误的概率不超过
9、0.01的前提下认为爱吃零食与性别有关系,那么在100个爱吃零食的人中必有99人是女性;由独立性检验可知在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系时,如果某人爱吃零食,那么此人是女性的可能性为99%;由独立性检验可知在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误【解析】K2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填.答案:三、解答题(每小题
10、10分,共20分)7某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列22列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析【解析】(1)22列联表如下:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(2)因为K2的观测值k106.635,P(K26.635)0.01,所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习
11、惯与年龄有关8(2020全国卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根据列联表,判断是
12、否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次400空气质量好空气质量不好附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为0.43,等级为2的概率为0.27,等级为3的概率为0.21,等级为4的概率为0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为350.(3)22列联表如下:人次400人次400空气质量好3337空气质量不好228K2的观测值k5.8203.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量
13、有关创新迁移练1有两个分类变量X与Y,其22列联表如表所示:Y1Y2总计X1a20a20X215a30a45总计155065其中a,15a均为大于5的整数,在犯错误的概率不超过0.05的前提下,认为X与Y之间有关,则a等于()A8 B9 C8或9 D7【解析】选C.在犯错误的概率不超过0.05的前提下,认为X与Y之间有关,需要K2的观测值k大于或等于3.841,由k3.841,解得a7.69或a1.54.而a5且15a5,aZ,所以a8或a9.2某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内
14、径尺寸,得结果如表: (1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写下面的22列联表,并问能否在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?甲厂乙厂总计优质品非优质品总计【解析】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为100%72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为100%64%.(2)22列联表如下:甲厂乙厂总计优质品360320680非优质品140180320总计5005001 000由于K2的观测值k7.3536.635,所以在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”关闭Word文档返回原板块