1、本章达标检测(满分:150 分;时间:120 分钟)一、单项选择题(本大题共 8 小题,每小题 5 分,共 40 分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中正确的是()A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义 B.独立性检验对分类变量关系的研究没有 100%的把握,所以独立性检验研究的结果在实际中没有多大的实际意义 C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的 D.独立性检验如果得出的结论有 99%的可信度,就意味着这个结论一定是正确的 2.若经验回归方程为 =2-3.5x,则变量 x 增加一个单位,变量 y
2、平均()A.减少 3.5 个单位 B.增加 2 个单位 C.增加 3.5 个单位 D.减少 2 个单位 3.根据如下样本观测数据可得到的经验回归方程为 =bx+a,则()x 3 4 5 6 7 8 y 4.0 2.5-0.5 0.5-2.0-3.0 A.a0,b0,b0 C.a0,b0 D.a0 4.下图是变量 x,y 的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程:=b1x+a1,样本相关系数为 r1;方案二:剔除点(10,32),根据剩下数据,得到经验回归方程:=b2x+a2,样本相关系数为 r2,则()A.0r1r21 B.0r2r11 C.-1r1
3、r20 D.-1r2r10 5.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:单位:人 男 女 合计 爱好 40 20 60 不爱好 20 30 50 合计 60 50 110 由 2=-算得 2=-7.8.附表:0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.635 7.879 10.828 参照附表,得到的正确结论是()A.有 99%以上的把握认为“爱好该项运动和性别有关”B.有 99%以上的把握认为“爱好该项运动和性别无关”C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过
4、0.1%的前提下,认为“爱好该项运动与性别无关”6.观察下列各图,其中两个分类变量 x,y 之间关系最强的是()7.某调查者在调查中获知某公司近年来科研费用支出 x(万元)与公司所获得利润 y(万元)的统计资料如下表:序号 科研费用支出 xi 利润 yi xiyi 1 5 31 155 25 2 11 40 440 121 3 4 30 120 16 4 5 34 170 25 5 3 25 75 9 6 2 20 40 4 合计 30 180 1 000 200 则利润 y 关于科研费用支出 x 的经验回归方程为()参考公式:=-,=-.A.=2x+20 B.=2x-20 C.=20 x+2
5、 D.=20 x-2 8.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问 100 名性别不同的居民能否做到“光盘”,得到如下的列联表:单位:人 不能做到“光盘”能做到“光盘”合计 男 45 10 55 女 30 15 45 合计 75 25 100 附:0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.635 7.879 10.828 2=-,其中 n=a+b+c+d.参照附表,得到的正确结论是()A.在犯错误的概率不超过 0.01 的前提下认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不超过 0.01 的前提下认为“该市居民能否做到
6、光盘与性别无关”C.在犯错误的概率不超过 0.1 的前提下认为“该市居民能否做到光盘与性别有关”D.在犯错误的概率不超过 0.1 的前提下认为“该市居民能否做到光盘与性别无关”二、多项选择题(本大题共 4 小题,每小题 5 分,共 20 分.在每小题给出的选项中,有多个选项符合题目要求,全部选对的得 5 分,部分选对的得 3 分,有选错的得 0 分)9.下列说法正确的是()A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系 B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好 C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效
7、果越好 D.在经验回归方程 =0.1x+10 中,当解释变量 x 每增加 1 个单位时,响应变量 增加 0.1 个单位 10.独立性检验中,为了调查变量 X 与变量 Y 的关系,经过计算得到 2.=0.01,其表示的意义是()A.有 99%的把握认为变量 X 与变量 Y 没有关系 B.有 1%的把握认为变量 X 与变量 Y 有关系 C.有 99%的把握认为变量 X 与变量 Y 有关系 D.有 1%的把握认为变量 X 与变量 Y 没有关系 11.已知由样本数据(xi,yi,=,求得的经验回归方程为 =1.5x+0.5,且=3,现发现两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后
8、重新求得的经验回归直线 l 的斜率为 1.2,则()A.变量 x 与 y 具有正相关关系 B.去除后的经验回归方程为 =1.2x+1.4 C.去除后 y 的估计值增加速度变快 D.去除后样本点(2,3.75)的残差为 0.05 12.某校团委对“学生性别和喜欢运动是否有关”进行了一次调查,其中被调查的男、女生人数相同,男生喜欢运动的人数占男生人数的 ,女生喜欢运动的人数占女生人数的 ,若有 95%的把握认为“是否喜欢运动和性别有关”,则被调查人中男生可能有()附:0.05 0.01 x 3.841 6.635 2=-,其中 n=a+b+c+d.A.25 人 B.45 人 C.60 人 D.75
9、 人 三、填空题(本大题共 4 小题,每小题 5 分,共 20 分.将答案填在题中横线上)13.下列是关于男婴与女婴出生调查的列联表:单位:人 晚上出生 白天出生 合计 男婴 45 A B 女婴 E 35 C 合计 98 D 180 那么 A=,B=,C=,D=,E=.14.已知样本容量为 11,计算得 xi=66,yi=132,经验回归方程为 =0.3x+a,则 a=.15.某单位为了了解用电量 y(度)与气温 之间的关系,随机统计了某 4 天的用电量与当天气温,并制作了如下对照表,由表中数据得经验回归方程 =x+,其中 =-2.现预测当气温为-时,用电量的度数为 .气温 18 13 10-
10、1 用电量 y(度)24 34 38 64 16.某部门通过随机调查 89 名工作人员的休闲方式是读书还是健身,得到的数据如下表:单位:人 读书 健身 合计 女 24 31 55 男 8 26 34 合计 32 57 89 在犯错误的概率不超过 的前提下认为性别与休闲方式有关系.附表:0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.635 7.879 10.828 四、解答题(本大题共 6 小题,共 70 分.解答应写出文字说明,证明过程或演算步骤)17.(本小题满分 10 分)2017 年 10 月 18 日至 10 月 24 日,中国共产党第十九次全国人
11、民代表大会在北京顺利召开.大会期间,北京某高中举办了一次“喜迎十九大”的读书读报知识竞赛,参赛选手为从高一年级和高二年级各随机抽取的 100 名学生.图 1 和图 2 分别是高一年级和高二年级参赛选手成绩(单位:分)的频率分布直方图.(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(同一组的数据用该组区间的中点值代表)(2)完成下面的 列联表,并依据=.的独立性检验,分析高一、高二两个年级学生这次读书读报知识竞赛的成绩是否有差异.单位:人 成绩低于 60 分 成绩不低于 60 分 合计 高一年级 高二年级 合计 附:2=-,其中 n=a+b+c+d.0.1 0.05 0.01 0.00
12、5 0.001 x 2.706 3.841 6.635 7.879 10.828 18.(本小题满分 12 分)某连锁经营公司的 5 个零售店某月的销售额和利润如下表:商店名称 A B C D E 销售额 x/千万元 3 5 6 7 9 利润 y/百万元 2 3 3 4 5(1)画出散点图,观察散点图,说明两个变量是否线性相关;(2)用最小二乘法计算利润 y 关于销售额 x 的经验回归方程;(3)当销售额为 4 千万元时,估计利润为多少.参考公式:=-,=-.19.(本小题满分 12 分)2020 年 3 月,由于疫情的影响,各地学生在家进行网上在线学习,为了研究学生在网上学习的情况,某学校在
13、网上随机抽取 120 名学生对线上教育进行调查,其中男生与女生的人数之比为 ,男生中有 30 人对线上教育满意,女生中有 15 人表示对线上教育不满意.(1)完成下面的 列联表,依据=.的独立性检验,分析对线上教育是否满意与性别是否有关;单位:人 满意 不满意 合计 男生 女生 合计 120(2)从被调查的对线上教育满意的学生中,利用分层随机抽样抽取 8 名学生,再在这 8 名学生中抽取 3 名学生作线上学习的经验介绍,其中抽取男生的人数为 X,求 X 的分布列及期望.附:2=-,其中 n=a+b+c+d.0.1 0.05 0.01 0.005 0.001 x 2.706 3.841 6.63
14、5 7.879 10.828 20.(本小题满分 12 分)某省级示范高中高三年级对各科考试的评价指标中有“难度系数”和“区分度”两个指标,难度系数=年级总平均分满分,区分度=实验班的平均分-普通班的平均分满分.(1)某次数学考试(满分为 150 分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为 147 分,142分,137 分;普通班三人的成绩分别为 97 分,102 分,113 分.通过样本估计本次考试的区分度(精确到 0.01);(2)该校高三年级 6 次数学考试的统计数据如下表:难度系数 x 0.64 0.71 0.74 0.76 0.77 0.82 区分度 y 0.18
15、0.23 0.24 0.24 0.22 0.15 计算样本相关系数 r,|r|0,b0.4.A 观察散点图可知,变量 x 和 y 呈现正相关,所以 0r11,0r21,剔除点(10,32)之后,可看出经验回归方程 =b2x+a2拟合数据效果更好,所以 r2更接近 1.所以 0r1r26.635=x0.01,所以有 99%以上的把握认为“爱好该项运动和性别有关”,故选 A.6.D 结合选项可知,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.7.A 设经验回归方程为 =x+.由题表中数据得,=-=2,=30-=,经验回归方程为 =2x+20.8.C 2=-=-7 .,0.1 2x
16、0.05,在犯错误的概率不超过 0.1 的前提下认为“该市居民能否做到光盘与性别有关”.二、多项选择题 9.ABD 对于 A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以正确;对于 B,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,所以正确;对于 C,样本相关系数的绝对值越大,只能说明两个变量具有较强的相关性,不能作为分析模型的拟合效果好坏的依据,应该是 R2越大,模型的拟合效果越好,所以错误;对于 D,在经验回归方程 =0.1x+10 中,当解释变量 x 每增加 1 个单位时,响应变量 增加 0.1 个单位,所以正确.故选 ABD.10.CD 独立性检验中
17、,2.=0.01,它表示的意义是有 1%的把握认为变量 X 与变量 Y 没有关系,D 正确;有 99%的把握认为变量 X 与变量 Y 有关系,C 正确.故选 CD.11.AB =3,经验回归方程为 =.+.,=,重新求得的经验回归直线 l 的斜率为 .,变量 x与 y 具有正相关关系,设新的数据的所有横坐标的平均值为 ,纵坐标的平均值为 ,则(n-2)=n-(1.2+4.8)=3n-6=3(n-2),(n-2)=n-(2.2+7.8)=5n-10=5(n-2),故 =3,=5,=-=5-.=.故新的经验回归方程为 =1.2x+1.4,故 A,B 正确;因为斜率为 1.2 不变,所以去除后 y
18、的估计值增长速度不变,C 错误;把 x=2 代入新的经验回归方程中,得 =3.8,3.75-3.8=-0.05,故 D 错误.故选 AB.12.BC 设被调查人中男生有 x 人,依题意可得列联表如下:单位:人 喜欢运动 不喜欢运动 合计 男生 x x x 女生 x x x 合计 7 x x 2x 若有 95%的把握认为“是否喜欢运动和性别有关”,则 .8 2=6.635,解得 .0,且 x 是 5 的整数倍,所以结合选项知 45 和 60 满足题意.故选 BC.三、填空题 13.答案 47;92;88;82;53 解析 +E=98,E=.E+=C,C=88.98+D=8,D=8.A+=D,A=
19、7.+A=B,B=9.14.答案 10.2 解析 xi=66,yi=132,=6,=,a=-.=.15.答案 68 解析 由题表中数据可得=8+-1)=10,=+8+=,所以经验回归直线 =-2x+过点(10,40),故 =60.所以当 x=-4 时,=-4)+60=68.16.答案 0.1 解析 由题中列联表中的数据,得 2=89 -8 7.89,因为 22.706=x0.1,所以在犯错误的概率不超过 0.1 的前提下认为性别与休闲方式有关系.四、解答题 17.解析(1)高一年级参赛学生的平均成绩为 .+.+.+7 .=分),高二年级参赛学生的平均成绩为 .+.+.+7 .=分).(4 分)
20、(2)补全 列联表如下:单位:人 成绩低于 60 分 成绩不低于 60 分 合计 高一年级 80 20 100 高二年级 40 60 100 合计 120 80 200 零假设为 H0:两个年级的成绩相互独立,即高一、高二两个年级学生这次读书读报知识竞赛的成绩没有差异.计算可得 2=8 -8 .=0.01,根据=.的独立性检验,推断 H0 不成立,即认为高一、高二两个年级学生这次读书读报知识竞赛的成绩有差异.(10 分)18.解析(1)散点图如图所示.由散点图可以看出变量 x,y 线性相关.(4 分)(2)设经验回归方程为 =x+.易得=3.4,=6,xiyi=112,=200,所以 =-.-
21、=0.5,=-=3.4-.=.,即利润 y 关于销售额 x 的经验回归方程为 =0.5x+0.4.(9 分)(3)当销售额为 4 千万元时,利润约为 .+.=.百万元).(12 分)19.解析(1)男生人数为 =55,所以女生人数为 120-55=65,于是可完成 列联表如下:单位:人 满意 不满意 合计 男生 30 25 55 女生 50 15 65 合计 80 40 120(3 分)零假设为 H0:对线上教育是否满意与性别无关.计算可得 2=-8 .7 .=0.01,依据=.的独立性检验,推断 H0不成立,即认为对线上教育是否满意与性别有关.(6 分)(2)由(1)可知男生抽取 3 人,女
22、生抽取 5 人,依题可知 X 的可能取值为 0,1,2,3,并且 X 服从超几何分布,P(X=k)=C C -C8(k=0,1,2,3),即 P(X=0)=C C8=8,P(X=1)=C C C8=8,P(X=2)=C C C8=,P(X=3)=C C8=.(9 分)所以 X 的分布列为 X 0 1 2 3 P 8 8 可得 E X=8+8+=98.(12 分)20.解析(1)实验班三人成绩的平均值为 142,普通班三人成绩的平均值为 104,故估计本次考试的区分度为 -.分)由题中的表格可知=.+.7+.7+.7+.77+.8 =.7,=.8+.+.+.+.+.=.,故 r=-0.13.因为
23、|r|0.75,所以相关性弱,故不能利用线性回归模型描述 y 与 x 的关系.(6 分)y 与 t 的对应数据如下表:t 0.10 0.03 0 0.02 0.03 0.08 区分度 y 0.18 0.23 0.24 0.24 0.22 0.15 则 =-.8-.7-0.86,所以 =-.+.8 .,所以所求经验回归方程为 =-0.86t+0.25,(10 分)当 x=0.75 时,t=0.01,则 y.分)21.解析(1)由已知得,样本中有 25 周岁以上组工人 60 名,25 周岁以下组工人 40 名.所以样本中日平均生产件数不足 60 的工人中,25 周岁以上组工人有 .=人),记为 A
24、1,A2,A3;25 周岁以下组工人有 .=人),记为 B1,B2.从中随机抽取 2 名工人,所有的可能结果共有 10 种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有 1 名 25 周岁以下组工人的可能结果共有 7 种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求概率 P=7 .(5 分)(2)由题中频率分布直方图可知,在抽取的 100 名工人中,25 周岁以上组中的生产能手有 .
25、=人),25周岁以下组中的生产能手有 .7=人),据此可得 列联表如下:单位:人 生产能手 非生产能手 合计 25 周岁以上组 15 45 60 25 周岁以下组 15 25 40 合计 30 70 100 (8 分)零假设为 H0:生产能手与工人所在的年龄组无关.计算可得 2=-7 .79.7 =0.1.(10 分)依据=.的独立性检验,没有充分证据推断 H0不成立,因此认为 H0成立,即认为生产能手与工人所在的年龄组无关.(12 分)22.解析(1)r0r.理由如下:由题图可知,y 与 x 呈现正相关,异常点 A,B 会降低变量之间的线性相关程度.个数据点与其经验回归直线的总偏差更大,回归
26、效果更差,所以样本相关系数更小.个数据点与其经验回归直线的总偏差更小,回归效果更好,所以样本相关系数更大.个数据点更贴近其经验回归直线.个数据点与其经验回归直线更离散.(4 分)(2)设 y 关于 x 的经验回归方程为 =x+.由题中数据可得:=xi=110.5,=yi=74,所以 (xi-)(yi-)=xiyi-42 =350 350-.7=9 .又因为 (xi-)2=13 814.5,所以 =-.,=-7-.8.7,所以 =0.50 x+18.75.将 x=125 代入,得 y=.+8.7=.+8.7 8,所以估计 B 考生的物理成绩为 81 分.(8 分)(3)=yi=74,s2=(yi-)2=,所以 XN(74,125),又因为 .,所以 P .8X8.=P 7-.X7+.8 7,所以 ZB(5 000,0.682 7),所以 E Z=.8 7 ,即该地区本次考试物理成绩位于区间62.8,85.2的人数 Z 的数学期望约为 3 414.(12 分)