1、章末综合检测(三) (时间:120分钟,满分:150分)一、选择题:本题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的1在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是()A吸烟,不吸烟 B患病,不患病C是否吸烟,是否患病 D以上都不对解析:选C.“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病可知A,B都是一个分类变量所取的两个不同值故选C.2某商品销售量y(单位:件)与销售价值x(单位:元/件)负相关,则其回归方程可能是()A.10x200 B.10x200C.10x200 D.10x200解
2、析:选A.由x与y负相关,可排除B,D两项,而C项中的10x2000不符合题意,故选A.3两个相关变量满足如下关系:x23456y25505664根据表格已得回归方程为9.5x8.8,表中有一数据模糊不清,推算该数据是()A37 B38.5C39 D40.5解析:选C.因为4,所以9.548.846.8.设模糊不清的数据为a,则25a5056645234,解得a39.故选C.4在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大()A.与 B.与C.与 D.与解析:选C.由等高条形图的解可知与的值相差越大,|adbc|就越大,相关性就越强5在一次独立性检验中,得出列联表如下:
3、A总计B2008001 000B180a180a总计380800a1 180a且最后发现,没有充分证据显示两个变量A和B有关系,则a的可能值是()A200 B720C100 D180解析:选B.由表得K2的观测值k,当a200时,k103.372.706,此时两个变量A和B有关联;当a720时,k0,由k2.706知此时没有充分证据显示两个变量A和B有关联,则a的可能值是720.6下列关于K2的说法正确的是()AK2在任何相互独立问题中都可以用来检验有关还是无关BK2的值越大,两个事件的相关性就越大CK2是用来判断两个分类变量是否有关系的,只对于两个分类变量适合DK2的观测值k的计算公式为k解
4、析:选C.K2是用来判断两个分类变量是否有关的,故A错;K2的值越大,只能说明有更大地把握认为二者有关系,却不能判断相关性的大小,B错;D中(adbc)应为(adbc)2.7.以下关于线性回归的判断,正确的个数是()若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C三点;已知回归直线方程为0.50x0.81,则x25时,y的估计值为11.69;回归直线方程的意义是它反映了样本整体的变化趋势A0 B1C2 D3解析:选D.能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知只有按最小二乘法求得回归系数,得到
5、的直线x才是回归直线,所以不对;正确;将x25代入0.50x0.81,得11.69,所以正确;正确故选D.8假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其22列联表如下:y1y2总计x1ababx2cdcd总计acbdabcd对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()Aa5,b4,c3,d2Ba5,b3,c4,d2Ca2,b3,c4,d5Da2,b3,c5,d4解析:选D.对于A,|adbc|1012|2;对于B,|adbc|1012|2;对于C,|adbc|1012|2;对于D,|adbc|815|7.9在第29届北京奥运会上,中国健儿取得了51金
6、、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力()A平均数与方差B回归直线方程C独立性检验D概率解析:选C.根据所学内容以及此题所提供的数据可知,要想回答性别对判断“中国进入了世界体育强国之列”是否有关系时,用独立性检验最有说服力10某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统
7、计数据如表1至表4,则与性别有关联的可能性最大的变量是() 表1成绩性别不及格及格总计男61420女102232总计163652 表2视力性别好差总计男41620女122032总计163652 表3智商性别偏高正常总计男81220女82432总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A成绩 B视力C智商 D阅读量解析:选D.结合各列联表中数据,得K2的观测值分别为k1,k2,k3,k4.因为k1,k2,k3,k4,则k4k2k3k1,所以阅读量与性别有关联的可能性最大11某学校开展研究性学习活动,某同学获得一组实验数据如下:(1.99,1.5),(3,
8、4.04),(4,7.5),(5.1,12),(6.12,18.01)对于这组数据,现在给出以下拟合曲线,其中拟合程度最好的是()Ay2x2 By()xCylog2x Dy(x21)解析:选D.本题若求R2或残差来分析拟合效果,运算将很烦琐,计算量太大,可以将各组数据代入检验,发现D最接近故选D.12已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程x,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A.b,a B.b,aC.b,a D.b,a解析:选C.法一:b2,a2,由公式求得,所以b,a.法二
9、:过(1,0)和(2,2)的直线方程为y2x2,画出六点的散点图,回归直线的大概位置如图所示,显然b,a.二、填空题:本题共4小题,每小题5分13下表是关于新生婴儿的性别与出生时间段调查的列联表,那么,A_,B_,C_,D_晚上白天总计男45A92女B35C总计98D180解析:由题意可知,A924547,D1809882,B984553,C1809288.答案:4753888214调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程为0.254x0.321.由线性回归方程可知,家庭年收入
10、每增加1万元,年饮食支出平均增加_万元解析:由题意知0.254(x1)0.321(0.254x0.321)0.254.答案:0.25415某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为0.66x1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为_解析:当7.675时,x9.262,所以0.82983%.答案:83%16某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感
11、冒的作用”利用22列联表计算得k3.918,经查阅临界值表知P(K23.841)0.05.对此,四名同学做出了以下判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒r:这种血清预防感冒的有效率为95%.s:这种血清预防感冒的有效率为5%.则下列复合命题中正确的是_(填序号)p(綈q); (綈p)q;(綈p綈q)(rs); (p綈r)(綈qs)解析:查阅临界值表,知P(K23.841)0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的
12、人中一个患感冒的人也没有”的可能,故p真,其余命题都为假结合复合命题的真值可知,选.答案:三、解答题:解答应写出文字说明、证明过程或演算步骤17(本小题满分10分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示杂质高杂质低旧设备37121新设备22202根据表中数据试判断含杂质的高低与设备改造有无关系解:由已知数据得到如下22列联表:杂质高杂质低合计旧设备37121158新设备22202224合计59323382K2的观测值k13.11,由于13.1110.828,故有99.9%的把握认为含杂质的高低与设备改造是有关的18(本小题满分
13、12分)2017年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过微信关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:班主任工作年限x(单位:年)4681012被关注数量y(单位:百人)1020406050(1)若“好老师”的被关注数量y与其班主任的工作年限x满足线性回归方程,试求回归方程x,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量;(2)若用(i1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率解:(1)x8,y36
14、,6,364812,所以6x12,当x15时,6151278百人(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.从5组“即时均值”任选2组,共有C10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为.19(本小题满分12分)某市规定中学生百米成绩达标标准为不超过16秒现从该市中学生中按照男、女生比例随机抽取了50人,其中有30人达标将此样本的频率估计为总体的概率(1)随机调查45名学生,设为达标人数,求的数学期望与方差;(2)如果男、女生采用相同的达标标准,男、女生达标情况如表:男女总计达标24不达标12总计
15、50根据表中所给的数据,完成22列联表,并判断在犯错误的概率不超过0.01的前提下能否认为“体育达标与性别有关”?若有,你能否给出一个更合理的达标方案?解:由题意可知,随机抽取1人,则此人百米成绩达标的概率为.(1)由题设可知,B,故E()4527,D()4510.8.(2)男女总计达标24630不达标81220总计321850K2的观测值k8.3336.635,所以在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”男、女生要使用不同的达标标准20(本小题满分12分)中石化集团通过与安哥拉国家石油公司合作,获得了安哥拉深海油田区块的开采权,集团在某些区块随机初步勘探了部分旧井,取得
16、了地质资料进入全面勘探时期后,集团按网络点来布置井位进行全面勘探由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用勘探初期部分旧井的数据资料见下表:井号123456坐标(x,y)(km)(2,30)(4,40)(5,60)(6,50)(8,70)(1,y)钻探深度(km)2456810出油量(L)407011090160205(1)16号旧井位置线性分布,借助前5组数据求得回归方程为x,其中6.5,求,并估计6号旧井中y的预报值;(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的,的值与(1)中,的值的差均不超
17、过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井(注:其中的计算结果用四6.8即6.8,19.05,由(1)知6.5,17.5.因为5%,9%,均不超过10%,因此使用位置最接近的已有旧井6(1,24)21(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区
18、间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估计该校学生每周平均体育运动时间超过4小时的概率; (3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”解:(1)30090,所以应收集90位女生的样本数据(2)由频率分布直方图得12(0.0250.100)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由第二问知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人
19、的每周平均体育运动时间不超过4小时又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2的观测值k4.7623.841.所以,在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”22(本小题满分12分)在关于人的脂肪含量(百分比)和年龄(岁)的关系的研究中,研究人员获得了一组数据如下表:年龄x23273941454950脂肪含量y9.517.8
20、21.225.927.526.328.2年龄x53545657586061脂肪含量y29.630.231.430.833.535.234.6(1)画出脂肪含量和年龄的散点图,根据该图猜想它们之间的关系应是什么;(2)建立年龄为解释变量,脂肪含量为预报变量的回归模型,并分析该模型能否较好地刻画两者的关系;(3)求相关指数R2,并说明其含义解:(1)画出散点图如图所示由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系(2)计算得线性回归方程为0.576x0.448.残差iyii,数据如下13.3,22.696,30.816,42.732,52.028,61.476,70.152,80.48,90.456,100.408,111.584,120.54,131.088,140.088.以年龄为x轴,残差为y轴画残差图(图略),可知残差点比较均匀地落在水平的带状区域中,说明用上述回归模型拟合数据效果很好