1、章末质量检测(三)成对数据的统计分析一、单项选择题(本大题共8小题,每小题5分,共40分在每小题给出的四个选项中,只有一项是符合题目要求的)1下列说法中正确的是()A相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的2若经验回归方程为23.5x,则变量x增加一个单位,变量y平均()A减少3.5个单位B增加2个单位C增加3.5个单位D减少2
2、个单位3通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050合计6050110由2算得27.8.附表:0.0500.0100.001x3.8416.63510.828参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动和性别有关”B有99%以上的把握认为“爱好该项运动和性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”4某考察团对全国十大城市的职工人均工资水平x(千元)与居民人均消费水平y(千元)进行统计调查,发现y与
3、x具有线性相关关系,经验回归方程为0.66x1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A86%B72%C67%D83%5某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:序号科研费用支出xi利润yixiyix1531155252114044012134301201645341702553257596220404总计301801000200则利润y对科研费用支出x的经验回归方程为()A2x20B2x20C20x2D20x26独立检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况
4、下,P(K26.635)0.010表示的意义是()A变量X与变量Y有关系的概率为1%B变量X与变量Y没有关系的概率为99.9%C变量X与变量Y没有关系的概率为99%D变量X与变量Y有关系的概率为99%7根据某班学生数学、外语成绩得到的22列联表如下:数优数差总计外优341751外差151934总计493685那么随机变量2约等于()A10.3B8C4.25D9.38春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:2,其中nabcd为样本容量0.100.050.025
5、x2.7063.8415.024参照附表,得到的正确结论是()A在犯错误的概率不超过0.01的前提下认为“该市居民能否做到光盘与性别有关”B在犯错误的概率不超过0.01的前提下认为“该市居民能否做到光盘与性别无关”C在犯错误的概率不超过0.1的前提下认为“该市居民能否做到光盘与性别有关”D在犯错误的概率不超过0.1的前提下认为“该市居民能否做到光盘与性别无关”二、多项选择题(本大题共4小题,每小题5分,共20分在每小题给出的四个选项中,有多项符合题目要求全部选对的得5分,部分选对的得3分,有选错的得0分)9独立性检验中,为了调查变量X与变量Y的关系,经过计算得到26.635x0.01表示的意义
6、是()A有99%的把握认为变量X与变量Y没有关系B有1%的把握认为变量X与变量Y有关系C有99%的把握认为变量X与变量Y有关系D有1%的把握认为变量X与变量Y没有关系10在统计中,由一组样本数据(x1,y1),(x2,y2),(xn,yn)利用最小二乘法得到两个变量的经验回归方程为x,那么下面说法正确的是()A经验回归直线x至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点B经验回归直线x必经过点(,)C经验回归直线x表示最接近y与x之间真实关系的一条直线D|r|1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小11已知由样本数据点集合(xi,yi)|i1,2
7、,n,求得的经验回归方程为1.5x0.5,且3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则()A变量x与y具有正相关关系B去除后的经验回归方程为1.2x1.4C去除后y的估计值增加速度变快D去除后相应于样本点(2,3.75)的残差为0.0512针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有()人附表:0.0500.010x3.8416.635
8、附:2A25B45C60D75三、填空题(本大题共4小题,每小题5分,共20分请把正确答案填在题中横线上)13下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45AB女婴E35C总计98D180那么A_,B_,C_,D_,E_14已知样本数为11,计算得i66,i132,经验回归方程为0.3x,则_15某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得经验回归方程x,其中2.现预测当气温为4时,用电量的度数约为_气温x()1813101用电量y(度)2434386416.某部门通过随机调查89名工作人员的休闲方式是读书还是健
9、身,得到的数据如下表读书健身总计女243155男82634总计325789在犯错误的概率不超过_的前提下认为性别与休闲方式有关系四、解答题(本大题共6小题,共70分解答时应写出必要的文字说明、证明过程或演算步骤)17(本小题满分10分)在改革开放40年成就展上有某地区某农产品近几年的产量统计如表:年份201420152016201720182019年份代码x123456年产量(万吨)6.66.777.17.27.4(1)根据表中数据,建立y关于x的经验回归方程x;(2)根据经验回归方程预测2020年该地区该农产品的年产量附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其经验回归
10、直线x的斜率和截距的最小二乘估计分别为,(参考数据:(xi)(yi)2.8,计算结果保留到小数点后两位)18(本小题满分12分)在海南省第二十四届科技创新大赛活动中,某同学为研究“网络游戏对当代青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏(1)根据以上数据建立一个22的列联表;(2)根据以上数据,在犯错误的概率不超过0.025的前提下,能否认为“喜欢玩电脑游戏与性别有关系”?19(本小题满分12分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩
11、剧的人数占女生人数的,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?20(本小题满分12分)某省级示范高中高三年级对各科考试的评价指标中,有“难度系数”和“区分度”两个指标中,难度系数,区分度.(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩分别为97,102,113.通过样本估计本次考试的区分度(精确到0.01).(2)如下表表格是该校高三年级6次数学考试的统计数据:难度系数x0.640.710.740.760.770.82区分度y0.180.230.240.240.2
12、20.15计算相关系数r,|r|0.75时,认为相关性弱;|r|0.75时,认为相关性强通过计算说明,能否利用经验回归模型描述y与x的关系(精确到0.01).ti|xi0.74|(i1,2,6),求出y关于t的经验回归方程,并预测x0.75时y的值(精确到0.01).附注:参考数据:iyi0.9309,0.0112,iyi0.0483,(ti)20.0073参考公式:相关系数r,经验回归直线x的斜率和截距的最小二乘估计分别为,.21(本小题满分12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了
13、100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图25周岁以上(含25周岁)组25周岁以下组(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不小于80件者为“生产能手”,请你根据已知条件画出22列联表,并判断是否在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”?0.1000.
14、0500.0100.001x2.7063.8416.63510.828(注:2)22(本小题满分12分)某地区在一次考试后,从全体考生中随机抽取44名,获取他们本次考试的数学成绩(x)和物理成绩(y),绘制成如图散点图:根据散点图可以看出y与x之间有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于感冒导致物理考试发挥失常,B考生因故未能参加物理考试为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:i4641,i3108,iyi350350,(xi)213814.5,(yi)25250,其中xi,yi分别表示这42名同学的数学成绩、物理成绩,i1,2
15、,42,y与x的相关系数r0.82.(1)若不剔除A,B两名考生的数据,用44组数据作回归分析,设此时y与x的相关系数为r0.试判断r0与r的大小关系,并说明理由;(2)求y关于x的经验回归方程(系数精确到0.01),并估计如果B考生加了这次物理考试(已知B考生的数学成绩为125分),物理成绩是多少?(精确到个位);(3)从概率统计规律看,本次考试该地区的物理成绩服从正态分布N(,2).以剔除后的物理成绩作为样本,用样本平均数作为的估计值,用样本方差s2作为2的估计值试求该地区5000名考生中,物理成绩位于区间(62.8,85.2)的人数Z的数学期望附:经验回归方程x中:,.若N(,2),则P
16、()0.6826,P(26.635x0.01,犯错误的概率不超过0.01.故选A.答案:A4解析:将7.675,代入经验回归方程可计算,得x9.26,所以该城市大约消费额占人均工资收入的百分比为7.6759.260.83,故选D.答案:D5解析:设经验回归方程为x.由表中数据得,2,302520,经验回归方程为2x20.故选A.答案:A6解析:由题意知变量X与Y没有关系的概率为0.01,即认为变量X与Y有关系的概率为99%.故选D.答案:D7解析:由公式得24.25.故选C.答案:C8解析:由22列联表得到a45,b10,c30,d15,则ab55,cd45,ac75,bd25,ad675,b
17、c300,n100,代入公式得23.0303.841.2.7063.0303.841,由23.841,解得x40.335,由题意知x0,且x是5的整数倍,所以45,60和75都满足题意故选BCD.答案:BCD13解析:45E98,E53,E35C,C88,98D180,D82,A35D,A47,45AB,B92.答案:479288825314解析:i66,i132,6,12,代入0.3x,可得:10.2.答案:10.215解析:由题意可知(1813101)10,(24343864)40,2.又经验回归直线2x过点(10,40),故60.所以当x4时,2(4)6068.答案:6816解析:由列联
18、表中的数据,得23.6892.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系答案:0.1017解析:(1)由题意可知:3.5,7,(xi)217.5,所以0.16,又6.44,故y关于x的经验回归方程为0.16x6.44.(2)由(1)可得,当年份为2020年时,年份代码x7,此时0.1676.447.56.所以可预测2020年该地区该农产品的年产量约为7.56万吨18解析:(1)22列联表性别游戏态度男生女生合计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523合计262450(2)25.06,又x0.0255.0243.841,由2x3.841,解得x10.24
19、,为整数,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人20解析:(1)实验班三人成绩的平均值为142,普通班三人成绩的平均值为104,故估计本次考试的区分度为0.25.(2)由题中的表格可知(0.640.710.740.760.770.82)0.74,(0.180.230.240.240.220.15)0.21,故r0.13.因为|r|0.75,所以相关性弱,故不能利用经验回归模型描述y与x的关系;y与t的值如下表t0.100.0300.020.030.08区别度y0.180.230.240.240.220.15因为0.86,所以0.210.860.25
20、,所以所求经验回归方程0.86t0.25,当x0.75时,此时t0.01,则y0.24.21解析:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能
21、结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手600.2515(人),“25周岁以下组”中的生产能手400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得21.79.因为1.792.706.所以在犯错误的概率不超过0.1的前提下不能认为“生产能手与工人所在的年龄组有关”22解析:(1)r0r.理由如下:由图可知,y与x
22、成正相关关系,异常点A,B会降低变量之间的线性相关程度44个数据点与其经验回归直线的总偏差更大,回归效果更差,所以相关系数更小42个数据点与其经验回归直线的总偏差更小,回归效果更好,所以相关系数更大42个数据点更贴近其经验回归直线44个数据点与其经验回归直线更离散(2)由题中数据可得:i110.5,i74,所以(xi)(yi)iyi42350 35042110.5746 916.又因为(xi)2138 14.5,所以0.501,740.501110.518.64,所以0.50x18.64.将x125代入,得y0.5012518.6462.518.6481,所以估计B同学的物理成绩均为81分(3)i74,s2(yi)25 250125,所以N(74,125),又因为11.2,所以P(62.885.2)P(7411.27411.2)0.682 6,因为ZB(5 000,0.682 6),所以E(Z)5 0000.682 63 413,即该地区本次考试物理成绩位于区间(62.8,85.2)的人数Z的数学期望为3 413.