1、A基础达标1对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是()A由样本数据得到的回归方程x必过样本点的中心(,)B残差平方和越小的模型,拟合的效果越好C用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D若变量y和x之间的相关系数r0.936 2,则变量y与x之间具有线性相关关系解析:选C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.2下列说法中正确的有:()若r0,则x增大时,y也相应增大;若r0,则x增大时,y也相应增大;若r1或r1,则x与y的关系完全对应(有函数关系),在散
2、点图上各个散点均在一条直线上ABC D解析:选C.若r0,表示两个相关变量正相关,x增大时,y也相应增大,故正确;r0,表示两个变量负相关,x增大时,y相应减小,故错误;|r|越接近1,表示两个变量相关性越高,|r|1表示两个变量有确定的关系(即函数关系),故正确3若两个变量的残差平方和是325,923,则随机误差对预报变量的贡献率约为()A64.8% B60%C35.2% D40%解析:选C.由题意可知随机误差对预报变量的贡献率约为0.352.4关于残差和残差图,下列说法正确的是()A残差就是随机误差B残差图的纵坐标是残差C残差点均匀分布的带状区域的宽度越窄,说明模型拟合精度越高D残差点均匀
3、分布的带状区域的宽度越窄,说明模型拟合精度越低解析:选C.根据残差分析的概念可知,C选项正确残差是真实值减去估计值5某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,发现y与x具有相关关系,回归方程为0.66x1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为()A72% B83%C67% D66%解析:选B.因为当7.675时,x9.262,所以0.82983%.6根据如下所示的列联表得到如下四个判断:在犯错误的概率不超过0.001的前提下认为患肝病与嗜酒有关;在犯错误的概率不超过0.01的前提下
4、认为患肝病与嗜酒有关;认为患肝病与嗜酒有关的出错的可能为0.001%,没有证据显示患肝病与嗜酒有关分类嗜酒不嗜酒总计患肝病7 775427 817未患肝病2 099492 148总计9 874919 965其中正确命题的个数为()A1 B2C3 D4解析:选B.由列联表可求K2的观测值k56.632,由56.63210.8286.635.且P(K210.828)0.001,P(K26.635)0.010.所以,均正确7某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如表),由最小二乘法求得回归方程0.67x54.9.零件数x/个1020304050加工
5、时间y/min62758189现发现表中有一个数据看不清,请你推断出该数据的值为_解析:由表格知30,得0.673054.975.设表中的“模糊数字”为a.则a62758189755,所以a68.答案:688(2019济南高二检测)“双十一”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双十一”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t(百元)的频率分布直方图如图所示:(1)求网民消费金额t的平均值 和中位数t0.(2)把下表中空格里的数填上,并判断能否在犯错误的概率不超过0.1的前提下认为网购消费与性别有关男女总计tt0tt030总计45附表:P(K
6、2k0)0.150.100.05k02.0722.7063.841K2解:(1)以每组的中间值代表本组的消费金额,则网民消费金额t的平均值2.50.27.50.312.50.217.50.1522.50.127.50.0511.5.直方图中第一组,第二组的频率之和为0.0450.0650.5.所以t的中位数t010.(2)男女总计tt0252550tt0203050总计4555100K2的观测值k1.0183838790a99,得a8,所以有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数,所求概率为.(2)由表中数据,计算得35,3.5,3.535.所
7、以x.当x60时,5.25.即预测年龄为60岁的观众周均学习成语知识的时间为5.25小时12(选做题)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下茎叶图根据医学知识,我们认为此项指标大于40为偏高,反之即为正常(1)依据上述样本数据研究此项血液指标与性别的关系,列出22列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望附:K2,其中nabcd.P(K2k0)0.0250.0100.005k05.0246.6357.879解:(1)由茎叶图可得22列联表:正常偏高合计男性16420女性12820合计281240K21.9056.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系(2)由样本数据可知,男性正常的概率为,女性正常的概率为.此项血液指标为正常的人数X的可能取值为0,1,2,3,4.P(X0),P(X1)CC,P(X2)CC,P(X3)CC,P(X4),所以X的分布列为X01234P所以E(X)012342.8,即此项血液指标为正常的人数X的数学期望为2.8.