1、第三章学业质量标准检测时间120分钟,满分150分一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中只有一个是符合题目要求的)1下列不具有相关关系的是(D)A瑞雪兆丰年B名师出高徒C吸烟有害健康D喜鹊叫喜,乌鸦叫丧解析喜鹊叫喜,乌鸦叫丧是一种迷信说法,无任何关系2(2018四川模拟)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是(D)A样本中的男生数量多于女生数量B样本中喜欢手机支付的数量多于现金支付的数量C样本中多数男生喜欢手机支付D样本中多数女生喜欢现金支付
2、解析由左图知,样本中的男生数量多于女生数量,A正确;由右图知样本中喜欢手机支付的数量多于现金支付的数量,B正确;由右图知,样本中多数男生喜欢手机支付,C正确;由右图知样本中女生喜欢现金支付人数比手机支付人数少,D错误故选D3(2019唐山高二检测)四名同学根据各自的样本数据研究变量x、y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423; y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578其中一定不正确的结论的序号是(D)ABCD解析y与x正(或负)相关时,线性回归直线方程yx中,x的系数
3、0(或7.879,故有10.00599.5%的把握认为疾病A与性别有关7(2018大连高二检测)已知回归直线的斜率的估计值是2,样本点的中心为(4,12),则回归直线的方程是(A)A2x4Bx2C2x20Dx2解析由回归直线方程x的定义知,2,回归直线过样本点的中心,1224,4,回归直线方程为2x48以下关于线性回归的判断,正确的个数是(D)若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;已知回归直线方程为0.50x0.81,则x25时,y的估计值为11.69;回归直线方程的意义是它反映了样本整体的变化趋势
4、A0B1C2D3解析能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线bx才是回归直线,不对;正确;将x25代入0.50x0.81,得11.69,正确;正确,故选D9某人对一地区人均工资x(千元)与该地区人均消费Y(千元)进行统计调查,Y与x有相关关系,得到回归直线方程0.66x1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为(D)A66%B72%C67%D83%解析该题考查线性回归的实际应用,由条件知,消费水平为7.675千元时,人均工资为9.262(千元)故83%10某化工厂为预测某产品
5、的回收率Y,需要研究它和原料有效成分含量x之间的相关关系,现取了8对观察值,计算得i52,i228,478,iyi1849,则y与x的回归方程是(A)A11.472.62xB11.472.62xC2.6211.47xD11.472.62x解析据已知2.6211.47.故选A11两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是(A)模型模型1模型2模型3模型4相关系数r0.980.800.500.25A模型1B模型2C模型3D模型4解析线性回归分析中,相关系数为r,|r|越接近于1,相关程度越大;|r|越小,相关程度越小,模型1的相关系数r最大,
6、模拟效果最好,故选A12下面是某市场农产品的调查表市场供应量表:单价(元/千克)22.42.83.23.64供应量(1000千克)506070758090市场需求量表:单价(元/千克)43.42.92.62.32供应量(1000千克)506070758090根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间(C)A(2.3,2.6)B(2.4,2.6)C(2.6,2.8)D(2.8,2.9)解析以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C二、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)13已知一个回归直线方程为1.5
7、x45,x1,7,5,13,19,则_58.5_解析因为(1751319)9,且1.545,所以1.594558.5本题易错之处是根据x的值及1.5x45求出y的值再求,由1.5x45求得的y值不是原始数据,故错误14许多因素都会影响贫穷,教育也许是其中之一在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的线性回归方程为0.8x4.6,斜率的估计值为0.8.说明_美国一个地区的成年人受过9年或更少教育的百分比增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比增加0.8%左右_15给出
8、下列命题:样本方差反映了所有样本数据与样本平均值的偏离程度;若随机变量XN(0.43,0.182),则此正态曲线在x0.43处达到峰值;在回归分析模型中,残差平方和越小,说明模型的拟合效果越差;市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3000人经过计算得K26.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.P(K2k0)0.250.150.100.0250.0100.0050.001k01.3232.0722.7065.0246.6357.87910.828其中正确的命题是_解析根据样本方差的概念、正态分布的概念可知均正确;在回归分析
9、中,残差的平方和越小,说明模型的拟合效果越好,即X与Y有很强的关系,所以不正确;通过表中的数据和K26.0235.024可知,可以认为有97.5%以上的把握认为市民收入与旅游欲望有关系,因此正确16某市居民20152019年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20152016201720182019收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是_13_,家庭年平均收入与年平均支出有_正_线性相关关系解析中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两
10、数的平均数由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系三、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步骤)17(本题满分12分)(2019洛阳市高二检测)以下资料是一位销售经理收集来的每年销售额和销售经验年数的关系的一组样本数据:销售经验x(年)13461012年销售额y(万元)89.5910.51112(1)根据最小二乘法求出y关于x的线性回归方程;(2)试预测销售经验为8年时的年销售额约为多少万元(精确到十分位)?解析(1)由散点图(图略)知y与x呈线性相关关系,由表中数据计算得,6,10,回归直线方程:x(2)x8时,
11、预测年销售额为810.7万元18(本题满分10分)(2019青岛高二检测)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率附
12、:K2P(K2k0)0.050.01k03.8416.635解析(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成22列联表如下:非体育迷体育迷合计男301545女451055合计7525100将22列联表中的数据代入公式计算,得K23.030因为3.0300.75,所以可认为x与y之间具有线性相关关系;(3)0.398,134.820(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:患病未患病总计没服用药203050服用药xy50总计MN100设从没服用药物的动物中任取2只,未患病数为;从服用药物的动物中任取2只,未患病数为,工
13、作人员曾计算过P(0)P(0)(1)求出列联表中数据x、y、M、N的值;(2)求与的均值(期望)并比较大小,请解释所得结论的实际含义;(3)能够以99%的把握认为药物有效吗?参考公式:K2当K23.841时有95%的把握认为、有关联;当K26.635时有99%的把握认为、有关联解析(1)P(0),P(0),x10y40,M30,N70(2)取值为0、1、2P(0),P(1),P(2).012PE()P(0)P(1)P(2).012PE()E()E(),即说明药物有效(3)K24.764.760.75,y与x之间具有很强的线性相关关系(2)由(1)可得0.4646,67.010.464666.8
14、35.97,故所求的线性回归方程为0.4646x35.97(3)当x73时,0.46467335.9769.9(英寸),所以当父亲身高为73英寸时,估计儿子的身高约为69.9英寸22(本题满分12分)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查根据问卷取得了这n名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组0,30),30,60),60,90),90,120),120,150),150,180),180,210),210,240,得到频率分布直方图如图已知抽取的学生中星
15、期天晚上学习时间少于60分钟的人数为5人(1)求n的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列22列联表:利用时间充分利用时间不充分总计走读生住宿生10总计据此资料,你是否认为学生“利用时间是否充分”与走读、住宿有关?(3)若在第组、第组、第组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X,求X的分布列及期望参考公式:K2解析(1)设第i组的频率为Pi(i1,2,8),由图可知:P130, P230学习时间少于60分钟的频率为P1P2由题意:n5,n100又P330, P530,
16、P630,P730,P830,P41(P1P2P3P5P6P7P8)第组的高度为:h频率分布直方图如图:(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,从而走读生中利用时间不充分的有251015人,利用时间充分的有451530人,由此可得22列联表如下:利用时间充分利用时间不充分总计走读生301545住宿生451055总计7525100将22列联表中的数据代入公式计算,得K23.030因为3.0303.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关(3)由(1)知:第组2人,第组3人,第组5人,总计10人,则X的所有可能取值为0,1,2,3P(Xi)(i0,1,2,3)P(X0),P(X1),P(X2),P(X3)X的分布列为:X0123PE(X)0123(或由超几何分布的期望计算公式E(X)n3)