1、第三章学业质量标准检测时间120分钟,满分150分一、单项选择题(本大题共8个小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合题目要求的)1下列说法中错误的是(B)A如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(xi,yi)(i1,2,n)将散布在某一条直线的附近B如果两个变量x与y之间不存在着线性关系,那么根据它们的一组数据(xi,yi)(i1,2,n)不能写出一个线性方程C设x,y是具有相关关系的两个变量,且y关于x的线性回归方程为x,叫做回归系数D为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系解析任何一组(
2、xi,yi)(i1,2,n)都能写出一个线性方程,只是有的无意义2(2020四川模拟)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:根据图中的信息,下列结论中不正确的是(D)A样本中的男生数量多于女生数量B样本中喜欢手机支付的数量多于现金支付的数量C样本中多数男生喜欢手机支付D样本中多数女生喜欢现金支付解析由左图知,样本中的男生数量多于女生数量,A正确;由右图知样本中喜欢手机支付的数量多于现金支付的数量,B正确;由右图知,样本中多数男生喜欢手机支付,C正确;由右图知样本中女生喜欢现金支付人数比手机支付人数少,D错误故选D3对
3、两个变量x,y进行线性相关检验,得线性相关系数r10.785 9,对两个变量u,v进行线性相关检验,得线性相关系数r20.956 8,则下列判断正确的是(C)A变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强解析由线性相关系数r10.785 90,知x与y正相关,由线性相关系数r20.956 80知u与v负相关,又|r1|7.879,故有10.00599.5%的把握认为疾病A与性别有关7已知
4、变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能是(A)A0.4x2.3B2x2.4C2x9.5D0.3x4.4解析因为变量x和y正相关,则回归直线的斜率为正,故可以排除选项C和D因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A和B中的直线方程进行检验,可以排除B,故选A8某汽车的使用年数x与所支出的维修总费用y的统计数据如下表:使用年数x/年12345维修总费用y/万元0.51.22.23.34.5根据上表可得y关于x的线性回归方程x0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足
5、1年按1年计算)(D)A8年B9年C10年D11年解析由y关于x的线性回归直线x0.69过样本点的中心(3,2.34),得1.01,即线性回归方程为1.01x0.69,由1.01x0.6910得x10.6,所以预测该汽车最多可使用11年,故选D二、多项选择题(本大题共4个小题,每小题5分,共20分,在每小题给出的四个选项中,有多项符合题目要求全部选对的得5分,部分选对的得3分,有选错的得0分)9四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论,其中结论一定不正确的是(AD)Ay与x负相关且2.347x6.423By与x负相关且3.476x5.64
6、8Cy与x正相关且5.437x8.493Dy与x正相关且4.326x4.578解析y与x正(或负)相关时,线性回归直线方程yx中,x的系数F0(或3.841时,我们(AD)A在犯错误的概率不超过0.05的前提下可认为A与B有关B在犯错误的概率不超过0.05的前提下可认为A与B无关C有99%的把握说A与B有关D有95%的把握说A与B有关解析由于23.841,所以P(23.841)0.05,则我们认为在犯错误的概率不超过0.05的前提下可认为A与B有关,有95%的把握说A与B有关故选AD12已知x,y是两个变量,下列四个关系中,x,y不是负相关的是(ABC)Ayx21Byx21Cyx1Dyx1解析
7、根据题意,依次分析选项:对于A,yx21,当x增大时,y的值不一定减小,两个变量不是负相关,符合题意;对于B,yx21,当x增大时,y的值不一定减小,两个变量不是负相关,符合题意;对于C,yx1,当x增大时,y的值一定增大,两个变量正相关,符合题意;对于D,yx1,当x增大时,y的值一定减小,两个变量负相关,不符合题意三、填空题(本大题共4个小题,每小题5分,共20分,把正确答案填在题中横线上)13已知一个回归直线方程为1.5x45,x1,7,5,13,19,则_58.5_解析因为(1751319)9,且1.545,所以1.594558.5本题易错之处是根据x的值及1.5x45求出y的值再求,
8、由1.5x45求得的y值不是原始数据,故错误14为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到22列联系:理科文科总计男131023女72027总计203050已知P(K23.841)0.05,P(K25.024)0.025根据表中数据,得到K24.844,则认为选修文理科与性别有关系出错的可能性约为_5%_解析由K24.8443.841,故认为选修文理科与性别有关系出错的可能性约为5%15给出下列命题:样本方差反映了所有样本数据与样本平均值的偏离程度;若随机变量XN(0.43,0.182),则此正态曲线在x0.43处达到峰值;在回归分析模型中,残差平方和越小,说明
9、模型的拟合效果越差;市政府调查江北水城市民收入与市民旅游欲望的关系时,抽查了3 000人经过计算得K26.023,根据这一数据查阅下表,则市政府有97.5%以上的把握认为市民收入与旅游欲望有关系.P(K2k0)0.250.150.100.0250.0100.0050.001k01.3232.0722.7065.0246.6357.87910.828其中正确的命题是_解析根据样本方差的概念、正态分布的概念可知均正确;在回归分析中,残差的平方和越小,说明模型的拟合效果越好,即X与Y有很强的关系,所以不正确;通过表中的数据和K26.0235.024可知,可以认为有97.5%以上的把握认为市民收入与旅
10、游欲望有关系,因此正确16某市居民20152019年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20152016201720182019收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是_13_,家庭年平均收入与年平均支出有_正_线性相关关系解析中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系四、解答题(本大题共6个大题,共70分,解答应写出文字说明,证明过程或演算步
11、骤)17(本题满分10分)改革开放以来,我国高等教育事业有了迅速发展,有人记录了某村2006到2016年10年间每年考入大学人数所占该年参加高考总人数的百分比,为了便于计算,把2006年编号为0,2007年编号为1,2016年编号为10.如果把每年考入大学人数占该年参加高考总人数的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:农村0.42x1.80;县镇2.32x6.76;城市2.84x9.50(1)对于农村青年来讲,系数等于0.42意味着什么?(2)在这10年间,农村、县镇和城市哪一个的大学入学率增长最快?(3)预测2020年县镇的入学率是多少?解析(1)
12、0.42是回归直线的斜率,意味着对于农村考生,每年的入学率平均增长0.42%(2)城市对应回归直线的斜率最大,所以城市的年入学率增长最快(3)y2.32146.7639.24,故2020年县镇的入学率为39.24%18(本题满分12分)(2020青岛高二检测)电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?
13、非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率附:K2P(K2k0)0.050.01k03.8416.635解析(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成22列联表如下:非体育迷体育迷合计男301545女451055合计7525100将22列联表中的数据代入公式计算,得K23.030因为3.0303.841,所以我们没有理由认为“体育迷”与性别有关(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的集合
14、为(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)其中ai表示男性,i1,2,3,bj表示女性,j1,2由10个基本事件组成,而且这些基本事件的出现是等可能的用A表示“任选2人中,至少有1人是女性”这一事件,则A(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),事件A由7个基本事件组成,因而P(A)19(本题满分12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88
15、.28.48.68.89销量y(件)908483807568(1)求回归直线方程x,其中20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解析(1)8.5,(908483807568)8020,80208.5250,回归直线方程20x250(2)设工厂获得的利润为L元,则Lx(20x250)4(20x250)202361.25,该产品的单价应定为元,工厂获得的利润最大20(本题满分12分)为考查某种药物预防疾病的效果,进行动物试验,得到如下丢失数据的列联表:患病未患病总计没服用药20
16、3050服用药xy50总计MN100设从没服用药物的动物中任取2只,未患病数为;从服用药物的动物中任取2只,未患病数为,工作人员曾计算过P(0)P(0)(1)求出列联表中数据x、y、M、N的值;(2)求与的均值(期望)并比较大小,请解释所得结论的实际含义;(3)能够以99%的把握认为药物有效吗?参考公式:K2当K23.841时有95%的把握认为、有关联;当K26.635时有99%的把握认为、有关联解析(1)P(0),P(0),x10y40,M30,N70(2)取值为0、1、2P(0),P(1),P(2).012PE()P(0)P(1)P(2).012PE().E()E(),即说明药物有效(3)
17、K24.764.76400空气质量好空气质量不好附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828解析(1)由频数分布表可知,该市一天的空气质量等级为1的概率为0.43,等级为2的概率为0.27,等级为3的概率为0.21,等级为4的概率为0.09(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为350(3) 列联表如下:人次400人次400空气质量好3337空气质量不好228K25.8203.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关22(本题满分12分)为了调查学生星期天晚上学习时间利用问题,某校从高二年级1
18、000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查根据问卷取得了这n名同学每天晚上学习时间(单位:分钟)的数据,按照以下区间分为八组0,30),30,60),60,90),90,120),120,150),150,180),180,210),210,240,得到频率分布直方图如图已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人(1)求n的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列22列联表:利用时间充分利用时间不充分总计走读生住宿生10总计据此资料,你是否认为学
19、生“利用时间是否充分”与走读、住宿有关?(3)若在第组、第组、第组中共抽出3人调查影响有效利用时间的原因,记抽到“学习时间少于60分钟”的学生人数为X,求X的分布列及期望参考公式:K2解析(1)设第i组的频率为Pi(i1,2,8),由图可知:P130, P230学习时间少于60分钟的频率为P1P2由题意:n5,n100又P330,P530,P630,P730,P830,P41(P1P2P3P5P6P7P8)第组的高度为:h频率分布直方图如图:(2)由频率分布直方图可知,在抽取的100人中,“走读生”有45人,“住宿生”有55人,其中“住宿生”中利用时间不充分的有10人,从而走读生中利用时间不充分的有251015人,利用时间充分的有451530人,由此可得22列联表如下:利用时间充分利用时间不充分总计走读生301545住宿生451055总计7525100将22列联表中的数据代入公式计算,得K23.030,因为3.0303.841,所以没有理由认为学生“利用时间是否充分”与走读、住宿有关(3)由(1)知:第组2人,第组3人,第组5人,总计10人,则X的所有可能取值为0,1,2,3,P(Xi)(i0,1,2,3),P(X0),P(X1),P(X2),P(X3),X的分布列为:X0123PE(X)0123(或由超几何分布的期望计算公式E(X)n3)