1、(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项是符合题目要求的)1已知回归方程x,其中3,且样本点的中心为(1,2),则回归直线方程为()A.x3B.2x3C.x3 D.x3解析:选C因为回归方程一定经过样本点的中心,所以只需将样本点的中心坐标代入方程,用待定系数法求出即可2每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程568x,下列说法正确的是()A废品率每增加1%,成本每吨增加64元B废品率每增加1%,成本每吨增加8%C废品率每增加1%,成本每吨增加8元D如果废品率增加1%,则每吨成本为56元解析:选C根据回归方程
2、知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位3下表是某厂14月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是0.7x,则等于()A10.5 B5.15C5.2 D5.25解析:选D样本点的中心为(2.5,3.5),将其代入线性回归方程可解得5.25.4下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x45678910y14181920232528A线性函数模型 B二次函数模型C指数函数模型 D对数函数模型解析:选A画出散点图(图略)可以得到这些样本
3、点在某一条直线上或该直线附近,故最可能是线性函数模型5试验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.x1 B. x2C.2x1 D.x1解析:选A由题意发现,(x,y)的四组值均满足x1,故x1为回归直线方程6下列说法中,错误说法的个数是()将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;回归方程35x,变量x增加1个单位时,平均增加5个单位;线性回归方程x必过样本点的中心(,);在一个22列联表中,若2的观测值k13.079,则有99.9%以上的把握认为这两个变量之间有关系A0 B1C2 D3解析:选B数据的方差与
4、加了什么样的常数无关,故正确;对于回归方程35x,变量x增加1个单位时,平均减少5个单位,故错误;易知正确;若k13.07910.828,则有99.9%以上的把握认为这两个变量之间有关系,故正确7根据一组样本数据(x1,y1),(x2,y2),(xn,yn)的散点图分析存在线性相关关系,求得其回归方程0.85x85.7,则在样本点(165,57)处的残差为()A54.55 B2.45C3.45 D111.55解析:选B把x165代入0.85x85.7,得y0.8516585.754.55,故残差为5754.552.45.8某高校统计课程的教师随机给出了选修该课程的一些情况,具体数据如下:选修该
5、课程未选修该课程男1310女720为了判断选修该课程是否与性别有关,根据表中数据,得24.844.因为23.841,所以可以判断选修该课程与性别有关那么这种判断出错的可能性不超过()A5% B95%C1% D99%解析:选A若23.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.9为考察数学成绩与物理成绩的关系,某老师在高二随机抽取了300名学生,得到下面的列联表:数学物理85100分85分以下总计85100分378512285分以下35143178总计72228300若判断数学成绩与物理成绩有关系,则判断的出错率不超
6、过()A0.5% B1%C2% D5%解析:选D由表中数据代入公式得2的观测值24.5143.841,所以有95%以上的把握认为数学成绩与物理成绩有关,因此,判断的出错率不超过5%.10已知x与y之间的几组数据如下表所示.x123456y021334假设根据上表数据所得回归方程为x,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()A.b,a B.b,aC.a D.b,a解析:选C由题意可得,b2,a2,.由公式求得,a.11假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其22列联表如下:y1y2总计x1ababx2cd
7、cd总计acbdabcd对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()Aa9,b8,c7,d6Ba9,b7,c6,d8Ca8,b6,c9,d7Da6,b7,c8,d9解析:选B对于同一样本,|adbc|越大,说明X与Y之间的关系越强,故检验知选B.12两个分类变量X和Y, 值域分别为x1,x2和y1,y2, 其样本频数分别是a10, b21, cd35. 若X与Y有关系的可信程度不小于97.5%, 则c等于()A3 B4C5 D6解析:选A列22列联表如下:x1x2总计y1102131y2cd35总计10c21d66故K2的观测值k5.024. 把选项A, B, C, D代入
8、验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分请把正确答案填在题中的横线上)13已知高三某学生的高考成绩y(分)与高三期间有效复习时间x(天)正相关,且回归方程是3x50,若期望他高考达到500分,则他的有效复习时间应不低于_天解析:本题主要考查运用线性回归方程来预测变量的取值当500时,易得x150.答案:15014若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足yibxiaei(i1,2,n),若ei恒为0,则r2为_解析:ei恒为0,说明随机误差总为0,于是yi,故r21.答案:115欲知作者的性别是否与读者的性别有关,某出版公司派工作人员到各书店随机调
9、查了500位买书的顾客,结果如下表所示.作家读者男作家女作家总计男读者142122264女读者103133236总计245255500则在犯错误的概率不超过0.025的前提下作者的性别与读者的性别_(填“有关”或“无关”)解析:由公式得25.1315.024,所以在犯错误的概率不超过0.025的前提下作者的性别与读者的性别有关答案:有关16已知x,y之间的一组数据如下表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:yx1与l2:yx,利用最小二乘法判断拟合程度更好的直线是_.x13678y12345解析:用yx1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S12(22)2
10、(33)222.用yx作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2(11)2(22)22(44)22.因为S23.841,所以能95%的把握认为是否满意该商品与性别有关20(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在21.7,22.3(单位:cm)之间,把零件尺寸在21.9,22.1)的记为一等品,尺寸在21.8,21.9)22.1,22.2)的记为二等品,尺寸在21.7,21.8)22.2,22.3的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列22列联表,根
11、据此数据你认为选择不同的工艺与生产出一等品是否有关?甲工艺乙工艺总计一等品非一等品总计附:P(2k0)0.100.050.01k02.7063.8416.6352(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由解:(1)22列联表如下:甲工艺乙工艺总计一等品5060110非一等品504090总计100100200K22.022.706,所以没有理由认为选择不同的工艺与生产出一等品有关(2)由题知运用甲工艺生产单件产品的利润X的分布列为X302015P0.50.30.2X的数
12、学期望为E(X)300.5200.3150.224,X的方差为V(X)(3024)20.5(2024)20.3(1524)20.239.乙工艺生产单件产品的利润Y的分布列为Y302015P0.60.10.3Y的数学期望为E(Y)300.6200.1150.324.5,Y的方差为V(Y)(3024.5)20.6(2024.5)20.1(1524.5)20.347.25.由上述结果可以看出V(X)V(Y),即甲工艺波动小,虽然E(X)10.828,所以能在犯错概率不超过0.001的前提下,认为该区的学生常吃零食与患龋齿有关系(2)设其他工作人员为丙和丁,4人分组的所有情况有:收集数据组:甲乙;甲丙
13、;甲丁;乙丙;乙丁;丙丁;相应的处理数据组:丙丁;乙丁;乙丙;甲丁;甲丙;甲乙共有6种情况记事件A为“工作人员甲分到负责收集数据组,工作人员乙分到负责数据处理组”,则满足条件的情况有:甲丙收集数据,乙丁处理数据或甲丁收集数据,乙丙处理数据,共2种情况所以P(A).22(本小题满分12分)某市为了对学生的数理(数学与物理)学习能力进行分析,从10 000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:等级得分(0,1(1,2(2,3(3,4(4,5(5,6人数3173030173(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生
14、,求恰有1名学生为良好的概率(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2的中点值为1.5)作为代表:据此,计算这100名学生数理学习能力等级分数的期望及标准差(精确到0.1);若总体服从正态分布,以样本估计总体,估计该市这10 000名学生中数理学习能力等级在(1.9,4.1)范围内的人数(3)从这10 000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:x(数学学习能力)23456y(物理学习能力)1.534.556请画出上表数据的散点图;请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x(附参考数据:11.4)解:(1)样本中学生为良
15、好的人数为20人故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为.(2)总体数据的期望约为:0.50.031.50.172.50.303.50.304.50.175.50.033.0,标准差(0.53)20.03(1.53)20.17(2.53)20.3(3.53)20.3(4.53)20.17(5.53)20.031.1,由于3,1.1当x(1.9,4.1)时,即x(,),故数理学习能力等级分数在(1.9,4.1)范围中的概率约为0.682 7.数理习能力等级分数在(1.9,4.1)范围中的学生的人数约为10 0000.682 76 827人(3)数据的散点图如图:设线性回归方程为x,则4,4.1.1,0.4.故回归直线方程为1.1x0.4.