1、阶段质量检测(一) 统计案例(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项是符合题目要求的)1对有线性相关关系的两个变量建立的回归直线方程x中,回归系数()A可以小于0B大于0C能等于0 D只能小于0解析:选A0时,则r0,这时不具有线性相关关系,但可以大于0也可以小于0.2一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为7.19x73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A身高一定是145.83 cmB身高在145.83 cm以上C身高在145.83 cm以下D身高在145.83
2、 cm左右解析:选D当x10时,7.191073.93145.83,由于线性回归方程只能近似描述,不是准确值,故这个孩子10岁时的身高在145.83 cm左右3下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出()A性别与喜欢理科无关B女生中喜欢理科的百分比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的百分比为60%解析:选C由题图可知,女生中喜欢理科的百分比约为10.80.220%,男生中喜欢理科的百分比约为10.40.660%,因此男生比女生喜欢理科的可能性大些4下列关于残差图的描述错误的是()A残差图的横坐标可以是编号B残差图的横坐标可
3、以是解释变量和预报变量C残差点分布的带状区域的宽度越窄,相关指数越小D残差点分布的带状区域的宽度越窄,残差平方和越小解析:选C由于残差图纵坐标为残差,横坐标可以选用样本编号或样本数据或估计值,A、B正确,由残差图的性质知D正确,故选C.5下表是某厂14月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是0.7x,则()A10.5 B5.15C5.2 D5.25解析:选D样本点的中心为(2.5,3.5),将其代入线性回归方程可解得5.25.6为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取
4、了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k9.643,根据临界值表,以下说法正确的是()A没有充足的理由认为课外阅读量大与作文成绩优秀有关B在犯错误的概率不超过0.995的前提下认为课外阅读量大与作文成绩优秀有关C在犯错误的概率不超过0.001的前提下认为课外阅读量大与作文成绩优秀有关D在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关解析:选D根据临界值表,9.6437.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成
5、绩优秀有关7有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析:选C由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项A、B错误根据列联表中的数据,得到K26.1093.
6、841,因此有95%的把握认为“成绩与班级有关系”,选项C正确8某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为0.66x1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A83% B72%C67% D66%解析:选A将y7.675代入回归方程,可计算得x9.262,所以该城市人均消费额占人均工资收入的百分比约为7.6759.2620.8383%,即约为83%.9.以下关于线性回归的判断,正确的个数是()若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中
7、绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;已知直线方程为0.50x0.81,则x25时,y的估计值为11.69;回归直线方程的意义是它反映了样本整体的变化趋势A0 B1C2 D3解析:选D能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线x才是回归直线,所以不对;正确;将x25代入0.50x0.81,得11.69,所以正确;正确10对两个变量y和x进行线性相关检验,已知n是观察值组数,r是相关系数,且已知:n7,r0.953 3;n15,r0.301 2;n17,r0.999 1;n3,r0.995 0.则变量y和
8、x具有线性相关关系的是()A BC D解析:选B在两个变量的线性相关检验中,r的绝对值越接近于1,线性相关性越强,所以都有较强的相关性,但是中n的值太小,所以具有线性相关关系11若对于变量y与x的10组统计数据的回归模型R20.95,又知残差平方和为120.53,那么(yi)2的值为()A241.06 B2 410.6C253.08 D2 530.8解析:选B由R21得10.95,所以(yi)22 410.6.12两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数分别是a10,b21,cd35.若X与Y有关系的可信程度不小于97.5%,则c等于()A3 B4C5 D6解析:
9、选A列22列联表如下:x1x2总计y1102131y2cd35总计10c21d66故K2的观测值k5.024.把选项A、B、C、D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分请把正确答案填在题中的横线上)13下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45AB女婴E35C总计98D180那么A_,B_,C_,D_,E_.解析:45E98,E53,E35C,C88,98D180,D82,A35D,A47,45AB,B92.答案:479288825314若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足yibxiaei(i1,2,n),若ei恒为0,则
10、R2为_解析:ei恒为0,说明随机误差总为0,于是yi,故R21.答案:115已知x,y之间的一组数据如下表:x12345y23578对于表中数据,现给出如下拟合直线:x;2x1;x;2x.根据最小二乘法的思想,其中拟合程度最好的直线是_(填序号)解析:根据最小二乘法的思想得变量x与y间的线性回归方程的一个特点是:此直线必过点(,)由题表中的数据可得3,5,经检验只有直线过点(3,5),故答案为.答案:16已知x,y之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:yx1与l2:yx,利用最小二乘法判断拟合程度更好的直线是_x13678y12345解析:用yx1作为拟合直
11、线时,所得y的实际值与y的估计值的差的平方和为:S12(22)2(33)222.用yx作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2(11)2(22)22(44)22.因为S25.024,故在犯错误的概率不超过0.025的前提下可以认为“晕机与性别有关”18(本小题满分12分)某运动员训练次数与成绩之间的关系如下表:训练次数x3033353739444650成绩y3034373942464851作出散点图,并求出线性回归方程(注:39.25,40.875,12 656,13 731,iyi13 180)解:作出散点图如图所示由散点图,可知x,y之间具有线性相关关系1.041 5
12、, 0.003 9.所以线性回归方程为1.041 5x0.003 9.19(本小题满分12分)有两个分类变量X与Y,其观测值的22列联表如下:y1y2总计x1a20a20x215a30a45总计155065其中a,15a均为大于5的整数,若K22.706时,有90%的把握认为两个分类变量X与Y有关系,那么a为何值时,我们有90%的把握认为两个分类变量X与Y有关系?附:K2,其中nabcd.解:K2.由K22.706得(13a60)21 124.03.所以13a6033.5或13a6033.5,即a7.2或a2.又a5且15a5,故5a3.841.所以在犯错误的概率不超过0.05的前提下可以认为
13、“该校学生的每周平均体育运动时间与性别有关”22(本小题满分12分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61 469108.8表中wi,i.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程
14、(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .解:(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程由于68,563686.8100.6,所以y关于w的线性回归方程100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大