1、第七章统计案例学校:_姓名:_班级:_考号:_一、单选题(本大题共9小题,共45.0分。在每小题列出的选项中,选出符合题目的一项)1. 已知x,y是两个变量,下列四个关系中,x,y呈负相关的是()A. y=x2-1B. y=-x2+1C. y=x-1D. y=-x+12. 相关系数是度量A. 两个变量之间线性相关关系的强度B. 散点图是否显示有意义的模型C. 两个变量之间是否存在因果关系D. 两个变量之间是否存在关系3. 如表是一个22列联表:则表中a,b的值分别为()y1y2合计x1a2173x2222547合计b46120A. 94,72B. 52,50C. 52,74D. 74,524.
2、 已知两个变量x,y线性相关,且根据观测到的数据(xi,yi)(i=1,2n)计算样本平均数得,则根据这组观测数据算得的线性回归方程不可能是( )A. B. C. D. 5. 经过对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:记忆能力x46810识图能力y3568由表中数据,求得线性回归方程为,若某中学生的记忆能力为14,则可预测该中学生的识图能力为( )A. 7B. 9.5C. 11.1D. 126. 对于变量 x与 y,当 x取值一定时, y的取值带有一定的随机性, x, y之间的这种非确定性关系叫做()A. 函数关系B. 线性关系C. 相关关系D. 回归关系7. 在两个变量的
3、回归分析中,作散点图的目的是( )A. 确定两变量之间的函数关系B. 判断两变量之间更近似于何种函数关系C. 判断拟合效果好不好D. 便于求出样本中心8. 下表是鞋子的长度与对应码数的关系长度()2424.52525.52626.5码数383940414243如果人的身高与脚板长呈线性相关且回归直线方程为.若某人的身高为173,据此模型,估计其穿的鞋子的码数为()A. 40B. 41C. 42D. 439. 已知由样本数据点集合(xi,yi)|i1,2,n,求得的回归直线方程l1为,且现发现两个数据点(0.9,2.4)和(5.1,7.6)误差较大,去除这两点后重新求得的回归直线方程l2的斜率为
4、1.2,则当x2时,由l2的方程得y的估计值为( )A. 2.9B. 3.5C. 3.8D. 4.1二、多选题(本大题共2小题,共10.0分。在每小题有多项符合题目要求)10. 已知变量之间的线性回归方程为,且变量之间的一组相关数据如表所示,则下列说法正确的是( )x681012y6m32A. 变量之间呈现负相关关系B. C. 可以预测,当时,约为D. 由表格数据知,该回归直线必过点11. 已知由样本数据(xi,yi),i=1,2,3,4,5,6求得的经验回归方程为=2x+1,且=3现发现一个样本数据(8,12)误差较大,去除该数据后重新求得的经验回归直线l的纵截距依然是1,则下列说法正确的是
5、()A. 去除前变量x每增加1个单位,变量y一定增加2个单位B. 去除后剩余样本数据中x的平均数为2C. 去除后的经验回归方程为=2.5x+1D. 去除后相关系数r变大三、填空题(本大题共6小题,共30.0分)12. 已知关于x,y的一组数据:x1m345yn根据表中这五组数据得到的线性回归直线方程为,则的值为.13. 双十一是指由电子商务为代表的,在全中国范围内兴起的大型购物促销狂欢节已知某一家具旗舰店近五年双十一的成交额如下表:年份20162017201820192020时间代号t12345成交额y(万元)50607080100若y关于t的回归方程为,则根据回归方程预计该店2021年双十一
6、的成交额是万元14. 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得表格中的数据,x681012y2356请根据表格中提供的数据,求出y关于x的线性回归方程:.(参考公式:,)15. 为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了次试验,得到组数据:,由最小二乘法求得回归直线方程为若已知,则.16. 两个分类变量X与Y,它们的取值分别为和,其列联表为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d若两个分类变量X,Y独立,则下列结论正确的有17. 一般来说,一个人脚越长,他的身高就越高现对10名成年人的脚长单位:与身高单位:进行测量,得如下数据:
7、x20212223242526272829y141146154160169176181188197203作出散点图后,发现散点在一条直线附近经计算得到一些数据:,.某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长,请你估计案发嫌疑人的身高为cm四、解答题(本大题共5小题,共60.0分。解答应写出文字说明,证明过程或演算步骤)18. (本小题12.0分)随着科技的发展,网购已经逐渐融入了人们的生活.在家里面不用出门就可以买到自己想要的东西,在网上付款即可,两三天就会送到自己的家门口,如果近的话当天买当天就能送到,或者第二天就能送到,所以网购是非常方便的购物方式.某公司组织统计了近五年来该公司
8、网购的人数(单位:人)与时间(单位:年)的数据,列表如下:123452427416479(1)依据表中给出的数据,是否可用线性回归模型拟合与的关系,请计算相关系数并加以说明(计算结果精确到0.01).(若,则线性相关程度很高,可用线性回归模型拟合)附:相关系数公式参考数据:.(2)某网购专营店为吸引顾客,特推出两种促销方案.方案一:每满600元可减100元;方案二:金额超过600元可抽奖三次,每次中奖的概率都为,且每次抽奖互不影响,中奖1次打9折,中奖2次打8折,中奖3次打7折.两位顾客都购买了1050元的产品,求至少有一名顾客选择方案二比选择方案一更优惠的概率;如果你打算购买1000元的产品
9、,请从实际付款金额的数学期望的角度分析应该选择哪种优惠方案.19. (本小题12.0分)某商店为了更好地规划某种商品进货的量,该商店从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下图所示(x(吨)为该商品进货量,y(天)为销售天数):x234568911y12334568(1)根据上表数据在网格中绘制散点图;(2)根据上表提供的数据,求出y关于x的线性回归方程参考公式和数据:,(保留分数形式)20. (本小题12.0分)某科学家测量气压(采用水银柱高度)和水的沸点(华氏温度)的一组数据,在观测范围内,沸点和气压值的对数(以10为底)近似成一条直线由于气压的对数值变化不大,为了避免研究
10、特别小的数字,将所有对数值乘以100其数据如下案例号123456789沸点(x)194.5194.3197.9198.4199.4199.9200.9201.1201.4气压(y)131.79131.79135.02135.55136.46136.83137.82138.00138.06案例号1011121314151617沸点(x)201.3203.6204.6209.5208.6210.7211.9212.2气压(y)138.05140.04142.44145.47144.34146.30147.54147.80()建立y关于x的回归方程;(系数精确到0.001)()可以通过残差发现原始数
11、据中的异常数据,请根据()所求的回归方程求出残差或利用残差图,判断上述数据中是否疑有异常数据,若有请指出案例号并求其残差,若无请说明理由,并通过决定系数R2(系数精确到0.001)描述回归方程拟合效果的好坏参考数据:, 参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,决定系数21. (本小题12.0分)2020年上半年,随着新冠肺炎疫情在全球蔓延,全球超过60个国家或地区宣布进入紧急状态,部分国家或地区直接宣布“封国”或“封城”,随着国外部分活动进入停摆,全球经济缺乏活力,一些企业开始倒闭,下表为2020年第一季度企业成立年限与倒闭分布情况统计表:企业成立年份2019201820172
12、0162015企业成立年限x12345倒闭企业数量(万家)5.234.703.723.122.42倒闭企业所占比例y%21.8%19.6%15.5%13.0%10.1%根据上表,给出两种回归模型:模型:建立曲线性回归模型ybln x+a,求得回归方程为y-7.2ln x+22.9;模型:建立线性回归模型(1)根据所给的统计量,求模型中y关于x的回归方程;(2)根据下列表格中的数据,比较两种模型的决定系数,并选择拟合精度更高、更可靠的模型,预测2014年成立的企业中倒闭企业所占比例(结果保留整数)回归模型模型模型回归方程y-7.2ln x+22.95.800.66参考公式:,参考数据:,ln 2
13、0.69,ln 31.1022. (本小题12.0分)某机构为了调查某市同时符合条件A与B(条件A:营养均衡,作息规律;条件B:经常锻炼,劳逸结合)的高中男生的体重y(单位:kg)与身高x(单位:cm)是否存在较好的线性关系,该机构搜集了6位满足条件的高中男生的数据,得到如下表格:身高/cm161167171172175180体重/kg454952545965根据表中数据计算得到y关于x的线性回归方程对应的直线的斜率为1.07(1)求y关于x的线性回归方程(精确到整数部分);(2)已知,当R20.9时,回归方程的拟合效果良好试结合数据,判断(1)中的回归方程的拟合效果是否良好1.【答案】D2.
14、【答案】A3.【答案】C4.【答案】D5.【答案】C6.【答案】C7.【答案】B8.【答案】C9.【答案】C10.【答案】ACD11.【答案】BCD12.【答案】0.4413.【答案】10814.【答案】15.【答案】37516.【答案】17.【答案】185.518.【答案】解:(1)由题知,则.故与的线性相关程度很高,可用线性回归模型拟合.(2)选择方案二比方案一更优惠则需要至少中奖一次,设顾客没有中奖为事件,则,故所求概率为;若选择方案一,则需付款(元),若选择方案二,设付款元,则可能取值为700,800,900,1000.;,所以(元),因为,所以选择方案二更划算.19.【答案】解:(1
15、)根据上表数据在下列网格中绘制散点图,如图所示,(2)根据上表提供的数据,计算=(2+3+4+5+6+8+9+11)=6,=(1+2+3+3+4+5+6+8)=4,=,=4-6=-,y关于x的线性回归方程=-.20.【答案】解:()由图中数据和附注中参考数据得:,所以,所以y关于x的回归方程为;()通过残差图,发现沸点数据在略大于140时残差比较大,计算第12个案例的残差为1.44,残差比其它案例大得多,可以判定疑似异常数据,决定系数,越大接近于1,说明回归方程拟合效果很好.21.【答案】解:(1)由,可得,所以,则,所以模型中y关于x的回归方程为-3x+25(2)因为,所以模型的R2小于模型,说明回归方程刻画的拟合效果更好,选择模型,当x6时,-36+257,所以预测2014年成立的企业中倒闭企业所占比例为7%22.【答案】解:(1)依题意可知,故y关于x的线性回归方程为(2),故(1)中的回归方程的拟合效果良好