1、章末综合测评(一)统计案例(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项是符合题目要求的)1下面是22列联表y1y2总计x1332154x2a1346总计b34则表中a,b处的值应为()A33,66B25,50C32,67D43,56A由22列联表知a1346,所以a33,又ba33,所以b333366.2根据一位母亲记录儿子39岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为7.19x73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是()A身高一定为145.83 cmB身高大于145
2、.83 cmC身高小于145.83 cmD身高在145.83 cm左右D用线性回归方程预测的不是精确值,而是估计值当x10时,y145.83,只能说身高在145.83 cm左右3独立性检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况下,P(K26.635)0.010表示的意义是()A变量X与变量Y有关系的概率为1%B变量X与变量Y没有关系的概率为99.9%C变量X与变量Y没有关系的概率为99%D变量X与变量Y有关系的概率为99%DP(K26.635)0.010,故有99%的把握认为变量X与变量Y有关系,故选D.4已知对某散点图作拟合曲线及其对应的相关指数R2,如下表所示:拟合曲线直
3、线指数曲线抛物线二次曲线y与x回归方程19.8x463.7e0.27x3.840.367x2202相关指数R20.7460.9960.9020.002则这组数据模型的回归方程的最好选择应是()A.19.8x463.7B.e0.27x3.84C.0.367x2202D.BR2越大,拟合效果越好,应选择e0.27x3.84.5下表是x和y之间的一组数据,则y关于x的回归直线必过()x1234y1357A.点(2,3)B点(1.5,4)C点(2.5,4)D点(2.5,5)C,4.y关于x的回归直线必过点(2.5,4)6若两个变量的残差平方和是325,(yii)2923,则随机误差对预报变量的贡献率约
4、为()A64.8%B60%C35.2%D40%C相关指数R2表示解释变量对于预报变量变化的贡献率,故随机误差对预报变量的贡献率为100%100%35.2%,故选C.7在一次调查后,根据所得数据绘制成如图所示的等高条形图,则()A两个分类变量关系较弱B两个分类变量无关系C两个分类变量关系较强D无法判断C从条形图中可以看出,在x1中y1比重明显大于x2中y2的比重,所以两个分类变量的关系较强8设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()Ab与r的符号相同Ba与r的符号相同Cb与r的符号相反Da与r的符号相反A当b0时,两变量
5、正相关,此时r0;b0时,两变量负相关,此时r6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即至少有99%的把握认为“患肝病与嗜酒有关系”因此正确,故选C.12某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x16171819y50344131由上表可得线性回归方程x中的4,据此模型预测零售价为15元时,每天的销售量为()A51个B50个C49个D48个C17.5,39.由39417.5得109.当x15时,41510949(个)二、填空题(本大题共4小题,每小题5分,共20分把答案填在题中横线上)13已知下表所示数
6、据的线性回归方程为4x242,则实数a_.x23456y251254257a266262由题意,得4,(1 028a),代入4x242,可得(1 028a)44242,解得a262.14为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表:理科文科男1310女720已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到k4.844,则认为“选修文科与性别有关系”出错的可能性为_0.05k4.8443.841,故判断出错的概率为0.05.15为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观测值计
7、算知i52,i228,478,iyi1 849,则y关于x的回归方程是_y11.472.62x由已知数据计算可得2.62,11.47,所以回归方程是11.472.62x.16对于回归分析,下列说法中正确的有_(填序号)在回归分析中,若变量间的关系是非确定性关系,则因变量不能由自变量唯一确定;相关系数可以是正的也可以是负的;回归分析中,如果R21,说明变量x与y之间是完全线性相关;样本相关系数r(,)在回归分析中,样本相关系数r的范围是|r|1,故错误,均正确三、解答题(本大题共6小题,共70分解答应写出文字说明、证明过程或演算步骤)17(本小题满分10分)如图是对用药与不用药,感冒已好与未好进
8、行统计的等高条形图若此次统计中,用药的患者是70人,不用药的患者是40人,试问:能否在犯错误的概率不超过0.001的前提下认为“感冒已好与用药有关”?解根据题中的等高条形图,可得在用药的患者中感冒已好的人数为7056,在不用药的患者中感冒已好的人数为4012.22列联表如下:感冒已好感冒未好总计用药561470不用药122840总计6842110根据表中数据,得到k26.9610.828.因此,能在犯错误的概率不超过0.001的前提下认为感冒已好与用药有关系18(本小题满分12分)网购已成为当今消费者最喜欢的购物方式之一,某机构对A,B,C,D四家同类运动服装网店的关注人数x(单位:千人)与其
9、商品销售件数y(单位:百件)进行统计对比,得到表格:网店名称ABCDx3467y11122017由散点图得知,可以用线性回归方程x来近似刻画它们之间的关系(1)试建立y关于x的回归方程;(2)在(1)的回归模型中,请用R2说明销售件数的差异有多大程度是由关注人数引起的(精确到0.01)解(1)由表中数据可得5,15,xiyi320,x110,2,所以15255,故线性回归方程为2x5.(2) (yi)254, (yii)214,R2110.74,说明销售件数的差异有74%是由关注人数引起的19(本小题满分12分)某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A
10、类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽取100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:身高达标身高不达标总计经常参加体育锻炼40不经常参加体育锻炼15总计100(1)完成上表;(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)?解(1)填写列联表如下:身高达标身高不达标总计经常参加体育锻炼403575不经常参加体育锻炼101525总计5050100(2)由列联表中的数据,得K2的观测值为k1.3332.706,所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关