1、章末评估验收(三)(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项符合题目要求)1下列关于K2的说法正确的是()AK2在任何相互独立问题中都可以用来检验有关还是无关BK2的值越大,两个事件的相关性就越大CK2是用来判断两个分类变量是否有关系的,只对于两个分类变量适合DK2的观测值k的计算公式为k解析:K2是用来判断两个分类变量是否有关的,故A错;K2的值越大,只能说明有更大地把握认为二者有关系,却不能判断相关性的大小,B错;D中(adbc)应为(adbc)2.答案:C2如图所示的等高条形图可以说明的问题是()A“心脏搭桥”手
2、术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C此等高条形图看不出两种手术有什么不同的地方D“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:由等高条形图知,“心脏搭桥术”和“血管清障”对“诱发心脏病”的影响程度不同,但没有100%的把握答案:D3两个变量x与y的回归模型中,分别选择了四个不同模型来拟合y与x之间的关系,它们的相关指数R2如下,其中拟合效果最好的模型是()模型1234R20.980.800.500.25A.模型1 B模型2 C模型3 D模型4解析
3、:两个变量y与x的回归模型中,它们的相关指数R2越接近于1,这个模型的拟合效果越好,所给的四个选项中0.98是相关指数最大的值,模型1拟合效果最好答案:A4为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )Al1和l2有交点(s,t)Bl1与l2相交,但交点不一定是(s,t)Cl1与l2必定平行Dl1与l2必定重合解析:由回归直线定义知选A.答案:A5相关变量x,y的样本数据如下:x1234
4、5y22356经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程1.1xa,则a()A0.1B0.2C0.3 D0.4解析:由题意,3,3.6,因为回归直线方程1.1xa过样本中心点(,),所以3.61.13a,所以a0.3.故选C.答案:C6随着资本市场的强势进入,互联网共享单车“忽如一夜春风来”,遍布了一二线城市的大街小巷为了解共享单车在A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中抽取了200人进行抽样分析,得到下表(单位:人):分类经常使用偶尔或不用总计30岁及以下703010030岁以上6040100总计13070200根据以上数据,认为A市使用共享
5、单车情况与年龄有关时犯错误的概率不超过()A0.10 B0.05 C0.15 D0.01参考公式:K2,其中nabcd.参考数据:P(K2k0)0.150.100.050.0250.010k02.0722.7063.8415.0246.635解析:由列联表可知,K2的观测值k2.198.因为2.1982.072,所以能在犯错误的概率不超过0.15的前提下认为A市使用共享单车情况与年龄有关答案:C7为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x.已知 xi225, y i1
6、600,4.该班某学生的脚长为24,据此估计其身高为()A160 B163 C166 D170解析:x()22.5,y()160,160422.570,则回归直线方程为4x70,所以当某学生的脚长为24时,该学生的身高为42470166.答案:C8在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A总偏差平方和 B残差平方和C回归平方 D相关指数R2解析:根据残差平方和的概念知选项B正确答案:B9废品率x%与每吨生铁成本y(元)之间的回归直线方程为2343x,表明()A废品率每增加1%,生铁成本增加3x元B废品率每增加1%,生铁成本每吨平均增加3元C废品率每增加1%,生铁成本增加
7、234元D废品率不变,生铁成本为234元解析:回归直线方程表示废品率x%与每吨生铁成本y(元)之间的相关关系故回归直线方程2343x时,废品率每增加1%,生铁成本每吨平均增加3元答案:B10在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()性别说谎不说谎总计男6713女8917总计141630A.在此次调查中有95%的把握认为是否说谎与性别有关B在此次调查中有99%的把握认为是否说谎与性别有关C在此次调查中有99.5%的把握认为是否说谎与性别有关D在此次调查中没有充分证据显示说谎与性别有关解析:由表中数据得k0.002 423.841.因此,判定主修统计专
8、业与性别有关系,那么这种判断出错的概率不超过_解析:根据k3.841,可判断在犯错误的概率不超过0.05的前提下,认为主修统计专业与性别有关系故出错的概率不超过0.05.答案:0.0515在研究硝酸钠的可溶性程度时,观测它在不同温度的水中的溶解度,得观测结果如下:温度x/ 010205070溶解度y66.776.085.0112.3128.0由此得到回归直线的斜率是_解析:把表中的数据代入公式0.880 9.答案:0.880 916某小卖部为了了解热茶销售量y(杯)与气温x()之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温/1813101杯数24343864由表中
9、数据算得线性回归方程x中的2,预测当气温为5时,热茶销售量为_杯解析:根据表格中的数据可求得x()(1813101)10,y()(24343864)40.所以y() x()40(2)1060,所以2x60,当x5时,2(5)6070.答案:70三、解答题 (本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17(本小题满分10分)某单位为了了解用电量y度与气温x之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温/1813101用电量/度24343864由表中数据得线性回归方程x中,2,预测当气温为4时,用电量为多少解:由题意得x10,y40,因为回归直线过点(
10、x,y),所以40210.所以60,所以2x60.令x4,得(2)(4)6068.所以当气温为4 时,预测用电量为68度18(本小题满分12分)某学校高三年级有学生1 000名,经调查,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:分类身高达标身高不达标总计经常参加体育锻炼40不经常参加体育锻炼15总计100(1)完成上表;(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼
11、与身高达标有关系(K2的观测值精确到0.001)?解:(1)填写列联表如下:分类身高达标身高不达标总计经常参加体育锻炼403575不经常参加体育锻炼101525总计5050100(2)由列联表中的数据,得K2的观测值为k1.3333.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系19(本小题满分12分)在统计学中,偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差,班主任为了了解个别学生的偏科情况,对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行学科偏差分析,决定从全班56位同
12、学中随机抽取一个容量为8的样本进行分析,得到他们的两科成绩偏差数据如表:学生序号12345678数学偏差x/分2015133251018物理偏差y/分6.53.53.51.50.50.52.53.5(1)已知x与y之间具有线性相关关系,求y关于x的线性回归方程(2)若这次考试该班数学平均分为118分,物理平均分为90.5,试预测数学成绩126分的同学的物理成绩参考数据: xiyi324, x 1 256.解:x(),y(),所以y() x(),故线性回归方程为x.(2)由题意,设该同学的物理成绩为,则物理偏差为:90.5.而数学偏差为1261188,则由(1)的结论可得:90.58,解得93,
13、所以,可以预测这位同学的物理成绩为93分20(本小题满分12分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:分类积极参加班级工作不太主动参加班级工作总计学习积极性高18725学习积极性一般61925总计242650(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关,并说明理由解:(1)积极参加班级工作的学生有24名,总人数为50名,概率为.不太主动参加班级工作且学习积极性一般的学生
14、有19名,概率为.(2)由K2公式得K211.5.因为K210.828,所以有99.9%的把握认为学习积极性与对待班级工作的态度有关系21(本小题满分12分)“双十一”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双十一”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t(百元)的频率分布直方图如图所示:(1)求网民消费金额t的平均值t和中位数t0.(2)把下表中空格里的数填上,并判断能否在犯错误的概率不超过0.1的前提下认为网购消费与性别有关项目男女总计tt0tt030总计45附表:P(K2k0)0.150.100.05k02.0722.7063.841K2
15、的观测值k解:(1)以每组的中间值代表本组的消费金额,则网民消费金额t的平均值t2.50.27.50.312.50.217.50.1522.50.127.50.0511.5.直方图中第一组,第二组的频率之和为0.0450.0650.5.所以t的中位数t010.(2)列出22的列联表如下:项目男女总计tt0252550tt0203050总计4555100K2的观测值k1.012.706,所以不能在犯错误的概率不超过0.1的前提下认为网购消费与性别有关22(本小题满分12分)假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.5830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归直线方程,对于基本苗数56.7预报其有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明残差变量对有效穗的影响占百分之几解:(1)散点图如下:(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系设回归方程为x,由已知数据可求得30.316,43.5,所以R210.830.所以解释变量小麦基本苗数对总效应贡献了约83%.残差变量贡献了约183%17%.