1、第三章检测(A)(时间:90分钟满分:120分)附:K2=P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的R2如下,其中拟合得最好的模型为 ()A.模型1的R2为0.75B.模型2的R2为0.90C.模型3的R2为0.25D.模型4的R2为0.55解析:R2的值越大
2、,意味着残差平方和越小,也就是说拟合效果越好.答案:B2.下列关于独立性检验的说法中,错误的是()A.独立性检验依据小概率原理B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两类事物是否相关的唯一方法答案:B3.工人月工资y(单位:元)与劳动生产率x(单位:千元)变化的线性回归方程为=90x+60,下列说法中正确的是()A.劳动生产率每提高1 000元,月工资提高150元左右B.劳动生产率每提高1 000元,月工资提高90元左右C.劳动生产率为1 000元时,月工资提高90元D.以上说法都不正确解析:由线性回归方程得到的预报值并不一定是预报变量的精
3、确值,而是预报变量可能取值的平均值,因此当劳动生产率每提高1 000元,月工资提高90元左右.故选B.答案:B4.根据如下样本数据:x345678y4.02.5-0. 50.5-2.0-3.0得到的回归方程为x+,则()A0,0B0,0C0D0,0解析:由样本数据可知y值总体上是随x值的增大而减少的,故0.故选B.答案:B5.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是()A=0.4x+2.3B=2x-2.4C=-2x+9.5D=-0.3x+4.4解析:由变量x与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过点(),由此
4、排除B,故选A.答案:A6.已知x与y之间的一组数据如下:x0123y2468则y与x的线性回归方程x+对应的图象必过点 ()A.(2,2)B.(1,2)C.(1.5,0)D.(1.5,5)解析:由表中数据可知,=1.5,=5.回归直线一定经过点(),选D.答案:D7.下列说法:若r0,则x增大时,y也相应增大;若rb,aBb,aCaDb,a解析:由题意可知,n=6,xi=yi=,故-n=91-6xiyi-n=58-6,故可得,=-而由直线方程的求解可得b=2,把(1,0)代入可得a=-2,比较可得a,故选C.答案:C10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10
5、次和15次试验,并且利用线性回归方法求得回归直线l1和l2,已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:l1与l2都过样本中心点(s,t).答案:A二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11.有下列关系:人的年龄与他(她)拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关
6、系;森林中的同一种树木,其断面直径与高度之间的关系;学生与他(她)的学号之间的关系.其中具有相关关系的是.(填序号)解析:中两个变量之间的关系是确定性关系,不是相关关系.中两个变量之间具有相关关系.答案:12.假设关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料:x/年23456y/万元2.23.85.56.57.0若由资料可知y对x呈线性相关关系,且线性回归方程为x,其中已知=1.23,请估计使用年限为20年时,维修费用约为.解析:由表中数据可知,=4,=5.回归直线一定经过样本点的中心(),5=+1.234,=0.08,线性回归方程为=1.23x+0.0
7、8.故估计使用年限为20年时,维修费用约为y=1.2320+0.08=24.68(万元).答案:24.68万元13.下列是关于男婴与女婴出生时间调查的列联表:晚上白天总计男婴45ab女婴e35c总计98d180那么a=,b=,c=,d=,e=.解析:45+e=98,e=53.e+35=c,c=88.98+d=180,d=82.a+35=d,a=47.45+a=b,b=92.答案:479288825314.为了了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的22列联表:喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050则在犯错误的概率不超过
8、的前提下认为喜爱打篮球与性别有关.(请用百分数表示)解析:由列联表数据可求得随机变量K2的观测值k=8.337.879,则在犯错误的概率不超过0.005的前提下认为“喜爱打篮球与性别有关”.答案:0.5%15.对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm2,则每立方米混凝土的水泥用量最少应为.(精确到0.1 kg)解析:由已知,得0.30x+9.9989.7,解得x265.7.答案:265. 7 k
9、g三、解答题(本大题共5小题,共45分.解答时应写出文字说明、证明过程或演算步骤)16.(8分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650 (1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:能否在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系?并说明理由.分析(1)运用古典概型概率公式求
10、值.(2)求出随机变量,说明关系.解:(1)积极参加班级工作的学生有24人,不太主动参加班级工作且学习积极性一般的学生有19人,总人数为50人,抽到积极参加班级工作的学生的概率为;抽到不太主动参加班级工作且学习积极性一般的学生的概率为(2)k=11.5.k10.828,在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.17.(8分)某个服装店经营某种服装,在某周内获纯利y(单位:元)与该周每天销售这种服装数x(单位:件)之间的一组数据关系见下表:x/件3456789y/元66697381899091已知=280,=45 309,xiyi=3 487.(1)求
11、;(2)判断纯利y(单位:元)与每天销售件数x之间是否线性相关,如果线性相关,求出回归方程.解:(1)=6;(2)画出散点图如图,可知y与x有线性相关关系,设回归直线方程为x+=4.75,-64.7551.36.故回归方程为=4.75x+51.36.18.(9分)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270 (1)估计该地区老年人中需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能
12、否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为=14%.(2)k=9.967.因为9.9676.635,所以在犯错误的概率不超过0.01的前提下,认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机抽样方法
13、更好.19.(10分)对于x与y有如下观测数据:x1825303941424952y356788910(1)作出散点图;(2)对x与y作回归分析;(3)求出y对x的回归方程;(4)根据回归方程,预测当y=20时x的值.解:(1)散点图如图.(2)作相关性检验:(18+25+30+39+41+42+49+52)=37,(3+5+6+7+8+8+9+10)=7,=182+252+302+392+412+422+492+522=11 920,=32+52+62+72+82+82+92+102=428,xiyi=183+255+306+397+418+428+499+5210=2 257,xiyi-8
14、=2 257-8377=185,-8=11 920-8372=968,-8=428-872=36,故r=0.991.由于|r|0.9910.75,因此认为两个变量有很强的线性相关关系.(3)由(2)知,可以用线性回归方程拟合.回归系数=0.191,=7-0.19137=-0.067,故y对x的线性回归方程为=0.191x-0.067.(4)当y=20时,有20=0.191x-0.067,解得x105.因此当y的值为20时,x的值约为105.20.(10分)在关于人的脂肪含量(单位:百分比)和年龄x(单位:岁)的关系的研究中,研究人员获得了一组数据如下表:年龄x/岁232739414549505
15、3545657586061脂肪含量y/%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.分析先作出样本数据的散点图,进而求出回归模型,并依据公式求出R2,进而说明拟合效果.解:(1)散点图如图.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为x+,则由计算器算得0.576,=-0.448,所以线性回归方程为=0.576x-0.448.(2)(yi-)237.78.(yi-)2644.99.R2=1-0.941.R20.941,表明年龄解释了94.1%的脂肪含量变化.(3)当x=37时,=0.57637-0.44820.9,故37岁时人的脂肪含量约为20.9%.