1、第三章检测(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1下列散点图中,变量x,y不具有相关关系的是()解析由相关性的定义可知D项错误.答案D 2下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程y=3-5x,变量x增加一个单位时,y平均增加5个单位;线性回归方程y=bx+a必过();在一个22列联表中,由计算得2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是()A.0B.1C.2D.3本题可以参考独立性检验临界值表P(2k0)0.50.40
2、0.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.5357.87910.828解析将一组数据中的每个数据都加上或减去同一个常数后,每个数与平均数的差值不变,因而方差恒不变,故正确;根据回归方程可知当x增加一个单位时,y平均减少5个单位,故错误;线性回归方程必过样本中心(),故正确;因为2=13.079,所以两个变量间有关系的犯错的概率不超过0.01,所以有99%的把握确认这两个变量间有关系,故正确.因此错误的只有.答案B3工人月工资y(单位:元)与劳动生产率x(单位:千元)变化的线性回归方程为y
3、=90x+60,下列说法中正确的是()A.劳动生产率每提高1 000元,月工资提高150元左右B.劳动生产率每提高1 000元,月工资提高90元左右C.劳动生产率为1 000元时,月工资提高90元D.以上说法都不正确解析由线性回归方程得到的预报值并不一定是预报变量的精确值,而是预报变量可能取值的平均值,因此当劳动生产率每提高1 000元,月工资提高90元左右.故选B.答案B4某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.收集到的数据如下表,由最小二乘法求得回归直线方程y=0.67x+54.9.零件数x/个1020304050加工时间y/min62758189表中有一
4、个数据模糊不清,请你推断出该数据的值为()A.66B.67C.68D.69解析设遮住部分的数据为m,=30,由y=0.67x+54.9恒过(),得=0.6730+54.9=75,所以=75,故m=68.答案C5某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是()A.y=2x-2B.y=C.y=log2xD.y= (x2-1)解析画出散点图或代入数据检验,D最接近.答案D6分类变量X和Y的列联表如下,则()y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c
5、+dA.ad-bc越小,说明X与Y的关系越弱B.ad-bc越大,说明X与Y的关系越强C.(ad-bc)2越大,说明X与Y的关系越强D.(ad-bc)2越接近于0,说明X与Y的关系越强解析2=(其中n=a+b+c+d),若(ad-bc)2越大,则2越大,说明X与Y的关系越强.答案C7某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为() 患心脏病情况秃发情况患心脏病无心脏病秃发20300不秃发5450A.0.1B.0.05C.0.01D.0.99解析2=15.9686.635,有99%以上的
6、把握认为秃发与患心脏病有关.故出错的可能性为1%=0.01.答案C8在研究色盲与性别的关系调查中,调查了男性50人,其中有20人患色盲,调查的60个女性中15人患色盲,则变量2的值约为()A.1.60B.2.83C.2.712D.6.004解析根据题目所给出的数据可得,2=2.83.答案B9设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析当b0时,两变量正相关,此时r0;当b0时,两变量负相关,此时r0,b0B.a0,b0C.a0D.a0,b
7、0解析由样本数据可知y值总体上是随x值的增大而减少的.故b0.故选B.答案B11已知x与y之间的几组数据如下表:x1245y0235假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=bx+a,则以下结论正确的是()A.bb,aaB.bb,ab,aaD.ba解析因为=3,所以b=1.1,a=2.5-1.13=-0.8,y=1.1x-0.8,而b=2,a=-2,所以ba.答案D12经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间x与数学成绩y进行数据收集如下:x
8、1516181922y10298115115120由表中样本数据求得回归方程为y=bx+a,则点(a,b)与直线x+18y=100的位置关系是()A.点在直线左侧B.点在直线右侧C.点在直线上D.无法确定解析由y=bx+a,得y=b+a.又因为a=-b,所以y=b-b,故回归直线过点(),而样本数据的中心为(18,110),在直线y=bx+a上,则a+18b=110100,所以点(a,b)在直线右侧.答案B二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中的横线上)13由数据(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)得出的线性回归方程y=a+bx必
9、经过的定点是以上点中的.解析易知,线性回归方程y=a+bx必经过定点(),而根据计算可知这几个点中满足条件的是(3,3.6).答案(3,3.6)14为了判断学生选修文科是否与性别有关,现随机抽取50名学生,得到如下22列联表:理科文科男1310女720已知P(23.841)0.05,P(25.024)0.025.根据表中数据,得到2=4.844.则认为选修文科与性别有关联的把握度是.解析24.8443.841,至少有95%的把握认为是否选修文科与性别有关.答案95%15某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:读书健身总计女243155男82634总计3257
10、89在犯错误的概率不超过的前提下性别与休闲方式有关系.解析由列联表中的数据,得2的值为2=3.6892.706,因此,在犯错误的概率不超过0.10的前提下认为性别与休闲方式有关系.答案0.1016某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:序号科研费用支出xi利润yixiyi1531155252114044012134301201645341702553257596220404合计301801 000200则利润y对科研费用支出x的线性回归方程为.解析设回归直线方程为y=a+bx.b=2,a=-b=30-25=20.故回归直线方程为y=2x
11、+20.答案y=2x+20三、解答题(本大题共6小题,共70分.解答时应写出文字说明、证明过程或演算步骤)17(10分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi=80,yi=20,xiyi=184,=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,b=,a=-b,其中为样本平均值.线性回归方程也可写为y=bx+a.解(1)由题意知n=10,xi=8,yi=2,又lxx
12、=-n=720-1082=80,lxy=xiyi-n=184-1082=24,由此得b=0.3,a=-b=2-0.38=-0.4,故所求回归方程为y=0.3x-0.4.(2)因为变量y的值随x的值增加而增加(b=0.30),所以x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.37-0.4=1.7(千元).18(12分)某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列22列联表:主食蔬菜主食肉类合计50岁以下50岁
13、以上合计(2)能否有99%的把握认为其亲属的饮食习惯与年龄有关?解(1)22列联表如下表:主食蔬菜主食肉类合计50岁以下481250岁以上16218合计201030(2)因为2=106.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关.19(12分)对某小学的小学生进行心理障碍测试得到如下列联表:焦虑说谎懒惰总计女生5101530男生20105080总计252065110试说明这三种心理障碍中哪一种最有可能与性别有关系.解对于焦虑、说谎、懒惰分别构造三个随机变量,由表中数据可得,0.8633.841;1.410r0.05,所以y与x有线性相关关系.(2)由(1)得,b=0.728 6,
14、a=-b=8.25-0.728 612.5=-0.857 5.故y=0.728 6x-0.857 5.(3)要使y10,即0.728 6x-0.857 510,所以x14.901 9.所以机器的转速应控制在14.901 9转/秒以下.21(12分)下表是某年美国旧轿车价格的调查资料:使用年数x12345678910平均价格y/美元2 6511 9431 4941 087765538484290226204试建立y与x之间的回归方程.解作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系,与已学函数图像比较,用y=ebx+a来刻画题中模型更为合理,令z
15、=ln y,则z=bx+a,题中数据变成如下表所示:x12345z7.8837.5727.3096.9916.640x678910z6.2886.1825.6705.4215.318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可用线性回归方程拟合.由表中数据可得r-0.996,故认为x与z之间具有线性相关关系,由表中数据得b-0.298,a8.165,所以z=-0.298x+8.165,最后回代z=ln y,y=e-0.298x+8.165即为所求.22(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否
16、与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图.25周岁以上组25周岁以下组(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附
17、:2=P(2k0)0.1000.0500.0100.001k02.7063.8416.63510.828解(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.05=3(人),记为A1,A2,A3;25周岁以下组工人有400.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手600.25=15(人),“25周岁以下组”中的生产能手400.375=15(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得2=1.79.因为1.792.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.