1、题组层级快练(八十七)1(2014湖北理)根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为bxa,则()Aa0,b0Ba0,b0Ca0 Da0,b0答案B解析根据题中表内数据画出散点图(图略),由散点图可知b0,选B.2下列有关样本相关系数的说法不正确的是()A相关系数用来衡量变量x与y之间的线性相关程度B|r|1,且|r|越接近于1,相关程度越大C|r|1,且|r|越接近0,相关程度越小D|r|1,且|r|越接近1,相关程度越小答案D3甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙
2、丁r0.820.780.690.85m115106124103则哪位同学的试验结果体现A、B两变量更强的线性相关性?()A甲 B乙C丙 D丁答案D解析r0且丁最接近1,残差平方和越小,相关性越高,故选D.4设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D
3、解析D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.8517085.7158.79 kg.故D不正确5下面是一个22列联表y1y2总计x1a2173x2222547合计b46120其中a,b处填的值分别为()A9472 B5250C5274 D7452答案C解析由a2173,得a52,a22b,得b74.故选C.6在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A若K2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病B由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能
4、患肺病C若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D以上三种说法都不正确答案C7下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归方程35x,变量x增加一个单位时,y平均增加5个单位;线性回归方程x必过(,);在一个22列联表中,由计算得K2的观测值k13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系其中错误的个数是()A0 B1C2 D3本题可以参考独立性检验临界值表P(K2k)0.50.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3
5、232.0722.7063.8415.0246.6357.87910.828答案B解析只有错误,应该是y平均减少5个单位8为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下22列联表:理科文科合计男131023女72027合计203050已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844,则认为选修文科与性别有关系出错的可能性约为_答案5%解析由K2的观测值k4.8443.841,故认为选修文科与性别有关系出错的可能性约为5%.9某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到
6、的数据(如下表),由最小二乘法求得回归方程 0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为_答案68解析由已知可计算求出30,而线性回归方程必过点(,),则0.673054.975,设模糊数字为a,则75,计算得a68.10(2014安徽文)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得
7、到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估计该校学生每周平均体育运动时间超过4小时的概率(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879附:K2.答案(1)90(2)0.75(3)有95%的把握思路(1)根据抽样比计算分层抽样中应抽取的人数;(2)利用对立事件或互斥事
8、件的概率公式求运动时间超过4小时的概率;(3)根据K2的计算公式求解解析(1)30090,所以应收集90位女生的样本数据(2)由频率分布直方图得12(0.0250.100)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时
9、16560225总计21090300结合列联表可算得K24.7623.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”11(2013重庆文)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为x.答案(1)0.3x0.4(2)x与y正相关(
10、3)约为1.7千元解析(1)由题意知n10,i8,i2,又n2720108280,iyin 184108224,由此得b0.3,ab20.380.4,故所求回归方程为0.3x0.4.(2)由于变量y的值随x的值增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄约为y0.370.41.7千元12(2015河北邯郸一模)为了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:患心肺疾病不患心肺疾病合计大于40岁16小于等于40岁12合计40已知在全部的40人中随机抽取1人,抽到不患心肺疾病的概率为.(1)请将22列联表补充完整;(2)已知大于
11、40岁患心肺疾病市民中,经检查其中有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出两名,记需住院治疗的人数为,求的分布列和数学期望;(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?下面的临界值表供参考:P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(参考公式:K2,其中nabcd)答案(1)略(2)(3)能判定解析(1)患心肺疾病不患心肺疾病合计大于40岁16420小于等于40岁81220合计241640(2)可以取0,1,2,P(0),P(1),P(
12、2),故的分布列为012PE()012.(3)K26.6676.735,所以在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关13(2014江南十校)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人陈老师采用A,B两种不同的教学方式分别在甲、乙两个班进行教改实验为了了解教学效果,期末考试后,陈老师对甲、乙两个班级的学生成绩进行统计分析,画出频率分布直方图(如下图)记成绩不低于90分者为“成绩优秀”(1)从乙班随机抽取2名学生的成绩,记“成绩优秀”的个数为,求的分布列和数学期望;(2)根据频率分布直方图填写下面22列联表,并判断能否在犯错误的概率不超过0.05的前
13、提下认为:“成绩优秀”与教学方式有关.甲班(A方式)乙班(B方式)总计成绩优秀成绩不优秀总计附:K2.P(K2k)0.250.150.100.050.025k1.3232.0722.7063.8415.024答案(1)(2)能判定解析(1)由频率分布直方图可得乙班“成绩优秀”的人数为4,的可能值为0,1,2.P(0),P(1),P(2).故的分布列为012P所以E()012.(2)由频率分布直方图可得,甲班成绩优秀、成绩不优秀的人数分别为12,38,乙班成绩优秀、成绩不优秀的人数分别为4,46.甲班(A方式)乙班(B方式)总计成绩优秀12416成绩不优秀384684总计5050100根据列联表
14、中数据,K2的观测值k4.762.由于4.7623.841,所以在犯错误的概率不超过0.05的前提下认为:“成绩优秀”与教学方式有关1设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()Ab与r的符号相同Ba与r的符号相同Cb与r的符号相反 Da与r的符号相反答案A2(2014石家庄市二模)2013年国内物价持续上涨,某著名纺织集团为了降低生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数
15、据如下表所示:日期10月1日10月2日10月3日10月4日10月5日价格x(元)99.51010.511销售量y(万件)1110865已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:3.2xa,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格为()A14.2元B10.8元C14.8元 D10.2元答案D解析依题意(99.51010.511)10,(1110865)8.因为线性回归直线必过样本中心点(,),所以83.210a,解得a40.所以回归直线方程为3.2x40.令7.36,则7.363.2x40,解得x10.2.所以该产品的价格为10.2元3某车间为了规定
16、工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程bxa,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b,ab )答案(1)略(2)0.7x1.05(3)8.05小时解析(1)散点图如图(2)由表中数据得xiyi52.5,3.5,3.5,x54.b0.7,a1.05.0.7x1.05.回归直线图略(3)将x10代入回归直线方程,得0.7101.058.05(小时)预测加工10个零件需要8.05小时4实验测得
17、四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.x1B.x2C.2x1 D.x1答案A解析画出散点图,四点都在直线x1.5两个相关变量满足如下关系:x1015202530y1 0031 0051 0101 0111 014则两变量的回归方程为()A.0.56x997.4 B.0.63x231.2C.0.56x501.4 D.60.4x400.7答案A解析回归直线经过样本中心点(20,1 008.6),经检验只有选项A符合题意6变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量
18、U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10 B0r2r1Cr200;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,所以有r20r1.故选C.7(2014沧州七校联考)某单位为了制定节能减排的计划,随机统计了某4天的用电量y(单位:度)与当天气温x(单位:),并制作了对照表(如表所示)由表中数据,得线性回归方程2xa,当某天的气温为5时,预测当天的用电量约为_度.x1813101y24343864答案70解析气温的平均值(
19、1813101)10,用电量的平均值(24343864)40,因为回归直线必经过点(,),将其代入线性回归方程得40210a,解得a60,故回归方程为2x60.当x5时,2(5)6070.所以当某天的气温为5时,预测当天的用电量约为70度8在一次考试中,5名同学的数学、物理成绩如下表所示:学生A1A2A3A4A5数学(x分)8991939597物理(y分)8789899293(1)根据表中数据,求物理分y对数学分x的回归方程;(2)要从4名数学成绩在90分以上的同学中选出2名参加一项活动,以X表示选中的同学中物理成绩高于90分的人数,求随机变量X的分布列及数学期望E(X)附:回归方程x中, ,
20、其中,为样本平均数解析(1)93,90,(xi)2(4)2(2)202224240,(xi)(yi)(4)(3)(2)(1)0(1)224330.0.75, 20.25.故物理分y对数学分x的回归方程为0.75x20.25.(2)随机变量X的所有可能取值为0,1,2.P(X0),P(X1),P(X2).故X的分布列为X012PE(X)0121.9(2013福建文)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁
21、)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如下图所示的频率分布直方图(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K2k)0.1000.0500.0100.001k2.7063.8416.63510.828附:K2.答案(1)(2)没有90%的把握认为“生产能手与工人所在的
22、年龄组有关”解析(1)由已知,得样本中有25周岁以上组工人60名,25周岁以下组工人40名所以样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053人,记为A1,A2,A3;25周岁以下组工人有400.052人,记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)故所求的概率P.(2)由频率分布直方图,可知在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515人,“25周岁以下组”中的生产能手有400.37515人,据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K21.79.因为1.792.706,故在犯错误的概率不超过0.10的前提下认为两个学校的数学成绩有差异