1、10-3相关关系、回归分析与独立性检验基础巩固强化1.(文)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.10x200 B.10x200C.10x200 D.10x200答案A解析由于销售量y与销售价格x成负相关,故x的系数应为负,排除B、D;又当x10时,A中y100,C中y300显然C不合实际,故排除C,选A.(理)(2012湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归
2、直线过样本点的中心(,)C若该大学某女生身高增加1cm,则其体重约增加0.85kgD若该大学某女生身高为170cm,则可断定其体重必为58.79kg答案D解析本题考查线性回归方程D项中身高为170cm时,体重“约为”58.79,而不是“确定”,回归方程只能作出“估计”,而非确定“线性”关系2(2012东北三校模拟)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算27.069,则所得到的统计学结论是:有()的把握认为“学生性别与支持活动有关系”()A0.1% B1%C99% D99.9%附:P(2k0)0.1000.0500.0250
3、.0100.001k02.7063.8415.0246.63510.828答案C解析由题意得,从给出的附表中可得P(26.635)0.010,又7.069(6.635,10.828),所以有99%的把握性认为学生性别与支持该活动有关系,故选C.3(2012新课标全国,3)在一组样本数据(x1,y1)、(x2,y2)、(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1 B0C. D1答案D解析样本相关系数越接近1,相关性越强,现在所有的样本点都在直线yx1上,样本的相关系数应为1.要注意理
4、清相关系数的大小与相关性强弱的关系4(2012广州市检测)某中学高三从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则xy的值为()A.7B8C9D10答案B解析由茎叶图得,甲班学生的平均分是85,解得x5.因为乙班学生成绩的中位数是83,故只有80y83,解得y3.所以xy8.故选B.5(文)(2011山东文,8)某产品的广告费用x与销售额y的统计数据如下表 广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A6
5、3.6万元 B65.5万元C67.7万元 D72.0万元答案B解析此题必须明确回归直线方程过定点(,)易求得3.5,42,则将(3.5,42)代入x中得:429.43.5,即9.1,则9.4x9.1,所以当广告费用为6万元时销售额为9.469.165.5万元(理)(2012石家庄市二模)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x(cm)160165170175180体重y(kg)6366707274根据上表可得回归直线方程0.56x,据此模型预报身高为172cm的高三男生的体重为()A70.09kg B70.12kgC70.55kg D71.05kg答案B解析170,6
6、9.回归直线过点(,),将点(170,69)代入0.56x中得26.2,回归直线方程0.56x26.2,代入x172cm,则其体重为70.12kg.6(2011山东烟台一模、江西吉安质检)下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(t)与相应的生产能耗y(t)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为0.7x0.35,那么表中t的值为()A3 B3.15C3.5 D4.5答案A解析样本中心点是(,),即(4.5,)因为回归直线过该点,所以0.74.50.35,解得t3.7(2011合肥模拟)已知x、y之间的一组数据如下表:x
7、13678y12345对于表中数据,甲、乙两同学给出的拟合直线分别为l1:yx1与l2:yx,利用最小二乘法判断拟合程度更好的直线是_(填l1或l2)答案l2解析用yx1作为拟合直线时,所得y值与y的实际值的差的平方和为s1;用yx作为拟合直线时,所得y值与y的实际值的差的平方和为s2.s2s,物理成绩更稳定(2)由于x与y之间具有线性相关关系,根据回归系数公式得到0.5,1000.510050,回归直线方程为0.5x50.当y115时,x130,即该生物理成绩达到115分时,他的数学成绩大约为130分建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高.能力拓展提
8、升11.(2012东北三校联考)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用22列联表进行独立性检验,经计算27.069,则所得到的统计学结论是:有()的把握认为“学生性别与是否支持该活动有关系”P(2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A0.1% B1%C99% D99.9%答案C解析因为7.069与附表中的6.635最接近,所以得到的统计学结论是:有10.0100.9999%的把握认为“学生性别与是否支持该活动有关系”,选C.12下列说法:将一组数据中的每个数据都加上或减去同一个常
9、数后,方差恒不变;设有一个回归方程为35x,变量x增加一个单位时,y平均增加5个单位;线性相关系数r和相关指数R2都是描述线性相关强度的量,r和R2越大,相关强度越强在一个22列联表中,计算得213.079,则有99%的把握确认这两个变量间有关系其中错误的个数是()A0B1C2D3本题可以参考独立性检验临界值表:P(2k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828答案C解析方差反映的是波动大小的量,故正确;中由于52.706,
10、所以有90%的把握认为“成绩优秀”与教学方式有关16(文)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程bxa,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?(注:b,ab)解析(1)散点图如图(2)由表中数据得iyi52.5,3.5,3.5,54,b0.7.a1.05.0.7x1.05.回归直线如图所示(3)将x10代入回归直线方程得,y0.7101.058.05(小时),预测加工10个零件需要
11、8.05小时(理)(2012河南新乡、许昌、平顶山调研)在某医学实验中,某实验小组为了分析某药物用药量与血液中某种抗体水平的关系,选取六只实验动物进行血检,得到如下资料:动物编号123456用药量x(单位)134568抗体指标y(单位)3.43.73.84.04.24.3记s为抗体指标标准差,若抗体指标落在(s,s)内,则称该动物为有效动物,否则称为无效动物研究方案规定先从六只动物中选取两只,用剩下的四只动物的数据求线性回归方程,再对被选取的两只动物数据进行检验(1)求选取的两只动物都是有效动物的概率;(2)若选取的是编号为1和6的两只动物,且利用剩余四只动物的数据求出y关于x的线性回归方程为
12、0.17xa,试求出a的值;(3)若根据回归方程估计出的1号和6号动物抗体指标数据与检验结果误差都不超过抗体指标标准差,则认为得到的线性回归方程是可靠的试判断(2)中所得线性回归方程是否可靠参考公式:样本数据x1,x2,xn的标准差:S,其中为样本平均数解析(1)3.9,s0.31.故1、6号为无效动物,2、3、4、5号为有效动物记从六只动物中选取两只为事件A.所有可能结果为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15种满足题意的有(2,3),(2,4),
13、(2,5),(3,4),(3,5),(4,5)共6种故P(A).(2)对于2、3、4、5号动物,4.5,3.925,代入0.17xa得a3.16.(3)由0.17x3.16得13.33,64.52.误差e10.07,e60.22,均比标准差s0.31小,故(2)中回归方程可靠1(2011济南模拟)对于回归分析,下列说法错误的是()A在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B线性相关系数可以是正的或负的C回归分析中,如果r1,说明x与y之间完全线性相关D样本相关系数r(1,1)答案D解析相关系数|r|1,D错2(2012湖北武汉市训练)已知一个样本容量为10的样本
14、数据,它们组成一个公差不为0的等差数列an,若a38,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A13,12 B13,13C12,13 D13,14答案B解析设数列an的公差为d,由a1,a3,a7成等比数列,得aa1a7,则82(82d)(84d),解得d0(舍去)或d2.故a1a32d4,ana1(n1)d2n2.故此样本数据的平均数为13,中位数为13.3有甲、乙两个班级进行数学考试,按照大于等于85分的优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正
15、确的是()参考公式:2附表:P(2k)0.0500.0100.001k3.8416.63510.828A.列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”答案C解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项A、B错误根据列联表中的数据,得到K26.1093.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确4某市居民20052009年家庭年平均收入x(单位:万元)与年平均支出
16、Y(单位:万元)的统计资料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系答案13正解析找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,年平均收入增多时,年平均支出也增多,因此两者正相关5考察黄烟经过药物处理跟发生青花病的关系,得到如下数据,在试验的470珠黄烟中,经过药物处理的黄烟有25珠发生青花病,60株没有发生青花病未经过药物处理的有185株发生青花病,200
17、株没有发生青花病,试推断药物处理跟发生青花病是否有关系解析由已知得到下表经药物处理未经药物处理合计患青花病25185210无青花病60200260合计85385470根据公式k29.788.由于9.7887.879,所以我们有99.5%的把握认为经过药物处理跟发生青花病是有关系的6(2011湖南六校联考)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x()1011131286就诊人数y(人)22252926161
18、2该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程bxa;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b,ab.)解析将6组数据按月份顺序编号为1,2,3,4,5,6,从中任取两组数据,基本事件构成的集合为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)中共15个基本事件,设抽到相邻两个月的事件为A,则A(1,2),(2,3),(3,4),(4,5),(5,6)中共5个基本事件,P(A).(2)由表中数据求得11,24,由参考公式可得b,再由ab求得a,所以y关于x的线性回归方程为x.(3)当x10时,|22|2;同样,当x6时,|12|2.所以,该小组所得线性回归方程是理想的版权所有:高考资源网()