1、高考资源网() 您身边的高考专家32回归分析1.了解回归分析的基本思想2.理解线性回归分析的方法和步骤3.能利用回归分析解决实际问题1回归直线方程及相关量的求法(1)x、y的求法对于n对数据(x1,y1),(x2,y2),(xn,yn),记x,y.(2)及回归系数的求法y(3)回归直线方程:x2相关性检验(1)相关系数相关系数r的计算公式相关系数r的性质()|r|1,()|r|越接近1,线性相关程度越强,()|r|越接近0,线性相关程度越弱(2)假设检验的步骤作统计假设:x与Y不具有线性相关关系根据小概率0.05与n2在附表中查出r的一个临界值r0.05.根据样本相关系数计算公式算出r的值作统
2、计推断如果|r|r0.05,表明有95%的把握认为x与Y之间具有线性相关关系如果|r|r0.05,则没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的1判断(对的打“”,错的打“”)(1)求回归直线方程前可以不进行相关性检验()(2)利用回归直线方程求出的值是准确值()答案:(1)(2)2散点图在回归分析中的作用是()A查找个体个数B比较个体数据大小关系C探究个体分类D粗略判断变量是否相关答案:D3变量x与y之间的回归方程表示()Ax与y之间的函数关系Bx与y之间的不确定性关系Cx与y之间的真实关系形式Dx与y之间的真实关系达到最大限度的吻合答案:D4已知回归直线方程0.75x0.7,则
3、x11时,y的估计值为_答案:8.95求回归直线方程学生用书P46假设关于某设备的使用年限x和所支出的维修费用Y(万元),有如下资料:使用年限x23456维修费用Y2.23.85.56.57.0由散点图(图略)知Y与x是线性相关的,试求(1)回归直线方程x的,;(2)估计使用年限为10年时,维修费用为多少?【解】(1) 4,5,某种产品的广告费支出x与销售额Y(单位:百万元)之间有如下对应数据:x24568Y3040605070(1)画出散点图;(2)求回归直线方程解:(1)散点图如图(2)列出下表,并用科学计算器进行有关计算序号xyx2xy12304602440161603560253004
4、65036300587064560合计252501451 380于是可得:x5,y50.506.5517.5.于是所求的回归直线方程是6.5x17.5.线性回归分析学生用书P47炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间Y(从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:x/(0.01%)104180190177147134150191204121Y/min100200210185155135170205235125(1)Y与x是否具有线性相关关系?(2)如果Y与x具有线性相关关系,求
5、回归直线方程;(3)预测当钢水含碳量为160个0.01%时,应冶炼多少分钟?【解】(1)由已知数据列成下表序号xyx2y2xy110410010 81610 00010 400218020032 40040 00036 000319021036 10044 10039 900417718531 32934 22532 745514715521 60924 02522 785续表613413517 95618 22518 090715017022 50028 90025 500819120536 48142 02539 155920423541 61655 22547 9401012112514
6、 64115 62515 125合计1 5981 720265 448312 350287 640于是x159.8,y172.又查表相应于显著性水平0.05和n2的相关系数临界值r0.050.632.由rr0.05 知,y与x具有线性相关关系(2)设所求的回归直线方程为x,所以已知x与y呈线性相关关系,就无需进行相关性检验,否则要进行相关性检验.进行相关性检验的方法有两种:(1)利用散点图发现线属于相关关系;(2)求回归系数r与r0.05比较,进行判断. 某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:x2468y30405070(1)x与y之间是否具有线性
7、相关关系?若有,求其回归直线方程:(2)若实际销售额不少于50百万元,则原料耗费应该不少于多少?解:(1)画出(x,y)的散点图,如图所示,由图可知x,y有线性关系.1 080,0.982 7.|r|0.982 7r0.050.950,从而有95%的把握认为x与Y之间具有线性相关关系,由公式得回归系数 47.56.5515.故Y对x的回归直线方程为6.5x15.(2)由回归直线方程知,当50,即6.5x1550时,x5.38.故原料耗费应不少于5.38百万元非线性回归分析学生用书P48在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124Y1612521试建立Y与x之间的回归
8、方程【解】由数值表可作散点图如下:根据散点图可知y与x近似地呈反比例函数关系,设y,令t,则ykt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系,列表如下:itiyitiyity141664162562212244144315512540.5210.25450.2510.250.062 517.753694.2521.312 5430所以1.55,7.2. 0.8.所以4.134 4t0.8.所以y与x的回归方程是0.8.非线性回归问题有时并不给出经验公式这时可以画出已知数据的散点图,把它与必修模块数学1中学过的各种
9、函数(幂函数、指数函数、对数函数、logistic模型的“S”形曲线函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决 某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重Y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重Y(kg)20.9226.8631.1138.8547.2555.05(1)试建立Y对x的回归方程;(2)如果体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地
10、区一名身高为175 cm,体重为82 kg的在校男生的体重是否正常?解:(1)根据表中的数据作散点图,如图所示由图可以看出,样本点分布在某条指数函数曲线yc1ec2x的附近,其中c1,c2为待定参数于是令zlny,得到x与z的数据如下表:x60708090100110120130140150160170z1.812.072.302.502.712.863.043.293.443.663.864.01作出散点图如图所示由表中数据可得z对x的回归直线方程0.6930.020x,则e0.6930.020x.故Y对x的回归方程为e0.6930.020x.(2)当x175时,预测平均体重为e0.6930
11、.02017566.22.因为66.221.279.4682,所以这个男生偏胖1相关关系的判断散点图:(1)优点:借助散点图的直观性对两个变量间有无线性相关关系及相关方向作出一个前提判断(2)缺点:散点图具有局限性,不能准确说明变量间的密切程度,且数据较大时,画散点图比较麻烦相关系数:根据公式计算r的值,用r来描述线性相关关系的强弱当|r|越接近于1,相关程度越强;当|r|越接近于0,相关程度越弱2两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型如yc1ec2x,我们可以通过对数变换把指数关系变为线性关系令zlny,则变换后样本点应该分布在
12、直线zabx(alnc1,bc2)的周围1回归直线方程中和的位置易混淆2如果不进行相关性检验,我们仍然可求出x与Y的回归直线方程,但这时的回归直线方程不能保证有实际意义,它也不能反映变量x与Y之间的变化规律,只有在x与Y之间具有相关关系时,求回归直线方程才有实用价值特别是对r不呈线性相关的回归模型,可以通过散点图或求相关系数r首先作出是否线性相关的检验,然后选择恰当的回归模型进行模拟1下列有关线性回归的说法,不正确的是()A变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B在平面直角坐标系中,用描点的方法得到的,表示具有相关关系的两个量的一组数据的图形叫做散点图C线性
13、回归直线方程最能代表观测值x,y之间的关系D任何一组观测值都能得到具有代表意义的回归直线方程解析:选D.只有对两个变量具有线性相关性作出判断时,利用最小二乘法求出线性方程才有意义2对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图如图;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图如图.由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关解析:选C.题图中的数据y随着x的增大而减小,因此变量x与变量y负相关;题图中的数据随着u的增大,v也增大,因此u与v正相关3
14、下面是两个变量的一组数据:x12345678Y1491625364964则x与Y两个变量之间的回归直线方程为_解析:364.5,20425.5,所以回归直线方程为159x.答案:159x 学生用书P83(单独成册)A基础达标1废品率x%和每吨生铁成本Y(元)之间的回归直线方程为2563x,表明()A废品率每增加1%,生铁成本增加259元B废品率每增加1%,生铁成本增加3元C废品率每增加1%,生铁成本平均每吨增加3元D废品率不变,生铁成本为256元解析:选C.回归方程的系数表示x每增加一个单位,平均增加,当x为1时,废品率应为1%,故当废品率增加1%时,生铁成本平均每吨增加3元2给定x与y的一组
15、样本数据,求得相关系数r0.690,则()Ay与x的线性相关性很强By与x的相关性很强Cy与x正相关Dy与x负相关解析:选D.因为r0,所以y与x负相关;又|r|0.75,1才表示y与x具有很强的线性相关性,所以选D.3变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数r2表示变量V与U之间的线性相关系数,则()Ar2r10B0r2r1Cr20r1 Dr2r1解析:选C.对于变量X与Y而言,Y
16、随X的增大而增大,故变量Y与X正相关,即r10;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r20.故r20r1.4若某地财政收入x与支出Y满足回归直线方程ybxae(单位:亿元),其中b0.8,a2,|e|0.5.如果今年该地区财政收入10亿元,则年支出预计不会超过()A10亿元 B9亿元C10.5亿元 D9.5 亿元解析:选C.代入数据y10e,因为|e|0.5,所以9.5y10.5,故不会超过10.5亿元5若施化肥量x与小麦产量Y之间的回归直线方程为2504x,当施化肥量为50 kg时,预计小麦产量为_kg.解析:把x50代入2504x,可求得450 (kg)答案:45
17、0 6为了解社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x/万元8.28.610.011.311.9支出Y/万元6.27.58.08.59.8根据上表可得回归直线方程x,其中0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为_万元解析:因为10,8,0.76,所以80.76100.4,所以回归直线方程为0.76x0.4.把x15代入上式得,0.76150.411.8万元答案:11.87下列有关线性回归的说法,不正确的是_(填序号)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;在平面直角坐标系中用描点的方法得到表
18、示具有相关关系的两个量的一组数据的图形叫做散点图;回归直线方程最能代表观测值x,y之间的关系;任何一组观测值都能得到具有代表意义的回归直线方程解析:只有具有线性相关的一组观测值才能得到具有代表意义的回归直线方程答案:8已知x与Y之间的一组数据如表所示,当m变化时,Y与x的回归直线方程x必过定点_x0123Y135m7m解析:易得,4.因回归直线必过(,),所以当m变化时,Y与x的回归直线方程x必过定点.答案:9某个服装店经营某种服装,在某周内获纯利Y(元)与该周每天销售这种服装件数x之间的一组数据关系见表:x3456789Y66697381899091已知x280,xiyi3 487.(1)求
19、,;(2)已知纯利Y与每天销售件数x线性相关,试求出其回归直线方程解:(1)x6,y.(2)因为Y与x有线性相关关系,4.75,64.7551.36.故回归直线方程为4.75 x51.36.10下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20082014.(1)由折线图看出,可用线性回归模型拟合Y与t的关系,请用相关系数加以说明;(2)建立Y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量解:(1)由折线图中数据和参考数据得r0.99.因为Y与t的相关系数近似为0.99,说明Y与t的线性相关程度相当高,从而
20、可以用线性回归模型拟合Y与t的关系(2)由1.331及(1)得1.3310.10340.92.所以,Y关于t的回归方程为0.920.10t.将2016年对应的t9代入回归方程得0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨B能力提升11下列数据符合的函数模型为()x12345678910Y22.6933.383.63.844.084.24.3A.y2xBy2exCy2e Dy2ln x解析:选D.分别将x值代入解析式判断知满足y2ln x.12某产品的广告支出x(单位:万元)与销售收入Y(单位:万元)之间有如下数据:广告支出x(单位:万元)1234销售收
21、入Y(单位:万元)12284256根据以上数据算得:418.(1)求出Y对x的回归直线方程x,并判断变量Y与x之间是正相关还是负相关;(2)若销售收入最少为144万元,则广告支出费用至少需要投入多少万元?解:(1)由表中数据得:2.5,34.5,所以14.6,b34.514.62.52,所以回归直线方程为14.6x2,且变量Y与x之间是正相关(2)依题意有:14.6x2144,解得x10,所以广告支出费用至少需投入10万元13(选做题)近年来我国电子商务行业迎来蓬勃发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币与此同时,相关管理部门推出了针对电商的商品和服务的评价体
22、系现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次(1)是否有99%的把握,认为商品好评与服务好评有关?(2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率附:2解:(1)由题意可得关于商品和服务评价的22列联表:对服务好评对服务不满意合计对商品好评8040120对商品不满意701080合计15050200211.1116.635,有99%的把握认为商品好评与服务好评有关(2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,则好评的交易次数为3次,不满意的次数为2次,令好评的交易为A,B,C,不满意的交易为a,b,从5次交易中,取出2次的所有取法为(A,B),(A,C),(A,a),(A,b),(B,C),(B,a),(B,b),(C,a),(C,b),(a,b),共计10种情况,其中只有一次好评的情况是(A,a),(A,b),(B,a),(B,b),(C,a),(C,b),共计6种,因此,只有一次好评的概率为.高考资源网版权所有,侵权必究!