1、 类型1线性回归分析【例1】一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:零件数X(个)102030405060708090100加工时间Y(分钟)626875818995102108115122(1)Y与X是否具有线性相关关系?(2)如果Y与X具有线性相关关系,求出线性回归方程参考数据:55,91.7,x38 500,y87 777,xiyi55 950思路点拨对变量进行相关性检验,可用公式r计算r的值,当|r|越接近于1时,说明两个变量具有越强的线性相关关系解(1)r0.999 8,Y与X具有较强的线性相关关系(2)设所求的线性回归方程为Yb
2、Xa,则0.668,91.70.6685554.96所以所求的线性回归方程为Y0.668X54.96判断两个变量是否线性相关有两种方法:一是画出“散点图”;二是计算相关系数r的值.值得注意的是,在求回归直线之前,要先判断它们是否线性相关,否则求出的回归直线可能毫无意义.跟进训练1已知X与Y有如下五组数据,X123510Y105422试分析X与Y之间是否具有线性相关关系若有,求出回归直线方程;若没有,说明理由解作出散点图,如图所示,由散点图可以看出,X与Y不具有线性相关关系 类型2可线性化的回归分析【例2】在一次抽样调查中测得样本的5个样本点,数值如下表:X0.250.5124Y1612521试
3、建立Y与X之间的回归方程思路点拨先确定拟合函数模型,再利用公式求出回归方程解由数值表可作散点图如下根据散点图可知y与x近似地呈反比例函数关系,设y,令t,则ykt,原数据变为t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系列表如下itiyitiyity141664162562212244144315512540.5210.25450.2510.250.062517.753694.2521.312 5430所以1.55,7.2所以4.134 4y0.8所以y0.84.134 4t所以Y对X的回归方程是Y0.8利用线性回归拟合曲线的一般
4、步骤(1)绘制散点图,根据样本点的分布,选择接近的、合适的曲线类型.(2)进行变量替换yf(y),xg(x).使变换后的两个变量呈线性相关关系.(3)按最小二乘法原理求线性回归方程.(4)将线性化方程转换为关于原始变量X,Y的回归方程.跟进训练2在平炉炼钢中,由于矿石与炉气中的氧气作用,铁水的总含量不断下降,现测得含碳量Y(百分比)与熔化时间X(小时)的关系,如下表:熔化时间X5.05.25.45.65.86.0含碳量Y(百分比)9.737.466.044.352.742.06熔化时间X6.26.46.66.87含碳量Y(百分比)1.480.980.570.410.25(1)画出散点图;(2)
5、求回归方程解(1)散点图如下(2)可以看出含碳量Y(百分比)与熔化时间X(小时)的散点图并不分布在一条直线周围,因此,不宜用线性回归方程来拟合它根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线ymenx的周围,其中m,n是待定参数,令zln y,则表中的数据变为:时间x5.05.25.45.65.86.0zln y2.2752.0101.7981.4701.0080.723时间x6.26.46.66.87.0zln y0.3920.0200.5620.8921.386得z1.845x11.69,即ln y1.845x11.69,回归方程为Ye1.845X11.69 类型3独立性检验的
6、基本方法【例3】某市对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材情况教龄支持新教材支持旧教材总计教龄在15年以上的教师122537教龄在15年以下的教师102434总计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?思路点拨根据独立性检验思想,由公式计算出2,然后与临界值比较得出结论解由公式得20.08由23.841,则有95%的把握认为“X与Y有关系”;若22.706,则有90%的把握认为“X与Y有关系”;如果23.841,2x3.841,解得x10.24,为整数,若有95%的把握认为是否喜欢韩剧和性别有关,则男生至
7、少有12人(2)没有充分的证据显示是否喜欢韩剧和性别有关,则22.706,由2x2.706,解得x7.216,为整数,若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人【例】下图是我国2013年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图注:年份代码17分别对应年份20132019(1)由折线图看出,可用线性回归模型拟合Y与T的关系,请用相关系数加以说明;(2)建立Y关于T的回归方程(系数精确到0.01),预测2021年我国生活垃圾无害化处理量附注:参考数据:yi9.32,tiyi40.17,0.55,2.646参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式
8、分别为,思路点拨解(1)由折线图中数据和附注中参考数据得4,(ti)228,0.55,(ti)(yi)tiyiyi40.1749.322.89,r0.99因为Y与T的相关系数近似为0.99,说明Y与T的线性相关程度相当高,从而可以用线性回归模型拟合Y与T的关系(2)由1.331及(1)得0.10,1.3310.1040.93所以Y关于T的回归方程为Y0.930.10T将2021年对应的t9代入回归方程得y0.930.1091.83 所以预测2021年我国生活垃圾无害化处理量将约为1.83亿吨在两个变量的回归分析中要注意以下两点:(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.素养提升练某校一个课外学习小组为研究某作物种子的发芽率Y和温度X(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率Y和温度X的回归方程类型的是()AYabXBYabX2CYabeXDYabln XD散点图中点的分布形状与对数函数的图象类似,故选D
Copyright@ 2020-2024 m.ketangku.com网站版权所有