1、西安市用水需求量的多元线性回归预测孙爱民摘要:本文分析了西安市用水需求量的影响因素,选取了 6 个变量,收集了西安市2004 年-2018 年的全年用水总量和 6 个变量的数据建立了用水需求量与 6 个变量的多元线性回归模型。经检验,模型具有较高的拟合优度和整体显著性,但有个别变量的系数的线性显著性较低,为此运用 SPSS 建立了多元线性逐步回归模型。经检验,模型可用来对西安市的用水量进行模拟及预测。最后运用所建立的多元线性逐步回归模型对西安市 2019-2022 全年用水总量进行了预测。Abstract:This paper analyzes the influencing factors
2、of water demand in Xian,selectssix variables,collects the data of total water consumption and six variablesfrom 2004 to 2018 in Xian,and establishes a multiple linear regressionmodel of water demand and six variables.After testing,the model has a highgoodness of fit and overall significance,but the
3、linear significance ofcoefficients with individual variables is low.Therefore,a multiple linearstepwise regression model is established by SPSS.After testing,the modelcan be used to simulate and predict the water consumption of Xian city.Finally,the multi linear step-by-step model is used to predict
4、 the totalwater consumption of Xian in 2019-2022.关键词:用水需求量;多元线性回归;SPSS;预测0引言西安市人均占有水資源仅相当于全国平均的 11.6%,远低于国际平均水平,属于严重缺水型城市。随着国家中心城市的建设,人口的膨胀,经济的进一步增长,对水资源的需求量进一步加大,使得本就用水紧张的矛盾进一步加剧,严重影响了西安市建设国中心城市的进程。为了确保西安市的用水需求量,合理规划分配水资源,为用水量提供参考依据,分析用水需求量的主要影响因素,进而准确预测用水需求量具有重要的现实意义。用水需求量的主要预测方法有多元线性回归模型和多元非线性回归模
5、型、时间序列分析模型、灰色预测模型,神经网络模型等1-6。本文分析了西安市用水需求量的影响因素,选取了 6 个变量,收集了西安市 2004 年-2018 年的全年用水总量和 6 个变量的数据建立了用水需求量与 6 个变量的多元线性回归模型,进而运用 SPSS 建立了多元线性逐步回归模型对西安市 2019-2022 全年用水总量进行预测。1多元线性回归模型1.1 多元线性回归模型原理1.2 多元线性回归模型的检验多元线性回归模型的检验有:拟合优度检验、方程总体的显著性检验和变量的显著性检验。1.2.1 拟合优度检验拟合优度检验主要是检验方程的总体拟合情况,其原理是通过将总离差平方和分解为回归平方
6、和加剩余平方和,进而用回归平方和与总离差平方和的比值即可决定系数的大小,来反映方程的总体拟合情况。1.2.2 方程总体的显著性检验方程总体的显著性检验即检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著。以上模型的参数的估计及检验可通过 SPSS 软件计算。2用水量的多元线性回归模型2.1 变量的选取及数据获取记西安市全年用水总量为 Y,城市人口数量为 X1,地区生产总值为 X2,固定资产投资额为 X3,生产运营用水量 X4,居民家庭用水量 X5,年末供水管道总长度 X6。选取 2004-2018 年的相关数据,见表 1,数据来源于西安市统计年检。2.2 多元线性回归模型分别作出全年
7、用水总量与各影响变量的散点图,见图 1。从图 1 可看出全年用水总量与各影响变量大致呈线性关系趋势,因此可建立全年用水总量与各影响变量的多元线性回归模型。运用 SPSS 进行计算,得模型回归方程为2.2.1 拟合优度检验由 SPSS 运算结果知模型的可决系数 R2=0.988,调整的可决系数 R2=0.980,方程的拟合优度非常高。2.2.2 回归方程的显著性检验由表 2 可知,F=114.232,给定显著性水平=0.05,查表可得临界值 F0.05(6,8)=3.58,FF0.05(6,8),回归方程的总体线性关系显著。2.2.3 回归方程的变量系数的显著性检验SPSS 返回的回归方程的变量
8、系数的显著性 t 检验结果见表 3。给定显著性水平=0.05,查表可得临界值 t0.025(8)=2.3060,由表 3 可知,t4t0.025(8),其余的t 统计量值小于临界值,因此,除过变量 X4 外,其余变量对 Y 的解释作用不显著,需要对自变量进行删减后,重新建立模型。2.3 多元线性逐步回归模型2.3.1 逐步回归方程的拟合优度检验SPSS 返回的可决系数 R2=0.986,调整的可决系数 R2=0.984,方程的拟合优度非常好。2.3.2 逐步回歸方程总体的显著性检验SPSS 返回的逐步回归方程显著性 F 检验结果见表 4。由表 4 可知,F=435.057,给定显著性水平=0.
9、05,查表可得临界值 F0.05(2,12)=3.89,FF0.05(2,12),回归方程的总体线性关系显著。2.3.3 逐步回归方程的变量系数的显著性检验给定显著性水平=0.05,查表可得临界值 t0.025(12)=2.1788,检验统计量的值为t4=11.017,t5=8.101,t4t0.025(12),t5t0.025(12),因此变量 X4,X5 对 Y 的解释作用显著。2.3.4 西安市 2004 年-2018 年全年用水总量的模拟逐步回归方程经过各项检验均符合要求,可用来对西安市的 2004 年-2018 年全年用水总量进行模拟。模拟结果见表 5,拟合曲线图见图 2。由表 5
10、及图 2 可知模拟的效果非常好。3西安市 2019-2022 年全年用水量预测用逐步回归方程(2)来预测 2019 年-2022 年的全年用水量需要知道变量 X4 和变量X5 在 2019 年-2022 的数据。为了得到 2019 年-2022 年的变量 X4 和变量 X5 的数据,需要分别建立变量 X4、X5 和时间的拟合方程。记 2004 年的时间 t=1,则 2004 年-2018 年对应 t 的值从 t=1 到 t=15。以时间为横轴,表 1 中变量 X4、X5 的数据为纵轴,分别作出变量 X4、X5 和时间的曲线图,如图 3 所示。分别计算(3)、(4)在 t=16,t=17,t=1
11、8,t=19 的值,得变量 X4,X5 在预测年份的值,进而由(1)式计算出全年用水量 Y 在预测年份的值,计算结果见表 6。由表 6 看出,2019-2022 年西安市全年用水总量预测值依次为 95940 万立方米、106130 万立方米、117080 万立方米、128800 万立方米。4结束语本文通过构建多元线性逐步回归模型对西安市 2019 年-2022 年全年的用水总量进行了预测。根据预测结果,到 2022 年西安市的全年用水总量将达到 128800 万立方米,为此西安市应进一步优化水资源配置,防止供水紧张,确保西安市经济社会发展的需要。参考文献:1张雄,党志良,张贤洪,马丁.城市用水
12、量预测模型综合研究J.水资源与水工程学报,2005,16(4):24-28.2周鹏飞,卢泽雨.基于 SPSS 多元线性回归模型在城市用水量的预测J.水利科技与经济,2018,24(5):6-10.3刘治学,张鑫,王颖华.包头市市区居民生活用水量预测分析J.水资源与水工程学报,2012,23(5):67-70.4谢敏萍,王志良,王得利.基于灰关联分析的多元线性回归模型在城市年需水量预测中的应用J.华北水利水电学院学报,2007,28(6):10-12.5孙丽芹,常安定,位龙虎,等.基于 GM(1,1)一逐步回归模型的用水量预测J.统计与决策,2016(20):95-97.6黄胜.灰色系统与多元逐步回归耦合模型J.节水灌溉,2007(5):38-40.
Copyright@ 2020-2024 m.ketangku.com网站版权所有