1、社会消费品零售总额预测刘娜摘要:现运用 ARIMA 模型、BP 神经网络模型以及构建的组合预测模型,对 1985-2018年我国社会消费品零售总额进行分析。研究发现预测误差平方和倒数模型预测为最优模型,预测精度高达 98.65%,预测结果显示 2019-2021 年我国社会消费品零售总额分别为405106.5653、426571.6308、446393.2806 亿元,总体呈现增长趋势。关键词:社会消费品零售总额;ARIMA 模型;BP 神经网络模型;组合预测中图分类号:F740文献标识码:A文章编号:1005-913X(2020)05-0036-03社会消费品零售总额是指企业或者单位,通过交
2、易售给个人、社会集团,非生产、非经营用的实物商品金额,以及提供餐饮服务所取得的收入金额。2018 年我国社会消费品零售总额 380 986.9 亿元,相比 2017 年增长 4.2%,截止 2019 年 12 月,全国社会消费品零售总额同比增长 8.0%。社会消费品零售总额大小直观地反映居民消费水平以及零售业经济发展状况,其精准分析与预测对于有关部门相关政策的制定以及重大事件决策具有一定的参考价值。一、模型介绍(一)ARIMA 模型理论ARIMA 模型又称单整自回归移动平均模型,属时间序列短期预测分析方法之一。时间序列分析主要是根据已有的历史数据对未来年份进行预测。本文采用图示法和单位根检验相
3、结合检验;数据平稳化处理,对于非平稳并且含指数趋势的时间序列,需先取对再进行差分处理;模型建立,确定参数跑(p,d,q)建立时间序列模型;模型检验,做残差检验诊断残差序列是否为白噪声序列;模型预测,使用 R 中的 forecast 包对拟合的 ARIMA(p,d,q)模型进行预测。(二)BP 神经网络模型理论BP 神经网络是一种多层前馈神经网络,它是模仿人类大脑神经元的一种模型,它的运行路线是信号向前传递,误差则是反向传递。在向前传递时,将数据录入到输入层,经过隐含层的处理,经输出层输出。如果输出结果不是期望值,则进入反向传递过程,通过不断地调整权值和阈值从而进一步优化输出值,使其接近或等于期
4、望值。BP 神经网络分为训练和测试两个过程,训练过程是让模型具有记忆和预测的能力。神经网络流程如图 1 所示,其中为 X 输入值,Y 为预测值,W 为权值。(三)ARIMA 与 BP 神经网络组合模型单个预测模型在预测的过程中不可避免的会出现误差,组合模型的建立能够有效减少误差。其基本思想就是充分利用单个预测方法所包含的独立的信息,对单个模型的预测结果进行加权处理。等权法:通过给需要组合的各个模型结果,给予相同的权重。等权法可以有效避免精度大权重小、精度小权重大,并且计算简单操作方便。预测误差平方和倒数法:预测模型误差平方和越小,表明该项预测模型的精度越高,它在组合模型中的重要性越高,公式如下
5、,其中 Dj 为第 j 个模型的误差平方和:误差方差均方倒数法:它是对预测误差平方和法的改进两者原理基本一样其公式如下,其中 Ej 为第 j 个模型的误差方差:预测精度,其中 Ei 是相对误差:二、实证分析本研究数据来自国家统计局官网公布的 1985-2018 年社会消费品零售总额数据。文章保留 2016-2018 年的数据作为检验模型数据,1985-2015 各年数据作为样本数据,所用软件为 Matlab 2016a 和 R 软件 3.6.2。(一)建立 ARIMA 模型预测1.模型建立平穩的时间序列是建立时间序列模型的基础,如果时间序列图像有明显的趋势性或者规律性,此时序列平稳,反之则非平
6、稳。如图 2 所示为 1985 至 2015 年社会消费品零售总额时间序列图,从图中可知在 1985-2010 年有上升趋势但是总体较为平缓。而 2010 年之后则以十分明显的呈指数趋势上升,序列不平稳。取对后的数据,消除了指数上升趋势,但其序列仍然不平稳,对于非平稳的数据进一步做差分处理,利用 R 软件中的 ndiffs()函数可知需进行二阶差分处理,结果如图 3 所示,序列在某一常数附近上下波动,并无明显上升或者下降趋势,此时序列平稳可以建立模型。图示判断简单直观,但往往带有一定的主观性,基于此本文采用 ADF 检验法,对时间序列平稳性进行检验。用 R 软件做单位根检验,结果显示 p-va
7、lue=0.01 0.05,不能拒绝原假设认为模型显著有效。对保留的 2016-2018 年数据进行模型验证,模型预测结果显示 2016-2018 年我国社会消费品零售总额分别为 333041.30、365877.90、399543.50 亿元,同实际值相比,预测误差的方差 2.82%,预测精度 97.18%,说明模型预测效果较为可靠,ARIMA(0,2,0)可以拟合模型。(二)建立 BP 神经网络模型进行预测1.数据预处理现将 1985-2015 年社会消费品零售总额指标作为输入,将 2019-2021 年社会消费品零售总额指标作为输出。对于原始数据进行预处理,能够将模型拟合的精度提高,为了
8、让网络快速收敛,本文所选的是 S 型函数,归一化公式如下:2.模型訓练输入输出层的设计,本文采用含有一个隐含层的单输出的 BP 网络建立预测模型。目前,对于隐含层中神经元数目的确定目前并没有明确的公式,本文在选取隐含层神经元个数时,采用学者通常采用的经验公式:l=+a,其中 n 为输入层中神经元的个数,m 为输出层中神经元的个数,a 为 1-10 之间的常数。根据公式(1.14)可以计算出神经元个数在2-11 个之间,经过大量反复试验,本文最终选取隐含层神经元个数为 4。根据社会消费品零售总额的数据特征,本文选择输入层为 2,输出层为 1,即构建一个输入层、隐含层、输出层节点数为 2-4-1
9、的三层网络结构。本文选择 S 型函数作为隐含层神经元的激励函数,将用来训练样本的数据先进行归一化处理,归一化后输入网络,并且设定网络参数,网络迭代次数 epochs=5000 次,期望误差 goal=0.00065,学习速率 lr=0.0354,设定完参数后开始训练网络。3.模型预测通过网络训练,得到 2016-2018 预测值分别为 329667.20、350160.87、367478.81 亿元。经计算,实际值与预测值相对误差为 2.92%,预测精度为 96.71%,预测误差的方差3.29%,结果在可接受范围内,但是比 ARIMA 模型预测精度低了 0.47%。(三)ARIMA 模型与 B
10、P 神经网络模型预测为了充分利用两种模型各自的优势,对于 ARIMA 模型、BP 网络模型分别提取不同数据信息,数据的线性部分由 ARIMA 模型提取,非线性部分由神经网络提取。其基本思想就是对 ARIMA 模型、BP 神经网络模型通过科学赋权重的方法,给定两个模型不同的权重,通过加权计算得出最终的预测结果。常见的确定权重的方法众多,但是符合本文数据特征的方法有:等权法、预测误差平方和倒数法、误差方差均方倒数法。误差方差均方倒数模型:根据公式(1.10),利用 EXCEL 计算得知,给定 ARIMA、BP网络分别 0.409、0.591 的权重,依据误差方差均方倒数模型,对预测 2016-20
11、18 年数据进行拟合,计算预测相对误差计算结果如表 1 所示,从结果看出等权法的预测误差的方差为 1.54%,预测精度为 98.46%,比 ARIMA 模型的预测精度高了 1.28%,比 BP 网络模型预测精度提高了 1.75%,拟合情况较好。等权组合预测模型:给定 ARIMA 和 BP 神经网络分别相同的权重得到组合模型,再根据组合模型对 2016-2018 年数据进行预测,计算预测相对误差如表 2 所示,从结果看出等权法的预测误差的方差为 1.36%,通过公式计算预测精度为 98.64%,相比于误差方差均方倒数模型预测精度提高了 0.18%,拟合情况更优。预测误差平方和倒数模型:根据公式(
12、1.9)借助 EXCEL 计算得知,ARIMA 和 BP 神经网络权重分别为 0.578、0.422,利用得到的组合模型预测结果如表 3 所示,从结果看出预测误差平方和倒数法的预测误差的方差为 1.35%比其他模型都小,预测精度提高到98.65%。对模型进行组合时权重计算方式的不同会导致其组合模型精度也不同,所以在对单一模型进行组合时要结合数据本身的特征且从不同方面考虑其得到最优模型。根据对比几种预测模型的预测精度以及预测误差方差的大小,得到本文最优的组合模型为预测误差平方和倒数模型,几种模型具体对比结果如下表。表 4 几种模型分析结果模型 预测精度 预测误差的方差 ARIMA 模型 97.1
13、8%2.82%BP 神经网络模型 96.71%3.29%误差方差均方倒数模型 98.46%1.54%等权组合预测模型 98.64%1.36%预测误差平方和倒数模型 98.65%1.35%3.基于组合模型预测文章借助最优拟合模型预测误差平方和倒数模型,对 2019-2021 年我国社会消费品零售总额进行预测,2019-2021 年社会消费品零售总额分别为 405106.5653、426571.6308、446393.2806 亿元,我国社会消费品零售总额在不断增长。三、结论本文运用预测误差平方和倒数模型进行预测,预测误差较小、精度较高、拟合情况较好,预测结果显示,2019-2021 年我国社会消
14、费品零售总额有增长趋势,鉴于文章是根据历史数据做预测,对于外生不可抗因素的干扰无法应对。参考文献:1 李庭辉,许涤龙.基于匹配性的社会消费品零售总额数据质量评估研究J.统计与决策,2012(8):24-27.2 吕艳丽,陈兵建.基于 ARMA 模型的城乡居民收入差距分析与预测以甘肃为例J.区域经济,2017(2):204-206.3 肖学培.季节性 ARIMA 模型对社会消费品零售总额的建模和预报J.经济研究,2019(4):63-65.4 王冬冬.基于 ARIMA 和 BP 神经网络模型的重庆市 GDP 实证分析D.桂林:广西师范大学,2019.5 刘海萍,王海涛,王洪利,等.基于 BP 神经网络的 CPI 预测模型J.山东交通学院学报,2009,17(3):83-86.6 崔 博.神经网络在 GDP 预测中的应用J.信息技术,2011(2):103-105.7 桂 梅,刘莲花.基于 ARIMA 模型对海南省社会消费品零售总额的预测J.2017,2(3).责任编辑:庞 林