摘要:国内生产总值(GDP)是一个国家或地区在一定时期内生产活动的最终成果,是国民经济核算的核心指标,也是衡量一个国家或地区经济状况和发展水平的重要指标。研究GDP可以了解经济增长速度,有助于分析GDP发展的影响因素并且预测GDP未来发展趋势,从而引导经济的增长,为政府在规划经济发展方面提供理论支持。有不少的国内外学者对GDP进行了分析和预测,开展了广泛的研究。从预测模型来看,主要有自回归移动平均模型(ARMA模型)、残差自回归模型等。
关键词:ARMA模型;残差自回归;GDP
- 文献综述
时间序列是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果。时间序列数据本质上反映的是某个或者某些随机变量随时间不断变化的趋势,而时间序列预测方法的核心就是从数据中挖掘出这种规律,并利用其对将来的数据做出估计。
(一)ARIMA模型
ARMA模型(Auto-Regressive and Moving Average Model)是研究时间序列的重要方法,由自回归模型(AR模型)与滑动平均模型(MA模型)为基础“混合”构成,ARAM模型只适用于平稳的时间序列。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。ARIAM模型在经济预测的过程中既考虑了经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对经济运行的短期趋势的预测准确率较高,因此使用ARIMA模型在分析GDP的趋势拟合和预测上具有独特的优势。相关研究成果主要有:安博文、李春玉和刘红卫(2021)对西藏地区1978——2018年的GDP时间序列进行分析研究,对非平稳数据进行平稳化处理后,采用ARMA模型对进行拟合,最后采用拟合效果最佳的ARIMA(4,1,2)模型,并且基于该模型对西藏地区未来十年的GDP进行了预测并对西藏经济发展给出了几点建议;李晴、杨春(2011)对1970——2008年南宁市GDP时间序列进行分析,对原始GDP数据进行差分平稳后,采用AIC准则和SC准则从几个ARMA模型中选出了最优的ARIMA(1,1,0)模型,并且检验了该模型的预测,其预测效果较好基于预测结果对南宁市今后的发展给出了几点建议。董依兰、周艺、范辉(2011)研究江苏省1978年至2006年GDP的发展情况,首先对数据进行单位根检验,来判断GDP序列是否平稳。从单位根检验得出GDP序列非平稳,故对数据进行二阶差分后得到平稳的GDP序列。根据自相关系数图和偏自相关系数图对模型进行定阶,可以对数据建立ARIMA(1,2,1)模型或者ARIMA(2,2,1)模型。对两个模型进行参数估计后,发现ARIMA(2,2,1)模型没有通过显著性检验,而ARIMA(1,2,1)模型通过了显著性检验,因此对GDP数据建立ARIMA(1,2,1)模型。对此模型的残差序列进行检验,发现残差是白噪声。用这个模型对GDP进行预测,从总体来看是较符合的,但残差并没有通过检验,可能是所选取的数据量太少,在考虑滞后期的时候损失了一部分数据,增加了模型的不准确性。魏艳华、王丙参、包丽莉(2019)分析甘肃省1978年至2016年的GDP数据,对数据进行分析后发现数据具有非平稳性和异方差性,故对数据进行了取对数以及差分处理后得到了平稳且方差齐性的数据,通过自相关图以及偏自相关图对模型定阶后构建了ARIMA(1,1,0)模型,并预测了2017-2019年的GDP值,与真实结果比较后发现误差控制在5%内,效果较理想。汪会宝(2008)利用我国1978年至2002年的GDP的年度数据,根据GDP序列特征(发现GDP随时间的增长呈指数趋势)对其做对数处理得到具有线性趋势的对数GDP序列(LnGDP),分别建立非平稳的时间序列组合模型AR(2)和差分后建立平稳的时间序列模型AR(1),通过比较模型的拟合效果和模型的残差检验,AR(1)模型较好,通过预测2003年——2006年的GDP值比较发现AR(2)模型预测更为准确稳定。最后得出结论:AR(2)非平稳时间序列组合模型和AR(1)差分后建立的平稳时间序列模型都有较高的拟合优度,但相比较而言,AR(2)模型的拟合优度更高、预测更加准确稳定,更加适用于GDP的分析与预测。阿卜杜拉·加佐(2021)对约旦1976-2019年期间的GDP采用Box-Jenkins方法,结果显示ARIMA(3,1,1)模型是最优的,并进行未来三年预测,结果显示GDP上升。马利克·穆巴舍尔·哈桑,塔巴苏姆·米尔扎(2021)在对印度1961-2020年GDP数据的分析基础上,对数据进行差分平稳化后,绘制ACF和PACF图对ARIMA模型进行定阶,选定最优的ARIMA(1,2,1),在此模型上对印度2021-2030的GDP进行预测,预测结果显示在95%的置信区间下,印度2030年GDP最差水平和最好的水平,这对政策制定者提供了一定的参考意见。
(二)残差自回归模型
ARIMA模型的提出使人们对非平稳时间序列的拟合精度大大提高,但和传统的确定性因素分解方法相比较,ARIMA模型仍然有一些缺憾,通过差分的方法对数据进行平稳化,差分的方法优点是对确定信息的提取比较充分,缺点是很难对模型进行直观解释。当时间序列具有非常明显的确定性趋势或者季节效应时,人们为了既有确定性因素分解方法对各种确定性效应的解释,又不浪费残差信息,构造了残差自回归模型。残差自回归模型是通过确定性因素分解法,提取序列中的确定性信息:,为确实效应拟合,为季节效应拟合,为残差序列。考虑到确定性因素分解法对信息的提取可能不充分,需要检验残差的自相关性。采用Durbin-Waston检验,如果检验结果显示残差序列的自相关性显著,就需要对残差序列拟合自回归模型提取残差的相关信息,从而提高模型的拟合精度,同时残差自回归模型更易于直观解释GDP序列的波动规律。残差自回归模型综合了确定性分析和随机分析的优点,既能提高拟合精度,又便于直观解释,用于GDP序列的分析与预测,可以取得较好的效果。相关的研究有:刘兆鹏(2020)研究了1979年到2018年的安徽省GDP,对数据进行取对数后消除异方差性,将序列关于变量t建立最小二乘线性回归模型,对残差序列拟合了自相关模型,综合结果分析对GDP对数序列建立残差自回归模型是何时的,模型通过了显著性检验。并且利用该模型对未来3年安徽省GDP进行预测,与真实值进行了比较,模型拟合效果较好,预测精度较高。符晓燕、杨娜娜(2011)运用中国1978年至2008年人均GDP数据建立模型分析预测,通过绘制人均GDP序列的时序图发现该序列非平稳,有指数递增趋势,针对有指数趋势的序列,作者通过取对数的方法消除其数量级,并对数据进行差分后平稳化,对数据建立了ARIMA模型。关于残差最回归模型,对构造两个确定性趋势模型,一是建立因变量关于t的残差自回归模型,二是建立延迟因变量回归模型。作者通过AIC准则和SBC准则比较残差自回归模型与ARIMA模型的优劣,得到ARIMA模型拟合效果最好。这是因为虽然数据通过差分有信息浪费,但只要进行适当次数的差分就能将确定性信息较充分地提取,对模型难以进行直观的解释,但是残差自回归模型虽然可以很好地进行直观解释,对信息提取也很充分,但是拟合精度却并不一定比ARIMA模型高。所以对不同的数据要进行不同的分析,对不同的分析需求也要选择建立不同的模型。如果要解决的问题偏重于对模型的解释,那么残差自回归模型更有优势,如果偏重于拟合精度或预测效果,那么需要对两种模型进行比较选择。魏艳华、王丙参、包丽莉(2019)分析甘肃省1978年至2016年的GDP数据,建立了两个残差自回归模型,分别为:通过观察甘肃省GDP序列的时序图呈现抛物线趋势且没有周期,考虑采取用时间t的幂函数作为自变量建立残差自回归模型,即用拟合趋势效应;用延迟因变量建立回归模型。采用共同的标准——MSE标准,对取对数后建的ARIMA模型和两个残差自回归模型进行选择,用延迟因变量建立的残差自回归模型预测的GDP值误差最小,且仅采用了3个变量,模型简单又能够对数据较好解释。
(三)ARIMAX模型
从许多研究分析预测GDP的论文中,我们可以看到他们用ARIMA模型和残差自回归模型对GDP数据进行了研究,但是没有考虑其他影响GDP的因素。ARIAM模型是对单变量进行分析和预测的经典模型,但实际上,很多序列的变化都会受到其他序列的影响。杜洁、高珊、金欣雪(2020)认为ARIMA等预测模型固然可以对GDP进行研究,却没有考虑其它变量对它的影响,在现实中,全社会固定资产投资总额会对GDP产生一定的影响,如果考虑此因素对GDP的影响,则可以提高模型的预测精度。如果将影响GDP的因素纳入研究范围,就涉及多元时间序列分析,其最典型的模型为ARIMAX模型,即动态回归模型。ARIAMX是一种对多个时间序列进行分析的模型,将对多元回归分析与时间序列有机地结合,提高了模型的预测精度。多元时间序列分析要求各变量是平稳的,否则容易出现虚假回归的情况。当变量不平稳时,1987年恩格尔和格兰杰给出了协整的定义,虽然变量不平稳,但是回归的残差平稳,那么变量间就是协整的,此时不存在虚假回归的问题。
(四)进一步研究的方向
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。