ARIMA模型与人工神经网络模型在股价预测中的比较
作者:Ayodele Ariyo Adebiyi, Aderemi Oluyinka Adewumi, and Charles Korede Ayo
国籍:South Africa,South Africa,Nigeria
出处:Hindawi Publishing Corporation
Journal of Applied Mathematics
Volume 2014, Article ID 614342, 7 pages
http://dx.doi.org/10.1155/2014/614342
中文译文:
本文以纽约证券交易所公布的股票数据为样本,检验了ARIMA和人工神经网络模型的预测性能。实验结果表明,神经网络模型优于ARIMA模型。研究结果进一步解决和阐明了文献中关于神经网络和ARIMA模型优越性。
- 引言
近年来,人们利用各种求解技术对股票的预测进行了研究。其中突出的技术可分为两大类,即统计技术和软计算技术。统计技术包括指数平滑、自回归综合移动平均(ARIMA)和广义自回归条件异方差(GARCH)波动率[1]。ARIMA模型,也称为Box-Jenkins模型或方法论,通常用于分析和预测。它被认为是社会科学中最有效的预测技术,并被广泛应用于时间序列数据的研究。ARIMA在时间序列预测中的应用对于不确定性是必不可少的,因为它不像其他方法那样可以假设任何潜在模型或关系。ARIMA基本上依赖于时间序列的过去值以及以前的误差项进行预测[2,3]。然而,相对于较复杂的结构模型而言,ARIMA模型相对而言更为稳健和有效[3]。
人工神经网络(ANN)作为一种软计算技术,在社会、工程、经济、商业、金融、外汇和股票等许多领域都是最精确和最广泛应用的预测模型[4–8]。由于人工神经网络的几个显著特点吸引了研究人员和工业从业者,其被广泛运用。如文献[4]所述,人工神经网络是一种数据驱动的自适应方法,具有很少的先验假设。它们也是一个很好的预测者,能够从原始数据中获得的结果中进行一般性的观察,从而允许正确推断种群的潜在部分。此外,神经网络是通用的逼近器,因为网络可以有效地将连续函数逼近到所需的精度水平。最后,人工神经网络在解决包括现实世界中的非线性问题时非常有效[4]。这与许多传统的时间序列预测技术(如ARIMA)形成了对比,ARIMA假设时间序列是由线性过程生成的,因此可能不适用于大多数非线性的实际问题[5,6]。人们越来越需要解决高度非线性、时变的问题,因为许多应用程序(如股票市场)都是非线性的,具有随时间变化的不确定行为[7,8]。众所周知,人工神经网络为各种传统的时间序列模型(如ARIMA模型)提供了具有竞争力的结果[4,9–11]。本文以股票预测为例,研究和比较了ANN和ARIMA模型的性能,进一步阐明和证实了文献中关于两种模型的相对性能和优越性。
论文的其余部分组织如下:第二节对ARIMA和ANN模型比较的相关工作进行了系统介绍,第三节概述了本文所用的方法。第四节展示和讨论了本文的实验结果,第五节给出了结论。
- 相关工作
人们对于如何有效地预测股票价格的研究是非常深入的。部分原因是问题的动态性以及需要更好的结果。Tansel等人[12]基于建模精度、方便性和计算时间,比较了线性优化、人工神经网络和遗传算法(GAs)在时间序列数据建模中的性能。研究表明,如果仔细选择参数边界和分辨率,线性优化技术给出的估计最好,而神经网络给出的估计最差。文献[13]中还比较了ARIMA模型和ANN模型对韩国股票价格指数的预测性能。ARIMA模型通常比bp神经网络(BPNN)模型提供更准确的预测。这对于中期预测水平更为明显。Merh等人[14]对印度股市趋势预测的ANN和ARIMA混合方法进行了比较,许多实例表明ARIMA预测值优于ANN预测值与实际股价的关系。Sterba和Hilovska[15]认为ARIMA模型和ANN模型在许多实际应用中取得了很好的预测性能,特别是在时间序列预测中。实验结果进一步表明,ARIMA模型对线性时间序列的预测效果较好,而人工神经网络对非线性时间序列的预测效果较好。在文献[16]中报道的一项类似的财务预测研究中,ANN模型在价值预测方面的表现优于ARIMA模型,而ARIMA模型在方向预测方面的表现优于ANN。
Yao等人[17]比较了ANN和ARIMA模型的股票预测性能,结果表明,与传统的ARIMA模型相比,ANN模型获得了更好的收益,Hansen等人[18]比较了ANN和ARIMA对时间序列预测的预测性能,表明ANN在预测股票运动方向方面优于ARIMA,因为后者能够检测到所用数据中的隐藏模式。Prybutok等人[19]还比较了ANN和ARIMA模型在预测日最大臭氧浓度方面的预测性能。实证结果也表明,人工神经网络模型优于ARIMA模型。Wijaya等人[20]基于印度尼西亚证券交易所进行了类似的比较,与ARIMA模型相比,ANN获得了更好的精度。更多的文献表明,人工神经网络是股票价格预测的有效工具[10,21–29]。这使得人工神经网络成为预测时间序列运动的一种很有前途的技术或潜在的混合方法。
然而,对于ARIMA模型和ANN模型在时间序列预测中的相对性能和优越性,尤其是对于不同的数据使用,文献中的观点不尽相同;因此,有必要进行进一步的研究,以便就更好的方法论达成一致的看法。因此,本文试图进一步阐明文献中关于人工神经网络模型与ARIMA模型的相对性能和优越性。研究结果基于纽约证券交易所(NYSE)的时间序列股票预测实证研究。
- 方法介绍
本研究采用的研究方法总结如下。本文使用了纽约证券交易所在ARIMA和ANN模型上发布的股票数据。分别使用EViews软件和Matlab第7版神经网络工具箱对ARIMA和ANN模型进行建模。
-
- 输入数据
本研究所使用的数据为历史日股价。股票数据包括开盘价、低价、高价、收盘价和成交量。开盘价是指指数在交易日开始时的开盘价,低价代表交易日的最低点,高价代表交易日的最高点,收盘价代表市场收盘时的点。因为收盘价反映了当天指数的所有活动,所以我们选择收盘价来代表要建模和预测的指数价格。
3.2 ARIMA(p,d,q) 由戴尔公司的股价模型开发而来。本文使用了戴尔公司1988年8月17日至2011年2月25日期间的股票数据,共有5680次观察。据观察,指数时间序列的原始模式并非平稳的。时间序列具有随机游走模式,并且随机变化,没有观察到全球趋势或季节性模式。
相关图用于确定特定序列是平稳的还是非平稳的。通常,平稳时间序列会给出一个自相关函数(ACF),该函数在零滞后时从其单位初始值迅速衰减。在非平稳时间序列的情况下,ACF随着时间的推移逐渐消失。我们观察到,戴尔股票指数的时间序列相关图是非平稳的,因为ACF的下降非常缓慢。用差分法使非平稳时间序列变为平稳时间序列。差分(d)的值由对时间序列执行差分的次数确定。
为了建立戴尔股票指数的最佳ARIMA模型,必须有效地确定自回归(p)和移动平均(q)参数。为了确定最佳模型,我们设置了如下标准(也在表1中描述):相对较小的贝叶斯信息标准(BIC)和回归标准误差(SER),相对较高的调整R2。根据Q统计量和相关图显示,残差的ACF和偏自相关函数(PACF)中没有明显的模式,这意味着所选模型的残差是白噪声。
表2显示了ARIMA模型中的不同参数。如表1所示,ARIMA(1,0,0)被认为是戴尔股票指数的最佳选择。
表1:Dell指数收盘时的ARIMA(1,0,0)估计输出
因变量:关闭 |
||||
方法:最小二乘法 |
||||
日期:2011年3月21日时间:15:54 |
||||
样本(调整):8/18/1988–2/25/2011 |
||||
纳入观察:调整后5679 |
||||
4次迭代后收敛 |
||||
Variable |
Coefficient |
Standard error |
t-statistic |
Prob. |
C |
34.11484 |
6.028238 |
5.659173 |
0.0000 |
AR(1) |
0.994802 |
0.001346 |
739.1456 |
0.0000 |
R-squared |
0.989716 |
Mean dependent variable |
33.91262 |
|
Adjusted R-squared |
0.989714 |
S.D. dependent variable |
23.28046 |
|
S.E. of regression |
2.361101 |
Akaike info criterion |
4.556485 |
|
Sum squared residual |
31648.13 |
Schwarz criterion |
4.558825 |
|
Log likelihood |
minus;12936.14 |
F-statistic |
546336.2 |
|
Durbin-Watson static |
2.015870 |
Prob. (F-statistic) |
0.000000 |
|
Inverted AR roots |
0.99 |
表2:戴尔股票指数不同ARIMA参数的统计结果
ARIMA |
BIC |
Adjusted R2 |
SER |
(1,0,0) |
4.5588 |
0.9897 |
2.3611 |
(1,0,1) |
4.5602 |
0.9897 |
2.3612 |
(2,0,0) |
5.2389 |
0.9796 |
3.3174 |
(0,0,1) |
7.8883 |
0.7127 |
12.4770 |
(0,0,2) |
7.9369 |
0.6984 |
12.7839 |
(1,1,0) |
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料 资料编号:[595702],资料为PDF文档或Word文档,PDF文档可免费转换为Word |
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。