基于时间序列ARIMA模型预测股价指数外文翻译资料

 2022-12-12 05:12

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


基于时间序列ARIMA模型预测股价指数

Paulo Rotela Junior,Fernando LuizRiecirc;raSalomon,Edson de Oliveira Pamplona

Itajuba联邦大学生产工程与管理学院,Itajuba,巴西

电子邮件:paulo.rotela@gmail.com,fer.salomon@hotmail.com,pamplona@unifei.edu.br

2014年10月10日收到; 修订于2014年11月1日; 于2014年11月15日接受

版权所有copy;2014作者和科学研究出版社

本作品根据知识共享署名国际许可协议(CC BY)许可。

http://creativecommons.org/licenses/by/4.0/

摘要

由于影响金融市场行为变量的相对不确定性,巴西股市指数(Ibovespa指数)未来的变化预测被认为是一项困难的任务。本文旨在探讨基于ARIMA模型的时间序列来预测Ibovespa指数。所采用的研究方法是数学建模和Box-Jenkins法。为了与其他平滑模型比较结果,我们引入评价参数MAPE(平均绝对百分比误差)。结果显示该模型的MAPE值最小,因此更适合。这表明,ARIMA模型可以用于时间序列指数相关的股票市场指标预测。

关键词:ARIMA模型,时间序列,MAPA指数,Ibovespa指数

1.简介

近几十年的经济危机市场和由此产生的金融损失表明,金融机构和投资者迫切需要改善他们的模型来衡量和预测市场所暴露的风险。相比于其他应用,股权投资成为一个伟大的选择,尤其是在很长的时间里[1]。马科维茨的[2]天才研究证明了由个资产组成的投资组合风险小于每个资产风险的加权总和,这不仅仅是指盈利能力,是给出了风险与回报之间的关系为正相关关系,这很有力地奠定了投资组合选择的基础。随着夏普[3]和Fama[4]的现代金融理论研究中,本研究中结合考虑了一个有效的预期收益风险关系。

本文旨在探讨用ARIMA模型对时间序列股市指数的预测,并利用MAPE(平均绝对误差百分比)的大小来判断它和其它模型的好坏。模型使用从1995年1月到2013年1月的月股市报价历史数据。该模型还用于比较单指数平滑和双指数平滑。

本文的结构如下:在第二节中,回顾预测。在第三节中,研究方法显示。在第四节中,分析历史数据的股市指数,对数据进行转化,在得到所有检查结果的基础上进行必要的调整和MAPE值的计算。在第五节中,写出研究结论。

2..预测

需求预测有两种主要的方法:定性方法和定量方法。定性和定量两种方法相结合是最接近理想预测要求的方法[5]

定性方法主要有:面板数据分析法、德尔菲法、情景规划法、训练猜测法、执行委员会共识法、销售调查法、历史分析法和市场调研法[5]-[8]

定量方法是基于历史数据(时间序列),且假设过去的结果与预测的未来是相关的[7]。经典的时间序列方法有:移动平均法、指数调整法、线性趋势法和非线性趋势法。这些方法要求序列是平稳的,即均值和协方差之间的周期是恒定的。在此背景下,平稳序列的AR(自回归)和ARMA(自回归移动平均)模型是最适合的,因为它们的预测更可靠[9]

时间序列的另一个关键影响因素是季节性的存在,即是一个振荡或干扰发生在不到一年的定期间隔内的一系列序列。根据Bacci[8],计量的ARIMA模型可以描述两类过程:线性平稳过程和线性齐次非平稳过程。而且,平稳线性过程基本上采用三种模型:自回归模型AR(p),移动平均模型MA(q),自回归移动平均模型ARMA(p,q). 非齐次平稳线性过程是假设该系列是非平稳的水平或着是存在斜率的[10]。根据Pindyck和Rubinfeld [11],为了得到平稳序列,也所谓齐次序,我们不得不将原序列进行差分。

一些平稳随机过程(正向平均随时间变化)的序列可以用混合自回归模型和移动平均模型ARMA建模。makridakis,wheelwrigt和hyndman叙述了时间序列取决于参数p,q.。这个过程是等式(1):

对于所示的过程(1),固定参数总和应小于1[11]。根据Pindyck, Rubinfeld [11] 和 Fava [13], 观察到一个或多个不同的时间的非平稳序列可以转化为平稳序列。数据的第一微分方程(2):

注意:

观察序列 Y在周期T内没有分化的序列;

观察序列 Y在周期T-1内没有分化的序列;

在周期T里,序列首次差分为序列

序列以下面的方式区别:第二个数据变为第一个数据,第三变为第二数据,依次内推。随着这个过程,不同序列经过一次差分后,序列将比原序列少一个观察值个观察值。数据的二次差分可以用方程(3)来表示:

根据Bacci[8],分化一次或者分化一次将会得到新数列。

差分数据序列得到如下:第二观测值减第一观测值变为第一数据,第三观测值减第二观测值作为第二个值,依次内推。

二次差分后的序列与原序列比只有个观察值。因此,一个序列经过一次或几次差分后得到平稳序列,就可以建立ARMA(p,q)模型。根据Pindyck和Rubinfeld [11],最初的序列是(p,d,q)阶自回归过程,综合移动平均(MA),由方程给出(4):

注意:            

,d为序列经过差分的次数得到平稳序列 

 自回归算子    

 移动平均算子

运算符B是每次应用于变量yt上的一个时间延迟。

一个ARIMA模型的构建是基于下列阶段[10]周期:识别一个将要分析的一般类模型;一 个 general class of models which will be analyzed;详述自相关分析的模型规范,规 范 , partial autocorrelations and other criteria;偏自相关函数和其他标准;模型参数估计;调整模型验证, which is done by means of residual analysis to measure its suitability to carry out the forecast;通过残差分析来衡量其是否适合进行预测;如果模型是是 not suitable, the cycle repeats from the identification of the model.不适合的,重复周期从模型的识别。

3.材料和方法

根据Bertrand和Fransoo [14],这项研究可以作为有类别的应用,它具有描述性经验目标,因为研究人员有兴趣创建一个可能充分描述存在于现实中因果关系的模型,从而导致对当前过程的理解,从而促进对实际过程的理解。它是一个用于定量的数学建模研究方法。 图1显示了Box-Jenkins方法[15]

最初,使用Economatica软件进行数据收集,收集了2000年1月至2012年12月的每月收盘价指数(Bovespa)。

4.结果分析

使用Minitab 16统计软件绘制所获得的值,用于如图2所示的数据的初始评估。

可以看出,数据不是固定的,并且系列呈现从一个周期到另一个周期的变化。通过分析表明需要对生成图3的数据进行对数变换。图4和图5显示了ACF(自相关)和PACF(部分自相关)变换的时间序列。

ACF(自相关)和PACF(部分自相关)的结果表明AR(1)模型ARIMA(0,2,1)模型可用于预测本模型,如表1和表2所示。

之后进行Log Bovespa指数和自相关和偏自相关转换的残差的验证,通过它证明在序列残差之间不存在自相关,这使得能够利用两者来预测序列的行为,如图6-9所示。 

图1. Box-Jenkins方法。 资料来源:Makridakis,Wheelwright and McGee [1]

图2.绘制Ibovespa时间序列

表1. AR(1)模型的系数统计

系数

系数标准误差

T统计量

P值

AR(1)

0.9996

0.0006

1697.01

0.000

表2. Box-Pierce修正(Ljung-Box)的卡方统计

图3. Ibovespa时间序列的对数图

图4.对数Ibovespa的ACF

图5.对数Ibovespa的PACF

图6.残差图

图7.残差检验图

图8.残差的自相关图

图9.残差的偏自相关图

下一步是实现测试以验证模型的准确性。最初,该模型用于预测10个月前的系列的几 个时期,试图比较这些时期之间的MAPE,如图所示在图10和图11中。 

使用该指标(MAPE)来评价模型,因为这测量绝对平均值,即百分比误差的总和,其中序列数据值在整个时间内经历改变,这会影响误差的大小。误差作为该观察的百分比,减少了由序列值的变化引起的影响,允许比较不同值的观察值之间的误差。使用误差的值除以观察值,变换误差作为该观察的百分比,减少了由系列值的变化引起的影响,允许比较不同值的观察值之间的误差。

在五个不同时期提前10个月的预测测试显示,在所有模型中,误差在第二个周期之后趋于增加,明显影响平均误差。 这个事实可能是由于一个模型的选择导致的,因为第二个周期的误差较低。 这个发现可能是有效的,如果预测用于在中期做出决定,其中预测几个时期将决定要采取的行动,而在短期内难以改变。

在财务时间序列的情况下,预测的重大变化可以在几分钟内,最糟糕的可能会是好几天,立即做出决定和更正,需要通过采取对策,甚至重新平衡投资组合,重新定位策略,通过完全消除某些在短时间内将受到影响甚至整个投资策略的位置。

图10.基于50个月,预测的10个点

图11. 基于上个月,预测10个点

因此,在选择本研究的情况下,提前一个月进行预测。 在分析的各种模型中,这种预测模型是最好的,具有最低的MAPE。 因此,为避免仅使用该序列的周期,分析由五个周期组成的一步前进的ASM,其评估这些周期中的每一个的预测,其是从这些误差的总和的绝对百分比平均构建的MAPE 。

表3示出了通过使用四个AR(1)模型,单指数平滑,双指数平滑和ARIMA(0,2,1)获得的MAPE的比较。 观察发现AR(1)模型的MAPE与其他选项相比,能够使用它。

5.结论

通过获得的结果,观察到模型在其预测中是有效的。 修改Box-Pierce(Ljung-Box)的AR(1)模型系数和卡方统计的统计数据证明了这一事实。

它获得0.052%的MAPE(平均绝对误差百分比),其值低于其它模型进行预测的值。

本研究试图获得下个月的短期预测(向前一步),以便尽量减少预测误差。 该模型可以被认为足以预测Bovespa指数系列,并且可以用作决策机制的辅助。

表3. MAPE表(绝对平均百分比误差)

AR(1)

单指数平滑

双指数平滑

ARIMA(0,2,1)

MAPE

0.052%

0.086%

0.118%

0.064%

致谢

作者想对巴西机构CNPq(国家技术和科学发展委员会),CAPES(研究生联邦机构)和FAPEMIG(米纳斯吉拉斯州的科学促进基金会)表示感谢,这些机构有 一直支持以不同方式和时期开展的这项工作。

参考文献

[1] Rotela, J.P., Pamplona, E.O. and Salomon, F.R. (2014) Otimizaccedil;atilde;o de Portfoacute;lios: Anaacute;lise de Eficiecirc;ncia. RAE—Revista de Administraccedil;atilde;o de Empresas, 54, 405-413.

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。