英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
基于模糊神经的时间序列预测建模方法
Hung-Wen Peng, Shen-Fu Wu, Chia-Ching Wei, Shie-Jue Lee
Department of Electrical Engineering, National Sun Yat-Sen University, Kaohsiung 804, Taiwan
【摘要】时间序列预测是基于先前等距间隔时间点观测的未来值的预测。其统计方法在过去几十年的预测中得到了广泛的应用。最近,机器学习技术已经引起人们的关注,基于这些技术的可利用的预测系统已经研制成功。在本文中,我们提出了一种基于模糊神经建模的时间序列预测。给定预测序列,序列的局部域位于所观察到的数据的一系列中。选择适当的滞后相关变量,并提取训练模式。基于提取的训练模式,构造一套TSK模糊规则,并采用混合学习算法改进规则中涉及的参数。然后,改进的模糊规则可以用于预测。我们的方法有几个优点。它可以产生自适应预测模型,适用于单变量和多变量预测,也适用于单步以及多步预测。一些实验已经证明了所提出的方法的有效性。
【关键词】时间序列预测;模糊神经建模;TSK模糊规则;学习算法;训练模式
1.介绍
时间序列预测关注的是未来的预测值的基础上的时间序列的先前观察到的数据。它在决策过程中发挥了重要作用。如金融领域的各种电源,医疗。一个例子是使用先前收集的数据来预测股票指数或收盘价[ 1 - 9 ]。另一个例子是预测电力需求,以避免产生额外的电力[ 10 - 13 ]。如果预测是一个时间步到未来,这是所谓的单步或一步预测。预测也可以做两个或两个以上的时间步长。在这种情况下,它被称为多步预测[ 14 - 17 ]。
两种方法已被用于构建时间序列预测模型。全局建模方法构建了一个独立的模型进行预测。对于时间序列预测,环境的条件可能会随着时间的推移而变化。一个全局性的模型是不适用的,因此精度变差。局部模型的局部建模方法[ 19,18 ]构建依赖于目标进行预测,因此是自适应。本地模型的特点通常是通过使用一个在接近的预测序列附近的小的值。时间序列预测的另一个问题是确定滞后参与模型,滞后对预测精度有较大影响。例如,在炼钢工程[20,21],当材料加入炉,在经过两到八个小时的后,炉内温度将改变。这表明有两到八小时的温度变化的时间滞后。此外,滞后可能会随着时间的推移而变化,需要调整他们[ 22 ]。
两种策略,直接[ 23 ]和迭代[ 24 ],传统上采用构建多步时间序列预测模型。它们之间的区别在于将先前步骤的预测纳入当前步骤的预测。这些策略各有利弊。由于累积误差,迭代预测模型可能导致预测精度低。另一方面,直接预测模型只能获得给定步骤的估计值。然而,所有给定的步骤的估计值,可以应用迭代模型获得。值得注意的是,一些研究工作已经提供了一些新的建模策略,多步时间序列预测。例如,一个智能和自适应建模策略被提出,采用一种基于PSO的启发式算法来创建灵活的划分与不同大小的预测视野下的多输入多输出(MISMO)策略。
最近,机器学习技术已经引起人们的注意和基于可利用的预测系统的技术已经开发[ 25 ]。多层感知器,通常简单地称为神经网络,是一种流行的网络架构,用于时间序列预测[ 26 - 31 ]。神经网络在训练过程中会遇到局部极小问题,而且隐含层节点数目难以确定。此外,很难为人类理解或调查提供一个可理解的表达方式。K最近邻回归方法是一种非参数方法,根据其预测的K最近邻的对象去预测[ 18,32 ]。然而,它缺乏适应能力和所采取的距离措施可能会影响预测性能。模糊理论被应用在股票市场预测中 [2,3,5,6,33,7,8,34]。然而,确定隶属函数通常是一个具有挑战性任务。此外,没有学习提供的模糊理论。支持向量回归提供了高精度的时间序列预测[ 35,12,9,13,16 ]。它避免了局部最小值。然而,求解二次规划问题的计算负担重。同时选择核函数和参数可能是一个不容易的任务。为了克服这些困难,采用最小二乘支持向量回归[18]和多核框架[36]。模糊神经建模是一种混合的方法,它利用模糊理论和神经网络学习技术,用于模拟输入与输出之间复杂的关系[5,37,38,32]。然而,自动导出适当的模糊规则集和有效地改进相关参数是两个挑战。
本文中,我们提出了一种基于模糊神经的时间序列预测模型。给定一个预测序列,序列的局部域位于一系列观测数据。采用考虑数据趋势的距离度量。选择适当的滞后变量预测和选取训练模式。基于所选取的训练模式,采用增量聚类算法自动构造一组TSK模糊规则。模糊规则中所涉及的参数,通过一个采用最小二乘法和梯度下降法的高效混合学习算法改进。改进的模糊规则构成的预测模型可以用于预测。开发直接和迭代预测模型,我们的方法有几个优点。它可以产生自适应预测模型。它适用于单变量和多变量预测。它也适用于单步以及多步预测。采用模糊神经建模的方法,是因为它结合了模糊理论和神经网络的思想,提供了良好的性能,如算法效率高、收敛速度快、和精度高。此外,其规则是人们可以理解的。
本文的其余部分组织如下。第2节描述要解决的问题。第3节简要介绍了所采用的神经模糊建模技术。我们所提出的方法在第4节概述。第5节描述了从一系列观察到的数据中提取训练模式的过程。第6节描述了从训练模式中得出预测模型的过程。第7节给出了一个小实例。实验结果列在第8节。最后,结束语在第9节中给出。
2.时间序列预测问题
考虑一系列实测观测值[39]:
X0,Y0,X1,Y1,...,Xt,Yt (1)
在等间隔的时间点t0,t0 t,T0 2t,...一些过程,Yi表示在时间点t0 i t输出变量的值(或因变量),Xi 表示m个附加变量(或自变量)的值,m ge; 0,在时间点t0 i t观察。时间序列预测是在未来的时间t s, i.e.,Yt s估计y的值,通过
=G(Xtminus;q,Ytminus;q,...,Xtminus;1,Ytminus;1,Xt,Yt) (2)
s ge; 1是预测的范围,G是预测函数或预测模型,Ytminus;i 是Yt的第i个滞后量,Xtminus;i 是Xt的第i 个滞后量,q是预测的滞后区间。对于s = 1,它被称为单步预测。对于s=1,它被称为多步预测。此外,如果m= 0,它是单变量预测;否则,它是多变量预测。
为了简便,
Q = Xtminus;q , Ytminus;q , . . ., Xtminus;1, Ytminus;1, Xt , Yt (3)
被称为预测Yt s的预测序列。
Yt s的预测可以看作是一个函数逼近的任务。通常采用两种策略[23,24]构建预测模型。
bull; 直接,通过训练 Xtminus;q, Ytminus;q, . . ., Xtminus;1, Ytminus;1, Xt, Yt 直接预测Yt s ,对于任何sge;1。
bull; 迭代,通过训练仅预测 Yt 1,从而迭代得到Yt s ,对于任何sge;1。
这些方法在s=1的情况下一致,然而,对于sgt;1的情况下,多变量预测的迭代方法不能使用,由于在这种情况下Xt 1, . . ., Xt s-1不能连续的获得, . . ., 。
3.神经模糊建模
神经模糊建模派生出一个基于观察到的一组训练输入输出数据的未知的系统模型。派生模型由一组模糊规则组成,即给定一定的输入量,可以通过模糊推理来预测系统的输出。在本文中,我们在[40]采用了神经模糊建模技术。建模过程中涉及到模糊规则的创建和模糊规则的细化两个阶段。在第一阶段,一组模糊规则是从给定的训练模式产生。在第二阶段中,通过混合学习算法模糊规则中所涉及的参数进行了改进。改进的模糊规则构成未知系统的预测模型,然后可以用来预测系统的输出。假设我们想象的模型的系统有n个输入变量, 表示为 x = x1, x2, . . ., xn ,和一个输出变量y。简要介绍了模糊神经网络建模方法如下。
3.1 模糊规则的生成
假设我们给定一组基于T集的N个参数的训练模式(Pv,Qv),1 le; v le; N, Pv =(P1v, P2v, . . ., Pnv)和Qv分别表示n个输入值和期望输出值。采用增量聚类算法[ 38 ],T集分为J集群C1,C2,。..,CJ。每个训练模式被分配到一个集群。每个集群Cj,1le;jle;J,其特征在于Gj(x)和hj,在Gj(x)是一个代表mj = (m1j,m2j,...mnj)和误差sigma;J = sigma;1J,sigma;2j,...,sigma;nj的分布,
hj是Cj的高度。值得注意的是,mj,sigma;j和hj cj的计算如下:
bull;mij和sigma;ij分别的均值和方差,为模式的第i个坐标包含在Gj,1le;ile;n。
bull;hj是包含在Gj模式的期望输出值的平均值。
用户不需要指定提前创建集群的数量。集群是在聚类过程中逐步有效地形成的。当获得J集群,每个簇的Cj转换为一个TSK型模糊规则Rj以下形式[ 41 ]:
如果 x1是mu;1j (x1),. . . ,xn 是mu;nj (xn )
然后y即fj (x) = b0j b1j x1 · · · bnj xn (4)
那么 mu;ij(xi)被假定为一个高斯函数,即
(5)
这是模糊集xi的隶属函数,b0j为 hj , b1j, b2j, . . ., bnj为0。为了方便,mij和sigma;ij称为前件参数,b0j,b1j,...., bnj.称为后件参数,这些参数将在第二阶段调整。因此,我们有一个由J模糊规则组成的规则基础R = { R1、R2,。..,RJ }。
从给定的训练集T创建模糊规则的过程总结如下。
procedure create-fuzzy-rules(T)
Group the training patterns in T into J clusters;
Convert the clusters to J fuzzy rules in the form of Eq. (4);
endprocedure
所得到的规则集R可以用来提供一个通过插值的所有规则,任何给定的输入的系统输出,对于一个输入x = x1,x2,。..,Xn,系统的输出y可以用质心法计算如下:
= (6)
其中˛J(x)表示程度,X和Rj:
j(x)=mu;1j(x1)times;mu;2j(x2)times;...times;mu;nj(xn) (7)
这就是所谓的Rj的发射强度。
3.2 改进的模糊规则
为了提高前一阶段创建的模糊规则的性能,采用最小二乘估计和梯度下降法混合学习算法被用来调整调整在R中的每个规则所涉及的前件和后件参数。假设我们得到了一组基于T集的N个参数的训练模式(prsquo;v,qrsquo;v),1le;vle;Nrsquo;。如前所述,prsquo;v=(prsquo;1v,prsquo;2v,...prsquo;nv),qrsquo;v分别表示与v有关的n个输入值和期望输出值。请注意,T不一定是第一阶段使用的T集。
根据式(6),对于任何训练系统的输入pv,1le;vle;N,输出yv是
, (8)
。
让所有Nrsquo;个训练模式的均方误差E定义为 . (9)
参数调整如
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[27314],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。
您可能感兴趣的文章
- 超过25年的缺陷极值统计:基本原理,历史发展,最近的应用外文翻译资料
- 固定汇率和灵活汇率下的资本流动和稳定政策外文翻译资料
- 固定和灵活汇率下国际调整的货币动态外文翻译资料
- 关税优惠与贸易条件经典模型的推广外文翻译资料
- 特征值/特征向量在工程中的应用外文翻译资料
- 运用反问题对古气候定量重建: 由泥炭纤维素氧同位素δ8o指标对青藏高原东部 全新世晚期气候作贝叶斯推断外文翻译资料
- 第151章 ASP。NET开发电子商务智能订餐系统外文翻译资料
- 用于1维Burgers和KDV方程的通用有限谱方法外文翻译资料
- 具有随机波动率的时变参数回归模型的半参数贝叶斯推断外文翻译资料
- 用于特征选择的梯度Lasso外文翻译资料