英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料
Hindawi期刊
国际光能杂志
第2018卷,文章编号6973297
基于相似日和交叉熵理论的光伏发电功率组合预测
基于相似日和交叉熵理论的光伏发电功率组合预测
季顺祥1,2 ,王 琦1,2 ,姚 阳1,2 ,陈佳浩1,2 ,刘 瑾1,2
( 1.南京师范大学南瑞电气与自动化学院,江苏 南京 210042)
( 2.南京师范大学江苏省气电互联综合能源工程实验室,江苏 南京 210023)
[摘要] 为进一步提高光伏发电功率预测精度,提出一种基于相似日和交叉熵理论的光伏发电短期功率组合预测方法. 首先采用模糊 C 均值聚类方法对历史样本数据分类,并提出一种基于隶属度的指标来选取相似日. 然后采用最小二乘支持向量机、时间序列法和 BP 神经网络法分别预测光伏发电功率,通过交叉熵算法动态设置各预测时刻下单一方法的权重值,建立光伏发电功率的组合预测模型. 算例结果表明,所提方法能够动态识别单一预测方法包含的信息量,能确定更加合理的权重值,从而提高光伏发电功率的预测精度.
[关键词] 光伏发电,组合预测,相似日,隶属度,交叉熵
随着新能源的不断开发与利用,以太阳能、风能为代表的大规模可再生能源并网发电已成为新型电力系统必然的发展趋势[1]. 受太阳辐照强度、环境温度和湿度等气象因素的影响,光伏发电功率具有随机性、间歇性与波动性,从而使得大规模光伏发电并网对电网造成不良影响. 如果能够准确地预测光伏发电功率,则对电网的调度与光伏电站的运行控制有着重大意义[2-4].
目前,光伏发电功率预测主要有两种方法: 直接预测法和间接预测法[5]. 间接法是根据气象预报的历史数据对光照强度、温度进行预测,然后通过相关公式或算法计算得出光伏电站出力预测值. 文献[6]依靠欧洲中尺度天气预报中心对太阳辐射预测模型进行改进以获取具体预报时间内的辐射值,最终得到光 伏出力值,但该方法过于依赖准确的气象预报信息. 直接法是利用光伏电站的历史出力数据以及相关的天气预报值,对其进行预测. 文献[7]采用 BP 神经网络方法对光伏输出功率进行预测,虽然考虑了天气因素,但预测精度还有待进一步提高. 文献[8]建立时间序列法( auto-regressive and moving average,ARMA)模型和马尔科夫链预测模型对光伏电站短期出力预测,但是该模型只适用于晴天,对复杂天气类型的预测 并不适用. 文献[9]建立了基于径向基神经网络的光伏预测模型,结合 K 均值聚类和遗传算法来优化径向基神经网络,预测精度较传统的模糊神经网络预测模型更高,但预测误差仍可进一步降低. 文献[10]利用LSSVM 建立光伏发电功率预测模型,分析了太阳辐射量、气温、季节以及天气类型等因素对光伏阵列发电的影响,预测光伏电站输出功率,但该方法的预测精度受模型参数的影响.
上述预测方法均采用单一的预测方法,由于单一预测方法具有一定的局限性,预测精度仍可进一步提 高. 因此,适当地采取组合预测方法能够更好地提高预测精度. 文献[11]提出了改进灰色 BP 神经网络的光伏出力组合预测方法,采用模糊 C 均值对历史出力数据统计分类,来选取相似日作为预测模型训练样本,但没有明确的相似日选取指标. 文献[12]采用熵权法建立光伏输出功率组合预测模型,但其设置的单一预测方法的权重值固定不变,未能实时动态反映光伏出力的变化,具有一定的局限性. 为此,本文提出一种基于相似日和交叉熵理论的光伏发电短期功率组合预测模型. 首先采用模糊 C 均值聚类方法对历史数据统计分类,并在此基础上提出一种基于隶属度的指标来选取相似日,以获取更佳的预测模型训练样本. 再采用 LSSVM、ARMA 和 BP 神经网络法 3 种单一方法分别对待预测日的发电功率进行预测. 然后通过交叉熵算法动态设置各预测时刻点下单一方法的权重值,建立了基于相似日和交叉熵理论的光伏发电 短期组合预测模型. 通过算例分析,并分别与基于误差平方和的组合模型以及基于相关系数的组合模型进行对比,验证了本文所提交叉熵组合预测模型的正确性与优越性.
1 相似日的选取
1.1 影响光伏发电功率的因素分析
光伏发电功率与诸多因素有关,主要包括太阳辐照度、温度、湿度、风速、天气类型等,光伏阵列输出功率计算如下[13]:
式中, eta; 为光伏电池转换效率( %) , S 为光伏阵列面积( m2) , I 为太阳辐照强度( kW/m2) , t0 为工作环境温 度( ℃) . 在短期的发电功率预测中,光伏发电系统的阵列面积 S 和转换效率 eta; 是不变的. 因此,由式( 1) 可知发电功率主要受到太阳辐照强度和环境温度 2 个因素的影响. 其中,由于季节和天气类型的不同,太 阳辐照度也有较大差异,从而光伏阵列发电功率也有很大差别. 考虑到气象观测站一般难以提供太阳辐 照度数据,本文以日照时数来代替,选取日照时数、日平均温度、日平均湿度、日平均风速作为影响光伏发 电功率的特征量,并采用模糊 C 均值算法对样本进行统计分类.
1.2 相似日选取原理
考虑到常规聚类方法只是将样本数据粗略分类,实际并不精确. 为进一步获取相似度更高的数据样 本,在模糊C 均值聚类( fuzzy-C-means, FCM) 方法的基础上,提出一种基于隶属度的指标来选取相似日. 具 体选取过程如下:
( 1) 确定聚类样本数据集
首先确定待预测日并且获取待预测日的气象特征. 对于样本总数 M,将待预测日气象数据列入历史 样本数据集中,则样本总数为( M 1) .
FCM 聚类计算目标表达式如下[14]:
式中, U 是隶属度矩阵, V 是各个聚类中心位置向量, J( U, V) 是目标函数, N 是聚类中心数, m 是权重系 数, Xi( iisin;{ 1, 2,hellip;, M 1}) 是样本里每个数据的聚类特征, Vr 是第 r 个聚类中心的位置向量, mu;r( i) 是第 i 个数据点对于第 r 个聚类中心的隶属度.
( 2) 确定聚类特征与聚类中心数
选取日照时数、日平均温度、日平均湿度和日平均风速作为聚类特征,将历史日分为 4 种基本类型:晴 天、多云、阴天和小雨,即聚类中心 N=4.
( 3) 隶属度矩阵 U 赋初值
式中, g 为迭代次数, Rrtimes;N为有理数矩阵.
( 4) 更新聚类中心位置向量
第 g 1 次的聚类 r 的中心位置向量是
( 5) 隶属度计算
各个数据点 Xi 的隶属度为
( 6) 迭代结束判断
根据迭代结束条件进行判断是否收敛,迭代结束条件为
式中, ε>0 为迭代计算结束条件.
( 7) 计算相似度并选取相似日
将与待预测日属于同一聚类中心的历史日作为选取样本,其中第 i 个历史日与待预测日的相似度为
式中, chi; i 越小则该历史日与待预测日的相似度就越高. 这样选取避免了再去采用其他相似性指标计算的 繁琐,选取过程变得更加简易. 这里,相似日选取按chi;i 从小到大进行选取,选取前t 个历史日数据作为预测 样本,其中 t 取 6.
2 单一预测方法
2.1 单一预测方法的选择
光伏发电功率与太阳辐照度、天气类型、季节类型、气温和湿度等诸多因素有关,难以用确定的数学模 型加以描述. 常用的单一预测方法有 ARMA、 BP 神经网络、 LSSVM 等,其中 ARMA 为线性模型,可以较好 地对数据的整体趋势分析预测. BP 神经网络和 LSSVM 模型为非线性模型,具有较强的非线性学习能力并 且能通过样本数据训练学习得到其内在关系. 为此,选取上述 3 种单一方法来预测光伏发电功率.
2.2 ARMA模型
ARMA模型的主要思想是当一个时间序列是依赖于时间的一族变量时,构成该时序的单个序列值虽 然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述. 设为零均值平稳序列,若其满足模型
则称 xt 为阶数为( p, q) 的自回归滑动平均序列,简记为 ARMA( p, q) 序列. 其中, εt 为白噪声序列, t 和 theta;t( tisin;Z) 为权重. 本文 ARMA 模型的输入变量为相似日内各预测时刻的光伏发电功率值,其预测过程主要包 括序列平稳性检验、模型参数估计和模型定阶. 平稳性采用 ADF 单位根检验,模型参数采用最小二乘法估 计,模型阶数根据 AIC 准侧确定.
2.3 BP 神经网络
BP 神经网络是一种误差反向传播训练的多层前馈神经网络,具有良好的自组织学习能力,它可以实 现从输入到输出的任意非线性映射. 其网络预测模型主要是通过输入信号正向传播和误差信号反向传播 来实现训练过程的,能够对大规模数据进行并行处理,具有一定的鲁棒性和容错性, BP 神经网络基本结构 如图 1 所示,是输入层和隐含层节点之间的连接权值,是隐含层和输出层节点之间的连接权值. 这里,选 取相似度较高的前6 日数据作为训练样本.
图 1 BP 神经网络结构
2.4 LSSVM
LSSVM 是由 Suykens 等人在原来支持向量机基础上, 继承其优点并对其改进的一种机器学习方法. LSSVM 具有 泛化能力更强和解决小样本、非线性、高维数以及局部极 小等问题的优点.
LSSVM 实际主要用来解决函数二次优化问题,其目标 函数可以描述为
式中, w 为加权向量, gamma; 为惩罚因子, ek 为误差变量, b 为常 量, xk 和 yk 分别为输入和输出向量.
选取径向基函数作为核函数,表示为
则 LSSVM 的估计函数为
考虑到惩罚因子 gamma; 和核参数 sigma;2 对模型性能影响最大,本文采用交叉验证来对参数寻优. LSSVM 模型 的输入变量为相似日的光伏发电功率. 相似日的日照时长、平均温度、最高温度和最低温度. 预测日的日 照时长、平均温度、最高温度和最低温度.
3 交叉熵组合预测模型
3.1 交叉熵理论
交叉熵( cross entropy, CE) 用于度量两个随机向量之间信息量的差异,也可用于描述两个概率分布间 的差异性. 交叉熵在同一概率空间两个概率测度和的定义分为以下两种情况[15]:
离散情况:
连续情况:
式中, f 和 g 在式( 12) 和( 13) 中分别表示概率矢量和概率密度函数.
性质: D( f‖g) ge;1,当且仅当 f=g 时,等号成立,并且 D( f‖g) ne;D( g‖f) .
交叉熵算法作为一种随机优化方法,最先用于模拟小概率事件,后来用来扩展到求解最优化问题. 交叉 熵方法目前已被应用于解决多目标优化、组合预测和机器学习等领域的相关实际问题. 在本文所提交叉熵的 组合预测模型中,交叉熵表示两个概率密度分布的相互支持程度,即单一预测方法对整体支持程度的大小.
3.2 模型建立步骤
基于相似日和交叉熵理论的光伏发电短期功率组合预测模型建立具体步骤如下:
( 1) 对待预测日内各预测点的功率进行预测
对于预测时间段 T( 时间间隔为 0.5 h) 的光伏发电功率,分别采用 M 种算法进行预测,预测样本采用 第1 节相似日选取方法获取,,则第m( misin;{ 1, 2,hellip;, M}) 种算法在预测时间段内第t( tisin;{ 1, 2,hellip;, T}) 点的光伏发电功率为 Pmt.
( 2) 定义光伏发电功率概率分布函数 设时刻的光伏发电功率服从正态分布, gm( t) 表示为第 m 种算法所得到的时刻的光伏发电功率分布 函数,可描述为
式中, mu;m 为平均值, sigma;2 m 为方差.
( 3) 计算光伏发电功率分布函数的数字特征
选取与待预测日相似度较高的个相似日,则第 k( kisin;{ 1, 2,hellip;, K},其中 K 为相似日样本总数) 个相似 日 t 时刻点的光伏发电功率值为Pkt. 对于第 m 种算法预测所得的光伏发电功率 Pmt,可看作该光伏发电功 率概率分布函数的均值 mu;m. 又可根据所选取的相似日的光伏发电功率计算样本方差
可得到种算法在预测时间段 T 内时刻光伏功率的概率密度函数.
设 g( t) 为融合各影响因素后的组合光伏发电功率的概率密度分布函数, gm( t) 表示为第 m 种算法所 得到的某时刻光伏发电功率分布函数,满足
则上式所求的时间段 T 内时刻组合光伏发电功率值为 g( t) 的数学期望 mu;,样本方差为
( 4) 建立支持向量并给出交叉熵目标函数
建立支持向量
由交叉熵定义可设
式中, Sm 用来表示 g( t) 与 gm( t) 之间的相互支持程度,支持程度越高,其值越小.
记
为了使权重 wm 更好地反应不同信息源之间的相互支持程度,设
则建立最小交叉熵的目标函数为
上式中 g( t) 与 gm( t) 均服从正态分布
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20362],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。