DOI:10.13334/j.0258-8013.pcsee.2013.25.012
第 33 卷 第 25 期
2013 年 9 月 5 日
文章编号:0258-8013 (2013) 25-0033-08 中图分类号:TM 711;TM 614 文献标志码:A 学科分类号:470·40
Vol.33 No.25 Sep.5, 2013
©2013 Chin.Soc.for Elec.Eng.
中 国 电 机 工 程 学 报
Proceedings of the CSEE
33
基于样本熵和极端学习机的
超短期风电功率组合预测模型
张学清,梁军,张熙,张峰,张利,徐兵
(电网智能化调度与控制教育部重点实验室(山东大学),山东省 济南市 250061)
Combined Model for Ultra Short-term Wind Power Prediction Based on Sample Entropy and
Extreme Learning Machine
ZHANG Xueqing, LIANG Jun, ZHANG Xi, ZHANG Feng, ZHANG Li, XU Bing
(Key Laboratory of Power System Intelligent Dispatch and Control of Ministry of Education (Shandong University),
Jinan 250061, Shandong Province, China)
ABSTRACT: An ultra short-term wind power combined
prediction approach based on empirical mode decomposition
(EMD)-sample entropy (SE) and extreme learning machine
(ELM) was proposed. Firstly, the wind power time series was
decomposed into a series of wind power subsequences with
obvious differences in complex degree by using EMD-SE.
Secondly, the prediction models of each subsequence were
least squares support vector machine
constructed with
(LSSVM), extreme
learning machine (ELM) and ELM
improved by primal ridge regression (PRR-ELM), of which the
parameters and the input vector dimensions were determined
by cross validation and chaotic phase space theory to improve
the forecasting accuracy of each prediction model. Finally,
taking the actual collecting data of certain a wind farm for an
example, the simulation results illustrate that ELM and
PRR-ELM prediction model based on EMD-SE are much
better than the combined LSSVM model based on EMD-SE on
forecasting accuracy and training speed, and the prediction
results of ELM are closer to the actual value, by which it is
possible to achieve the online ultra short-term wind power
combined prediction with higher precision.
KEY WORDS: wind power prediction; sample entropy;
extreme learning machine; ridge regression; support vector
machine
摘 要 : 该 文 提 出 一 种 经 验 模 态 分 解(empirical mode
基金项目:国家自然科学基金项目(51177091);山东省自然科学基
金项目(ZR2010EM055)。
Projects Supported by National Natural Science Foundation of China
(51177091); Projects Supported by Shandong Province Natural Science
Foundation (ZR2010EM055).
decomposition,EMD)–样本熵(sample entropy,SE)和极端学
习机(extreme learning machine,ELM)相结合的风电功率超
短期预测方法。该方法首先利用 EMD-SE 将风电功率时间
序列分解为一系列复杂度差异明显的风电子序列;其次利用
最小二乘支持向量机(least squares support vector machine,
LSSVM) 、 极 端 学 习 机 和 经 原 始 岭 回 归 (primal ridge
regression,PRR)改进的极端学习机(PRR-ELM)对各子序列
建立组合预测模型,并采用交叉验证法和重构相空间法确定
各模型的参数和输入向量维数,以提高各组合模型的预测精
度;最后以某一风电场实际采集的数据为算例,结果表明基
于 EMD-SE 理论的 ELM 和 PRR-ELM 组合预测模型在预测
精度和训练速度上都明显优于 EMD-SE 理论和 LSSVM 的
组合模型,且其预测结果更接近于真实值,为实现风电功率
在线的较高精度超短期预测提供了可能。
关键词:风电预测;样本熵;极端学习机;岭回归;支持向
量机
0 引言
由于风电固有的间歇性和随机性,风电大规模
并网必将给电网运行与控制带来难度[1-2]。为了解决
风电并网的不确定性问题,可对风电场所发出的功
率进行准确的短期预测,这样不但可以节约常规能
源和降低旋转备用的容量,提高电网运行的经济
性,还可有效提高电网接纳风电的能力[3-4]。
最 初 风 电 功 率 预 测 大 都 基 于 单 一 的 预 测 模
型[5-10],从而导致在某些测量点容易产生较大的误
差。文献[11]综合多种预测方法,在多嵌入维的基
础上提出了风电组合预测模型,取得了比单体预测
更好的效果。从此组合预测模型在风电功率短期预
34
中 国 电 机 工 程 学 报
第 33 卷
测得到了普及。目前在风电功率组合预测中应用最
广 泛 的 是 神 经 网 络 和 支 持 向 量 机(support vector
machine,SVM)理论[12-13]。但是传统的神经网络如
BP 神经网络等主要基于梯度下降的学习算法,收
敛速度慢,容易陷入局部最优,从而制约了其广泛
的应用。SVM 是一种基于结构风险最小的机器学
习算法,具有较好的泛化能力,虽然最小二乘支持
向 量 机 (least squares support vector machine ,
LSSVM)把 SVM 的学习问题转化为求解一组线性
方程组的问题,其在保持原求解算法精度几乎不变
的条件下有效的减少了计算时间,但是 LSSVM 仍
要求其核函数必须满足 Mercer 定理,从而限制了其
在时间序列预测中的应用。极端学习机(extreme
learning machine,ELM)是最近几年发展起来的一种
新型的前馈神经网络方法,具有训练过程简单,抗
干扰能力强等优点[14],且 ELM 克服了传统神经网
络的缺陷,并已被证明了在许多时间序列的预测上
优于 SVM[15-16],但 ELM 在某些条件下训练的过程
中自相关矩阵易产生奇异,所以利用原始岭回归
(Primal
regression , PRR) 方 法 改 进
ELM(PRR-ELM),其在保持原 ELM 测试精度几乎
不变的条件下具有更快的学习训练速度和较好的
算法稳定性,本文尝试将 ELM 应用于风电功率的
超短期组合预测。
ridge
本文提出一种基于样本熵和极端学习机的风
电功率组合预测模型。针对风电序列的非平稳特
性 , 首 先 利 用 经 验 模 态 分 解 (empirical mode
decomposition,EMD)将风电功率分解为一系列具
有不同特征尺度的子序列;其次利用样本熵(sample
entropy,SE)对不同尺度的子序列进行复杂度分析,
根据子序列的不同熵值进行归类叠加产生新的子
序列。最后利用交叉验证法和重构相空间法确定了
学习机的各种参数和输入维数,再利用 PRR-ELM、
ELM 和 LSSVM 分别对各子序列进行建模预测分
析,结果表明基于 EMD-SE 和 ELM 组合预测模型
无论在预测精度和训练速度上都明显优于 EMD-SE
理论和 LSSVM 的组合预测模型,且与真实值的预
测误差更小,其为实现风电功率在线的较高精度预
测提供了可能。
1 经验模态分解
经验模态分解非常适用于非线性非平稳信号
的分析[13]。为了分析风电功率的局部特征,本文将
经验模态分解应用于风电功率时间序列的分析。文
献[17] 假 设 任 一 信 号 都 是 由 许 多 固 有 模 态 函 数
(intrinsic mode function,IMF)组成的,详细内容参
见文献[17]。EMD 分解具体的处理步骤:
1)先根据序列 x(t)的极大点和极小点求出其上
包络 v1(t)及下包络 v2(t)之平均值:
m
1 (
2
v t
( )
1
v t
2
( ))
然后考察 x(t)与 m 之差 h,即
( )x t m h
(1)
(2)
2)将 h 视为新的 x(t)重复以上操作,直到 h 满
足 IMF 条件时,记 c1h,c1 为第一个 IMF 分量。
(3)
r
( )x t
c
1
视 r 为新的 x(t),重复以上过程,依次得到 c2,c3,,
直到 r(t)基本成单调趋势或|r(t)|很小,视为测量误
差时即可停止。于是
x t
( )
n
c
i
i
1
r
(4)
即把原序列分解成 n 个 IMF 即 c1,c2,,cn,和 1 个
剩余分量 r。式(4)可表征 EMD 分解的完备性。
通过对 2006 年 6 月份美国科罗拉多州某一大
型风电场实际采集的风电功率时间序列进行分析,
共采集 19d 的数据,其中每天 24h,每 10min 采集
一次数据,风电场的额定装机容量是 267MW,为
了方便计算,将风电功率转化为标幺值并作归一化
处理,风电功率时间序列如图 1 所示。
u
p
/
率
功
电
风
1.0
0.8
0.6
0.4
0.2
0.0
0.0
0.5
1.5
2.0
1.0
采样点数/103
2.5
3.0
图 1 风电功率时间序列
Fig. 1 Wind power time series
2 样本熵
近似熵[18]可以度量序列的复杂性,且只需要较
少的数据就可以得出稳定的数值,但是由于近似熵
存在固有的对自身数据段的比较而导致其计算会
产生偏差;同时近似熵的值与数据长度有关,一致
性较差,所以针对近似熵的缺陷,由 Richman[19]于
2000 年提出来的与近似熵类似,但精度更好的样本
第 25 期
张学清等:基于样本熵和极端学习机的超短期风电功率组合预测模型
35
m
B r
( )
i
1
N m
num{
d X i X j
m
( ),
( ))
(
r
}
(6)
H
熵理论能很好的降低近似熵的误差。若序列的自相
似性越高,样本熵值就越小,序列越复杂,其样本
熵值就越大。样本熵是条件概率的严格自然对数,
可用 SampEn(N,m,r)表示。其中 N 为长度,r 为相似
容限,m 为维数。其具体算法如下[18]:
假设时间序列{xi}为 x(1),x(2),,x(N)(N 为数据
总数):
1)将序列{xi}按顺序组成 m 维矢量,即 X(i)
[x(i),x(i1),,x(im1)],其中 i1,2,,Nm1。
2 ) 定 义 两 者 X(i) 与 X(j) 之 间 的 距 离
dm(X(i),X(j))为两者对应元素差值最大的一个,即
(5)
d X i X j
m
x j
(
( ),
x i
(
) |
k
k
(
)
( )) max |
m
1
0
对于每一个 i 值计算 X(i)与其余矢量 X(j)(j
1,2,,Nm1,且 ji)之间的 dm(X(i),X(j))。
3)给定相似容限 r(r0),对每一个 i 值统计
dm(X(i),X(j))r 的数目,然后计算其与距离总数
Nm 的比值,记作 Bi
m(r),即
式中:i1,2,,Nm1,ji;num 为 dm(X(i),X(j))
m(r)表示
r 数目。该过程称为 X(i)模板匹配过程,Bi
任一个 X(j)与模板的匹配概率。
4)Bi
m(r)的平均值为
1
N m
m
B r
( )
N m
1
1
1
i
m
B r
( )
i
(7)
5)增加维数为 m1,重复步骤(1)—(3),则
m1(r)的平均值为
Bi
N m
1
N m
1
i
m
B
i
1
r
( )
m
1
B
r
( )
样本熵定义为
SampEn(
m r
, )
lim{ ln(
N
m
1( )
B
r
m
B r
( )
)}
(8)
(9)
当 N 取有限值时,上述得出的是样本熵估计
值,为
SampEn(
N m r
, )
,
ln[
B
m
1
r B r
( ) /
( )]
m
(10)
SampEn 的取值与 m 和 r 的值有关,但样本熵
具有良好的一致性,其熵值增大与减小的趋势并不
受 m 和 r 的影响,一般情况下 m 取为 2,r 为 0.1~
0.25SD,SD 为时间序列的标准差,本文取 m2,
r0.2SD。
3 极端学习机
3.1 极端学习机模型
极端学习机是一种新型的前馈神经网络,其表
k
,
f
t
in
b
x
),
{(
o
k
T
W x
(
)}N
k
k
k
1
N
,
1,2,
示如下[20]:设有 N 个训练样本
k
(11)
式中:xk 为输入向量;Win 为连接输入节点和隐层
节点的输入权值;b 隐含层偏置;ok 为网络输出;
为连接隐含层与输出层的输出权值;f 为隐含层
激活函数,一般取为 Sigmoid 函数;N 为样本数[14]。
在训练开始时,Win 和 b 随机生成并保持不变,
仅需训练确定输出权值。假设单隐层前馈网络以
N
零误差逼近训练样本,即
k
1
Win、b 和使式(12)成立:
,
W x
(
T
b
)
f
t
in
k
k
||
o
k
t
k
|| 0
。则存在
k
1,2,
N
,
(12)
将式(12)写成矩阵形式为 HT,其中,
f
f
W x
(
in 1
W x
(
in
N
b
1
)
b
1
)
f
f
W x
(
in 1
W x
(
in
N
b
m
)
b
m
)
N m
(13)
式中:H 为极端学习机的隐含层输出矩阵;m 为隐
含层节点数;T[t1,t2,,tN]T 为期望输出向量。文
献[21]已经证明,给定任意小的正数0,只要单
隐层前馈神经网络的隐层节点激活函数无限可微,
且隐层节点的个数为 mN,则直接对网络的输入
权值 Win 和偏置 b 随机赋值,就可使其以任意小的
正数的训练误差逼近 N 个训练样本,而通常采用
伪逆算法求取的值。
单隐层前馈神经网络的训练过程等价于求取
线性系统 HT 的最小二乘解:
|| min ||
ˆ
H
H
T
||
||
T
(14)
ˆ H T
†
为 HT 方程组的极小范数最小二
式中
乘解;H†
为隐含层输出矩阵 H 的 Moore-Penrose 广
义逆。对于前馈神经网络,权值越小泛化能力越强。
而在方程 HT 的所有最小二乘解中, ˆ有最小
范数,
||
ˆ||
||
{ | ||
||
H
†
H T
||
T
||
,且
||
Hz T
||
||,
z
R
}N m
(15)
从式(15)可以看出,ELM 不仅能达到最小训练
误差,而且比传统的梯度下降算法泛化能力更强,
而且由于矩阵 H 的 Moore-Penrose 广义逆 H†
是唯
一的,所以解 ˆ也是唯一的。
36
3.2 ELM 与最小二乘支持向量机
中 国 电 机 工 程 学 报
第 33 卷
4 基于 SE 和 ELM 的风电功率预测模型
LSSVM 是由 SVM 演变而来的,但由于标准
SVM 的训练为二次规划过程,训练复杂且占用时
间较长,由文献[17]提出的 LSSVM 把 SVM 的学习
问题转化为求解线性方程组问题,极大地提高了运
算速度。但是 LSSVM 跟 SVM 一样仍是把非线性
输入变量从低维空间映射到高维特征空间进行某
种运算,由于在映射的过程中会引起空间维数增
加,为了降低计算规模需要采用核函数理论来简化
计算,故选择合适的核函数成为 LSSVM 回归问题
的关键。
ELM 作为一种新型的前馈神经网络,已被证明
具有优良的预测性能[15-16]。由于在某些情况下,如
训练样本数小于隐层节点数、输入权值较大等情况
可能会导致 ELM 的自相关矩阵出现奇异,所以常
规的伪逆算法不再适用,本文采用岭回归法来代替
伪逆算法求解输出权值向量[22],其主要思路如下。
由式(12)知可以转化为如下的优化问题:
min
,
s.t.
L
(
)
,
||
2
||
f
(
x
i
)
,
i
i
1
2
t
i
N
C
2
i
1
1,2,
2
i
(16)
,
N
式中 C 为正则项系数,基于 KKT 条件可以表示为
如下的优化问题:
L
1 ||
2
2
||
C
2
N
i
1
2
i
N
i
1
i
(
f
(
x
i
)
i
t
i
)
(17)
式中i 为 Lagrange 乘子。由 KKT 条件易得
H
C
T
T
H
)
1 (
C
H
T
0
(18)
(19)
可以推得
(
I H H H T
C
1
)
T
T
(20)
可见,ELM 与 LSSVM 都是将原始训练数据映
射到某一高维特征空间,但是 ELM 的特征空间是
可知的而 LSSVM 是未知的,从而导致了 LSSVM
严重依赖核函数,与此相反 ELM 则完全独立于核
函数,是一种无核机学习方法,且经过原始岭回归
改进的算法的训练速度比原 ELM 以及 LSSVM 训
练更方便快捷,不仅不会出现自相关矩阵奇异的现
象,而且具有较好的算法稳定性。
1)由图 1 可知,风电功率时间序列具有明显
的非线性和非平稳性,同时由于 EMD 分解具有较
好的处理非线性数据能力,本文采用 EMD 分解对
风电功率时间序列进行分解,以产生一系列的不同
尺度的固有模态信号(intrinsic mode function,IMF)
和剩余分量 r。
2)由于 EMD 分解后的 IMF 分量很多,如果
直接利用 ELM 对每一个分量分别进行建模预测,
会增大计算的规模。采用样本熵理论,对每一 IMF
信号分别进行复杂性评估,得到的结果如图 2 所示。
熵
本
样
0.4
0.3
0.2
0.1
0.0
1
3
5
7
各分量序列数
9
11
图 2 各 IMF 分量的样本熵
Fig. 2 Sample entropy of each IMF component
从图 2 可知,前 3 个 IMF 分量的样本熵相差不
多,说明各 IMF 分量产生新模式的概率大小基本一
致,可以把这 3 项叠加作为一个时间序列输入 ELM
进行训练和预测。同理其余 IMF 分量叠加结果如
表 1 所示,叠加后的各子时间序列如图 3 所示。
表 1 各 IMF 分量合并为新子序列的结果
Tab. 1 Results of the new subsequences with
merged IMF components
新序列号 原 IMF 分量序列号 新序列号 原 IMF 分量序列号
1
2
3
1,2,3
4,5
6
4
5
6
7,8
9,10
11
3)对上述得到的各子时间序列分别建立 ELM
预测模型进行预测,最后将各子序列的预测结果进
行叠加即可得到风电功率预测值。具体预测流程见
图 4 所示。
利用 ELM 模型进行预测,需要确定隐层节点
的个数,因为隐层节点个数直接决定 ELM 的学习
能力[14];同时利用原始岭回归算法训练 ELM 输出
权值需要确定正则项等参数,本文以第 19 日的风
电功率各子序列前 24 点作为预测对象。其处理过
第 25 期
张学清等:基于样本熵和极端学习机的超短期风电功率组合预测模型
37
1
列
序
2
列
序
3
列
序
4
列
序
5
列
序
6
列
序
1
0
1
2
0
2
0.5
0.0
0.5
0.5
0.0
0.5
0.5
0.0
0.5
0.1
0.0
0.1
0.0
0.5
1.5
2.0
1.0
采样点数/103
2.5
3.0
图 3 经 EMD-SE 处理后的风电子序列
Fig. 3 Wind power subsequences processed by EMD-SE
原始风电功率时间序列
EMD 分解
样本熵(SE)
序列 1
序列 2
序列 3
序列 4
序列 5
序列 6
ELM1
ELM2
ELM3
ELM4
ELM5
ELM6
合并叠加
功率预测结果
图 4 基于 EMD-SE 和 ELM 组合预测流程
Fig. 4 Combined prediction flowchart based on
EMD-SE and ELM
程是每次进行一步预报,再将预测值作为新息加入
原子时间序列并重复一步 ELM 即可得 24 点的多步
预报,并以一次 24 步预报的均方根误差和训练时
间作为评价指标来获取合适的隐层节点个数和正
则项系数。均方根误差公式为
E
rmse
mN
1
N
im
1
x
i
(
ˆ
x
i
2
)
(21)
式中:xi 为实际的风电功率子序列; ˆix 为预测值;
Nm 为预测的时间点数,取为 24。选择 ELM 和
PRR-ELM 参数的主要依据如下:
ELM 的隐层节点数的确定主要依据隐层节点
数不同时各子序列的均方根误差,选取一次 24 步
最小预测误差的隐层节点数,而且使隐层节点数尽
量选择在误差波动比较平缓的区域;PRR-ELM 正
则项的确定则固定已确定的隐层节点数,观察不同
正则项时各子序列的均方根误差,并选取一次 24
步最小预测误差时的正则项,各子序列的 ELM 与
PRR-ELM 模型参数如表 2 所示。
表 2 各子序列预测模型的参数
Tab. 2 Parameter of prediction model for each
subsequence
LSSVM 预测
ELM 预测
PRR-ELM 预测
序列
数 正则项系数
1
2
3
4
5
6
420
90
90
50
1200
120
核参
数
4.6
6.4
0.8
1.6
2.4
0.1
5 算例分析
隐层节点数
30
230
80
40
340
420
正则项系
数
7.2
30.6
24.4
1336.9
3.1
27.4
隐层节点数
30
230
80
40
340
420
输入
维数
8
9
7
5
6
4
为验证本文所提出的风电功率组合预测模型
的可信性,以美国科罗拉多州某一大型风电场在
2006 年 6 月 1 日到 19 日实际采集的风电功率时间
序列进行分析,首先对数据进行了归一化处理,转
化为[1,1]之间的数据,其中前 18 日数据进行模型
训练,即前 2 592 个点为训练样本,第 19 日的数据
进行测试验证;利用 EMD-SE 处理过的样本数据对
ELM 和 PRR-ELM 进行训练后建立预测模型,以
EMD-SE 和 LSSVM 的风电功率组合预测模型和风
电功率实际值进行对比预测分析,说明了本文预测
模型的有效性和计算的快速性。本文所有的训练和
仿真均在 Matlab 环境下进行,采用 AMD Athlon(tm)
7450 2.4GHz 双核处理器,2.0G 内存的计算机平台。
EMD-SE 和 LSSVM 的风电功率组合预测模型
流程与前述图 4 的 EMD-SE 和 ELM 的组合预测模
型流程类似,只不过把各 ELM 换成 LSSVM 再进
行组合预测即可。其也需要对每个子序列进行学习
机参数的选择以及输入向量维数的确定。LSSVM
的参数选择也可仿照前面确定 ELM 参数的方法进
行确定,LSSVM 的参数见表 2 所示;而输入向量
的维数利用重构相空间理论进行确定[24],各子序列
的输入维数见表 2 所示。
为便于与文献[13]的组合预测进行对比分析,
本文也采用提前 12 步的一次多步预测,由于 19 日
的测试数据是 144 点,所以要进行 12 次多步预测,
即 12 次提前 2h 的风电功率预测。具体方法就是进
行完一次 12 步的多步预测之后,把刚测试完的实
38
中 国 电 机 工 程 学 报
第 33 卷
际风电子序列再送入学习机进行训练,再继续下一
次的 12 步预测,如此反复 12 次即可得到 19 日一
天的各风电子序列的预测结果,各子序列的各预测
模型与真实值的均方根误差以及建立初始模型的
训练时间如表 3 所示。最后再将各子序列预测结果
进行叠加就可以得到风电功率预测值。利用 ELM、
PRR-ELM 组合模型以及 EMD-SE 和 LSSVM 的组
合预测模型分别进行风电功率预测,12 次 12 步的
多步预测结果以及实际风电功率值如图 5 所示。
表 3 各子序列的预测模型训练时间和测试误差
Tab. 3 Training time and testing errors of prediction
model for each subsequence
序列
LSSVM 预测
ELM 预测
PRR-ELM 预测
数 训练时间/s Ermse 训练时间/s
Ermse 训练时间/s
Ermse
1
2
3
4
5
6
307.141 0.098520
0.1720
0.05839
0.05621
0.05621
1.9810
0.02175
121.859 0.050720
126.265 0.014570
0.63960
0.02933
0.14040 5.223103
0.2964
0.2184 5.060104 0.20280 5.990105
39.500 0.000688
39.624 1.872105 3.5412 8.489105 0.68640 7.648105
56.8125 4.489104 3.3696 1.507106 1.21680 1.386105
0.00106
/
W
M
率
功
电
风
250
200
150
100
50
0
0.0
实际值
ELM
预测
1.5
PRR-ELM
预测
LSSVM
预测
0.5
1.0
t/(103min)
图 5 风电功率实际值以及各模型的提前 2h 预测值
Fig. 5 Actual value of wind power and prediction results
3)最大绝对误差 Emae
E
mae
1
P
cap
max(|
ˆ
x
i
x
i
|),
i
1,2,
t
N
,
(24)
式中:Nt 为测试的时间点数为 144;Pcap 为风电场
的额定装机容量。表 4 分别列出了 3 种预测模型的
各种误差性能指标。
表 4 各组合预测模型的预测误差比较
Tab. 4 Compared errors of each prediction model
方法名称
归一绝对平均
归一均方根
误差/%
误差/%
LSSVM 组合预测 7.9204046
ELM 组合预测
4.8789864
PRR-ELM 组合预测 4.9835288
11.6220325
6.3921459
6.6060158
最大绝对
误差/%
52.6652404
17.3624758
17.7128090
从图 5、表 3 和表 4 可以得知,基于 EMD-SE
的 PRR-ELM 组合模型和 ELM 组合模型作提前 2h
的风电功率预测值与实际值吻合较好,2 种模型的
3 种误差相差不大,且均比目前在风电预测中采用
的 EMD 和 LSSVM 的组合预测模型的预测误差要
小,归一化均方根误差仅为 6.39%和 6.6%,而
LSSVM 组合预测则为 11.6%。2 种模型在风电波动
的拐点处能紧跟风电功率的变化趋势,而且在风电
急剧变化时也能很快的做出反应,而 LSSVM 组合
模型虽然也能跟踪风电的变化趋势,但是效果明显
不及 ELM 和 PRR-ELM 组合模型,而且 PRR-ELM
和 ELM 组合模型在序列的训练时间上都要明显小
于 LSSVM 组合模型;由此可见本文提出的方法不
仅在整体上提高了预测精度,而且在样本的训练时
间上也远小于目前普遍采用的 SVM 组合预测模
型,其为实现风电在线的较高精度超短期预测提供
了可能。
ahead 2 hours of each prediction model
虽然本文的方法实现了较高精度的风电功率
为定量的评价各方法的预测结果与真实值接
近程度,以国际上普遍采用的归一化绝对平均误
差、归一化均方根误差和最大绝对误差为依据来评
价各模型的预测性能。
1)归一化绝对平均误差 Enmae
E
nmae
1
tN
1
P N
i
1
cap
x
i
|
t
2)归一化均方根误差 Enrmse
E
nrmse
1
P
cap
tN
1
N
i
1
t
x
i
(
ˆ
x
i
|
(22)
ˆ
x
i
2
)
(23)
预测,但是在风电波动特别剧烈的时刻仍然会产生
较大的误差,例如图 5 最后一个波峰的时段,这是
由于风电功率本身的非平稳性造成的,如果只分析
历史数据可以获得风电波动的趋势,但是在风电剧
烈波动时要获得较为准确的波动大小较为困难,若
能在预测时加入天气预报等风电场周围的物理信
息就能有效的减小误差,提高风电预测的精度。
6 结论
针对风电功率的超短期预测问题,本文提出了
一种样本熵和 ELM 的组合预测模型,其比目前在
风电超短期预测中采用的 EMD 和 LSSVM 的组合
第 25 期
张学清等:基于样本熵和极端学习机的超短期风电功率组合预测模型
39
模型具有更高的预测精度和更少的样本学习时间,
主要有以下 3 点:
1)利用小波变换对风电功率进行局部分析需
解决优先确定小波基的困难,本文采用 EMD 分解
将风电序列作多尺度分解;同时 EMD 分解的 IMF
分量数目较多且不固定,利用样本熵对各 IMF 分量
进行复杂度分析,取熵值相近的 IMF 分量进行叠
加,产生一组复杂度差异明显的子序列,减小计算
规模。
2)对复杂度差异明显的子序列分别建立预测
模型。分别采用交叉验证法和重构相空间法确定各
预测模型的隐层节点数、正则项系数以及输入维数
等参数,以利于提高风电预测精度。
3)通过与目前采用的 EMD 和 LSSVM 的风电
组合预测模型对比分析发现,该方法不仅整体上提
高了预测精度,预测结果更接近于真实值,而且减
少了样本的学习时间,为实现风电功率的在线较高
精度超短期预测提供了可能。
参考文献
[1] 高爽,冬雷,高阳,等.基于粗糙集理论的中长期风速
预测[J].中国电机工程学报,2012,32(1):32-37.
Gao Shuang,Dong Lei,Gaoyang,et al.Mid-long term
wind speed prediction based on rough set theory[J].
Proceedings of the CSEE,2012,32(1):32-37(in Chinese).
[2] Ernst B,Oakleaf B,Ahlstrom M L,et al.Predicting the
wind[J] . IEEE Transactions on Power & Energy
Magazine,2007,11(2):79-89.
[3] 张丽英,叶廷路,辛耀中,等.大规模风电接入电网的
相关问题及措施[J].中国电机工程学报,2010,30(25):
1-9.
Zhang Liying,Ye Tinglu,Xin Yaozhong,et al.Problems
and measures of power grid accommodating large scale
wind power[J].Proceedings of the CSEE,2010,30(25):
1-9(in Chinese).
[4] 刘吉臻,柳玉,曾德良,等.单一风电场的短期负荷调
度优化策略[J].中国科学:技术科学,2012,42(4):
437-442.
Liu Jizhen,Liu Yu,Zeng Deliang ,et al.Optimal
short-term load dispatch strategy in wind farm[J].Sci.
China Tech.Sci.,2012,55:1140-1145.
[5] 范高峰,王伟胜,刘纯,等.基于人工神经网络的风电
功率预测[J].中国电机工程学报,2008,28(34):118-123.
Fan Gaofeng,Wang Weisheng,Liu Chun,et al.Wind
power predication based on artificial neural network[J].
Proceedings of the CSEE,2008,28(34):118-123(in
Chinese).
[6] 冯双磊,王伟胜,刘纯等.风电场功率预测物理方法研
究[J].中国电机工程学报,2010,30(2):1-6.
Feng Shuanglei,Wang Weisheng,Liu Chun,et al.Study
on the physical approach to wind power prediction[J].
Proceedings of the CSEE,2010,30(2):1-6(in Chinese).
[7] 杨秀媛,肖洋.风电场风速和发电功率预测研究[J].中
国电机工程学报,2005,25(11):1-5.
Yang Xiuyan,Xiao Yang.Wind speed and generated
power forecasting in wind farm[J].Proceedings of the
CSEE,2005,25(11):1-5(in Chinese).
[8] 潘迪夫,刘辉.风电场风速短期多步预测改进算法[J].
中国电机工程学报,2008,28(26):87-91.
Pan Difu,Liu Hui.Optimization algorithm of short-term
multi-step wind speed forecast.Proceedings of the CSEE,
2008,28(26):87-91(in Chinese).
[9] 蔡凯,谭伦农,李春林,等.时间序列与神经网络法相
结合的短期风速预测[J].电网技术,2008,32(8):82-85.
Cai Kai,Tan Lunnong,Li Chunlin,et al.Short-term wind
speed forecasting combing time series and neural network
method[J].Power System Technology,2008,32(8):
82-85(in Chinese).
[10] 孙春顺,王耀南,李欣然.小时风速的向量自回归模型
及应用[J].中国电机工程学报,2008,28(14):112-117.
Sun Chunshun,Wang Yaonan,Li Xinran.A vector
autoregression model of hourly wind speed and its
application
in hourly wind speed forecasting[J] .
Proceeding of the CSEE ,2008 ,28(14) :112-117(in
Chinese).
[11] 王丽婕,冬雷,胡国飞,等.基于多嵌入维数的风力发
电功率组合预测模型[J].控制与决策,2010,25(4):
576-580.
Wang Lijie,Dong Lei,Hu Guofei,et al.Combined
prediction of wind power generation in multi-dimension
embedding phase space[J].Control and Decision,2010,
25(4):576-580(in Chinese).
[12] 王丽婕,冬雷,廖晓钟,等.基于小波分析的风电场短
期发电功率预测[J].中国电机工程学报,2009,29(28):
30-33.
Wang Lijie,Dong Lei,Liao Xiaozhong,et al.Short-term
power prediction of a wind farm based on wavelet
analysis[J].Proceeding of the CSEE,2009,29(28):
30-33(in Chinese).
[13] 叶林,刘鹏.基于经验模态分解和支持向量机的短期风
电功率组合预测模型[J].中国电机工程学报,2011,
31(31):102-108.
Ye Lin,Liu Peng.Combined model based on EMD-SVM
for short-term wind power prediction[J].Proceeding of the
CSEE,2011,31(31):102-108(in Chinese).
[14] 王新迎,韩敏.基于极端学习机的多变量混沌时间序列
预测[J].物理学报,2012,6(8):080507-1-080507-9.
40
中 国 电 机 工 程 学 报
第 33 卷
2006,70(1-3):489-501.
[22] Hoerl A E,Kennard R W.Ridge regression:biased
problems[J] .
nonorthogonal
estimation
Technometrics,1970,12(1),55-67.
for
[23] Suykens J A K,Vandewalle J.Least squares support
vector machine classifiers[J].Neural Processing Letters,
1999,9(3):293-300.
[24] 韩敏.混沌时间序列预测理论与方法[M].北京:中国
水利水电出版社,2007:42-93.
Han Min.Prediction theory and method of chaotic times
series[M].Beijing:China Waterpower Press,2007:
42-93(in Chinese).
张学清
收稿日期:2012-09-10。
作者简介:
张学清(1982),男,博士研究生,主要
从事电力系统运行、调度与控制技术的研
究,zxq_wy@163.com;
梁军(1956),男,教授,博士生导师,
主要从事电力系统运行与控制技术的研究;
张熙(1982),男,博士研究生,主要从
事电力系统运行与控制方面的研究;
张峰(1983),男,讲师,博士,主要从
事电力系统运行和新能源调度控制方面的
研究;
张利(1967),女,副教授,硕士生导师,
主要从事电力系统运行与控制以及电力市
场方面的研究;
徐兵(1988),男,硕士研究生,主要从
事电力系统运行、控制及建模方面的研究。
(责任编辑 王剑乔)
Wang Xinying,Han Min.Multivariate chaotic time series
prediction based on extreme learning machine[J].Acta
Phys.Sin.,2012,6(8):080507-1-080507-9(in Chinese).
[15] Huang G B,Ding X J,Zhou H M.Optimization method
based extreme learning machine for classification[J].
Neurocomputing,2010,74(1-3):155-163.
[16] Huang G B,Zhou H M,Ding X J,et al.Extreme learning
machine for regression and multiclass classification[J].
IEEE Trans. on System,Man and Cybernetics-Part B:
Cybernetics,2012,42(2):513-529.
[17] Huang N E,Shen Z,Long S R.The empirical mode
decomposition and the Hilbert spectrum for nonlinear and
non-stationary time series analysis[J].Proceedings of the
Royal Society Soc Lond.,1998,454(1971):903-995.
[18] 彭涛,陈晓宏,庄承彬.基于样本熵的东江月径流序列
复杂性分析[J].生态环境学报,2009,18(4):1379-1382.
Peng Tao,Chen Xiaohong,Zhuang Chengbin.Analysis
on complexity of monthly runoff series based on sample
entropy
river[J] . Ecology and
Environmental Sciences , 2009 , 18(4) : 1379-1382(in
Chinese).
the Dongjiang
in
[19] Richman J S,Moorman J R,Physiological time-series
analysis using
sample
entropy[J].American Journal of Physiological Heat and
Circulatory Physiology,2000,278(6):2039-2049.
approximate
entropy
and
[20] 袁琦,周卫东,李淑芳,等.基于 ELM 和近似熵的脑
电信号检测方法[J].仪器仪表学报,2012,33(3):
514-519.
Yuan Qi,Zhou Weidong,Li Shufang,et al.Approach of
EEG detection based on ELM and approximate
entropy[J].Chinese Journal of Scientific Instrument,
2012,33(3):514-519(in Chinese).
[21] Huang G B,Zhu Q Y,Siew C K.Extreme learning
machine:theory and application[J].Neurocomputing,