第42卷 第10期 电 网 技 术 Vol. 42 No. 10 2018年10月 Power System Technology Oct. 2018 文章编号:1000-3673(2018)10-3234-07 中图分类号:TM 614 文献标志码:A 学科代码:470·40 考虑多位置NWP和非典型特征的 短期风电功率预测研究 宋家康,彭勇刚,蔡宏达,夏杨红,王晓明 (浙江大学 电气工程学院,浙江省 杭州市 310027) Research of Short-Term Wind Power Forecasting Considering Multi-Location NWP and Uncanonical Feature SONG Jiakang, PENG Yonggang, CAI Hongda, XIA Yanghong, WANG Xiaoming (College of Electrical Engineering, Zhejiang University, Hangzhou 310027, Zhejiang Province, China)ABSTRACT1: Numerical weather prediction (NWP) is the main input of short-term wind power forecasting model. Usually, only five canonical features in the NWP, namely wind speed, wind direction, temperature, humidity and pressure, are considered in conventional models, most of which are established based on the NWP of single location. In order to make full use of NWP information, applicability of uncanonical features is investigated and the NWP information of multiple locations is considered. By combining the NWP information of multiple locations with uncanonical features, the method where models are established based on input variables obtained with the principle of minimal redundancy and maximal relevance is proposed and compared with the method based on principal component analysis. Results show that NWP of multiple locations and its uncanonical features contain useful information, beneficial to improve prediction accuracy. By considering the NWP of multiple locations and uncanonical features, the forecasting model based on principle of minimal redundancy and maximal relevance shows advantages over the model based on principal component analysis and improves its RMSE by 1.84%, compared with the model only considering NWP of single location with canonical features. KEY WORDS: short-term wind power forecasting; uncanonical feature; multiple locations; feature selection; numerical weather prediction 摘要:数值天气预报(numerical weather prediction,NWP)是短期风电功率预测模型的主要输入。通常,传统模型只考虑 基金项目:国家重点研发计划项目(2017YFB0903300);浙江省重点研发计划项目(2017C01039);浙江省自然科学基金项目(LY16E070002)。 Project Supported by the National Key Research and Development Program (2017YFB0903300); Key Research and Development Program of Zhejiang Province (2017C01039); Natural Science Foundation of Zhejiang Province (LY16E070002). NWP的风速、风向、温度、湿度、压强这5类典型特征,且多数在单位置NWP的基础上建立。因此,为充分利用NWP信息,研究了NWP非典型特征的可用性,并考虑了多个位置的NWP信息。在考虑多位置NWP及非典型特征时,提出了以最大相关-最小冗余原则提取输入变量的预测方法,并和通过主成分分析提取的方法进行对比。结果表明,多位置NWP和非典型特征均包含有效信息,有利于提高预测精度。而在考虑多位置NWP和非典型特征时,以最大相关-最小冗余原则建立的模型比通过主成分分析建立的模型预测精度更高,其均方根误差较只考虑单位置NWP和典型特征时降低了1.84%。 关键词:短期风电功率预测;非典型特征;多位置;特征选择;数值天气预报 DOI:10.13335/j.1000-3673.pst.2018.0492 0 引言 目前,中国是世界上风电装机容量最多,也是风电发展最迅速的国家[1],风力发电已成为国内继火电、水电之后的第三大电力能源。但同时,风电发展也面临着一系列突出问题。由于风能具有较强的波动性与间歇性,风电场大规模接入后给电网的稳定运行和调度带来了严峻挑战。风功率预测是目前国内外公认的解决这一问题的关键技术之一[2]。根据国家能源局规定,所有并网运行的风电场须向电网调度机构提供次日0:00至24:00发电功率的预测,称为日预报[3]。风电功率的日预报属于短期风力预测范畴。 国内的短期预测方法多集中于时序法、人工神经网络法等[4-5],几乎都用到了数值天气预报(numerical weather prediction,NWP)数据[6]。以NWP数据为预测模型输入时,传统方法通常只考虑某个特定位置(网格点)的风速、风向、温度、湿度、压
第42卷 第10期 电 网 技 术 3235 强这5类特征[7-10],将其称为典型特征(canonical feature,CF)。而对NWP数据中的其余特征,即非典型特征(uncanonical feature,UF),以及对多位置NWP的应用与研究则相对较少。 在典型特征基础上,一般通过两类方法得到输入变量。一是通过主成分分析(principal component analysis,PCA)进行特征提取[11],二是考虑典型特征与风电功率间的相关性,并以此为依据进行特征选择[12]。在考虑NWP的非典型特征时,尤其在多位置情况下,不论是对NWP的特征提取还是特征选择都显得尤为重要。文献[13]以风电场周围位置NWP的主成分作为模型的输入,并通过聚类分析提取相似训练样本,有效降低了训练时间,并提高了预测精度。但该方法只使用了NWP中的典型特征,且主成分分析会损失风电功率与NWP间的部分非线性信息。而文献[14]只利用NWP构造待预测日风电功率的参考样本,以非线性指标——熵相关系数为依据选取高相关的历史样本作为模型输入,同时改进BP神经网络,提高了预测模型的泛化能力与计算效率。然而,通过特征排序法选择(只取熵相关系数靠前)的历史样本之间往往也有很强的相关性,这会增加网络的冗余性[15]。NWP数据中不同层高的风速与风电功率的相关性最高,但不同层高的风速之间相关性也很高,仅仅通过特征排序法对NWP进行特征选择,容易选中每个层高的风速为输入。显然,如果只以不同层高的风速为输入变量,会给预测模型带来较高的冗余性,增加网络的复杂度,因而难以获得准确且稳定的预测结果。 综上所述,本文考虑了多位置NWP及其非典型特征,对其可用性进行研究。并引入了最大相关-最小冗余(minimal-redundancy-maximal-relevance,mRMR)原则对包含非典型特征的多位置NWP数据进行特征选择建立预测模型。该方法不仅可以充分利用NWP信息,还保证了输入变量与风电功率相关性高的同时,输入变量整体的冗余性低。 同时,本文还通过主成分分析法对NWP进行特征提取建立了模型,并以西班牙Sotavento风电场的数据为基础对二者进行了对比分析。首先,在单位置NWP情况下,考虑非典型特征,分别基于mRMR原则和通过PCA提取输入变量建立了预测模型,同时建立只考虑典型特征的预测模型。其次,类似地,在多位置NWP情况下,亦建立了上述模型。最后,从输入变量和预测结果两个角度对各方法进行了对比分析,验证了所提方法的优越性。 1 输入变量的提取 1.1 熵相关系数 为了消除变量量纲不同对互信息的影响,文 献[16-17]以不同方式对互信息进行了归一化。文 献[14]将其中一种称为熵相关系数R(X,Y)并将其应用于风电功率与历史样本的相关性衡量,其定义为 (,)(,)()()IXYRXYHXHY (1) 式中:I(X,Y)为变量X和变量Y的互信息;H(X)和H(Y)分别为X和Y的熵。可得,熵相关系数是归一化的互信息,可用来量化一个特征所含关于目标特征的信息。由于NWP数据和风电功率都是连续性随机变量,其概率密度函数难以计算,因此需进行离散化处理[18-19],离散化后的熵相关系数公式可参见附录A。 1.2 基于mRMR原则的特征选择 设NWP的全部特征(all feature,AF)共有m项,将其表示为{,1,2,...,}i=qi=mQ。基于mRMR原则选择得到的最优特征子集包含n项特征,将其表示 为{,1,2,...,}j=uj=nU,风电功率用p表示。 mRMR原则[20]由两个原则共同组成,其中最大相关原则是指最优特征子集与风电功率的熵相关系数的平均值最大,即满足 1max(,),(,)||iiuDpDRpuUUU (2) 式中|U|是取集合U元素个数的运算。 而最小冗余原则是指最优特征子集内各项特征之间的熵相关系数的平均值最小,即满足 2,1min(),(,)||ijijuuFFRuuUUU (3) 引入算子Φ将相关信息D和冗余信息F相结合,得到mRMR原则为 max(,),ΦDFΦDF (4) 实际中,可通过增量搜寻法获得满足近似最优特征子集,计算步骤如下: 1)计算Q内每项特征与功率p的熵相关系数,取熵相关系数最大的一项特征lq,令 {},lqUQQU (5) 式中“”代表集合差运算。 2)遍历Q内的特征,找到算子增益Φ最大的特征hq,即新特征满足: maxhqUΦ (6) 1[(,)(,)]1jhhjqΦRpqRqqmQ (7)
3236 宋家康等:考虑多位置NWP和非典型特征的短期风电功率预测研究 Vol. 42 No. 10 3)对满足式(6)的新特征hq,令 {},hqUUQQU (8) 4)判断U包含特征的个数,若不满足要求则返回步骤2,继续迭代计算。 式(6)(7)给出了新特征应满足的条件,将Φ称为算子增益。根据式(7),算子增益代表新特征所包含的相关信息与冗余信息的差值,值越大,则新特征有助于预测的信息越多,故算子增益也是对新特征的评价指标,类似于机器学习中的信息增益[21]。 1.3 基于PCA的特征选择 主成分分析是常用的一种特征提取方法,被广泛应用于风电功率预测领域。它将高维数据转化为低维线性无关的主成分。所提取的主成分既保留了原始数据的大部分信息,同时又降低了维度,可作为新的输入变量。因此,可对NWP包含的特征进行主成分分析,将提取的主成分作为输入变量建立预测模型。主成分分析的计算步骤可参见文献[10]。 2 风电功率预测模型 2.1 预测模型及评价指标 本文主要研究不同输入变量对风电功率预测精度的影响,因此以浅层神经网络作为基础预测模型。其网络结构为单隐含层,激活函数sigmoid函数,采用反向传播算法(back propagation,BP)和随机梯度下降算法[22]训练模型,隐含层神经元数目通过遍历得到,预测模型建立原理如图1所示。其中,输入tR为t时刻NWP向量。 PCA/mRMRBP神经网络XtPtRt 图1 模型原理图 Fig. 1 Schematic diagram of model 实质上,预测模型是对根据NWP特征获得的输入变量与风电功率非线性关系的拟合,即 BP()ttpfX (9) 式中:tp为t时刻的功率;tX代表t时刻输入向量,对应着NWP的最优特征子集或主成分。误差指标选择常用的均方根误差(root mean square error,RMSE)和平均绝对误差(mean absolute error,MAE)[23],其定义为 fRMSE111()NiiiePPPN (10) fMAE11||NiiiePPPN (11) 式中:N为样本数量;iP是i时刻实际功率值;fiP是i时刻预测功率值;P是风电场的额定装机容量。 2.2 标的风电场与NWP 本文选择西班牙加利西亚省的Sotavento风电场进行算例分析。风场具体情况可见附录B,该场可用数据为该场2016年全年实测风速、风向、发电功率以及配套的NWP数据。NWP数据由加利西亚省气象局提供,于每日0时发布,提供未来4天的预报,时间分辨率为1 h,空间分辨率为4 km。 每个位置的NWP包括37项特征,对其进行编号:其中,5类典型特征包含阵风速率、4个高度的风速与风向以及空气的温度、湿度、压强,共计12项,将其编号为1—12。而非典型特征如可见度、降雨量等,则编号为13—37,每项编号所代表的特征含义以及多个位置NWP在若干天的风速预测曲线可参见附录B。风电场周围的NWP网格点共有6个,可完整地包裹整个风电场,如图2所示。因此选择这6个位置的NWP数据进行分析。 图2 风场风机排布与周围NWP位置 Fig. 2 Locations of NWP and wind turbines of the wind farm 本文主要研究日预报,因此提取2016年1月份至11月份每日0时至24时的数据用于建模分析,将2016年12月份的数据用于验证。 3 对比分析 3.1 单位置NWP下的预测模型建立过程 由图2可得,位置2距离各个风机的平均距离最短,因此,先建模分析位置2处的NWP数据。 首先,基于mRMR原则对NWP的全部特征进行特征选择。原始特征集为NWP全部37项特征,
第42卷 第10期 电 网 技 术 3237 而初始的最优特征子集为空集,由式(1)计算出每项特征的熵相关系数,结果如图3所示。 图3中前12项为典型特征,后25项为非典型特征。其中,第34项为空气的可见度(Visibility),与风电功率的熵相关系数在非典型特征中最高。其余非典型特征亦具有一定相关性,这也从侧面反映了非线性特征的可用性。 图3 单位置NWP特征与风电功率的熵相关系数 Fig. 3 Entropy correlation coefficient between wind power with NWP data of single location 在所有特征中,第1项的熵相关系数最大,为阵风速率(Gust),代表了瞬间极大风速。因此,将其作为最优特征子集的第1项,并从原始特征集中移除。之后,遍历NWP剩余的36项特征,根据 式(7)算出每项特征的算子增益,得到算子增益最大的为非典型特征对流降水量(CPrec)。则将其作为第2项新特征加入到最优特征子集并从原始特征集中移除。以此类推,直到所有特征都加入到最优特征子集中,便完成了对原始特征子集的排序。此时,新特征加入最优特征子集的顺序即是NWP全部特征的排序,每项特征的算子增益如图4所示。 图4 单位置下的算子增益曲线 Fig. 4 Carve of operator gain of single location 从图4可以看出每项加入最优特征子集的新特征包含的有益信息。其中,从第8项新特征起,特征的算子增益先在0处波动,之后从第11项开始一直小于0,总体呈下降趋势。 当算子增益小于0时,由式(7)可知,新特征带来的冗余信息将多于相关信息,则认为此时加入最优特征子集的新特征并不利于预测。因此,本文选择算子增益大于0的前8项特征组成最优特征子集,如表1所示,表中每项特征含义见附录B1。 以表1所示的最优特征子集为输入变量建立预测模型,称为AF-mRMR。然后,为了对比分析,分别对NWP全部特征和典型特征做主成分分析,得到各主成分的累计方差贡献率如图5所示。 表1 单位置下的最优特征子集及对应的熵相关系数 Tab. 1 Optimal feature and its corresponding entropy correlation coefficient correlation of single location NWP特征 熵相关系数 Gust 0.184 1 CPrec 0.080 3 U3 0.156 5 Visibility 0.105 2 Swflx 0.067 3 W 0.157 8 Pres 0.082 0 Cfh 0.059 8 图5 单位置NWP主成分贡献率 Fig. 5 Contribution rates of principal components based on NWP of single location 由图5可得,典型特征对应前5个主成分的累计方差贡献率达到了93.11%,全部特征对应的前12个主成分的累计方差贡献率达到了90.35%。据此,分别选取典型特征的前5个主成分为输入变量建立CF-PCA模型,以全部特征的前12个主成分为输入变量建立AF-PCA模型。 3.2 多位置NWP的预测模型建立过程 在考虑多位置NWP数据进行特征选择时,每个位置的NWP有37项特征,将6个位置的特征并列,则此时NWP的全部特征共计222项,典型特征共计72项,NWP特征的编号从1—37变为1—222,各项特征具体含义亦见附录表B1。类似于单位置NWP的特征选择过程,首先,计算各项特征与风电功率的熵相关系数,结果如图6所示。 由图6可得,各位置的NWP特征相似度很高,曲线具有一定周期性。其中,位置1处的阵风风速(Gust-1)与风电功率的熵相关系数最大。可见,位置1 处包含了比2处更有效的信息,但在图2中位置1显然不如位置2更贴近各风机。因此,将其作为最优特征子集的第1项。同样地,可得各项新特征的算子增益曲线,如图7所示。
3238 宋家康等:考虑多位置NWP和非典型特征的短期风电功率预测研究 Vol. 42 No. 10 图6 多位置NWP全部特征与风电功率的熵相关系数 Fig. 6 Entropy correlation coefficient between wind power with all features of NWP data of multi-locations 图7 多位置下的算子增益曲线 Fig. 7 Carve of operator gain of multi-locations 由图7可得,从第8项新特征开始,算子增益开始在0处波动。因此,本文选择算子增益大于0的前8项特征组成最优特征子集,如表2所示。 由表2可得,在多个位置NWP下,最优特征子集选中的气象信息与单位置有相同的项,如阵风速率等,只不过位置不同。发现,位置1处的阵风速率具有最高熵相关系数,而不是距离各风机最近的位置2处的阵风速率。在多位置下通过mRMR原则选择的特征比单位置下的特征熵相关系数都更高,即更有效,这也说明了单个位置NWP数据的局限性。 以表2所示的最优特征子集为输入变量建立预测模型,记作MAF-mRMR。表中NWP特征后的数字编号代表图2中NWP的位置编号,即Gust-1表示图2中的NWP1处的Gust特征,每项特征含义见附录B1。 同理,多位置NWP的全部特征和典型特征的 表2 多位置下的最优特征子集及对应熵相关系数 Tab. 2 Optimal feature and its corresponding entropy correlation coefficient correlation of multi-locations NWP特征 熵相关系数 Gust-1 0.197 6 Lwflx-4 0.071 5 U3-3 0.156 5 W-6 0.159 8 CPrec-2 0.098 0 PBL-2 0.086 9 Gust-3 0.184 1 HGT850-5 0.093 2 前40个主成分如图8所示。由图8可得,多位置下,典型特征对应的前5个主成分累计方差贡献率达到了91.80%,全部特征对应的前15个主成分累计方差贡献率达到了90.25%。 图8 多位置NWP主成分贡献率 Fig. 8 Contribution rates of principal components based on NWP of multi-locations 因此,分别以典型特征的前5个主成分为输入变量建立MCF-PCA模型,以全部特征的前15个主成分为输入变量建立MAF-PCA模型。 3.3 输入变量的对比分析 至此,得到了6种预测模型,分别对应着6个输入变量集,每个输入变量集的维数如表3。 表3 6个模型输入变量维数 Tab. 3 Input variable dimensions of 6 models 预测模型 输入维数 预测模型 输入维数 CF-PCA 5 MCF-PCA 5 AF-PCA 12 MAF-PCA 15 AF-mRMR 8 MAF-mRMR 8 由表3可得对全部特征通过PCA提取的输入变量维数最高,而基于mRMR原则选择的输入变量维数处于中等水平。其中,多位置NWP下,基于mRMR原则进行特征选择,将包含非典型特征的222维NWP特征筛选到只有8维。 由式(7),可计算由PCA提取的主成分的算子增益,并与基于mRMR原则选取的输入变量对比,结果如图9所示。由于算子增益从第2点开始,所以第1点为该特征与风电功率的熵相关系数。 图9从变量的相关性和冗余性角度上反映了6个输入变量集的优劣。由图9可得,MAF-mRMR 图9 各模型的输入变量集的算子增益 Fig. 9 Operator gain of each model input variable set
第42卷 第10期 电 网 技 术 3239 模型对应的第1项输入变量的熵相关系数最高,且MAF-mRMR模型的大多数输入变量的算子增益优于AF-mRMR模型。通过PCA提取的第一主成分的熵相关系数相比而言则降低较多,可见主成分分析后数据丢失了部分非线性信息。之后的主成分算子增益波动较大,呈现不出明显的规律。因此,从输入变量的算子增益角度只能明显看出:基于mRMR原则,考虑多个位置NWP提取的输入变量优于单个位置,而通过PCA提取的输入变量会损失原始数据的部分非线性信息。 3.4 预测结果的对比分析 以2016年1—11月数据为基础建立上述6种预测模型,以12月份数据为验证,可得不同模型的平均误差如表4所示,误差概率密度函数如图10所示,且其中1周左右的预测曲线见附录B。 表4 6个模型12月份日前预测误差 Tab. 4 Day-ahead prediction error of 6 models in Dec. 预测模型 RMSE/% MAE/% CF-PCA 12.60 9.53 AF-PCA 11.78 8.77 AF-mRMR 11.92 8.89 MCF-PCA 11.61 8.48 MAF-PCA 11.14 8.06 MAF-mRMR 10.76 7.73 图10 6个模型预测误差的概率密度函数 Fig. 10 Probability density function of forecasting deviation of 6 models 由表4可以看出,对指标RMSE,AF-PCA和AF-mRMR模型比CF-PCA模型预测误差分别降低了0.82%和0.68%,MAF-PCA和MAF-mRMR模型比MCF-PCA模型分别降低了0.41%和0.85%。可见,不管是单个位置还是多个位置下,NWP的非典型特征同样包含有用信息,考虑了非典型特征的预测模型精度更高。在单个位置下,由于风电场内风机比较分散,单位置NWP数据无法准确描述风电场的气象信息。此时,通过PCA提取输入变量建立的预测模型比基于mRMR原则建立的模型精度更高。 在多个位置NWP情况下,各模型预测误差比只考虑单位置时分别降低了0.99%(MCF-PCA对CF-PCA)、0.64%(MAF-PCA对AF-PCA)、1.16% (MAF-mRMR对AF-mRMR)。可见,风电场周围多个位置的NWP数据包含更多更有效的信息,考虑多位置NWP可有效提高预测模型的精度。 在6个模型中,MAF-mRMR模型的预测误差最低,比CF-PCA降低了1.84%。因此,在利用NWP进行短期风电功率预测时,应考虑多位置NWP及其非典型特征。此时,利用熵相关系数,基于mRMR原则提取输入变量具有可行性,所建立模型的精度比通过主成分分析建立的模型更高。对MAE亦有类似结论。 4 结论 为提高短期风电功率的预测精度,本文研究了多位置NWP和非典型特征的影响,并通过两种方式提取输入变量建立预测模型,通过算例分析,得到如下结论: 1)NWP非典型特征包含有用信息,考虑非典型特征可提高预测精度。 2)多位置的NWP包含更多更准确的信息,考虑多位置NWP的预测模型比只考虑单位置的预测模型精度更高。 3)在多位置NWP情况下,利用熵相关系数,基于mRMR原则提取的输入变量与风电功率相关性高,整体冗余性低,其模型精度比通过PCA建立的模型更高。 4)由于单位置NWP无法准确地描述风电场的气象信息,此时,通过PCA建立的模型更优。 本文主要研究和分析了输入变量对预测模型精度的影响,而预测网络同样对精度有重要影响,利用改进的预测网络将有助于提高预测精度,这也是我们下一步的研究重点。 附录见本刊网络版(http://www.dwjs.com.cn/CN/volumn/ current.shtml)。 参考文献 [1] 钱政,裴岩,曹利宵,等.风电功率预测方法综述[J].高电压技术,2016,42(4):1047-1060. Qian Zheng,Pei Yan,Cao Lixiao,et al.Review of wind power forecasting method[J].High Voltage Engineering,2016,42(4):1047-1060(in Chinese). [2] 乔颖,鲁宗相,闵勇.提高风电功率预测精度的方法[J].电网技术,2017,41(10):3261-3269. Qiao Ying,Lu Zongxiang,Min Yong.Research & application of raising wind power prediction accuracy[J].Power System Technology,2017,41(10):3261-3269(in Chinese). [3] 国家能源局.风电场功率预测预报管理暂行办法[Z].北京:国家能源局,2011. [4] 薛禹胜,郁琛,赵俊华,等.关于短期及超短期风电功率预测的
3240 宋家康等:考虑多位置NWP和非典型特征的短期风电功率预测研究 Vol. 42 No. 10 评述[J].电力系统自动化,2015,39(6):141-151. Xue Yusheng,Yu Chen,Zhao Junhua,et al.A review on short-term and ultra-short-term wind prediction[J].Automation of Electric Power Systems,2015,39(6):141-151(in Chinese). [5] 叶林,滕景竹,蓝海波,等.变尺度时间窗口和波动特征提取的短期风电功率组合预测[J].电力系统自动化,2017,41(17):29-36,59. Ye Lin,Teng Jingzhu,Lan Haibo,et al.Combined prediction for short-term wind power based on variable time window and feature extraction[J].Automation of Electric Power Systems,2017,41(17):29-36,59(in Chinese). [6] 谷兴凯,范高锋,王晓蓉,等.风电功率预测技术综述[J].电网技术,2007,31(2):335-338. Gu Xingkai,Fan Gaofeng,Wang Xiaorong,et al.Summarization of wind power prediction technology[J].Power System Technology,2007,31(2):335-338(in Chinese). [7] 范高锋,王伟胜,刘纯,等.基于人工神经网络的风电功率预测[J].中国电机工程学报,2008,28(34):118-123. Fan Gaofeng,Wang Weisheng,Liu Chun,et al.Wind power prediction based on artificial neural network[J].Proceedings of the CSEE,2008,28(34):118-123(in Chinese). [8] 白永祥,房大中,侯佑华,等.内蒙古电网区域风电功率预测系统[J].电网技术,2010,34(10):157-162. Bai Yongxiang,Fang Dazhong,Hou Youhua,et al.Regional wind power forecasting system for Inner Mongolia Power Grid[J].Power System Technology,2010,34(10):157-162(in Chinese). [9] 杨志凌,刘永前.应用粒子群优化算法的短期风电功率预测[J].电网技术,2011,35(5):56-61. Yang Zhiling,Liu Yongqian.Short-term wind power prediction with particle swarm optimization[J].Power System Technology,2011,35(5):56-61(in Chinese). [10] 王勃,冯双磊,刘纯.基于天气分型的风电功率预测方法[J].电网技术,2014,38(1):93-98. Wang Bo,Feng Shuanglei,Liu Chun.Study on weather typing based wind power prediction[J].Power System Technology,2014,38(1):93-98(in Chinese). [11] 周松林,茆美琴,苏建徽. 基于主成分分析与人工神经网络的风电功率预测[J].电网技术,2011,35(9):128-132. Zhou Songlin,Mao Meiqin,Su Jianhui.Prediction of wind power based on principal component analysis and artificial neural network [J].Power System Technology,2011,35(9):128-132(in Chinese). [12] 朱乔木,李弘毅,王子琪,等.基于长短期记忆网络的风电场发电功率超短期预测[J].电网技术,2017,41(12):3797-3802. Zhu Qiaomu,Li Hongyi,Wang Ziqi,et al.Short-term wind power forecasting based on LSTM[J].Power System Technology,2017, 41(12):3797-3802(in Chinese). [13] 王丽婕,冬雷,高爽.基于多位置NWP与主成分分析的风电功率短期预测[J].电工技术学报,2015,30(5):79-84. Wang Lijie,Dong Lei,Gao Shuang.Wind power short-term prediction based on principal component analysis of NWP of multiple locations[J].2015,30(5):79-84(in Chinese). [14] 史坤鹏,乔颖,赵伟,等.计及历史数据熵关联信息挖掘的短期风电功率预测[J].电力系统自动化,2017,41(3):13-18. Shi Kunpeng,Qiao Ying,Zhao Wei,et al.Short-term wind power prediction based on entropy association information mining of historical data[J].Automation of Electric Power Systems,2017,41(3):13-18(in Chinese). [15] 赵永宁,叶林.区域风电场短期风电功率预测的最大相关-最小冗余数值天气预报特征选取策略[J].中国电机工程学报,2015,35(23):5985-5994. Zhao Yongning,Ye Lin.A numerical weather prediction feature selection approach based on minimal-redundancy-maximal-relevance strategy for short-term regional wind power prediction[J].Proceedings of the CSEE,2015,35(23):5985-5994(in Chinese). [16] 丁晶,王文圣,赵永龙.以互信息为基础的广义相关系数[J].四川大学学报(工程科学版),2002(3):1-5. Ding Jing,Wang Wensheng,Zhao Yonglong.General correlation coefficient between variables based on mutual information[J].Journal of Sichuan University(Engineering Science Edition),2002(3):1-5(in Chinese). [17] Maes F,Collignon A,Vandermeulen D,et al.Multimodality image registration by maximization of mutual information[J].IEEE Transactions on Medical Imaging,1997,16(2):187-198. [18] Kraskov A,Stögbauer H,Grassberger P.Estimating mutual information[J].Physical Review.E,Statistical,Nonlinear,and Soft Matter Physics,2004,69(6 Pt 2):066138. [19] 庄楚强,吴亚森.应用数理统计基础[M].广州:华南理工大学出版社,1992. [20] Peng H,Long F,Ding C.Feature selection based on mutual information criteria of max-dependency,max-relevance,and min- redundancy[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(8):1226-1238. [21] 周志华.机器学习[M].北京:清华大学出版社,2016. [22] Rumelhart D E,Hinton G E,Williams R J.Learning representations of back-propagation errors[J].Nature,1986(323):533-536. [23] 徐曼,乔颖,鲁宗相.短期风电功率预测误差综合评价方法[J].电力系统自动化,2011,35(12):20-26. Xu Man,Qiao Ying,Lu Zongxiang.A comprehensive error evaluation method for short-term wind power prediction[J].Automation of Electric Power Systems,2011,35(12):20-26(in Chinese). 收稿日期:2018-03-19。 作者简介: 宋家康(1995),男,硕士研究生,研究方向为可再生能源的预测,E-mail:sjk171@zju.edu.cn;彭勇刚(1978),男,通信作者,教授,博士生导师,研究方向为进化优化、智能电网等,E-mail:pengyg@zju.edu.cn; 蔡宏达(1990),男,博士研究生,研究方向为新能源发电控制,E-mail:caihd@zju.edu.cn; 夏杨红(1991),男,博士研究生,研究方向为微电网与非线性控制,E-mail:royxiayh@zju.edu.cn;王晓明(1993),男,博士研究生,研究方向为新能源与智能电网,E-mail:wxm_15@zju.edu.cn。宋家康 (责任编辑 王金芝)
附录A 离散后的NWP数据某一特征1N和风电功率的熵相关系数表达式为 pN1pN1N1,pN1,p11N1p1ppN1N111(,)(,)lg()()(,)=()()()()lglgNNiiNNjinijNnijNninjRpNnjnjniniNNNN(A1) 式中:N1N为对1N升序排列等分的子区间个数;N1()ni为1N第i个子区间内的数据个数;pN为对功率p升序排列等分的子区间个数;p()nj为功率p第j个子区间内的数据个数;N1,p(,)nij为落入1N第i个子区间且对应功率落入功率p第j个子区间内的数据个数N1,p(,)nij;N为数据序列的总个数。对等分区间数的计算可参考经验公式: 2/5p1.87(1)NN (A2) 附录B Sotavento风电场总装机容量为17.56 MW,位于西经7.8812度,北纬43.3543度,共有24台风机,风机排布呈现“一”字形。该场长度为4 km左右,宽度不超过1 km,所处地形为山地,整个风电场海拔高度在600~700 m之间,地形为中度复杂,风电场实景图如图B1所示。 图B1 风电场实景图 Fig. B1 Reality images of wind farm 图B2描述了多个位置NWP连续4天的风速预测曲线与实际风速曲线的对比。 图B2 6个NWP位置连续4天的风速预测曲线 Fig. B2 Wind speed forecasting carves of the 6 NWP locations 图B3描述了上述6个预测模型在12月份其中1周左右的预测结果对比。 图B3 各模型1周左右预测结果对比图 Fig. B3 Comparison of forecasting results of each mode 表B1为NWP编号1—37的每项特征的名称(英文简写)及其含义。而图2中不同位置的NWP特征由预测特征名称加上位置编号用以区分表示,例如,Gust-2代表图2中NWP2处的Gust特征。