2
23
2
一种规范化的处理相关因素的短期负荷预测新策略
康重庆 程 旭 夏 清 沈 瑜
(清华大学电机系 100084 北京)
1999 年 9 月
第 23 卷 第 18 期
电 力 系 统 自 动 化
A u tom ation of E lectric Pow er System s
摘 要 提出了一种规范化的可以直接考虑各种相关因素的短期负荷预测新策略。 这种策略不仅
可以考虑已经被详细研究过的气象因素, 而且可以同时考虑一般性的分类指标, 如工作日
休息日,
节假日等。 设计了一个规范化的相关因素映射数据库, 用以反映不同影响因素在映射函数
正常日
上的差异。根据模式识别的基本原理, 应用聚类分析方法描述由于相关因素的不同而导致的待预测
日与历史日之间的差异程度。作为这种预测策略的一个应用, 实现了一种基于相关因素匹配的短期
预测方法。 实际算例表明, 应用这种新的规范化的预测策略可以得到更加精确的预测结果。
关键词 短期负荷预测 模式识别 聚类分析
分类号 TM 715
0 引言
负荷预测是从已知的用电需求和对此有影响的
经济、气象等因素情况出发, 探索用电负荷与主要影
响因素之间的内在联系和发展变化规律, 对未来用
电需求作出预先的预测。 负荷预测工作实质上是对
电力市场需求的预测, 是实现电网安全、经济运行的
前提。为了准确地预测市场对电力这一商品的需求,
必须认真分析各种信息与相关数据, 采用最新的理
论进一步提高预测精度。 提高预测精度的途径之一
是在预测过程中设法计及各种相关因素 (如气象因
素) 对预测结果的影响[ 1, 2 ]。
1 基于聚类分析的预测策略
1
1 现有方法分析
短期负荷预测是负荷预测的重要组成部分。 国
内外学者提出了多种短期负荷预测的方法, 如多元
回归[ 3 ]、谱分析[ 2, 3 ]、A RM A 模型[ 2, 3 ]、人工神经网络
方法 (ANN ) [ 4 ]等。 总结起来, 主要可以分为以下几
类: ①仅利用负荷自身发展规律的方法, 如A RM A
模型等; ②负荷发展规律与气象因素结合的方法, 如
ANN 方法; ③其他方法。
第 1 类方法仅仅对历史负荷数据进行统计、分
析、运算, 而对于其他的相关信息特别是对短期负荷
影响较大的气象信息没有进行考虑, 使正常日的预
测精度无法进一步提高, 而特殊天气日更会造成误
差过大。 这是因为仅靠历史数据并不能很好地反映
它未来的发展趋势, 气象因素对短期负荷的影响很
1999
07
07 收稿。
大, 但未能在这类算法中体现。
第 2 类方法考虑了气象因素, 一般采用经验方
法, 利用粗略的气象情况进行补偿, 或者作为相关元
进入神经网络模型计算, 但由于采用的信息太少和
相关方式较弱, 结果有时并不理想。 此外, 该类方法
一般不涉及气象以外的因素, 并且计及气象因素的
方式也不灵活。
事实上, 负荷预测考虑的相关因素绝对不仅仅
是气象因素, 而应该包括: 日分类 (正常日、国庆、春
节等) ; 星期类型 (周一~ 周日) ; 日期差 (两日之间相
距的天数) ; 日天气类型 (晴、阴等) ; 日最高温度、日
平均温度、日最低温度; 日降雨量; 湿度; 风速等。 随
着科学技术的发展, 有可能新增加其他相关因素。为
了叙述方便, 下文中称上述所有相关因素在某日的
取值为该日的特征量。
因此, 需要一种规范化的策略, 可以直接考虑各
种相关因素 (不仅是气象因素)。 该策略既可以指导
预测人员构造新的短期负荷预测方法, 也可以对各
种现有的预测方法进行改造, 使之可以计及各种因
素的影响。
模式识别中的聚类分析是处理这些特征量的一
种很好的思路[ 1, 2, 5 ]。 本文应用聚类分析的基本原
理, 在不同日之间特征量的差异度、相似度概念的基
础上, 设计了一种规范化的映射数据库, 并举例说明
了具体预测方法的实现。
1
2 不同日之间特征量的差异度、相似度
这里首先引入各日的量化指标向量: 记 X i =
[ x i1, x i2, …, x im ] 为第 i 日的所有特征量的取值 (假
设共有 m 个特征量) , 记 L i = [ li1, li2, …, liT ] 为第 i
日的负荷曲线 (假设共有 T 个数据点, 例如 T = 24,
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
·学术论文与应用研究· 康重庆等 一种规范化的处理相关因素的短期负荷预测新策略
33
q
d ij =
m
∑
k= 1
x ik -
x jk
q
(1)
T = 48 等) , 则可将第 i 日的所有量化指标记为:
D i = (X i, L i)。
于是可以引入不同日之间“差异度”的概念, 它
描述任意两日由于特征量的差别而表现出的差异程
度。 抽象地, 设有 i, j 两天, 其因素量化指标分别为
X i, X j, 则可用下述指标描述两天之间的差异度:
当 q = 2 时, 该差异度正是 m 维空间中两点之
间的距离。
类似地, 可以引入“相似度”的概念, 它描述两天
之间特征量的接近程度。 可用下述指标计算:
m
∑
k= 1
x ikx jk
rij =
(2)
m
m
∑
ik∑
x 2
x 2
jk
k= 1
k= 1
该相似度是 m 维空间中两向量之间的夹角余
弦。
相似度与差异度可以用一定的尺度进行相互转
换, 例如:
其中
,
rij = 1 -
为适当的参数。
d
ij
(3)
2 差异度与相似度计算的实际处理
差异度 d ij 越小 (相似度 rij 越大) , 表示 i, j 两天
之间的日类型、天气类型、气象状况等各种因素“综
合”意义上更接近, 考虑以下情况:
a
一 般 情 况 下, 应 将 所 有 的 x ik, x jk 映 射 到
[ 0, 1 ] 区间上比较, 这样才有可比性。但是, 为了体
现其中某些因素的“主导”差异, 可以使其在[ 0, a ]
上映射, 这里 a > 1, 从而使该分量的差异在 d ij 中显
得比较强烈。
b
对于常规的直接量化气象指标, 如日平均温
度、日最高温度、日最低温度、降雨量、平均风速和湿
度等, 应采取线性映射, 或分段线性映射 (按几个阈
值分段) ; 对于近大远小的日期差 i -
j , 采用线性映
射, 对于星期类型 (周一, 周二, …, 周日) 可采用分组
映射, 如周一~ 周五映射为 0
5, 周六、周日为
2, 从而加大休息日和工作日之间的差别; 对
3
于日天气类型 (晴、多云、阴等) 应按分类映射, 但有
一个排序, 表明负荷的递增和递减特性, 使相近的天
气类型有较相同的负荷特性。
1~ 0
0, 3
通 过以上分析, 任意 i, j 两天, 无论星期类型
(工作日、休息日)、日天气类型 (阴、晴等)、日期差及
各种气象指标的差异如何, 总可以通过 d ij (或者 rij)
衡量两天之间的差异度 (或者相似度) , 从而为相似
日的选取打好基础。这是基于聚类分析的一种手段。
3 映射数据库的设计
由于各个特征量的量纲各不相同, 因此需要把
不同量纲的值通过无量纲化处理, 映射到特定的区
间, 使各个量之间可以有数值上的可比性, 从而方便
相似度和差异度的定量计算。
3
1 映射库的构成
需要考虑的特征量包括 2 类。
a
原始定量指标: 温度 (最高温度、最低温度、
平均温度等) , 降雨量, 风速, 相对湿度等;
b
可转化为定量指标: 日天气类型 (阴, 晴, 多
云, 雨, 雪, 风等) , 星期类型 (周一, 周二, …, 周日) ,
日期差 (历史日与预测日相差天数, 1 天, 2 天, 等) ,
日分类 (正常日, 元旦, 国庆, 春节等) 等。
当需要考虑新的特征量时, 预测人员可自行加
入。 建立指标映射数据库如表 1。
表 1 指标映射数据库
Table 1 Con ten t of index-mapp ing da taba se
元旦
特征量
描述
正常日
特征量
名称
日分类
日分类 元旦前一天
日分类
日分类 元旦后一天
日分类
日分类
日分类
星期类型
星期类型
国庆
春节
…
周一
…
映射前
取值
映射后
取值
特征量
名称
特征量
描述
周五
周六
周日
昨天
…
晴
阴
…
星期类型
星期类型
星期类型
日期差
日期差
0
4
9
5
5
5 日天气类型
… 日天气类型
1 日天气类型
… 日最高温度 温度 38 ℃
1
2
3
4
5
6
…
1
…
1
1
1
3
4
0
映射前
取值
映射后
取值
特征量
名称
特征量
描述
映射前
取值
映射后
取值
5
6
7
1
…
1
2
…
38
0
3
3
0
4
5 日最高温度 温度 37 ℃
0 日最高温度 温度 36 ℃
2 日最高温度 温度 35 ℃
1 日最高温度 温度 34 ℃
… 日最高温度 温度 33 ℃
10 日最高温度 温度 32 ℃
45 日最高温度
… 其他因素
5
…
…
0
1
37
36
35
34
33
32
…
…
3
2
2
1
1
1
5
7
0
8
6
4
…
…
1
1
做正常日处理。
3
3
2 映射库的说明
2
1 原始定量指标的映射
以最高温度为例。假设本地区高温阈值为 30 ℃
和 35 ℃。则 0 ℃~ 30 ℃可以采用线性映射, 映射值
有变化, 但变化不大; 而 30 ℃~ 35 ℃采用另外一组
线性映射, 映射值相互之间的差别比较明显; 35 ℃
以上采用非线性映射, 气温每增加 1 ℃, 其映射值变
化很大。 低温区域类似。
43
2
2
1, 3
3
2
1 星期类型
若日最高温度为主导气象因素, 则其映射区间
可以超出[ 0, 1 ]的区间限制, 而对于非主导气象因
素, 则其映射区间应限制在[ 0, 1 ]。
2 可转化为定量指标的映射
3
如表 1 中的示例。 仅详细讨论以下 2 个指标。
2
由于星期类型在短期负荷预测中是占主导作用
的影响因素, 故其映射区间可以映射到[ 0
2 ]的
映射区间中, 以加大星期因素的作用。周一~ 周五的
映射值很接近, 而周六和周日比较接近, 表明周一~
周五是负荷类型相似的正常工作日, 而周六和周日
是休息日, 这两组之间有较大的差别。区分工作日和
休息日, 在聚类分析时比较有利。
3
2
日分类属性在短期预测中的作用很大, 特别对
于重大节日以及重大节日左右几天的影响比较大,
如果不加考虑, 必然会对预测结果产生较大的影响,
从而产生较大的预测误差。 为了将正常日与节假日
区别对待, 更有利于节假日的负荷曲线的预测, 下面
对日分类属性进行讨论。
2 日分类属性
表 1 列出了具体的做法, 其特点是: 正常日编号
可以编为 1, 均映射为 0。 节假日的编号从 2 开始连
续编号, 顺序无所谓, 但要进行分组映射。 负荷特性
比较接近的节假日可以分为一组, 映射的取值也较
接近。对于不同的地区, 可能节假日的特点也各不相
同, 因此, 不同地区可以设计自己的节假日映射数据
库及其映射方式。
通过这种处理, 对于预测日为正常日
节假日寻
找最佳历史匹配时有较大的不同, 而且可以自动识
别最相近的节假日, 故可以将正常日
节假日统一在
一起进行预测。
事实上, 这种方法还实现了一种历史数据的修
正。例如, 预测 10 月 8 日的负荷时, 10 月 1 日在“星
期 类型”上最匹配, 但是在“日分类”上有可能不匹
配, 其结果是 10 月 1 日可能对预测日的影响很小。
可以根据本地区特点添加或删除日分类, 视各
地区的情况而定。 但一般增加一个日分类后无需删
除, 只需在实际日特征库中将该日置为 1 即可, 即当
不同地区认定的日分类不同, 故该数据表 1 可
以包含地区索引。 如有些地区认为端午节与其他正
常日差别较大, 可将其列入重大节假日, 但其余地区
不将其列入。
3
3 映射数据库的修改
可以专门设计一个用户设置界面, 供用户修改
映射数据库。用户可以通过这个界面反复预测、修改
映射数据库的值, 摸索出适合本地区的映射关系, 直
到满意为止。 当然, 在以后不断的预测中, 各地区的
负荷特性仍有可能改变, 虽然这种改变不是很剧烈,
因此用户仍可以根据负荷特性的变化将认为已经适
合本地区的映射关系改变为更适应的映射关系。
若有新的气象因素指标, 可以直接在数据库中
加入, 而不用修改计算程序, 大大减轻了工作量, 提
高了程序的灵活性。
映射表可以由用户设置, 对于映射前取值不匹
配的值, 可以采用最临近两点的线性插值。如温度为
5 ℃, 则可以在 32 ℃到 33 ℃之间找出对应的
32
40 到 1
1
60 之间的线性插值。
不同季节可以分别建立相应的合适的映射表,
比如冬季可能风速和温度是主导的气象因素, 而夏
季可能主要的影响因素又变成了温度和湿度, 总之
主导的气象因素可能会不相同, 而且相同因素的映
射值在不同季节也有可能不相同, 这些改变都可以
通过修改数据库很容易地进行。
由此可见, 建立此映射数据库的作用是: 使用户
通过输入数据可以随意改变和建立复杂的映射模
型, 而不是在程序中固化一段“死”的代码。 这样, 若
需要修改映射方程关系, 只需要修改数据库中的映
射关系就可以了。
4 应用举例
这里仅举一种使用本文策略的新方法——基于
相关因素匹配的短期预测方法。
对历史上的若干天, 取近期 n 天的数据作为预
测样本集。已知条件为: 历史上各日的特征量 x ik
( i = 1, 2, …, n; k = 1, 2, …, m ) 与负荷 lit ( t = 1, 2,
…, T )。这里m 为特征量数目, T 为每日的负荷采样
点 数, x ik 已经是量化值, 并且做了映射变换。已知待
预测日的特征量为 x 0k, 待求解的量是 l
0t, 则预测步
骤如下。
a
求历史上各日与待预测日的相似度 ri0。可以
直接按式 (2) 求取 ri0, 也可按式 (1) 求得差异度 d i0
后再变换为相似度 ri0。
相似度归一化:
b
Ψ
;
Ψ
2
Ψ
Κ
2
Κ
2
n
Κ
Κ
Κ
Ù
Κ
Κ
Ù
Γ
2
53
Κ
·学术论文与应用研究· 康重庆等 一种规范化的处理相关因素的短期负荷预测新策略
ri0′=
ri0
n
∑
j= 1
rj0
5 结语
(4)
c
待预测日负荷是历史上各日负荷的加权平
均。(周一~ 周日及其他因素已体现在 ri0 中, 这里无
需区分)。
0t = ∑
l
i= 1
( ri0′lit) t = 1, 2, …, T
(5)
使用上述预测方法对某电网实际数据进行了模
拟预测。 预测结果如图 1、图 2 所示。
图 1 预测效果与实际历史数据的对比
F ig
1 Com par ison of foreca sting
results with h istor ica l da ta
本文提出了一种规范化的可以直接考虑各种相
关因素的短期负荷预测策略。 考虑的相关因素非常
广泛, 不仅仅是气象因素。 利用该策略, 预测人员既
可以构造新的短期负荷预测方法, 也可以对各种现
有的预测方法进行改造, 使之可以计及各种因素的
影响。该策略的核心思想是: 设计一个规范化的相关
因素映射数据库, 可根据不同地区确定适当的参数,
然后应用聚类分析的原理, 对待预测日与任意的历
史日之间求取相似度, 作为负荷预测的依据。这一策
略为在短期负荷预测中考虑更复杂的相关因素提供
了新思路。 文中以一种采用这种策略的短期负荷预
测的新方法为例, 并通过实际预测表明其有效性。
参 考 文 献
1 D ehdash ti A S, T udo r J R , Sm ith M C. Fo recasting of
Hou rly L oad by Pattern R ecogn ition ——A D eterm in istic
A pp roach.
IEEE T ran s on Pow er A pparatu s and
System s, 1982, 101 (9) : 3290~ 3294
2 孙洪波. 电力网络规划. 重庆: 重庆大学出版社, 1996
3 M oham ed A A , N aresh S K. Sho rt
T erm L oad D em and
M odeling and Fo recasting: A R eview.
IEEE T ran s on
System s, M an, and Cybernetics, 1982, 12 (3) : 370~ 382
Sharkaw iM A , M ark s R J. E lectric L oad
IEEE
Fo recasting U sing A rtificial N eu ral N etw o rk.
T ran s on Pow er System s, 1991, 6 (2) : 442~ 449
4 Park D C, E l
图 2 各时的预测误差
2 Hourly percen t error of foreca sting result
F ig
由图可见, 预测结果令人满意, 相对误差绝对值
小于 1% 的有 10 个点, 1%~ 2% 之间有 8 个点, 大
于 2% 的有 6 个点, 最大误差 3
16% , 平均的绝对值
相对误差为 1
40%。
5 黄振华, 吴诚一. 模式识别. 杭州: 浙江大学出版社, 1991
康重庆, 男, 1969 年生, 博士, 讲师, 从事电力系统自动
化的研究。
程 旭, 男, 1977 年生, 硕士研究生, 从事电力市场的研
究。
夏 清, 男, 1957 年生, 教授, 博士生导师, 长期从事电
力系统规划与运行的研究, 近期主要研究方向为电力市场。
A NEW UN IF IED APPROACH TO SHORT-TERM LOAD FORECAST ING
CONSID ER ING CORRELATED FACTORS
K ang C hong qing
C heng X u
X ia Q ing
S hen Y u
T singhua U n iversity
100084
B eijing
Ch ina
bu t also som e classification indexes such as w eekday
Abstract A new un ified app roach to sho rt
term load fo recasting is p ropo sed w h ich is capab le of dealing w ith m o st of the
facto rs co rrelated w ith pow er system load. T h is app roach can con sider no t on ly w eather w h ich has been studied tho rough ly in
etc. A n index
som e p reviou s literatu res
m app ing database is designed to show the differen t m app ing function s fo r variou s facto rs. A cco rding to the basic p rincip les of
clu ster analysis techn ique is u sed to describe the difference betw een the fu tu re day and past days. A s its
pattern recogn ition
term load fo recasting m ethod nam ed facto r m atch ing m ethod is pu t fo rw ard. Case study show s that
app lication
m o re accu rate fo recasting resu lts can be go t by the p ropo sed m ethod.
Keywords sho rt
term load fo recasting pattern recogn ition clu ster analysis
a new sho rt
w eekend
w o rkday
ho liday