第 33 卷第 3 期
2018 年 3 月
热
能
动
力
工
程
JOURNAL OF ENGINEERING FOR THERMAL ENERGY AND POWER
Vol.33,No.3
Mar,2018
文章编号: 1001-2060( 2018) 03-0138-07
基于 kmeans 聚类与 BP 神经网络算法的办公
建筑逐时电负荷预测
刘倩颖1,阮应君1,时 翔2,李铮伟3
( 1.同济大学 机械与能源工程学院,上海 201804; 2.国网山东省电力公司青岛供电公司,山东 青岛 266071;
3.同济大学 机械与能源工程学院,上海 201804)
摘 要: 基于青岛某办公建筑 2015 年全年逐时总用电能耗及空调用电能耗数据,利用 kmeans 聚类算法对其进行聚
类,将全年能耗水平分为四大类。利用求平均值法得到每一类典型设备使用率曲线。将典型曲线的数据、日前两
周数据以及气象数据一同作为 BP 神经网络的输入,预测未来 24 小时的建筑总用电和空调用电,该方法比单用日
前两周数据及气象数据进行负荷预测能获得更低的相对误差、均方根误差、平均绝对百分误差。BP 负荷预测相对
误差在 5%以内,而 kmeans-BP 负荷预测算法控制在±2.5% 以内; BP 预测得到的均方根误差和平均绝对百分误差
范围分别在 4.6 ~ 9.0 之间、2.3% ~ 4.4%之间,kmeans-BP 将该误差缩小到 3.1、2.0%以内,对于负荷预测精度要求上
是阶跃性的突破。
关 键 词: 能源; 聚类分析; 神经网络; 预测; 相对误差; 均方根误差; 平均绝对百分误差
中图分类号: TK01+8
文献标识码: B
DOI: 10.16146 / j.cnki.rndlgc.2018.03.021
Hourly Power Load Forecasting of Office Building based on
Kmeans Clustering and BP Neural Network Algorithm
LIU Qian-ying1,RUAN Ying-jun1,SHI Xiang2,LI Zheng-wei3
( 1.Mechanical Engineering School of Tongji University,Shanghai,China,Post Code: 201804;
2.Qingdao Power Supply Company,Qingdao,China,Post Code: 266071;
3.Mechanical Engineering School of Tongji University,Shanghai,China,Post Code: 201804)
Abstract: Based on the data of hourly total energy consumption and energy consumption for air condi-
tioning of an office building in Qingdao in 2015,kmeans clustering analysis was used to cluster all of the
data. As a result,they were devided into four categories according to annual energy consumption level.
The average value method was utilized to obtain each kind of typical usage curves.Typical curve data,two
weeks’data before the forecasting day and meteorological data were used as input of BP neural network,
and then the power load of next 24 hours was predicted. This method was better than that without consid-
ering typical curve data,as shown by the lower relative error,root mean square error and mean absolute
percent error. The relative error of the BP load forecasting is less than 5%,while the kmeans-BP load
forecasting algorithm controls it within ± 2. 5%. The root mean square error and absolute absolute error
range predicted by BP are between 4. 6 - 9. 0 and 2. 3% - 4. 4%,respectively. Kmeans-BP reduces the
errors to 3.1 and 2%,respectively,which is a breakthrough for the accuracy requirement of load forecas-
ting.
收稿日期: 2017-03-27; 修订日期: 2017-05-16
基金项目: 国家重点研发计划项目“可再生能源绿色建筑领域应用效果研究”( 2016YFC0700104)
Fund-supported Project: National Key Research and Development Program of China“Study on Application Effect of Renewable Energy Green Building”
作者简介: 刘倩颖( 1993-) ,女,福建泉州人,同济大学硕士研究生.
( 2016YFC0700104 )
第 3 期
刘倩颖,等: 基于 kmeans 聚类与 BP 神经网络算法的办公建筑逐时电负荷预测
·931·
Key words: energy,clustering analysis,neural network,prediction,relative error,root mean square
error,mean absolute percentage error
引 言
目前,国内外对于建筑的冷热电负荷预测方法
主要分为以下两类: 数值模拟法和基于历史数据外
推法。数值模拟法因实际建筑和模拟模型在参数设
计上存在一定的差异[1 ~ 5],因此得到的结果往往存
在较大误差。基于历史数据外推法主要有回归分
析、时间序列分析法和人工智能的方法[ 6]。
Forster J R 等人利用多元线性、偏最小二乘法
和小波法等回归分析方法[7 ~ 8],对于中长期的电力
负荷预测相当可靠,但对于短期负荷预测较不利。
时间序列法主要包括移动平均算法、指数平滑算法
以及 ARMA、ARIMA 方法等[9 ~ 11]。其不考虑外界因
和支持向量机法[12]。A. Azadeh 等人利用前馈神经
网络、支持向量机回归预测等方法对实测数据进行
短期负荷预测[13 ~ 15]。K.Siwek 等人将一个多层感知
器和两个竞争型的自组织网络的预测结果进行整合
对某建筑未来 24 小时的电负荷进行预测[16]。Jo-
vanovic 采用前馈反向传播神经网络、径向基函数网
络和自适应神经模糊推理系统对热负荷实测数据进
行预测[17]。有前人曾使用过 kmeans 聚类、BP ( 多
层前馈神经网络) 或 RBF( 径向基函数神经网络) 结
合的方法[18 ~ 19],但其方法均建立在需要大量建筑能
耗数据样本的基础上才能完成,实际上想获得大量
的完整数据样本难度较大。本研究在只有单体建筑
负荷数据的基础上提出一种新的 kmeans-BP 结合负
荷预测方法,通过模拟证明该方法可获得很高的预
素影响,往往会有较大偏差。
测精度。
人工智能法主要包括两大类: 人工神经网络法
表 1 Kmeans 聚类结果
Tab.1 Kmeans clustering results
1 聚类分析
1.1 数据标准化
员变动等因素造成设备使用率的改变,因此数据波
动大。设备的使用率定义如下:
使用率 =
实际负荷
同工况下满负荷容量
( 1)
在青岛能耗监测平台获得某办公建筑 2015 年
由于该建筑各设备满负荷容量难以获取,因此
全年逐时电耗及空调电耗数据。由于气象变化、人
本文用该建筑在 2015 年小时用电最大值作为其设
·041·
计总容量。
热 能 动 力 工 程
2018 年
1.2.3 聚类结果分析
该建筑总用电设备使用率定义公式如下:
利用 MATLAB 调用 kmeans 聚类算法。Distance
第 i 小时总用电设备使用率 Qi =
Measure 选取 sqEuclidean,即采 用 欧 几 里 得 距 离 函
数。Replicates 取 5,即重复聚类的次数为 5 次。
聚类的结果如表 1 所示。用不同的颜色和数字
代表不同的类别。A 类集中在 11、12、1、2 这 4 个
月,属于冬季最冷月。B 类集中在 3、7、8、9 这 4 个
月。其中 7、8、9 为夏季最热月,而 3 月为接近冬季
的次冷月。C 类集中在 4、5、6、10 4 个月,还有少数
几天分布在 3、10 等月份。其中 4、5、6、10 属于过渡
季节。剩下的假日类全部归为 D 类。将相同类别
的建筑总用电设备逐时使用率曲线、空调设备逐时
使用率曲线绘制在同一张图上。如图 1 ~ 图 4 所示,
从前 3 张图可以看出,该建筑设备使用率曲线在四
季均呈现明显的峰谷差异。日高峰大致分布在早上
9: 00 到下午 18: 00 之间。其中设备的使用率在早
上 9: 00-10: 00 之间达到日最高水平,A 类在 60% ~
100%之间,B 类 在 40% ~ 70% 之 间,C 类 在 15% ~
40%之间。这三类位于不同的能耗水平。这是由于
季节的不同带来的用电设备需求量的差异。第四张
属于假日类,因此能耗水平处在最低是合理的。
图 1 A 类
Fig.1 Category A
第 i 小时总用电量 / h
全年总用电最大值 / h
该建筑的空调设备使用率定义公式如下:
第 i 小时空调设备使用率 Pi =
第 i 小时空调用电量 / h
全年空调用电最大值 / h
( 2)
( 3)
按照上面两式处理类似于 0 ~ 1 标准化处理。
处理后的设备使用率数据皆落在[0,1]区间内,在
同一个计算水平上。
1.2
kmeans 聚类
1.2.1 最佳聚类数的确定
设备逐时使用率在全天的走势随着季节而变
化。但在相近的气候条件下,或相近的日期内,其走
势曲线变化不大。在这样的前提下,考虑将该建筑
365 天的逐时使用 率 的 走 势 曲 线 进 行 聚 类。运 行
kmeans 聚类算法生成不同的聚类数下的聚类结果,
MATLAB 自带的 CH( 聚类有效性评估函数) 指标对
于聚类数的评估具有良好的效果,其值越大代表类
自身越紧密,类与类之间越清晰,聚类效果更好。通
过查看日历可知,2015 年全年的节假日和周六日总
天数为 115 天。由于研究的建筑属于办公类建筑,
节假日、周六日与工作日相比,能耗水平相差较大,
单独剔除,以便单独聚成一类。工作日剩下 250 天。
将工作日中用电设备、空调设备逐时使用率构建成
一 个 250 × 48 的 矩 阵。 通 过 MATLAB 中 的
evalclusters 函数( 最佳聚类数计算函数) 计算最佳聚
类数为 3。这与办公建筑全年能耗水平大致分为夏
季、过渡季、冬季相一致。
1.2.2
kmeans 聚类
kmeans 聚类采用的准则函数通常为平方误差
和准则函数,又称最小方差划分,即 MSE ( minimum
squared error) ,定义式如下:
k
MSE = ∑
i = 1
∑
P∈Xi
‖P - mi‖
2
( 4)
式中: k—类别数,Xi—第 i 类聚类中心域的样本集
合,P—数据对象,mi—第 i 类均值向量( 类中心) 。
mi =
1
Ni
P
∑
P∈Xi
Ni是 Xi中的样本数。
( 5)
图 2 B 类
Fig.2 Category B
第 3 期
刘倩颖,等: 基于 kmeans 聚类与 BP 神经网络算法的办公建筑逐时电负荷预测
·141·
在每一类中,将该类所有的曲线在各个点上取
平均值,得到每一类的典型使用率曲线,如图 5 所
示。这些典型使用率曲线在每一点的数值将作为下
一节 kmeans-BP 组合算法的一部分输入数据。从该
图可知,这 4 类处于不同的能耗水平,其中排布顺序
为 A、B、C、D 类。就在总用电使用率而言,A 类均值
高于第 B、C、D 类分别为 43%、129% 和 191. 8%,A
类最 大 值 高 于 B、C、D 类 分 别 为 45%、161% 和
270%。其它比较方法以此类推。因此可以判定该
建筑冬季的能耗水平高于夏季和过渡季,而夏季的
能耗水平高于过渡季,节假日能耗水平最低。
2
kmeans-BP 负荷预测
2.1 方法介绍
本研究提出了一种将 kmeans 聚类算法与人工
神经网络中的 BP 神经网络相结合,预测 2016 年某
日的用电负荷的模型。日负荷预测属于短期负荷预
测,可用于经济运行计划,机组发电系统管理,安全
分析,短期维护等。
图 3 C 类
Fig.3 Category C
图 4 D 类
Fig.4 Category D
图 5 各类典型使用率曲线
Fig.5 Typical usage curves
表 2
kmeans-BP 负荷预测训练样本变量
Tab.2 Training sample variables of kmeans-BP
load forecasting
x1
Th
x2
Tl
x3
Tm
x4
h
x5
v
x6
x7
Qi-2
Qi-1
x8
Qs
y1
Qi
表 3 BP 负荷预测训练样本变量
BP 神经网络是一种误差反向传播的多层前馈
网络,其拓扑结构如图 6 所示。传统的 BP 神经网
络算法用于短期负荷预测,至少需要日前两周的逐
时负 荷 数 据,才 能 保 证 预 测 精 度。 在 本 研 究 的
kmeans-BP 负荷预测方法中,将该类的典型使用率
曲线的 24 个逐时数据也作为样本的输入数据。从
Tab.3 Training sample variables of BP load forecasting
青岛能耗监测平台中获取 2016 年全年总用电能耗
x1
Th
x2
Tl
x3
Tm
x4
h
x5
v
x6
x7
Qi-2
Qi-1
y2
Qi
数据和空调用电能耗数据作为对比数据,即期望值,
通过误差分析来比较不同算法的预测精度。
·241·
热 能 动 力 工 程
2018 年
结果。
图 7 给出 1 月 19 日总用电负荷及空调用电负
荷在两种预测方案下的对比图。kmeans-BP 神经网
络的输出点所在的曲线基本上覆盖了期望值所在的
点。BP 神经网络输出点所在曲线尽管靠近期望值
所在的点,但仍没有完全覆盖,有个别点仍有一定的
偏离,由此直观地体现出 kmeans-BP 神经网络的优
越性。
图 6 BP 神经网络拓扑结构
Fig.6 Topological structure of BP neural network
选取冬季一个典型日,2016 年 1 月 19 日,作为
分析案例。例如,现在要预测该日的能耗值,首先根
据表 1 聚类结果判定其属于 A 类能耗水平。扣除
日前两周的周末数据,共 10 个训练样本,分别为 1
月 5 日 ~ 9 日,1 月 12 日 ~ 16 日。每个训练样本由 9
个数据构成,Th,T1,Tm,h ,v ,Qi-2,Qi-1,Qi,分别为
日最高温度,最低温度,平均温度,湿度,平均风速,i
图 7 两种方案预测结果
-2 h 的负荷值,i-1 h 的负荷值,典型设备使用率曲
Fig.7 Prediction results of two cases
线中 i h 的负荷值( 由于 1 月 19 日属于 A 类,因此
这里采用 A 类的典型设备使用率曲线) ,以及要预
图 8 和图 9 分别给出总用电负荷和空调用电负
测的 i h 的负荷值。为了比较 kmeans-BP 模型与传
荷在两种预测方案下的相对误差对比。浅色代表
统 BP 模型的优劣,将 BP 神经网络模型作为对比方
BP 预测相对误差,深色代表 kmeans-BP 预测相对误
案,该方案去掉典型设备使用率曲线中的 i h 的数
差,由于参数设置的合理性,两种方案的相对误差绝
据。两个方案输入变量分布均在表 2、表 3 中列出。
对值都控制在 5% 以内。Kmeans-BP 组合方案每一
kmeans-BP 负荷预测方案中网络输入层节点数为 8,
点的相对误差都明显小于 BP 的相对误差,且将相
输出 层 节 点 数 为 1。根 据 Kolmogorov 定 理,n1 =
对误差的绝对值减少到 2. 5% 以内。因此 kmeans-
n +槡 m + a ,n 和 m 分别为输入输出结点数,a 为 1
~ 10 之间的常数,n1 为隐含层节点数。经过多次训
练,最终确定为 6。
由于一天有 24 个小时,因此建立 24 个 BP 神
经网 络 来 预 测 全 天 的 负 荷 值。迭 代 次 数 设 置 为
2 000,学习率为 0.1,动量因子设置为 0.3,训练函数
选择 traingdx,增加模式选择 learngdm。BP 负荷预
测方案中网格输入层节点数为 7,输入层节点数为
1,隐含层节点数为 4。其余参数设置不变。在经过
24 次的仿真之 后,得 到 24 个 小 时 的 能 耗 预 测 值。
由于同时预测总空调能耗和总用电能耗,因此两种
算法分别得到 48 个能耗预测值。
2.2 预测结果
由于篇幅限制,以下只展示 A 类之中,预测 1
月 19 日的逐时总用电、逐时空调用电负荷的预测
BP 结合预测能获得更高的精度。
图 8 总用电负荷预测在两种方案下相对误差
Fig.8 Relative error of total electric load
forecasting in two cases
第 3 期
刘倩颖,等: 基于 kmeans 聚类与 BP 神经网络算法的办公建筑逐时电负荷预测
·341·
对百分误差控制在 2.0%以内。
3 结 论
本研究提出了一种 kmeans 聚类与 BP 相结合
的算法预测办公建筑日用电负荷。即将某办公建筑
全年的总用电设备逐时使用率、空调用电设备逐时
使用率利用 kmeans 聚类算法进行聚类,结果聚成 3
类,其中周末、节假日单独成一类,不参与聚类。将
每一类的逐时使用率曲线取平均,得到各类典型使
用率曲线。该典型使用率曲线在各点的数据作为
BP 神经网络的输入样本的一个变量。与不与聚类
结合的 BP 算法做对比,结果显示,BP 负荷预测相
对误差在 5% 以内,而 kmeans-BP 负荷预测算法将
相对误差的绝对值控制在 2.5% 以内; BP 预测得到
的均方 根 误 差 和 平 均 绝 对 百 分 误 差 范 围 分 别 在
4.6% ~ 9. 0% 之间、2. 3% ~ 4. 4% 之间,kmeans-BP 将
该误差缩小到 3.1%,2.0%以内,对于负荷预测精度
图 9 空调用电负荷预测在两种方案下相对误差
Fig. 9 Relative error of electric load forecasting
for air conditioning in two cases
从每一类中分别选取典型日的预测结果,采用
均方根误差( RMSE) 及平均绝对百分误差( MAPE)
作为评价指标,结果 列 于 表 4。在 这 4 类 中,使 用
Kmeans-BP 组合预测的方法,在很大程度上比单独
使用 BP 预测获得更低的均方根误差和平均绝对百
分误差。且将均方根误差控制在 3.1 以内 ,平均绝
要求上是阶跃性的突破。
表 4 各类典型日在两种方案下的预测指标
Tab.4 Forecast indexes of different typical days in two cases
日 期
1 /19
1 /19
7 /29
7 /29
4 /29
4 /29
10 /25
10 /25
PTPL
PPLA
RMSE / kW·h
MAPE / %
RMSE / kW·h
MAPE / %
3.024 8
7.612 2
2.176 5
6.356 9
3.056 6
7.098 7
2.876 5
7.098 6
0.980 4
2.640 3
1.565 4
2.337 6
0.878 0
3.098 9
0.976 9
2.789 8
3.271 8
5.521 6
3.096 0
8.985 6
1.987 6
4.676 5
3.243 5
7.098 7
1.804 7
3.141 9
1.986 2
3.878 7
1.267 8
4.365 6
0.890 2
4.122 7
1
2
3
4
Kmeans-BP
BP
Kmeans-BP
BP
Kmeans-BP
BP
Kmeans-BP
BP
注: PTPL-总电负荷预测; PPLA-空调用电负荷预测
参考文献:
[3] CRAWLEY DB,LAWRIE LK,WINKELMANN FC. EnergyPlus:
creating a new-generation building energy simulation program[J].
[1] Andolsuna S,Culp CH,Haberl JS,Witte MJ. Energy Plus vs DOE
Energy and Buildings,2001,33( 4) : 319-331.
- 2.1e:
the effect of ground coupling on cooling / heating energy re-
[4] FUMO N,MAGO P,LUCK R. Methodology to estimate building
quirements of slab-on-grade code houses in four climates of the US
energy consumption using EnergyPlus Benchmark Models[J]. En-
[J]. Energy and Buildings,2012,52( 3) : 189 – 206.
ergy and Buildings,2010,42( 12) : 2331 – 2337.
[2] KIM DW,PARK CS. Difficulties and limitations in performance
[5] ANDELKOVIC AS,MUJANA I, DAKIC S. Experimental
simulation of a double skin facade with EnergyPlus[J]. Energy
validation of a EnergyPlus model: Application of amulti-storey nat-
and Buildings,2011,43( 12) : 3635-3645.
urally ventilated double skin facade[J]. Energy and Buildings,
·441·
热 能 动 力 工 程
2018 年
2016,118: 27-36.
ment,2008,49( 8) : 2272-2278.
[6] AHMAD A S,HASSAN M Y,ABDULLAH M P,et al. A review
[14] 刘 涵,刘 丁,郑 岗,等.基于最小二乘支持向量机的天
on applications of ANN and SVM for building electrical energy
然气负荷预测[J]. 化工学报,2004,55( 5) : 828-832.
consumption forecasting[J]. Renewable and Sustainable Energy
LIU Han,LIU Ding,ZHENG Gang,et al. Natural gas load fore-
Reviews,2014,33( 2) : 102-109.
casting based on least squares support vector machine[J]. Journal
[7] FORSTER J R,WEPFER W J. Formulation of a load prediction
of Chemical Industry and Engineering,2004,55( 5) : 828-832.
algorithm for
a
large
commercial
building [ J ]. Ashrae
[15] KO Chia-Nan,LEE Cheng-Ming. Short-term load forecasting
Transactions,1984,90( 5) : 536-551.
using SVR ( support vector
regression ) -based radial basis
[8] 毛李帆. 基于偏 最 小二 乘 回 归 分析 的 中长期电力负荷预 测
function neural network with dual extended Kalman filter[J].
[J].电网技术,2008,32( 19) : 71-77.
Energy,2013,49( 49) : 413-422.
MAO Li-fan. Medium and long-term load forecasting based on par-
[16] SIWEK K, OSOWSKI S, SZUPILUK R. Ensemble neural
tial least squares regression analysis[J].Power System Technology,
network approach for accurate load forecasting in a power system
2008,32( 19) : 71-77.
[J],International Jourral of Applied Mathematics and Computer
[9] RUBY-FIGUEROA R,SAAVEDRA J,BAHAMONDE N,et al.
Science,2009,19( 2) : 303-315.
Permeate flux prediction in the ultrafiltration of fruit juices by ARI-
[17] JOVANOVIC RZ,SRETENOVIC AA,ZIVKOVIC BD. Ensemble
MA models[J]. Journal of Membrane Science,2016,524: 108
of various neural networks for prediction of heating energy con-
-116.
sumption[J]. Energy and Buildings,2015,94: 189-199.
[10] NURY A H,HASAN K,ALAM M J B. Comparative study of
[18] 黎 祚,周步祥,林 楠. 基于模糊聚类与改进 BP 算法的
wavelet-ARIMA and wavelet-ANN models for temperature time
日负荷特性曲线分类与短期负荷预测[J]. 电力系统保护与
series data in northeastern Bangladesh[J]. Journal of King Saud
控制,2012,40( 3) : 56-60.
University-Science,2015.
LI Zuo,ZHOU Bu-xiang,LIN Nan. Classification of daily load
[11] LASHERAS F S,DE COS JUEZ F J,SNCHEZ A S,et al.
characteristics curve and forecasting of short-term load based on
Forecasting the COMEX copper spot price by means of neural net-
fuzzy clustering and improved BP algorithm[J]. Power System
works and ARIMA models[J]. Resources Policy,2015,45: 37
Protection and Control,2012,40( 3) : 56-60.
-43.
[19] 黄 磊,陈 浩,衣乔木,等. 基于 k-means 聚类和 BP 神经
[12] AHMAD AS,HASSAN MY,ABDULLAH MP. A review on ap-
网络组合模型的用电负荷预测[J]. 电力与能源,2016,37
plications of ANN and SVM for building electrical energy[J].
( 1) : 56-60.
Renewable & Sustainable Energy Reviews,2014,33 ( 2) : 102
HUANG Lei,CHEN Hao,YI Qiao-mu,et al. Load forecast
-109.
based on hybrid model with k-means clustering and BP neural
[13] AZADEH A,GHADERI SF,SOHRABKHANI S. Annual elec-
network[J]. Electricity and Energy,2016,37( 1) : 56-60.
tricity consumption forecasting by neural network in high energy
consuming industrial sectors[J]. Energy Conversion and Manage-
( 陈 滨 编辑)