基于季节性负荷自适应划分及重要点分割的多分段短期负荷预测

您所在的位置:网站首页 负荷预测数据哪里可以获得 基于季节性负荷自适应划分及重要点分割的多分段短期负荷预测

基于季节性负荷自适应划分及重要点分割的多分段短期负荷预测

2024-01-19 08:38| 来源: 网络整理| 查看: 265

0 引言

负荷预测是根据电力负荷、经济、社会、气象等历史数据,探索电力负荷历史数据变化规律对未来负荷的影响,寻求电力负荷与各种相关因素之间的内在联系,从而对未来的电力负荷进行科学的预测[1],同时分布式能源和新能源储能装置正逐步并入坚强智能电网,潮流负荷变化加大,因此准确的短期负荷预测成为保障智能电网安全健康运行的重要一环[2]。

近年来,国内外学者在负荷预测领域进行了大量的研究[3],文献[4]通过基于时变的Cook距离统计量,对异常负荷值进行检测并根据温度、湿度使用分参数概率密度进行异常值修复,提高了负荷预测的精确度与稳定性。文献[5]在聚合层面上使用计及气象因素的预测,同时使用小波分解技术对负荷进行多分辨率预测并使用指数加权的方式进行模型组合,取得了较高的预测精度。文献[6]定义了一种三级预测方法,通过多尺度周期变量剥离、平稳序列预测、周期变量再叠加的方式建立负荷预测模型。文献[7]分析了影响电力负荷的多种因素,采用交互效应探究多因素对负荷的影响机理,建立了解释能力强的负荷预测模型。

但上述关于短期负荷预测的文献在以下几方面仍存在不足:1)电力负荷有明显的季节特性,且不同地区四季分布不同,仅以月份或固定温度值进行季节划分,不能充分保证季节划分的准确性;2)电力负荷作为温度与湿度强驱动数据,在不同季节、不同时段对负荷影响程度不同,直接对日前负荷建立单一预测模型,会一定程度影响模型的预测精度。

本文针对上述问题,建立了一种基于季节划分与重要点分割的多分段短期负荷预测方法。首先使用聚类技术对历史负荷数据进行负荷聚类分析,根据负荷聚类结果结合Gini系数确定能体现负荷季节性的最佳决策点,以此作为电力负荷的季节划分阈值;然后采用非参数核密度估计(kernel density estimation,KDE)提取出分季的典型日负荷曲线,并使用基于重要点的时间序列分割方法确认分季曲线的分割点;最后使用基于纵横交叉算法(crisscross optimization,CSO)优化的鲁棒极限学习机(outlier robust extreme learning machine,ORELM)建立多分段的负荷预测模型。仿真结果表明,本文所提预测方法在弥补上述所提缺陷的同时能有效提高预测精度。

1 基于聚类的季节性负荷自适应划分

电力负荷数据具有很强的周期性,且不同季节下由于用户用电行为的改变,负荷曲线的形态将会有比较明显的差异。在气象学上常以候温(即连续五日的平均气温的平均值)作为季节的划分标准,候温\({{H}_{i}}\)的计算公式:

\({{H}_{i}}=\frac{{{T}_{i-4}}+{{T}_{i-3}}+{{T}_{i-2}}+{{T}_{i-1}}+{{T}_{i}}}{5}\) (1)

式中:\({{H}_{i}}\)为第\(i\)日的候温;\({{T}_{i}}\)为第\(i\)日的平均气温。但对电力负荷来说,仅以月份或气象学上的候温标准进行季节性划分是不精确的,应以温度变化所导致负荷曲线形态发生明显变化的气温值作为分季负荷的划分点。因此,本文提出一种结合聚类的季节性负荷自适应分类方法。

1.1 负荷曲线聚类 1.1.1 聚类相似性度量指标的选取

为体现负荷数据的季节特性,采用聚类分析对负荷数据样本集进行划分。由于电力负荷在不同的季节下将体现出明显的形态差异,本文选取余弦相似度[8]作为聚类的相似性度量指标。设\({{x}_{i}}=[{{x}_{i1}},\)\({{x}_{i2}},\cdots ,{{x}_{in}}]\)与\({{x}_{j}}=[{{x}_{j1}},{{x}_{j2}},\cdots ,{{x}_{jn}}]\)为某区域电网第\(i\)日与第\(j\)日的负荷数据,则余弦相似度的计算公 式为

\({{S}_{\cos }}({{x}_{i}},{{x}_{j}})=\frac{\sum\limits_{q=1}^{n}{({{x}_{iq}}\times {{x}_{jq}})}}{\sqrt{\sum\limits_{q=1}^{n}{{{({{x}_{iq}})}^{2}}}}\times \sqrt{\sum\limits_{q=1}^{n}{{{({{x}_{jq}})}^{2}}}}}\) (2)

式中\({{S}_{\cos }}\)取值越大,负荷曲线形态上越相似,当\({{S}_{\cos }}\)为1时,两条曲线完全重合。

1.1.2 聚类评判指标的选取

为确定最优的聚类个数,需对聚类结果进行聚类有效性检验,对于以余弦相似度作为度量的聚类算法,采用基于图的聚类效果评估方法,建立聚类评判指标[9]:

\(V=\sum\limits_{c=1}^{k}{\sum\limits_{i=1}^{{{n}_{k}}}{{{S}_{\cos }}({{x}_{c}},{{x}_{i}})}}\) (3)

式中:\(k\)为聚类数目;\({{n}_{k}}\)为当前类\(k\)所包含的样本数目。

\(V\)随着聚类数目的递增而增大,当\(V\)的值增大趋势不再明显时,定义\(k\)为最优聚类数目。

1.2 结合负荷聚类与CART树的季节性负荷分类器

为确定划分季节性负荷的最佳候温划分点,本文采用CART决策树模型产生可视化的分类规则。决策树思想,实际上就是在一个数据集中找到一个最优特征,然后从这个特征的选值中找出最优候选值以进行节点分裂因此生成决策树模型的关键点在于分类特征量的确定、分类目标的确定以及分裂点的确定[10]。

1.2.1 分类特征量以及分类目标的确定

季节的划分常以候温来决定的,因此本文直接以候温\({{H}_{\text{s}}}\)作为季节性负荷的分类特征量(根节点),\({{H}_{\text{s}}}\in [ceil({{H}_{\text{s}.\min }}),floor({{H}_{\text{s}.\max }})]\),其中,\({{H}_{\text{s}.\min }}\)为历史候温最小值;\({{H}_{\text{s}.\max }}\)为历史候温最大值,\(ceil\)为向下取整符,\(floor\)为向上取整符。

在1.1节中对历史负荷曲线进行了聚类分析,并根据聚类评判指标得出了最佳聚类数目,因此本文的分类目标为,使分裂的最终标签(叶节点)尽可能与聚类结果相一致,即最为纯净的划分。

1.2.2 最优分裂点的确定

CART算法中利用Gini系数作为损失函数构造二叉决策树,通过Gini系数增益确定最佳分裂点。Gini系数的计算公式为

\({{G}_{k}}(T)=1-\sum{p_{k}^{2}}\),\(k=1,2,\cdots ,N\) (4)

式中:\(T\)为样本集;\({{p}_{k}}\)是样本集\(T\)中第\(k\)类数据的相对频率。在本文中样本集\(T\)由所有参与聚类的历史负荷曲线构成,\({{p}_{k}}=(\frac{{{c}_{k}}}{S})\),其中\({{c}_{k}}\)为所有参与聚类的历史负荷曲线中属于第\(k\)类负荷曲线的个数,\(S\)为样本集\(T\)中元素的个数。

\(\left\{ \begin{matrix} {{G}_{k}}({{T}_{\text{l}}},{{H}_{\text{s}}})=1-\frac{{{c}_{\text{l}k}}}{{{S}_{\text{l}}}}-\frac{{{{\bar{c}}}_{\text{l}k}}}{{{S}_{\text{l}}}} \\ {{G}_{k}}({{T}_{\text{r}}},{{H}_{\text{s}}})=1-\frac{{{c}_{\text{r}k}}}{{{S}_{\text{r}}}}-\frac{{{{\bar{c}}}_{\text{r}k}}}{{{S}_{\text{r}}}} \\\end{matrix} \right.\) (5)

式中:\({{H}_{\text{s}}}\)为分裂节点的候温值;\({{T}_{\text{l}}}\)左子节点中包含的历史负荷曲线集;\({{T}_{\text{r}}}\)为右子节点中包含的历史负荷曲线集;\({{G}_{k}}({{T}_{\text{l}}},{{H}_{\text{s}}})\)为左子节点的Gini系数;\({{G}_{k}}({{T}_{\text{r}}},{{H}_{\text{s}}})\)为右子节点的Gini系数;\({{S}_{\text{l}}}\)为样本集\({{T}_{\text{l}}}\)中元素的个数;\({{S}_{\text{r}}}\)为样本集\({{T}_{\text{r}}}\)中元素的个数;\({{c}_{\text{l}k}}\)、\({{c}_{\text{r}k}}\)分别为左子节点与右子节点中属于第\(k\)类负荷曲线的个数;\({{\bar{c}}_{\text{l}k}}\)、\({{\bar{c}}_{\text{r}k}}\)分别为左子节点与右子节点中不属于第\(k\)类负荷曲线的个数。则第\(k\)层分裂节点的Gini系数增益为

\(\begin{align} \Delta {{G}_{k}}({{H}_{\text{s}}})={{G}_{k}}(T)-\frac{S{}_{\text{l}}}{S}{{G}_{k}}({{T}_{\text{l}}},{{H}_{\text{s}}})- \\ \text{ }\frac{S{}_{\text{r}}}{S}{{G}_{k}}({{T}_{\text{r}}},{{H}_{\text{s}}}) \\ \end{align}\) (6)

遍历第 层所有待选候温值的Gini系数增益,选取增益系数最小的候温值作为该层最优分裂点并获得相应的子节点。使用式(4)—(6)对子节点进行计算,以获得下一层的最优分裂点。

1.2.3 分裂终止条件

由于本文是以聚类结果作为导向来进行CART树的构建,因此CART树的分裂终止条件为分裂所得叶节点的个数等于聚类个数。

考虑到本文仅以CART树对季节性负荷进行划分,所生成的二叉树规模较小,在此不讨论剪枝相关问题。

2 负荷曲线分段处理及参考日选择 2.1 气象数据相关性分析

气象因素为电力需求变化的主要驱动因素[11],且气象因素在不同的季节下作用负荷的情况是不同的,因此通过划分季节对气象数据与电力负荷做相关性分析是十分重要的。在电力系统负荷中温度和相对湿度对负荷的影响程度最大[12],为反映变量之间线性关系的密切程度,本文选取皮尔逊相关系数(Pearson correlation coefficient,PCCs)[13]作为度量标准(为简化说明,第2节中公式均针对某季节数据进行分析),温度或相对湿度因素与负荷在\(q\)时刻下的皮尔逊相关系数\({{r}_{q}}\)的计算公式为

\({{r}_{q}}(Y,X)=\frac{\sum\limits_{m=1}^{n}{({{Y}_{mq}}-{{{\bar{Y}}}_{mq}})({{X}_{mq}}-{{{\bar{X}}}_{mq}})}}{\sqrt{{{\sum\limits_{m=1}^{n}{({{Y}_{mq}}-{{{\bar{Y}}}_{mq}})}}^{2}}}\sqrt{{{\sum\limits_{m=1}^{n}{({{X}_{mq}}-{{{\bar{X}}}_{mq}})}}^{2}}}}\) (7)

式中:\(Y\)表示温度或相对湿度变量;\(X\)表示负荷变量;\(m\)为变量样本个数;\({{r}_{q}}\)越大相关性越高。日皮尔逊相关系数向量\({{R}_{p}}=[{{r}_{1}},{{r}_{2}},\cdots ,{{r}_{n}}]\)。

气象因素与负荷的相关性在不同季节,不同时间点是不同的,也即气象因素对负荷的影响强弱程度是在不断变化的。图1所示为悉尼城市电网的夏季、冬季、春秋季日负荷曲线与温度、相对湿度的皮尔逊相关系数。

图1 气象因素与各季负荷曲线的皮尔逊相关系数 Fig. 1 Pearson correlation coefficient of weather factors and load curves in summer and winter

从图中可以看出夏季、冬季以及春秋季各变量间的皮尔逊相关系数曲线形态是有较大的差异的,且同一季节下各时段的气象因素与负荷的皮尔逊相关系数波动性较大。由于夏冬两季气温敏感性负荷在总负荷中占比较大,因此夏季温度与负荷用量呈正相关,冬季温度与负荷用量呈负相关,而春秋两季昼夜温差较大,因此春秋季温度与负荷用量在日间大多数时段呈正相关,夜间呈负相关。

2.2 基于重要点的负荷曲线分段

建立短期负荷预测模型时参考日的选择将直接影响预测结果的精度。考虑电力系统负荷在节假日与工作日有较大的差别,所以在进行预测时常分开处理,本文着重解决工作日的短期负荷预测。一般地,在进行工作日的短期负荷预测时,参考日的选择以预测日前连续多天工作日作为预测参考日[14],但此种做法并未考虑气象因素的影响,在对于气象突变的预测日时,预测精度将会有一定程度的下降。因此提出一种基于气象因素相关性加权的参考日选择方法。

在使用基于气象因素进行参考日选择时,常以下式来计算历史日与待预测日的气象数据向量的相似性\({{R}_{ij}}\)[15]:

\({{R}_{ij}}=\frac{\sum\limits_{q=1}^{n}{({{Y}_{iq}}{{Y}_{jq}})}}{\sqrt{(\sum\limits_{q=1}^{n}{Y_{iq}^{2}})(\sum\limits_{q=1}^{n}{Y_{jq}^{2}})}}\) (8)

式中:\({{R}_{ij}}\)越大,相似度越高。根据预测日与历史日的相似度进行强弱排序,选取相似度较大的几天作为训练样本。

以式(8)进行进行参考日选取,建立短期负荷预测模型会有以下几点缺陷:

1)分析式(8)可知,参考日的选取是根据日整体气象因素相似度确定的,因此整体相似度最高并不能代表局部相似度最高。

2)在使用机器学习方法进行短期负荷预测时,其模型建立是以训练集日整体训练误差确定的,因此建立的预测模型,并不能充分体现各时间段的用电特点。

3)通过2.1节中的相关性分析可知,气象因素在不同时间点对负荷的影响是有区别的,仅用式(8)所示相似性进行参考日筛选会忽略此部分信息。

2.2.1 重要点的确定

为解决第一、二个缺陷,本文使用重要点分割对负荷时间序列进行多分段处理。重要点分割是时序数据模式表示方法中分段线性表示[16](piecewise linear representation,PLR)法的一种,其主要是通过特征点以及序列趋势来刻画整个序列的主要形态而不计细节上的差异,以更鲜明地反映时间序列自身的特点。在进行分段线性表示原始时间序列数据时,如边缘点、极值点以及时间序列变化趋势发生改变的点都是必须被保留的[17],这些点统称为重要点。因此对时间序列分割实际就是找到时间序列的重要点的位置。

时间序列可表示为

\(X=\text{ }\!\!\{\!\!\text{ }{{x}_{k}}=({{t}_{k}},{{y}_{k}})\text{ }\!\!\}\!\!\text{ }_{k=1}^{n}\) (9)

式中:\({{x}_{k}}=({{t}_{k}},{{y}_{k}})\)表示时间序列在\({{t}_{k}}\)时刻的记录值为\({{y}_{k}}\),\({{y}_{k}}\in R\),且\({{t}_{k}}-{{t}_{k-1}}={{t}_{k+1}}-{{t}_{k}}\)。对时间序列中任意连续两点\({{x}_{k}}\)、\({{x}_{k+1}}\),构成的变化趋势可分为“上升”、“下降”和“保持”3种模式,如图2所示。

图2 两点间时间序列模式变化 Fig. 2 Mode change of time series between two points

而任意三点\({{x}_{k-1}}\)、\({{x}_{k}}\)、\({{x}_{k+1}}\)之间的模式则由上述3种模式两两组合而成。因此本文采用时间序列中连续三点构成的三角关系来描述模式特征的变化。借鉴文献[18],本文采用如下方法选择重要点。

定义:对时间序列\(X=\text{ }\!\!\{\!\!\text{ }{{x}_{k}}=({{t}_{k}},{{y}_{k}})\text{ }\!\!\}\!\!\text{ }_{k=1}^{n}\)的子序列\({{X}_{i\tilde{\ }j}}=({{x}_{i}},{{x}_{i+1}},\cdots ,{{x}_{j}})\),\({{x}_{k}}\in {{X}_{i\tilde{\ }j}}\),\({{x}_{k}}\)成为重要点的可能性与\({{x}_{k}}\)到线段\(c\)的距离\({{D}_{\text{o}}}\)有关,\({{D}_{\text{o}}}\)的值越大,\({{x}_{k}}\)成为重要点的可能性越大,反之越小。

图3 点到直线的正交距离 Fig. 3 Orthogonal distance from the point to the line

从图3可以看出,相邻两个模式间的变化幅度可用三角形的面积\({{S}_{\Delta \text{ABC}}}\)表示,由于时间序列

\(X=\text{ }\!\!\{\!\!\text{ }{{x}_{k}}=({{t}_{k}},{{y}_{k}})\text{ }\!\!\}\!\!\text{ }_{k=1}^{n}\)中,点之间的时间间隔\(t\)是相同的,因此\({{S}_{\Delta \text{ABC}}}\)的面积为

\({{S}_{\Delta \text{ABC}}}=\frac{1}{2}({{y}_{k+1}}-{{y}_{k-1}}){{D}_{\text{o}}}\) (10)

式中:当\({{S}_{\Delta \text{ABC}}}\)越大时,相邻模式的变化越剧烈,即正交距离\({{D}_{\text{o}}}\)越大。

Do称之为点到直线的正交距离,其计算公式为

2.2.2 负荷曲线及气象序列的多分段处理

地区电力负荷曲线在相同季节下其峰谷差、负荷率以及整体用电模式十分近似,且曲线整体走势差异不大。为从整体上体现季节负荷曲线的形态,精确定位分割点,本文采用文献[19]中提取典型日负荷曲线的方法,基于概率统计的思想,使用非参数核密度估计的概率密度拟合确定典型日负荷指标向量,进而对同一季节下各样本日的负荷曲线进行加权叠加得到最终的典型日负荷曲线,从而使提取所得曲线在最大程度上反映地区季节负荷的形态。

在获得季节典型日负荷曲线后,使用2.2.1节所提分割方法对负荷曲线进行多分段处理,获得分段负荷曲线。同时气象数据也按负荷曲线所确定的重要点时刻进行分割。

2.3 改进的参考日选择模型

为解决2.2节中提出的第3个问题,在进行参考日选择时进行基于皮尔逊相关系数的加权处理。则加权相似性系数\({{{R}'}_{ij}}\)为

\({{{R}'}_{ij}}=\frac{\sum\limits_{q=1}^{n}{({{Y}_{iq}}{{Y}_{jq}}{{r}_{q}}^{2})}}{\sqrt{(\sum\limits_{q=1}^{n}{Y_{iq}^{2}{{r}_{q}}^{2}})(\sum\limits_{q=1}^{n}{Y_{jq}^{2}}{{r}_{q}}^{2})}}\) (12)

式中\({{{R}'}_{ij}}\in [0,1]\),当\({{{R}'}_{ij}}=1\)时,第\(i\)日与第\(j\)日气象因素完全一致。

3 基于CSO优化的ORELM短期负荷预测模型 3.1 ORELM模型

相较于传统极限学习机(extreme learning machine,ELM),ORELM根据压缩感知理论及鲁棒性分析理论,通过将ELM在求解模型训练误差中的二范数替换为一范数的方式[20],有效提高了预测模型的鲁棒性,降低了因数据波动带来的预测精度下降以及ELM出现的训练模型过拟合情况。

设定ORELM的隐含层个数为 L,则激活函数模型为:

\(\sum\limits_{i=1}^{L}{{{\beta }_{i}}g({{w}_{i}}{{X}_{j}}+{{b}_{i}})={{y}_{j}}}\),\(j=1,2,\ldots ,N\) (13)

式中:\({{w}_{i}}={{[{{w}_{i1}},{{w}_{i2}},\ldots ,{{w}_{in}}]}^{\text{T}}}\)为隐含层第\(i\)个神经元随机生成的权值;\({{X}_{j}}\)为训练集第\(j\)个输入值;\({{y}_{j}}\)为训练集第\(j\)个输出值;\({{b}_{i}}\)为隐含层\(i\)个神经元随机生成的偏置;\({{\beta }_{i}}\)为连接隐含层和输出层神经元的输出权值。

\(N\)个激活函数模型可组成线性系统:

\(H\beta =y\) (14)

式中:

;\(\beta ={{[{{\beta }_{1}},{{\beta }_{2}},\ldots ,{{\beta }_{L}}]}^{\text{T}}}\);\(y={{[{{y}_{1}},{{y}_{2}},\ldots ,{{y}_{N}}]}^{\text{T}}}\);\(H\)为隐含层输出矩阵。

在对输出权值求解时,通过求解训练误差的最小二乘解来获得,同时为了提高预测模型的鲁棒性,将求解训练误差的二范数替换为一范数[14],即

\(\left\{ \begin{align} \underset{\beta }{\mathop{\min }}\,||e|{{|}_{1}}+\frac{1}{C}||\beta ||_{2}^{2} \\ e=y-H\beta \\ \end{align} \right.\) (15)

式中\(C\)为正则化参数。

通过增广拉格朗日乘子法转换上述问题为约束优化问题。增广拉格朗日函数式为

\(\begin{align} {{L}_{\mu }}(e,\beta ,\lambda )=||e|{{|}_{1}}+\frac{1}{C}||\beta ||_{2}^{2}+{{\lambda }^{\text{T}}}(y-H\beta -e)+ \\ \text{ }\frac{\mu }{2}||y-H\beta -e||_{2}^{2} \\ \end{align}\)(16)

式中:\(\lambda \)为拉格朗日因子;\(\mu \)为惩罚因子,取\(\mu =2N/||y|{{|}_{1}}\)。

通过以下迭代方程求解式(12)的优化问题:

\(\left\{ \begin{align} {{\beta }_{k+1}}=\arg \underset{\beta }{\mathop{\min }}\,{{L}_{\mu }}({{e}_{k}},\beta ,{{\lambda }_{k}}) \\ {{e}_{k+1}}=\arg \underset{e}{\mathop{\min }}\,{{L}_{\mu }}(e,{{\beta }_{k+1}},{{\lambda }_{k}}) \\ {{\lambda }_{k+1}}={{\lambda }_{k}}+\mu (y-H{{\beta }_{k+1}}-{{e}_{k+1}}) \\ \end{align} \right.\) (17)

式中\(k\)为迭代次数。

将式(13)中求解所得的权值\(\beta \)带入式\(\hat{y}=H\beta \)中,即可得预测结果。

3.2 基于CSO优化的ORELM模型

在ELM以及ORELM算法模型中,隐含层权值\({{w}_{i}}\)以及隐含层偏置\({{b}_{i}}\)是随机设定的,这将一定程度上影响预测模型的性能,导致无法获得最优解或解出现波动,为克服以上缺陷,本文以CSO算法进行参数优化。

CSO算法是群智能算法的一种,其核心参数为对种群中两个粒子相同维之间进行算数交叉的横交叉参数\({{a}_{\text{HC}}}\)与对种群粒子中不同维之间进行算数交叉的竖交叉参数\({{a}_{\text{VC}}}\)。该算法使用\({{a}_{\text{HC}}}\)与\({{a}_{\text{VC}}}\)产生子代后通过贪心算法获得最优解。原始CSO算法的详细描述可参考文献[21]。

CSO算法中为防止在寻优时陷入局部最优解,通过设置竖交叉参数概率值\({{p}_{\text{VC}}}\)来进行纵向交叉使整个种群摆脱在局部最优中摆脱出来,\({{p}_{\text{VC}}}\)的值使用种群适应度的方差特征进行自适应选取,其计算公式为

\({{p}_{\text{VC}}}(t)=({{p}_{\text{VC}\max }}-{{p}_{\text{VC}\min }})(1-\frac{\sigma _{k}^{2}}{n})+{{p}_{\text{VC}\min }}\) (18)

\({{\sigma }^{2}}=\sum\limits_{k=1}^{n}{{{(\frac{{{o}_{k}}-{{o}_{\text{avg}}}}{o})}^{2}}}\) (19)

\(o=\max \{{{\max }_{1 图4 总体预测流程 Fig. 4 Global forecasting procedure

2)根据聚类结果使用CART算法进行建树,以候温作为分裂属性,计算各分裂点Gini系数增益,以确定最优划分节点。

3)利用基于非参数核密度拟合的方法提取历史负荷数据的分季典型日负荷曲线,并使用重要点分割对曲线进行分段处理。

4)根据最优划分节点对待预测负荷数据进行季节性负荷归类,同时待预测负荷数据以及对应的气象数据均以当季的重要点进行分段处理。

5)使用加权相似度筛选参考日,并建立基于CSO优化的ORELM短期负荷预测模型,以输出预测结果。

4 实例验证及结果分析

为验证上述所提基于季节性负荷自适应划分及重要点分割的多分段短期负荷预测方法的有效性,选用澳大利亚AEMO电力公司提供的新南威尔士州悉尼市2006年1月1日至2010年12月31日的实时负荷数据和实时温度、相对湿度数据进行实验仿真[22],数据采样频率为每日48点。本文使用2006—2009年共4年954个工作日数据作为训练集进行模型训练,2010年全年共243个工作日数据作为测试集以验证模型预测精度。

4.1 季节性负荷分类节点确定 4.1.1 负荷数据聚类分析

本文使用基于余弦相似度的k-means算法对训练集中负荷数据进行聚类分析,根据式(3)的聚类指标可得,当聚类数目超过3个后,随着聚类数目\(k\)的增大,聚类指标值增大趋于明显变弱,因此聚类个数定义为3较为合适。训练集负荷曲线聚类结果如图5所示。

从图5可以看出对2006—2009年工作日负荷进行聚类时最优聚类个数为3,这是由于悉尼春秋季季节特性差异不明显,春秋季负荷曲线形态较为相似,因此将两季曲线归为同一类。进一步对负荷数据进行分析可以发现第一类负荷曲线簇集中于同年10月中下旬至次年3月中下旬,第二类负荷曲线簇集中于同年5月中旬至同年9月中旬,第三类负荷曲线簇集中于同年3月中下旬至同年5月中旬、同年9月中旬至同年10月中下旬。考虑到悉尼位于南半球,则定义第一类为夏季负荷曲线,第二类为冬季负荷曲线,第三类为春秋季负荷曲线。

4.1.2 季节性负荷自适应划分

以负荷曲线聚类结果作为分类目标,候温作为分裂属性,建立CART树。由于Gini系数作为分裂

图5 训练集负荷曲线聚类结果 Fig. 5 Clustering results of training set load curves

规则只能用于离散型数据,因此本文根据历史气象数据设定ceil(Hs.min)为\(10{}^\circ C\),\(floor({{H}_{s.\max }})\)为\(26{}^\circ C\),步长为\(0.5\)。计算各分裂点Gini系数增益可得,当\({{H}_{\text{s}}}\ge 20{}^\circ C\)为夏季负荷,\(16{}^\circ C\le {{H}_{\text{s}}} 图6 季节性负荷分类决策树 Fig. 6 Seasonal load classification tree

使用候温分类阈值对测试集负荷曲线进行分类,分类结果如图7所示。

图中测试集夏季负荷曲线共93条,冬季负荷曲线共93条,春秋季负荷曲线共57条。对比图5和图7中负荷曲线形态可以看出,本文所提基于聚类结果结合CART树对负荷进行季节性划分是合理的,根据待预测日候温确定负荷的季节属性,由此针对不同地区不同季节日负荷曲线进行自适应划

图7 测试集负荷曲线划分结果 Fig. 7 Partition results of test set load curves

分,为下一步有针对性的进行预测模型建立打好了基础。

4.2 负荷曲线的重要点分割

根据2.2.1节中基于非参数核密度拟合方法提取各季节性典型日负荷曲线,结果如图8所示。

图8 各季节典型日负荷曲线 Fig. 8 Typical daily load curve of different seasons

由式(11)计算各负荷点的正交距离\({{D}_{\text{o}}}\),选择其中正交距离\({{D}_{\text{o}}}\)值较大点作为分割点,当任意2个重要点较为接近时,停止重要点的选取。各季负荷曲线重要点确定如图9所示。

分析图9可知,对于夏季典型日负荷曲线,当出现第3个重要点时,其与前面所确定的重要点较为接近,因此该曲线重要点个数确定为2个。同理,对于冬季典型日负荷曲线,共4点重要点;春秋季

图9 各季节性负荷曲线重要点选取 Fig. 9 Extraction of different seasonal load curves’ important points

典型日负荷曲线,共3个重要点。根据图中所示重要点可见,分割点均为负荷曲线变化趋势较大的拐点或负荷曲线的极值点,说明该分割方法能有效辨识曲线形态,作出较优的分割选择。分割详细情况如表1所示。

表1 各季负荷曲线详细分割情况 Tab. 1 Segmentation results of different seasonal load curves

4.3 基于CSO-ORELM的多分段短期负荷预测 4.3.1 预测模型数据预处理

为保证参考日筛选的有效性及提高建立预测模型时的收敛速度,对气象数据以及负荷数据本文使用以下公式进行归一化处理:

\({{{S}'}_{i}}=\frac{{{S}_{i}}-{{I}_{\min }}}{{{I}_{\max }}-{{I}_{\min }}}\),\(i=1,2,\cdots ,n\) (23)

式中:\({{S}_{i}}\)为原始数据;\({{{S}'}_{i}}\)为归一化后的数据;\({{I}_{\min }}\)为同类数据样本集中数据的最小值;\({{I}_{\max }}\)为同类数据样本集中数据的最大值;\(n\)为样本集数据量。

预测模型参考日根据式(12)进行选取,再与待预测日进行选取,加权相似性系数\({{{R}'}_{ij}}\)的计算范围为与待预测日具有相同季节类型、相同日类型的训练集数据,选取\({{{R}'}_{ij}}\)值较大的作为参考日。

本文训练负荷预测模型时的输入变量包括温度序列\(T\);考虑温度累积效应的前一日温度序列\({{T}^{(-1)}}\),前两日温度序列\({{T}^{(-2)}}\);相对湿度序列\(H\);日前负荷序列\({{L}^{(-1)}}\)。输出变量为待预测负荷序列\(L\)。

4.3.2 模型精度评价标准

为验证本文所提预测方法的精度,本文选用平均绝对百分比误差作为评判标准,其计算公式为:

\({{e}_{\text{MAPE}}}=\frac{\sum\limits_{i=1}^{n}{|({{x}_{i}}-{{{{x}'}}_{i}})/{{x}_{i}}|}}{n}\times 100%\) (24)

式中:\({{x}_{i}}\)、\({{{x}'}_{i}}\)为时刻\(i\)的电力负荷实际值和预测值;\(n\)为预测天数。

4.3.3 预测结果分析

CSO优化过程参数设置如下:最大迭代次数为200次,种群数目为20。

ORELM参数设置如下:隐含层神经元个数为20,正则化参数\(C\)为230。

同时为说明本文所提多分段预测方法的普遍适用性,本文使用前向反馈神经网络(back propagation neural network,BPNN)、支持向量回归(support vector regression,SVR)以及极限学习机进行预测精度对比。

图10—12分别给出了BP神经网络、SVR、ELM

图10 BP神经网络典型周负荷预测结果 Fig. 10 Typical weekly load forecast results of BP network

图11 SVR典型周负荷预测结果 Fig. 11 Typical weekly load forecast results of SVR

图12 ELM典型周负荷预测结果 Fig. 12 Typical weekly load forecast results of ELM

各季典型周负荷的预测结果。

由图10—12中可以看出,BP神经网络分段算法以及ELM分段算法相较于对应的非分段算法在各季典型周负荷预测精度上有较为明显的提升,而SVR分段算法在预测精度上则提升不明显。为进一步说明本文所提算法的客观真实性,表2—4给出

了2010年全年各季工作日的日平均预测精度对比。

从表中可以看出,本文所提分段算法在3种预测方法中,相较于整体48点非分段预测算法在预

表2 夏季工作日平均预测精度对比 Tab. 2 Load forecast accuracy comparison of weekdays in summer

表3 冬季工作日平均预测精度对比 Tab. 3 Load forecast accuracy comparison of weekdays in winter

表4 春秋季工作日平均预测精度对比 Tab. 4 Load forecast accuracy comparison of weekdays in spring and autumn

测精度上均有不同程度的提高,且各季各分段平均预测精度基本高于非分段全日平均预测精度。其中BP神经网络分段算法预测精度提升最大,其次为ELM分段算法,SVR分段预测算法预测精度提升则不明显。

为验证基于重要点分段的CSO-ORELM预测方法的精度,本实验在前文已知分段算法相较于非分段算法在预测精度上有一定程度的提升的结论下,给出各类分段算法的预测结果对比,各季典型周负荷预测结果如图13所示,全年各季工作日的日负荷平均预测误差对比如图14所示。

从图13可以清晰地看出分段CSO-ORELM算法预测所得的各季周负荷曲线更加接近真实负荷曲线,且分析图14可知分段CSO-ORELM算法的预测误差在4种方法中最小,稳定性最高。

表5给出了各分段算法2010年全年日负荷平均预测误差。显然,CSO-ORELM多分段预测算法预测精度最高,夏季负荷\({{e}_{\text{MAPE}}}\)为1.97%,冬季负荷\({{e}_{\text{MAPE}}}\)为1.49%,春秋季\({{e}_{\text{MAPE}}}\)为1.44%。其中夏季负荷由于气象条件较为复杂,因此预测精度相较于冬季、春秋季负荷偏低。

图13 各季典型周负荷分段预测结果对比 Fig. 13 Piecewise forecast results comparison of typical weekly load of different seasons

图14 全年各季日负荷分段预测误差对比 Fig. 14 Piecewise forecast accuracy comparison of daily load of different seasons

表5 基于多分段方法的各季负荷预测平均MAPE Fig. 5 Average MAPE of load forecasting of different seasons

5 结论

本文提出一种基于季节性负荷自适应划分及重要点分割的多分段短期负荷预测方法。首先基于聚类与CART决策树相结合的划分方法对地区负荷进行季节性划分,然后采用重要点分割技术对各季负荷曲线进行时间序列切割,最后使用基于CSO优化的ORELM算法对各季负荷进行多分段建模。结合新南威尔士州悉尼市的实时负荷数据和实时温度、相对湿度数据进行实验仿真表明:

1)本文所提季节性负荷自适应划分方法能够根据负荷曲线聚类情况准确对地区负荷进行划分,降低由于负荷所在地区不同所导致的仅以固定候温对负荷进行划分的错误率。

2)本文所提基于重要点分割的多分段预测方法在对负荷序列进行分割时能根据曲线形态对负荷趋势变化较大的点进行切割,且多分段预测在预测精度上相较于非分段预测在多种预测算法上均有不同程度的提高,同时基于CSO优化的ORELM算法在预测结果上有显著的优越性。

本文着重研究了季节性负荷的自适应划分算法以及曲线形态分割下,基于气象因素的参考日选取对短期负荷预测的影响。但考虑到在中国电力市场改革与智能电网建设的大背景下,电力将逐渐回归商品属性,电价也将实时波动[23],因此在进行短期负荷预测研究时,应进一步考虑电价这一影响因素。今后将展开多因素对负荷预测影响的研究,以提高算法的应用价值。

(实习编辑 宋钰龙)

参考文献

[1] 康重庆,夏清,刘梅.电力系统负荷预测[M].中国电力出版社,2017.

[2] Overbye T J,Weber J.Smart grid wide-area transmission system visualization[J].Engineering,2015,1(4):466-474.

[3] Kuster C,Rezgui Y,Mourshed M.Electrical load forecasting models:a critical systematic review[J].Sustainable Cities Society,2017,35.

[4] 彭显刚,郑伟钦,林利祥,等.考虑负荷自适应检测和修复的鲁棒极限学习机短期负荷预测方法[J].中国电机工程学报,2016,36(23):6409-6417. Peng Xiangang,Zheng Weiqin,Lin Lixiang,et al.Short-term load forecasting method based on outlier robust extreme learning machine considering adaptive load detection and repair[J].Proceedings of the CSEE,2016,36(23):6409-6417(in Chinese).

[5] Bessec M,Fouquau J.Short-run electricity load forecasting with combinations of stationary wavelet transforms[J].European Journal of Operational Research,2017,264:149-164.

[6] Høverstad B A,Tidemann A,Langseth H,et al.Short-term load forecasting with seasonal decomposition using evolution for parameter tuning[J].IEEE Transactions on Smart Grid,2015,6(4):1904-1913.

[7] 李江,王宝财,陈继开.考虑气象因素的改进虚拟交互回归负荷预测方法[J].南方电网技术,2017,11(8):72-79. Li Jiang,Wang Baocai,Chen Jikai.Improved dummy interactive regression method for load forecasting considering meteorological factors[J].Southern Power System Technology,2017,11(8):72-79(in Chinese).

[8] 卜凡鹏,陈俊艺,张琪祁,等.一种基于双层迭代聚类分析的负荷模式可控精细化识别方法[J].电网技术,2018,42(3):903-913. Bu Fanpeng,Chen Junyi,Zhang Qiqi,et al.A controllable and refine recognition method of electrical load pattern based on bilayer iterative clustering analysis[J].Power System Technology,2018,42(3):903-913(in Chinese).

[9] 王星华,陈卓优,彭显刚.一种基于双层聚类分析的负荷形态组合识别方法[J].电网技术,2016,40(5):1495-1501. Wang Xinghua,Chen Zhuoyou,Peng Xiangan.A new combinational electrical load analysis method based on bilayer clustering analysis[J].Power System Technology,2016,40(5):1495-1501(in Chinese).

[10] 陈华丰,张葛祥.基于决策树和支持向量机的电能质量扰动识别[J].电网技术,2013,37(5):1272-1278. Chen Huafeng,Zhang Gexiang.Power quality disturbance identification using decision tree and support vector machine[J].Power System Technology,2013,37(5):1272-1278(in Chinese).

[11] Hong T,Wang P,White L.Weather station selection for electric load forecasting[J].International Journal of Forecasting,2015,31(2):286-295.

[12] 刘荣,方鸽飞.改进Elman神经网络的综合气象短期负荷预测[J].电力系统保护与控制,2012,40(22):113-117. Liu Rong,Fang Gefei.Short-term load forecasting with comprehensive weather factors based on improved Elman neural network[J].Power System Protection Control,2012,40(22):113-117(in Chinese).

[13] 马瑞,周谢,彭舟,等.考虑气温因素的负荷特性统计指标关联特征数据挖掘[J].中国电机工程学报,2015,35(1):43-51. Ma Rui,Zhou Xie,Peng Zhou,et al.Data mining on correlation feature of load characteristics statistical indexes considering temperature[J].Proceedings of the CSEE,2015,35(1):43-51(in Chinese).

[14] 孙宏斌,陈佳,江曦源,等.最小信息损失综合短期负荷预测(二):算法和算例[J].中国电机工程学报,2016,36(18):4801-4807. Sun Hongbin,Chen Jia,Jiang Xiyuan,et al.Minimization of information loss based hybrid short-term load forecasting part 2-algorithm and case study[J].Proceedings of the CSEE,2016,36(18):4801-4807(in Chinese).

[15] 陈超,黄国勇,邵宗凯,等.基于日特征量相似日的PSO-SVM短期负荷预测[J].中国电力,2013,46(7):91-94. Chen Chao,Huang Guoyong,Shao Zongkai,et al.Short-term load forecasting for similar days based on PSO-SVM and daily feature vector[J].Electric Power,2013.46(7):91-94(in Chinese).

[16] Fuad M M M,Marteau P F.Speeding-up the similarity search in time series databases by coupling dimensionality reduction techniques with a fast-and-dirty filter[C]//IEEE Fourth International Conference on Semantic Computing.IEEE Computer Society,Pittsburgh,2010:101-104.

[17] 程敏,翁宁泉,刘庆,等.基于时间序列分段的气象数据压缩算法[J].计算机系统应用,2014,23(8):125-129. Cheng Min,Weng Ningquan,Liu Qing,et al.Meteorological data compression algorithm based on time-series segmentation[J].Computer Systems Applications,2014,23(8):125-129(in Chinese).

[18] Li Y,Wang S,Deng C.Redundant ridgelet transform and its application to image processing[C]//Fifth International Conference on Information Assurance and Security.IEEE Computer Society,Xian,2009:225-228.

[19] 高亚静,孙永健,杨文海,等.基于非参数核密度估计和改进谱多流形聚类的负荷曲线分类研究[J].电网技术,2018,42(5):1605-1612. Gao Yajing,Sun Yongjian,Yang Wenhai,et al.Study on load curve’s classification based on nonparametric kernel density estimation and improved spectral multi-manifold clustering[J].Power System Technology,2018,42(5):1605-1612(in Chinese).

[20] Zhang K,Luo M.Outlier-robust extreme learning machine for regression problems[J].Neurocomputing,2015,151(3):1519-1527.

[21] Meng A B,Chen Y C,Yin H,et al.Crisscross optimization algorithm and its application[J].Knowledge-Based Systems,2014,67(4):218-229.

[22] File Exchange-MATLAB Central[EB/OL].http://cn.Mathworks.com/ matlabcentral/fileexchange/31877-electricity-load-forecasting-for-the-australian-market-case-study.

[23] 李鹏,何帅,韩鹏飞,等.基于长短期记忆的实时电价条件下智能电网短期负荷预测[J].电网技术,2018,DOI:10.13335/j.1000- 3673.Pst.2018.0433. Li Peng,He Shuai,Han Pengfei,et al.Short term load forecasting of smart grid based on long short term memory recurrent neural networks in condition of real-time electricity price[J].Power System Technology,2018,DOI:10.13335/j.1000-3673.Pst.2018.0433(in Chinese).



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3