基于支持向量机的短期负荷预测

时间:2022-07-25 03:58:20

基于支持向量机的短期负荷预测

【摘要】电力负荷预测的准确性对电力系统安全运行和经济建设有着越来越显著的作用。本文提出一种基于支持向量机的电力系统短期负荷预测方法,将 SVM 引入短期负荷预测,通过不断输入新的负荷数据来更新回归函数,以获得更快的计算速度和较好的预测精度,以佛山地区的负荷数据,结果证明了该方法预测速度快,并且能提高电力负荷的预测精度。

【关键词】电力系统;无功优化;潮流计算;简化梯度法

1.引言

电力系统负荷预测是一项重要的基础性工作,是电力系统规划的核心问题之一,是制定发电计划和输电方案的主要依据。长期以来,在这一领域出现了多种负荷预测方法,主要可分为以时间序列为主的传统方法和以神经网络为主的机器学习方法。传统方法具有运算简单,运行速度快等优点,但是由于模型简单,在电力发展的过程中难以模拟日益复杂的负荷;而机器学习方法有着强大的统计理论依据,在大规模信息处理和学习能力取得了较大进展,但其模型较为复杂,网络结构难以确定,收敛速度较慢,得到的最终解过于依赖初值。20世纪90年代中期,Vapnik 等人在扎实的统计理论基础上提出了一种基于结构风险最小化原则(Structural Risk Minimization, SRM)的新型机器学习算法――支持向量机(Support Vector Machines,简称SVM)方法。它的核心问题是寻找一种归纳原则以实现最小化风险泛函,从而得到最佳的推广。支持向量机方法解决了两个难题:(1)在分析过程中应用核函数的展开定理, 所以不需要核函数的完整表达式;(2)在高维特征空间中用线性回归的方法来进行预测,几乎不增加计算的复杂性,这也就避免了很多人担心升维过程可能出现的维数灾。它避免了人工神经网络等方法的网络结构难于确定、过学习和欠学习以及局部极小等问题, 被认为是目前针对小样本的分类、回归等问题的最佳理论,为解决非线性问题提供了一个新思路。SVM方法是目前统计学中较为年轻的内容,还处于发展当中。

在对一些数据进行统计分析过程中,降维(即把样本空间向低维空间做投影)是首选,因为可以降低计算上的困难。而升维一般只会只会增加计算的复杂性, 甚至会引起维数灾。但是作为分类、回归等问题来说, 很可能在低维样本空间无法线性处理的样本集, 在高维特征空间却可以通过一个线性超平面实现线性划分(或回归), 而与特征空间的线性划分(或回归)相对应的却是样本空间的非线性分类(或回归)。自然发生的两个问题是如何求得非线性映射和解决算法的复杂性。

2.支持向量机回归原理

给定训练集:

(1)

其中,为N维向量, ;根据训练样本集在Rn空间上寻求一个实值函数g(x),以便用y=g(x)来推断任一输入x所对应的输出值y。

显然,空间Rn上的线性函数对应于空间Rn×R上的一个超平面。所以从几何上看,线性回归就是在给定训练集(1)的条件下寻找一个n+1维空间Rn+1上的超平面。给定>0,若超平面满足,即,该超平面的-带包含了训练集T中的所欲训练点,则称该超平面为训练集T的硬-带超平面。

当充分大时,硬-带超平面总是存在的。

2.1 线性可分问题情况

存在最优值,使当时,硬-带超平面不存在;时,训练集T的所有训练点都在硬-带超平面内。这时的硬-带超平面可以看作完全正确划分训练集:

(2)

的超平面。其一般形式为,即超平面的法向量的形式应为,其中是与x对应的n维向量,是与y对应的实数。由此可得凸二次规划问题:

(3)

求出其解后,便得到分划超平面:

(4)

由此可得出线性回归函数:

(5)

其中:

2.2 线性不可分的问题情况

通过引入一个惩罚变量和松弛变量来软化约束条件,则原公式(3)可以等价转化为:

(6)

2.3 核函数

在低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可空间分。但是,如果直接采用这种技术在高维空间进行分类或回归,则存在确定非线性映射函数的形式和参数、特征空间维数等问题,而最大的障碍则是在高维特征空间运算时存在的“维数灾难”。核函数是支持向量机的精髓。采用核函数技术可以有效地解决这样问题。

下面给出核函数的定义:

如果存在着从Rn到Hilbert空间H的变换

(7)

使得(其中(・)表示空间H中的内积),则定义在Rn×Rn上的函数K(x,x')是Rn×Rn的核函数。

下面提出几种常用的核函数:

1)多项式核函数

设d为正整数,则d阶齐次多项式函数K(x,x')=(x,x')d和d阶非齐次多项式函数K(x,x')=((x,x')+1)d都是核函数。

2)Gauss径向基核函数

以为参数的Gauss径向基函数:

是核函数。

以上两个基本核函数都由最基本的核函数K(x,x')=(x,x'),通过满足K(x,x')=K1(x,x')K2(x,x')、K(x,x')=K1(x,x')=K2(x,x')两个保持核函数运算的条件构造出来。

3)Sigmoid核函数

采用Sigmoid函数作为核函数时,支持向量机实现的就是一种多层感知器神经网络,应用SVM 方法,隐含层节点数目(它确定神经网络的结构)、隐含层节点对输入节点的权值都是在设计(训练)的过程中自动确定的[11]。支持向量机的理论基础决定了它最终求得的是全局最优值,而不是局部最小值,也保证了它对于未知样本的良好泛化能力而不会出现过学习现象。

3.基于SVM的短期负荷预测

用支持向量机的方法来进行功率预测的步骤如图1所示:

图1 SVM流程图

1)对历史数据进行归一化处理(scaling),及在原始数据中找出最大值,再用所有数据去除,即可将原始数据均变为小于1的数值,方便在matlab软件里面运行。

根据以往经验可知,一般来说,核函数选择高斯函数效果要好于其他两个。并选择参数C(一般取2的次方)和g。

2)输入训练数据,根据所编的程序运行,建立预测模型。

3)将训练数据的预测结果与实际历史数据比较,如果误差结果符合预想,即可以进行预测。如果偏差较大,则返回步骤2重新修改C和g,再次预测。

4.算例分析

本文利用广东省佛山市2011年10月29日至2011年11月9日的历史负荷数据作为训练数据,对2011年11月10日的全天96个点进行预测。96个点的预测数据如表1所示。

图2

从以上图表可以看出,用SVM进行负荷预测的平均相对误差为3.11%,最大误差为7.69%,在负荷的非高峰时期,可以看出,预测的结果与实际几乎一致,但在负荷的峰处有一定的偏离。

与传统的时间序列法、神经网络进行负荷预测进行结果对比,在同样的样本下,随机选取一天进行负荷预测,其预测结果如表2所示:

表2 预测结果

预测方法 平均相对误差 最大相对误差

时间序列法 6.07% 10.41%

神经网络 5.89% 9.34%

支持向量机 4.43% 8.12%

图3 时间序列法

图4 神经网络法

图5 支持向量机法

从图表可以看出,用时间序列法进行负荷预测时,预测负荷数据与实际负荷数据的整个趋势基本相同,其主要差距在于其峰值,实际负荷的峰值更高一些。

造成这一现象的主要原因是时间序列法的主要思想是根据历史负荷数据的变化趋势及特点来预测未来负荷的趋势和负荷值,历史负荷包含的信息通过时间序列法所建立的模型存储起来,并通过预测模型将这些信息表现在对将来负荷的预测上。

因此,时间序列法对于负荷中的基荷预测较为准确,而对于在峰荷时出现的变动则往往不能表现的很准确。上图就表现出了时间序列法对于大变动的负荷预测不准确的结果,并造成了平均误差较大的结果。

而用神经网络进行负荷时,预测数据和实际数据在两个负荷高峰有着比较好的预测效果。在曲线两端,算法的预测效果不是非常明显。

最后,用支持向量机进行负荷预测时,预测负荷数据能反映实际负荷的总体趋势,但是其主要差距在于时间,预测的结果总比实际的要滞后。

造成这一现象的主要原因是由于支持向量机是根据历史负荷数据的变化趋势及特点来预测未来负荷的趋势和负荷值,历史负荷包含的信息通过所建立的模型存储起来,并通过预测模型将这些信息表现在对将来负荷的预测上,选择更为合适的训练样本将会使得负荷预测更为准确。尽管如此,从预测结果的统计上看,用支持向量机进行负荷预测是明显优于其他两种方法。

5.结论与展望

本文对短期负荷预测进行了一些研究,特别针对支持向量机负荷预测方法的发展历史以及算法原理进行了深入的探讨。并基于支持向量机编制仿真程序,对佛山市的负荷进行预测,将预测结果与真实负荷数据作对比和误差分析。同时,与时间序列法、神经网络法进行负荷预测的结果进行对比,从结果上看,支持向量机负荷预测方法具有较高的准确性。

由于支持向量机的预测精度很大一部分是依赖于对样本的选取,目前采用的天气聚类方法、分行业聚类方法对样本进行预处理各有其优劣势,如何综合考虑,并采用有效的数据处理技术对样本进行预处理是下一步的研究工作。

参考文献

[1]李艳红,雷金辉.电力负荷时间序列预测的应用与研究[J].科学技术与工程,2011,11(4).860-864

[2]王日见,张少华.一种应用时间序列技术的短期电力负荷预测模型[J].上海大学学报(自然科学版),2002,8(2):133-136

[3]李晗书.时间序列分析在电力负荷预测中的应用研究[D].秦皇岛:燕山大学,2009.

[4]张颖,高中文.基于时间序列和神经网络的电力系统负荷预测[J].哈尔滨理工大学学报,2003,8(1):30-36.

[5]邹森.时间序列自适应短期负荷预测[J].山东工业大学学报,1988,18(2):43-49.

[6]王秋梅.时间序列法负荷预测的原理和应用[J].华东电力,1993(4):37-39.

[7]莫玲.基于时间序列和人工神经网络的电力系统短期负荷预测[D].南昌:南昌大学,2006.

[8]Ren Boqiang,Jiang Chuanwen.A review on the economic dispatch and risk management considering wind power in the power market[J].Renewable and Sustainable Energy Reviews.2009(13):2069-2074.

[9]关薇.时间序列在电力系统负荷预测中的应用[D].北京:北方工业大学,2008

[10]谢忠玉.电力短期负荷时间序列混沌特性分析及预测研究[D].哈尔滨:哈尔滨工业大学,2010.

[11]刘霖雯,刘超,江成顺.EMD新算法及其应用[J].系统仿真学报,2007,19(2):446-447.

[12]杨云飞,鲍玉昆,胡忠义,张瑞.基于EMD和SVMs的原油价格预测方法[J].管理学报,2010,7(12).

[13]祝志慧,孙云莲,季宇.基于EMD和SVM的短期负荷预测[J].2007.33(5):118-121.

[14]段益群,刘国彦.基于EMD和SVM的虹膜识别方法[J].2010,46(30):188-194.

[15]孙志刚,翟玮星,李伟伦,卫志农.基于EMD和相关向量机的短期负荷预测[J].电力系统及其自动化学报,2011.23(1):92-97.

作者简介:熊焰雄(1963―),男,硕士,广东电力投资有限公司工程师,从事变电继电保护、运行检修,电力工程及规划等工作。

上一篇:基于MATLAB的永磁同步电机变频调速系统的仿真... 下一篇:双自复位热断路器水壶非正常试验设备研究探讨