Smart Grid
Vol.4 No.06(2014), Article ID:14610,8 pages
DOI:10.12677/SG.2014.46030

Big Data Analysis of Mid-Long Term Load Forecasting in Power System

Xiaoping Wang, Yang Li, Jun Yong, Hao Zhang, Bing He, Tao Zheng, Qianshan Cheng, Hualiang Fang

Mianyang Power Supply Company, State Grid Sichuan Electric Power Company, Mianyang

Email: qianshan_ch@163.com

Copyright © 2014 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

Received: Oct. 31st, 2014; revised: Nov. 19th, 2014; accepted: Nov. 26th, 2014

ABSTRACT

A mid-long term load forecasting method based on big data theory is proposed because of the present complicated forecasting models and bad adaptability. The method focuses on the data and the load in large area is partitioned to different levels and classified to different types. Then the relationships among data are researched. Based on the characteristic of each partition and analysis of corresponding data, the load forecasting model is established, and thus the elaborate load forecasting is realized. In the end, the validity of the method is proved by practical example in power system.

Keywords:Mid-Long Term Load Forecasting, Big Data, Partition and Classification of Load, Elaborate Load Forecasting Model

电力系统中长期负荷预测的
大数据分析

王小平,李  阳,雍  军,张  浩,何  冰,郑  涛,程潜善,方华亮

国网四川省电力公司绵阳供电公司,绵阳

Email: qianshan_ch@163.com

收稿日期:2014年10月31日;修回日期:2014年11月19日;录用日期:2014年11月26日

摘  要

针对当前电力系统中长期预测模型复杂、适应性差等不足,提出基于大数据的中长期负荷预测方法。该方法以数据为中心,将大区域的负荷进行分层分区及分类,并研究数据之间的关联性。针对各区间负荷结构等特点,在数据分析基础上,建立与数据相适应的负荷预测模型,实现大区域内负荷的精细化预测。最后以某地区电网为例,验证了该方法的有效性。

关键词

中长期负荷预测,大数据,负荷分区分类,精细化预测

1. 引言

中长期负荷预测是对未来五到十年及以上的负荷进行预测,为电网规划和建设提供参考。预测时间周期长、影响因子多,除了经济水平、产业结构、相关政策外,还受到新型负荷如电动汽车等的迅速发展,节能环保政策,以及气候的异常变化等的影响,中长期负荷预测是一个十分复杂的多维、非线性的不确定性问题。很多学者对中长期负荷预测进行了研究,主要有回归分析法[1] 、灰色系统理论预测法[2] [3] 、以及人工智能预测方法如神经网络预测法[4] [5] 、证据理论预测法[6] 、数据挖掘技术[7] 及支持向量机预测法[8] 。这些预测方法主要是以模型或算法为中心,基于某种数学理论,建立负荷预测模型,并根据实际情况进行相应的改进,计算得到负荷预测结果。预测结果严重依赖于数学模型,对于基础数据类型多样,模型的适应性较差。

中长期负荷预测受到诸多随机因素的影响,没有明确的数学机理,数学模型无法准确地描述负荷变化规律[9] 。根本上决定负荷变化的是各类型数据,而模型只是数据的支撑。所以精准的负荷预测只有尽可能搜集、发掘影响负荷变化因子的数据,全面考虑各种不同因素对负荷的影响。而实际上,电网在运营过程中已收集到大量的负荷信息,如各地负荷的类型与分布情况,另外各相关部门提供的诸如经济、气候等也会随技术革新而愈加全面、准确。根据这种趋势,本文提出了基于大数据思想的中长期负荷预测方法,是在数据的分析基础上建模预测。

大数据技术[10] [11] 是解决预测问题强有力的工具,为负荷预测提供了一种全新的思路,它以数据的分析处理为中心,从数据中挖掘出隐含未来发展的信息。中长期负荷预测是典型的数据决定问题,利用大数据方法,对负荷大数据进行细致的分析处理,能很好地发掘出负荷的分布情况和变化趋势。本文首先从整体上构建大数据思想下中长期负荷框架,然后就框架中数据分析处理和建模预测两个核心部分进行了详细的分析,通过数据的分区分层与分类、建立与之相适应的预测模型,最后通过实例验证了方法的有效性。

2. 大数据思想负荷预测框架

负荷预测一般包括确定预测目标、负荷数据收集、数据分析处理、建模预测和误差分析等几个环节。基于大数据思想的负荷预测对数据的要求更高,要对数据源进行全面分析,且更依赖通信网络和微机技术来传送汇集存储数据,以形成大数据平台,如图1所示。

数据源分析与采集:中长期负荷预测的影响因素多,相关数据不仅体量大、类型多,相互影响与层次关系也非常复杂。在收集之前,对数据进行全面分析,确定其种类和影响负荷的方式。在此基础上,

Figure 1. Frame diagram of big data load forecasting

图1. 大数据负荷预测框架图

结合数据分布情况,通过各种数据采集终端、政府信息发布平台等渠道收集这些数据。

数据通信与预处理:预测基础数据是分布在广域空间上的,各采集终端所获得数据必须通过通信传输汇集起来,通过格式转换、整理归类等预处理操作存储起来,形成负荷预测大数据信息平台。

数据处理与分析:在大数据平台下,对数据的分析处理分为两步。首先针对数据的不足进行的处理,包括时效性检验、缺失数据补全、错误数据修正等,剔除错误数据,补足重要数据。其次利用大数据分析技术,对各类型数据进行详细的分析,提取特征参数和变化规律,挖掘出数据中隐含信息。

建模预测与误差分析:基于大数据的负荷预测建模是针对数据的建模,是根据数据的分布规律与变化规律建立的与数据相适应的模型,能针对数据的改变做出相应调整,最后通过误差分析进一步修正模型中的参数。

在预测框架中,数据源分析、数据分析处理及建模预测为其核心部分,决定预测精度。大数据思想正是通过数据源分析,大量掌握负荷相关数据,利用大数据分析技术全面分析负荷大数据特点,建立以数据为中心的预测模型,最终实现大区域内负荷的精细化预测。在预测体系中,负荷数据对最终结果起着很大作用。实际中不可避免出现数据不足的情况,在部分数据严重缺失的情况下某些参数会无法提取,会使得模型过于简单,预测结果较为粗糙,所以数据源的分析和数据的收集在大数据负荷预测中至关重要。

3. 负荷大数据分析

中长期负荷预测除了需搜集大量的影响因素数据外,电网本身也会有大量的负荷数据产生。这些数据不仅体量大,类型多,而且相互关系复杂,在建模预测前必须进行详细的数据分析,构建起数据间层次结构体系,这便需要对负荷进行分区分层与分类处理。

负荷分区分类是细致考虑底层负荷个性,实现精细化预测的手段,能针对不同地域负荷的分布、类型等特点作出相应的预测处理,更加贴合实际。负荷分层分区与分类要与实际分布情况相统一,能反映出负荷密度、负荷类型等特点,图2是按照我国电网管理方法的开放性负荷分类方法。

这种分类方法结合电网管理,实现对区域负荷多层次的划分,能自由根据所收集数据选择划分的层级,当数据足够充分时,甚至能精确到某个具体的负荷。对划分到底层的负荷,依次进行独立的分析预测,但在实际中,由于产业链等因素,负荷之间存在复杂的关联关系,即某一类型负荷的变化会造成相关负荷的改变,特别是关联紧密产业间的大负荷。

大负荷间的关联关系与产业间关系相对应,主要有横向关联与纵向关联。横向关联指同一级别的产业负荷间相互影响关系,既有竞争又有共生,纵向关联指不同级别,即存在上下游产业负荷间作用关系,只有共生关系,如汽车生产企业负荷间的横纵关联关系如图3所示。

对于有横纵关联关系的大负荷,可将其分别从原有的各分区内提取出来,组成独立的虚拟分区,对虚拟分区内的负荷进行单独预测,整体修正。单独预测是对虚拟分区内的负荷依据各自的变化趋势和影响因素分别做出预测,整体修正是根据负荷间的关联类别和关联程度对各负荷的预测结果作出整体上的修正。

Figure 2. Open hierarchy chart of load partition and classification

图2. 开放性负荷分区分类层次图

Figure 3. Horizontal and vertical relationship diagram among big load

图3. 大负荷间横、纵关联关系图

4. 大数据预测建模

4.1. 分区模型

分区建模要依据分区的层次,从一级分区开始,逐层深入。发展不同、负荷密度不同的区域,分区级数会有所区别。对某一分区用表示,其中表示分区的级数,表示每个分区层级中的不同分区,若对于子分区个下级子分区,则有

(1)

那么整个预测区域可表示为

(2)

对应上式,分别表示具有个下级子分区的分区,表示没有子分区的分区。可以看出,不同子分区下可以有不同个数、不同层级的下级子分区,在实际情况下,根据数据的详实程度一直确定到细化程度最高的级别。

对于有横纵关联性的产业大负荷,将这些负荷从各分区内提取出来,组成虚拟分区,虚拟分区的处理同其他分区的处理方法类似,即根据分区特点独立进行预测。新建负荷的虚拟分区后,整个预测区域可表示为

(3)

4.2. 分类模型

负荷分类要在分区的前提下进行,针对每个分区内不同类型,不同作用因素的负荷进行区分,具体分类要根据分区所深入的程度,当分区深入到基层负荷时,那负荷可划分为办公楼负荷,居民楼负荷,户外设施负荷等具体类型负荷,当分区层级比较少,也可划分为三大产业的负荷以及居民用电负荷等类型。负荷分类要在分区内进行,对分区,若共有类型负荷,则有

(4)

4.3. 预测模型

负荷分区分类的最终目的是实现不同类型负荷的精细化预测。在分区分类的基础上,建立反映不同分区负荷特性的预测模型。

对于包含两类子分区的级预测分区,即有个包含子分区的分区和个不包含子分区的分区,详细的建模过程如图4

对于不包含子分区的个分区内的某一类型负荷,假设其受到种影响因素的影响,写成向量即,对的预测,首先根据变化的整体变化趋势确定基准值,基准值的确定可采取多种方法,选用弹性系数法有

(5)

为基值参考值,可选择某一年负荷量或多年均值等作为参考,为弹性系数,为经济的增长

Figure 4. Model structure diagram of load partition

图4. 预测分区模型结构图

率,为相对基值参考值经过的年限。

然后根据每种影响因子对负荷的作用程度对预测基值进行修正,有

(6)

为相应预测分区经过年后的预测值,为各种影响因素年后的预测数据变化向量,为相应变化对的影响系数。

对预测分区年后负荷的预测值

(7)

对于包含子分区的个分区,同样从最底层的负荷出发,逐级向上级分区分步计算,对于预测分区

(8)

综合两种子分区,最后得出预测分区的预测结果为

(9)

5. 算例分析

利用大数据分析方法,对某市的用电量进行分析预测。该市的用电量如表1所示。

由数据可将该市分为7个分区,每个分区内的负荷分为第一产业、第二产业、第三产业以及居民生活用电4种类型。在横向上,首先对该市负荷做整体分析,确定关键分区以及各类型负荷的重点分区(图5)。

图5中看出,该市以第二产业用电为主,超过全市负荷的一半,而第一产业负荷非常少。全市负荷主要集中在A、B、C三个区域,尤其是A、C两个分区,拥有全市接近70%的负荷。各类型负荷,也都是A、B、C三个分区占据比重最大,所以要准确的进行该市负荷预测,需将这三分区作为重点分区考虑。

然后对各分区内的负荷进行分析,从下面的百分比图可以看出,包括重点分区A、B、C在内的所有分区均以第二产业负荷为主,特别是C区,达到70%多,因各分区产业结构的不同,各类型负荷的比例均不相同(图6)。

在纵向上,分析各分区内各类型负荷比例变化。随着地区的发展,不同产业经济增速是不一样的,

Table 1. Basic data of load forecasting

表1. 负荷预测基础数据

Figure 5. Load types analysis in whole city

图5. 全市负荷类型分析

Figure 6. Load analysis diagram in each partition

图6. 分区类型负荷分析图

Figure 7. Structure changing of the load in partition A

图7. A区负荷结构变化图

Table 2. Forecasting result of each kind of load

表2. 分类型负荷预测结果

造成各类型负荷的比重会有改变。以A分区为例,如图7所示,可以看出,当各类型负荷比例保持相对稳定时,总体负荷的增长越平稳,规律性较强;在经济动荡时候会出现负荷的较大波动。

通过上述全市及分区各类型负荷的分析,分别确定相应负荷的基准值和影响系数等参数,尤其是在重点分区内,对精度要求会更高。对各类型负荷用相应的经济、人均收入等影响因素对基值进行相应的修正,逐分区层级向上,得出最终的预测结果如表2所示。

从预测结果来看,均与实际值较为接近。误差主要的来源是基值的误差和修正量的误差,基值误差由负荷的分析引起的;修正量的误差由各影响因素数据统计误差和影响系数引起的,这两种误差均会随着数据的丰富,精度得到提高。

6. 结论

本文提出了基于大数据思想的中长期负荷预测方法,并建立了大数据思想下的预测框架体系,建立体系中分区分类和相应预测模型,能针对负荷类型等特点,综合考虑影响负荷变化的各类因素,体现数据对预测结果的决定性作用。实例证明,本文提出的方法体系预测结果能反映负荷实际情况,较传统方法更加精确。

基金项目

国家自然科学基金(51107090)。

参考文献 (References)

  1. [1]   毛李帆, 江岳春, 姚建刚 (2009) 采用正交信号修正法与偏最小二乘回归的中长期负荷预测. 中国电机工程学报, 16, 82-88.

  2. [2]   张伏生, 刘芳, 赵文彬 (2003) 灰色Verhuist模型在中长期负荷预测中的应用. 电网技术, 5, 37-39.

  3. [3]   周德强 .(2009) 改进的灰色Verhuist模型在中长期负荷预测中的应用. 电网技术, 18, 124-127.

  4. [4]   Hsu, C.C. and Chen, C.Y. (2003) Regional load forecasting in Taiwan-application of artificial neural networks. Energy Conversion and Management, 44, 1941-1949.

  5. [5]   李春祥, 牛东晓, 孟丽敏 (2009) 基于层次分析法和径向基函数神经网络的中长期负荷预测综合模型. 电网技术, 2, 99-104.

  6. [6]   倪明, 高晓萍, 单渊达 (1997) 证据理论在中期负荷预测中的应用. 中国电机工程学报, 3, 199-203.

  7. [7]   崔旻, 顾洁 (2004) 基于数据挖掘的电力系统中长期负荷预测新方法. 电力自动化设备, 6, 18-21.

  8. [8]   李瑾, 刘金朋, 王建军 (2011) 采用支持向量机和模拟退火算法的中长期负荷预测方法. 中国电机工程学报, 16, 63-66.

  9. [9]   郑志杰, 李磊, 赵兰明 (2011) 考虑数据不确定性的中长期电力负荷预测. 电力系统保护与控制, 7, 123-126.

  10. [10]   赵云山, 刘焕焕 (2014) 大数据技术在电力行业的应用. 研究电信科学, 1, 57-62.

  11. [11]   宋亚奇, 周国亮, 朱永利 (2013) 智能电网大数据处理技术现状与挑战. 电网技术, 4, 927-935.

期刊菜单