Computer Science and Application
Vol. 12  No. 09 ( 2022 ), Article ID: 55541 , 11 pages
10.12677/CSA.2022.129210

基于CEEMDAN-GWO-KELM模型对我国电力需求预测

王斯1,2,张国浩1,2,杨澈洲1,2

1重庆工商大学数学与统计学院,重庆

2经济社会应用统计重庆市重点实验室,重庆

收稿日期:2022年8月1日;录用日期:2022年8月30日;发布日期:2022年9月6日

摘要

中长期电力预测是电力系统规划主要研究之一,也是学界和业界广泛关注的热点之一。本文构建合理的电力需求影响因素指标体系,通过稀疏贝叶斯学习和相关性分析筛选出关键性指标。利用自适应噪声完备经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN)将电力需求数据分解成多个信号分量(intrinsic mode function, IMF),并将其作为待预测分量。利用灰狼优化算法(Grey Wolf Optimizer, GWO)对核极限学习机(Kernel Based Extreme Learning Machine, KELM)的参数进行优化,建立了CEEMDAN-GWO-KELM多重组合模型。通过1960~2020年的电力需求数据做模型对比的实证分析,验证了该模型的有效性,并对我国中长期电力需求进行预测。

关键词

中长期电力,电力需求,稀疏贝叶斯学习,模态分解,核极限学习机

Electricity Demand Forecasting in China Based on CEEMDAN-GWO-KELM Model

Si Wang1,2, Guohao Zhang1,2, Chezhou Yang1,2

1College of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing

2Chongqing Key Laboratory of Economic and Social Applied Statistics, Chongqing

Received: Aug. 1st, 2022; accepted: Aug. 30th, 2022; published: Sep. 6th, 2022

ABSTRACT

Medium- and long-term power forecasting is one of the main studies in power system planning, and one of the hot spots widely concerned by academia and industry. In this paper, we construct a reasonable index system of power demand influencing factors, and screen out key indexes by sparse bayesian learning (SBL) and correlation analysis. Using complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN), the electricity demand data are decomposed into multiple signal components (intrinsic mode function, IMF) and the IMF is used as the component to be predicted. The parameters of the kernel based extreme learning machine (KELM) are optimized by the grey wolf optimizer (GWO), and a CEEMDAN-GWO-KELM multiple combination model is developed. The empirical analysis of model comparison is done through the electricity demand data from 1960 to 2020 to verify the validity and accuracy of the model and to forecast the medium and long-term electricity demand in China.

Keywords:Medium and Long-Term Electricity, Electricity Demand, Sparse Bayesian Learning, Modal Decomposition, Kernel Extreme Learning Machine

Copyright © 2022 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

电力行业是国民经济发展最基础、最重要的能源产业,最近几年的电力需求增速加快、电力弹性系数剧烈波动、煤炭供给侧改革力度巨大和可再生能源稳定性不足,造成电力供需失衡。如何稳健地把握中长期电力需求发展趋势,这对电力预测的准确性提出了挑战。

众多国内外学者为提高电力预测精度做了大量研究 [1],方法大致分为两类:

1) 传统模型方法。时间序列模型(autoregressive integrated moving average model, ARIMA) [2] [3]、回归模型 [4]、灰色理论预测模型 [5]、系统动力学 [6] 等,该类模型简单、可操作性强,虽能解决中长期预测问题,但无法捕获数据中非线性和非平稳性特征,同时面对电力预测系统的复杂性,很难有较高的预测精度。

2) 智能优化算法。支持向量机回归算法 [7]、人工神经网络 [8] (artificial neural network, ANN)、自适应Boosting模型 [9]、基于遗传算法(genetic algorithm, GA)和粒子群优化(particle swarm optimization, PSO)算法的BP神经网络 [10]、基于卡尔曼滤波器和回归方法相结合的组合型算法 [11]、基于ANN与增强进化算法(IEAMCGM-R) [12] 等。这些算法都用于长期、短期的电力负荷预测。这些模型不管从精度还是处理非线性问题上,都有明显的优越性,但仍存在不足,比如计算复杂导致迭代时间过长,优化容易陷入局部最优解,还可能诱发参数敏感,导致模型出现过拟合,一定程度上影响了预测效率和精度。

因此,本文采用SBL模型分析电力需求的影响因素,筛选出关键性变量,以此来弥补传统模型在非线性和非平稳的时间序列预测偏差不足,由于不需要优化参数,将大大提高模型训练效率,同时结果更加可靠。基于KELM模型在非线性和非平稳的时间序列表现优良性能的考虑,将作为最终的预测输出模型,并引入GWO算法对KELM模型进行全局最优的参数搜索,进一步提升预测精度。引入CEEMDAN算法 [13] 做信号分解,它不仅能去除信号噪声,在处理非线性和非平稳性数据有着良好的表现,为了避免模型过拟合,将分解的各个分量,分别用于各个模型的训练,最终得到多个模型的预测结果,提升模型的泛化能力。

本文模型的优点:整体上克服非线性与非平稳性数据的不足;利用SBL模型提升了模型训练效率;利用GWO-KELM模型获取全局最优解并提升模型预测精度;利用CEEMDAN分解信号防止模型过拟合。

2. 电力需求影响因素指标体系构建

本文指标体系的构建是从宏观经济指标的角度去衡量,考虑到电力需求与经济社会发展息息相关,是经济、城市发展、人口规模、产业结构等综合因素作用的结果,结合多位学者的研究经验 [14] [15] [16],具体如下:

1) 经济发展水平。电力需求与经济发展具有高度耦合关系,经济的增长是促进电力消费增长的重要极,我们选取GDP(X1)来代表经济总量水平,人均GDP (X2)来代表人民经济生活水平。

2) 城镇化水平。城镇化也是一个预测电力需求的重要影响因素,选取城镇化率(X3)和城镇人口基数(X4)代表城镇化水平。

3) 人口总量水平。居民生活用电是电力需求的重要组成部分,选取常住人口数(X5)作为人口基数。

4) 经济产业结构。电力消耗随着国家产业结构的调整而变化,我们选取第一产业增加值(X6)、第二产业增加值(X7)、第三产业(X8)增加值来代表产业结构。

5) 工业化水平。我国电力消费主要来自于工业用电,选取工业增加值(X9)代表工业化水平。

6) 居民消费水平。居民消费与电力的需求是间接影响关系。选取消费者物价指数(consumer price index, CPI) (X10)代表居民消费水平。

7) 电力价格。考虑到价格与供需的关系,电力价格也是影响电力消费的重要因素,火力发电仍然是电力生产的主流,从而使用燃料类商品零售价格指数(X11)代替电价。

8) 用电基数。我国电力生产供应能力稳步提升,供需总体趋于平衡,通过前一期的电力数据(X12)来预测后一期的电力数据具有一定的可靠性。

3. 算法概要

3.1. 稀疏贝叶斯学习模型

本文采用稀疏贝叶斯学习模型 [17] (sparse bayesian learning, SBL),主要是考虑样本特征少于样本量时表现优秀,而且由于只需要少量参数,不仅提高模型训练效率而且结果也更加稳定,更具有可解释性。

3.2. 核极限学习机(KELM)

本文采用核极限学习机作为最终预测输出模型,它不仅能降低计算复杂度,而且使得模型更具有稳定性和鲁棒性,效率上更高,泛化性能更好。

3.3. 灰狼优化算法(GWO)

本文采用灰狼优化算法对最终预测模型进行参数优化,GWO算法是元启发式算法,具有较强的收敛性能、参数少、简单易实现等特点。

3.4. GWO-KELM模型

本文引入GWO算法对KELM进行参数优化。GWO算法具体优化KELM模型中待确定的正则化参数C和核函数gamma。为保证GWO-KELM模型在最优的条件下进行,用均方根误差(root mean square error, RMSE)作为GWO算法适应度函数,不断迭代得到KELM参数全局最优解。

4. CEEMDAN-GWO-KELM预测模型

4.1. 不同经验模态分解对比

本文选取EEMD分解、CEEMD分解、CEEMDAN分解方法进行对比。图1(a)是电力的原始分解信号,图1(b)~(d)是不同模态分解的信号,通过对比图1(e)与图1(f),可以发现CEEMDAN信号恢复具有最小的误差,这也表明它在处理非线性,非平稳信号具有良好的自适应分解能力,可以将信号按照一定顺序排列,通过提取分解后的模态函数构造滤波器实现对原始信号的降噪处理,这也是本文选取此分解法的缘由。

4.2. CEEMDAN-GWO-KELM模型

CEEMDAN [18] 分解原时间序列时,引入噪声系数来控制每次分解的噪声水平,分解成若干个IMF分量和一个残差后,通过预测各个分量加和得到最终预测值。同时GWO算法优化KELM参数,在参数取值范围内获得最优解,并且KELM模型不需要迭代,还具有出色的泛化能力。具体步骤:

(a) 电力需求原始信号 (b) EEMD分解信号 (c) CEEMD分解信号 (d) CEEMDAN分解信号(e) 三种信号恢复 (f) 三种信号恢复误差

Figure 1. Comparison of different modal signals and errors

图1. 不同模态信号和误差对比

1) CEEMDAN分解得到N个IMF分量。

2) GWO优化每一个IMF分量的KELM模型参数。

3) 将每次GWO得到的最优参数传入KELM模型,进行每一个分量预测。

4) 通过算术相加得到电力需求预测结果。

CEEMDAN-GWO-KELM算法的具体流程图2所示:

Figure 2. CEEMDAN-GWO-KELM algorithm flow chart

图2. CEEMDAN-GWO-KELM算法流程图

5. 实证分析

所选样本是我国的电力消费需求量以及12个解释变量,所有数据来源由国家统计局、世界银行、世界能源数据库。根据Alsaber Ahmad R [19] 等,使用随机森林方法填补缺失值。进行数据归一化后,将1960~2008年作为训练集,2009~2020年为测试集。

5.1. 数据平稳性检验

基于统计推断的基础下,如果数据非平稳,会破坏推断的“一致性”,基于非平稳时间序列的预测也就失去了意义。所以本文采用的方法能较好地克服非平稳数据的缺陷。

表1中,除了X5和X11的概率P值小于0.1 (常见统计标准),即拒绝原假设,说明两个变量的数据是平稳的,其余变量均大于0.1,支持原假设,即数据是非平稳序列,数据非平稳对于常见机器学习模型可能会使得预测效果不佳。

Table 1. Stationary test of data

表1. 数据平稳性检验

5.2. 电力需求影响因素分析

本文选用相关性分析和SBL回归模型,综合筛选出关键性的电力需求预测指标。

表2,我们取综合排名前5个指标,分别是:用电基数、工业增加值、GDP、城镇人口数、人均GDP。将以上的变量作为预测电力需求的输入变量,将其后的变量作为备选变量,如果加入模型后,预测效果不佳则相应剔除。

Table 2. Comprehensive variable screening ranking

表2. 综合变量筛选排名

注:变量的系数与权重值相同,排名不同的原因,是由于保留小数位数原因。

5.3. 电力需求预测模型对比

为增加模型对比说服力,控制输入相同参数值,见表3,由于其他模型,算法不同,输入参数不同,文章未列出。

Table 3. GWO-SVR & GWO-KELM model parameter explanation

表3. GWO-SVR & GWO-KELM模型参数解释

对比图3表4预测结果:RVM和SVR预测结果最差,其次是无参数优化的KELM模型;传统ARIMA模型与GWO-SVR模型预测精度比较高,GWO-KELM与本文提出的模型具有最高预测精度。

综上说明:经过GWO优化的SVR、KELM算法预测效果都显著的优于网格搜索法;本文提出的模型,可以提升预测精度,适用于非线性和非平稳性特征的数据。

Table 4. Electric power forecast error statistics of different models

表4. 不同模型电力预测误差统计

Figure 3. Comparison of power prediction results of different models

图3. 不同模型电力预测结果对比

5.4. 我国电力需求中长期预测

2021~2035年输入数据源,实际值见表5。输入变量包括:GDP、人均GDP、城镇人口数、工业增加值、用电基数。根据我国“十四五”规划的主要指标 [20],结合胡鞍钢 [21]、李平 [22] 的研究内容,实际GDP增速逐步放缓,并考虑了通货膨胀率的影响,确定了名义GDP的值,以及工业增加值。

根据孔亦舒 [23] 对未来15年人均GDP的预测,即2035年人均GDP达到中等发达国家水平目标,由于中等发达国家人均GDP水平是属于动态变化,以2020年不变价格为基础,其增长率按照4.5%计算,最终得到未来15年的人均GDP。

结合胡鞍钢等对常住人口城镇化率预测数据和杨舸 [24] 等对人口变动预测数据,计算得到城镇人口数。

根据杜忠明等对我国中长期电力需求的研判,中长期我国电力持续增长,2030年将达到11.5亿kW∙h,年均增长率为3.9%,2035年将达到13.1亿kW∙h时,年均增长率为2.6%。本文将2020年的电力需求作为2021用电基数,通过增长速率计算得到2022~2035年的用电基数。同时为了对比模型的预测效果,将无滞后一期的电力需求数据假定为未来15年电力的实际需求数据。

Table 5. Electricity demand results in China in 2021~2035

表5. 2021~2035年我国电力需求结果

Figure 4. Forecast results of different models for medium and long-term electricity demand

图4. 不同模型对中长期电力需求预测结果

Table 6. Error of medium and long-term electricity demand forecast by different models

表6. 不同模型对中长期电力需求预测误差

结合图4表6,传统预测模型ARIMA在前期表现较好,中后期出现偏差,且逐年增大。线性回归(linear regression, LR)、贝叶斯岭回归(bayesian ridge, BR)、随机抽样一致性算法(random sample consensus, RANSAC)表现较差。贝叶斯ARD回归、泰尔森估算模型(Theil-Sen estimator, TSE)表现一般。综合以上来看,本文提出的模型预测表现最好,拥有最小的RMSE、MAE值,最大的R2

6. 结语

从2021~2035年我国电力需求预测结果来看,“十四五”末期,我国电力需求有望达到95,709亿kW∙h,前五年平均增长率为4.96%,且增长率逐年下降。到2035年末期,电力需求将达到135,052亿kW∙h,后十年平均增长率为3.5%,增长率依然逐年下降,到2035年降至2.52%。电力需求增速放缓,但仍有上升空间,应该合理优化电力高质量发展路径,同时加强电力供需的监测预警,切实提升国民电力供应保障能力,充分满足人民对美好生活的向往,助力我国社会主义现代化强国的建设。

本文提出的方法丰富了中长期电力需求预测的研究,实验结论也为我国实现用电供需平衡、电力系统科学规划提供一定的借鉴意义。

基金项目

研究生创新项目(yjscxx2022-112-189)。

文章引用

王 斯,张国浩,杨澈洲. 基于CEEMDAN-GWO-KELM模型对我国电力需求预测
Electricity Demand Forecasting in China Based on CEEMDAN-GWO-KELM Model[J]. 计算机科学与应用, 2022, 12(09): 2073-2083. https://doi.org/10.12677/CSA.2022.129210

参考文献

  1. 1. Mohammed, N.A. (2018) Modelling of Unsuppressed Electrical Demand Forecasting in Iraq for Long Term. Energy, 162, 354-363. https://doi.org/10.1016/j.energy.2018.08.030

  2. 2. Wang, X.F. and McDonald, J.R. (1994) Modern Power System Planning. McGraw-Hill Companies, New York.

  3. 3. Oliveira, E.D. and Oliveira, F.C. (2018) Forecast-ing Mid-Long Term Electric Energy Consumption through Bagging ARIMA and Exponential Smoothing Methods. En-ergy, 144, 776-788. https://doi.org/10.1016/j.energy.2017.12.049

  4. 4. Nazih, A.S. and Fawwaz, E. (2011) Me-dium-Term Electric Load Forecasting Using Singular Value Decomposition. Energy, 36, 4259-4271. https://doi.org/10.1016/j.energy.2011.04.017

  5. 5. 李云霞. 差分灰色模型在中长期电力负荷预测中的应用研究[D]: [硕士学位论文]. 北京: 华北电力大学, 2019.

  6. 6. He, Y., Jiao, J., Chen, Q., Ge, S., Chang, Y. and Xu, Y. (2017) Urban Long Term Electricity Demand Forecast Method Based on System Dynamics of the New Economic Nor-mal: The Case of Tianjin. Energy, 133, 9-22. https://doi.org/10.1016/j.energy.2017.05.107

  7. 7. Pai, P.F. and Hong, W.C. (2005) Forecasting Regional Electric-ity Load Based on Recurrent Support Vector Machines with Genetic Algorithms. Electric Power Systems Research, 74, 417-425. https://doi.org/10.1016/j.epsr.2005.01.006

  8. 8. Kandil, M.S., El-Debeiky, S.M. and Hasanien, N.E. (2002) Long-Term Load Forecasting for Fast Developing Utility Using a Knowledge-Based Expert System. IEEE Transactions on Power Systems, 17, 491-496. https://doi.org/10.1109/TPWRS.2002.1007923

  9. 9. Moral-Carcedo, J. and Pérez-García, J. (2017) Integrating Long-Term Economic Scenarios into Peak Load Forecasting: An Application to Spain. Energy, 140, 682-695. https://doi.org/10.1016/j.energy.2017.08.113

  10. 10. Ardakani, F.J. and Ardehali, M.M. (2014) Long-Term Electrical Energy Consumption Forecasting for Developing and Developed Economies Based on Different Optimized Models and Historical Data Types. Energy, 65, 452-461. https://doi.org/10.1016/j.energy.2013.12.031

  11. 11. Hisashi, T., Yoshiyasu, T. and Seisho, S. (2016) Using the En-semble Kalman Filter for Electricity Load Forecasting and Analysis. Energy, 104, 184-198. https://doi.org/10.1016/j.energy.2016.03.070

  12. 12. Priyanka, S., Pragya, D. and Kant, V. (2019) A Hybrid Method Based on Neural Network and Improved Environmental Adaptation Method Using Controlled Gaussian Mutation with Real Parameter for Short-Term Load Forecasting. Energy, 174, 460-477. https://doi.org/10.1016/j.energy.2019.02.141

  13. 13. 陈焕. 基于CEEMDAN-GWO-KELM模型的国际原油价格预测研究[D]: [硕士学位论文]. 成都: 西南财经大学, 2019.

  14. 14. 肖欣, 周渝慧, 张宁, 韩新阳, 薛万磊, 唐鑫, 等. 城镇化进程与电力需求增长的关系研究[J]. 中国电力, 2015, 48(2): 145-149+160.

  15. 15. 张进芳. 产业结构调整对电力需求的影响及其模型构建[D]: [硕士学位论文]. 北京: 华北电力大学, 2016.

  16. 16. 赵会茹, 周佳, 郭森, 韩新阳, 薛万磊. 影响中长期电力需求的经济社会发展指标体系研究[J]. 陕西电力, 2015, 43(8): 71-77+81.

  17. 17. 杨国鹏, 周欣, 余旭初. 稀疏贝叶斯模型与相关向量机学习研究[J]. 计算机科学, 2010, 37(7): 225-228.

  18. 18. 张建文, 刘洋, 张大朋, 张寰宇. 基于CEEMDAN与小波自适应阈值的去噪新方法[J]. 电测与仪表, 2018, 55(10): 14-18+33.

  19. 19. Alsaber, A.R., Pan, J.Z. and Al Hurban, A. (2021) Handling Complex Missing Data Using Random Forest Approach for an Air Quality Monitoring Dataset: A Case Study of Kuwait Environmental Data (2012 to 2018). International Journal of Environmental Research and Public Health, 18, Article No. 1333. https://doi.org/10.3390/ijerph18031333

  20. 20. 许宪春, 唐雅, 胡亚茹. “十四五”规划纲要经济社会发展主要指标研究[J]. 中共中央党校(国家行政学院)学报, 2021, 25(4): 90-99.

  21. 21. 胡鞍钢, 周绍杰. 2035中国: 迈向共同富裕[J/OL]. 北京工业大学学报(社会科学版): 1-22. http://kns.cnki.net/kcms/detail/11.4558.g.20211123.0845.004.html, 2021-12-28.

  22. 22. 李平, 娄峰, 王宏伟. 2016-2035年中国经济总量及其结构分析预测[J]. 中国工程科学, 2017, 19(1): 13-20.

  23. 23. 孔亦舒. 我国各省份经济发展迅速为2035年人均GDP达到中等发达国家水平提供有力支撑[J]. 中国经贸导刊, 2021(15): 29-32.

  24. 24. 杨舸. 我国“十四五”时期的人口变动及重大“转变” [J]. 北京工业大学学报(社会科学版), 2021, 21(1): 17-29.

期刊菜单