Modeling and Simulation
Vol. 10  No. 02 ( 2021 ), Article ID: 42301 , 7 pages
10.12677/MOS.2021.102044

基于RDU-Net深度学习模型的电力基础设施提取方法研究

韩吉军,鲁燿,邸伟,姜龙

内蒙古电力集团有限责任公司乌兰察布电业局,内蒙古 乌兰察布

收稿日期:2021年1月8日;录用日期:2021年5月10日;发布日期:2021年5月17日

摘要

随着电力基础设施的逐步完善,如何减少电力损耗及提高发电量变成当前最迫切的需求,这就需要有效的对设施进行管理,对设施的位置、大小、面积进行识别统计是建立管理系统的前提。传统的识别统计方法如人工实地调查、遥感影像解译等都需要花费大量的人力物力和财力。本文根据地物特性,使用了RDU-Net网络模型,该模型在U-Net网络模型上进行了算法优化和完善,通过添加空洞卷积以提升模型感受野,同时引入Tversky损失函数自动平衡正负样本,最终得到了更适用于高分遥感图像分割的模型。本文实验结果表明:本文使用的RDU-Net模型能够很好的克服草木遮挡的干扰,精度较U-Net模型得到了很好得提升。可为识别典型电力基础设施相关方面研究提供思路,并能有效提高国家对基础能源设施的管理效率以及起到指导规划建设的作用。

关键词

深度学习,图像分割,RDU-Net模型,电力设施

Research on Power Infrastructure Extraction Method Based on RDU-Net Deep Learning Model

Jijun Han, Yao Lu, Wei Di, Long Jiang

Wulanchabu Electric Power Bureau, Inner Mongolia Electric Power Group Co., Ltd., Wulanchabu Inner Mongolia

Received: Jan. 8th, 2021; accepted: May 10th, 2021; published: May 17th, 2021

ABSTRACT

With the gradual improvement of power infrastructure, how to reduce power loss and improve power generation has become the most urgent demand at present, which requires effective management of facilities. The identification and statistics of the location, size and area of facilities is the premise of establishing a management system. Traditional identification statistical methods, such as manual field investigation and remote sensing image interpretation, require a lot of manpower, material resources and financial resources. In this paper, according to the characteristics of ground objects, RDU-Net network model is used. This model performs algorithm optimization and improvement on the U-Net network model, improves the model’s receptive field by adding cavity convolution, and introduces Tversky loss function to automatically balance the positive and negative samples. Finally, a model more suitable for high-resolution remote sensing image segmentation is obtained. The experimental results show that the RDU-Net model used in this paper can overcome the interference of vegetation occlusion very well, and its accuracy is better than that of U-Net model. It can provide ideas for the identification of typical power infrastructure related research, and can effectively improve the national management efficiency of basic energy facilities and play a guiding role in planning and construction.

Keywords:Deep Learning, Image Segmentation, RDU-Net Model, Power Facilities

Copyright © 2021 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

随着电力产业的发展与普及,作为基础能源,已经为各行各业产生了巨大的经济效益和社会效益,为了减少传统发电方式的电力损耗以及增加发电量,需要及时建立电力基础设施管理系统对其进行全方位管理,为国家电网基础能源建设提供有效帮助 [1]。如何快速高效的自动检测并提取各种基础设施以获得其信息显得至关重要。

随着卫星遥感技术的快速发展,使用遥感技术获取地物信息已经变成一种主要的手段,由于其具有范围大、精度高、速度快等一系列地面采集所不能具备的优点。目前已经被大量应用于工业、农业等众多行业中。但是由于某些电力基础设施目标较小,大部分卫星影像的时间分辨率和空间分辨率不满足对其提取的要求,且在获取影像的过程中容易受到大气干扰导致影像质量下降等问题。本文采用高分遥感影像数据,克服了分辨率低的缺点,是对小型地物空间信息的采集重要的手段。

遥感图像分割的核心是如何高效高质量的对图像进行表示 [2],Song等人(2004)提出了一种基于少量人工标注特征的特征编码方法,利用支持向量机(SVM)提取道路信息,可以更好地提取道路主干信息 [3]。然而,这些传统方法生成的图像特征很少,这从本质上阻碍了遥感图像特征的提取。目前,深度学习方法展现出来的优越性及其高精度使其成为当下研究的热点,特别是全卷积神经网络(FCN)模型,它使用编码和解码实现对影像特征的检测与提取 [4]。但是FCN算法在权衡定位和识别精度上存在问题,识别精度会随着定位精度的提高而降低 [5]。Ronneberger等针对此问题对模型进行了改进,提出了U-net网络模型 [6],该模型能够很好的处理识别精度与定位精度之间的平衡问题。但在U-net卷积运算中,边界像素是通过镜像运算而不是填充来处理的。后续卷积运算仍然存在尺度单一、层间信息频繁丢失的问题,导致识别定位精度大幅下降。

本文使用的RDU-Net (残差空洞卷积U型网络)模型在原有的U-Net网络模型上,将长短连接、空洞卷积、Tversky系数结合起来,减少了信息损失并增大了模型感受野,并将恒等映射转换为差值计算防止模型退化。为了验证模型与算法的精度和可靠性,本文选取一类典型电力基础设施研究对象展开实验,提取信息。

2. 提取方法与流程

2.1. DUNet模型

DUNet模型是基于全卷积神经网络的变形U-Net网络模型,适用于视网膜血管的分割。图1说明了DUNet的结构。该体系结构由U-Net框架中的卷积编码器(左)和解码器(右)组成。在DUNet的底部,使用普通的卷积层代替了变形块。在每个编码和解码阶段,可变形卷积块用于通过学习局部,密集和自适应接收场来模拟不同形状和比例的视网膜血管。虚线窗口显示了可变形卷积块的详细设计。每个可变形卷积块包括一个卷积偏移层(这是可变形卷积的核心概念),一个卷积层,一个归一化层和一个激活层 [7]。通过这种结构,DUNet可以学习识别特征并生成准确的视网膜血管分割结果。

Figure 1. Dunet structure of convolutional codec based on U-Net structure

图1. 基于U-Net结构的卷积编解码器的Dunet结构

2.2. RDU-Net模型

在卷积神经网络中,网络级别越深,训练过程中会产生更多的错误,训练时间越长。ResNet提出了一种拟合残差映射的方法 [8],即不直接将卷积结果作为输出,而是使用残差映射进行计算,称为shortcut。这种残余连接解决了深度卷积神经网络在极端深度条件下的性能下降问题。

本文结合了DUNet和残差连接的特点,将“shortcut”概念引入DUNet结构,并提出了一种称为RDU-Net的新型模型,如图2所示,该模型基于DUNet模型,并将残差结构添加到原始变量卷积模块(5-6、8-9、25-26、27-28层)。它有助于网络进一步从目标中提取特征,减少在深度卷积层之间进行信息传递时发生的信息丢失,并提高模型检测的准确性。

该模型采用U形结构,左侧卷积模块执行下采样以提取图像特征。正确的卷积模块执行上采样以提高输出分辨率。我们还使用跳过连接将低级功能与高级功能相结合,以提取上下文信息以实现像素级本地化。由于将可变形卷积添加到模型中,因此可以自适应地训练接收场和采样点,以适应设施的大小和形状,这两者都可以实现精确的分割。通过使用残差结构,可以将前一个卷积层提取的浅层信息以跳跃的方式传递到后一个卷积层,从而减少了层之间信息传输的损失。由于残差网络的特性,解决了深度卷积神经网络性能下降的问题。这也是选择残差结构以改进DUNet模型的重要原因。

Figure 2. Overall structure of RDU-Net and output size of feature graph

图2. RDU-Net的总体结构,特征图的输出大小

图3示出了普通卷积块和改进的可变形卷积块的详细设计。每个改进的可变形卷积块都使用卷积偏移层和卷积层提取特征信息,并使用残差连接在该结构之后添加原始特征图和特征图,同时将浅层信息和深层信息传输到下一层卷积层提取特征。由于卷积后特征图的通道数变为原始的2或1/2,因此本文无法使用ResNet的方法通过在卷积层上直接添加几个残差结构来改善网络,而是增加1 × 1卷积层到残差连接的尺寸,以便在将残差添加到当前特征图时统一尺寸。为了解决内部协变量移位问题并加快训练处理速度,在每个单元之后插入了批量归一化层。

Figure 3. Detailed design of the ordinary convolution block and the improved deformable convolution block

图3. 普通卷积块和改进的可变形卷积块的详细设计

2.3. 算法流程

本文的算法流程图如图4所示。首先,对输入图像进行预处理(灰色,CLAHE,双边滤波)以使其易于分割,然后将其转移到训练后的模型中以学习识别特征并生成准确的分割结果。此外,为了更全面地评估RDU-Net模型的分割效果,我们需要准确绘制电力基础设施的轮廓,因此需要再次处理该模型输出的概率图(双边过滤,同态过滤,二值化)以使概率图中的电力基础设施边缘更清晰。最后,使用OpenCV查找设施的轮廓并将其绘制在输入图像上。

Figure 4. Algorithm flow chart

图4. 算法流程图

3. 实验与结果分析

本文选择高分二号遥感图像作为实验数据源,高分二号卫星拥有0.8 m的全色分辨率,以及3.2 m的多光谱分辨率,成像幅宽45 km。

实验结果图5中第一列为部分原始影像数据,可以清晰的看到典型电力基础设施整齐的分布在影像中,利于样本集的选取。第二列为人工勾选的标签数据,将其作为样本集输入。第三列为RDU-Net模型提取结果。第一行为设施较少情况下的提取结果,第二行为复杂情况下的结果。根据A0、A2显示在具有少量电力设施情况下在影像上方进行了部分错误提取,将部分围墙识别为电力设施,并且部分设施在提取时边界产生了融合,前者可能是因为影像噪声太大导致了错分,而后者一方面可能是由于影像中设施之间的距离太小,另一方面也可能是因为噪声而导致错误的识别,但整体上错分和漏分的情况很少。B0为信息量最大,情况最为复杂的影像,相比于前两种情况,提取的结果中出现了很多识别不全和连接的情况,这表明该模型对于复杂情况下的地物识别精度还有待提升,但是错分和漏分的情况几乎没有。

Figure 5. Extraction results of RDU-Net

图5. RDU-Net提取结果

为了定量的评价提取的准确性,本实验引入IoU分数与F1分数作为评价指标。IoU分数是衡量目标分类分割问题性能的标准指标,给定一组图像,IoU度量给出了预测区域与该图像中存在的目标地面真实区域的相似性。F1评分是统计学中衡量二元分类模型准确性的一个指标,它同时考虑了分类模型的精确率和召回率。IoU与F1分数的公式分别为:

{ IoU = S P M P + S P + M N F 1 s c o r e = 2 S P 2 S P + M N + M P (1)

式中MP代表提取对象被错分为背景,代表标签与提取结果都为背景,MN是背景被错分为提取对象,也就是B2所示情况。SP为标签和提取结果都为提取对象。图6图7是两种情况下的训练精度曲线和损失函数曲线,红线和蓝线分别表示图A2和B2的结果。可以看出,随着迭代次数的增多,模型的训练精度呈上升并趋于平稳趋势,损失函数则处于逐渐降低的趋势。

Figure 6. Training accuracy

图6. 训练精度

Figure 7. Loss function

图7. 损失函数

表1为RDU-Net模型的各项参数,由表可知,该模型的提取精度达到95.8%,且IoU分数和F1分数都达到了80%以上,表明该模型对此类电力基础设施提取具有较高的准确度与鲁棒性。

Table 1. RDU-Net performance parameters

表1. RDU-Net性能参数

4. 结论

建立电力基础设施的管理系统,为解决电力紧缺问题和节能减排开辟了一条新的道路。深度学习作为目前的热门研究方向,在道路、房屋等的提取方面都已有很多的研究,但在电力基础设施等地物要素提取方面还尚未有成型的方案。因此。本文综合多个应用场景经验,采用RDU-Net模型,采用高分二号卫星影像数据,进行简单和复杂场景下的电力设施提取。本文选取典型电力基础设施为研究对象,充分考虑到其连接的紧密性以及样本选择的简便性,提取结果可以体现出其对边界效应处理的有效性。也避免了高分影像中因地物细节化差异性增大、影像离散化和不规则化造成的大面积假阴性等问题。

结果表明,本文使用的RDU-Net模型提取精度达到95.8%,能够很好的满足高分影像提取电力基础设施信息的要求,较传统的模型与算法具有更高的准确度和鲁棒性。该算法模型可为小型地物要素的提取提供参考。

文章引用

韩吉军,鲁 燿,邸 伟,姜 龙. 基于RDU-Net深度学习模型的电力基础设施提取方法研究
Research on Power Infrastructure Extraction Method Based on RDU-Net Deep Learning Model[J]. 建模与仿真, 2021, 10(02): 435-441. https://doi.org/10.12677/MOS.2021.102044

参考文献

  1. 1. Malof, J.M., Hou, R., Collins, L.M., Bradbury, K. and Newell, R. (2016) Automatic Solar Photovoltaic Panel Detection in Satellite Imagery. International Conference in Renewable Energy Research and Applications, 1428-1431. https://doi.org/10.1109/ICRERA.2015.7418643

  2. 2. Li, D. and Dong, Y. (2013) Deep Learning: Methods and Applications. Foundations and Trends in Signal Processing, 7, 197-387. https://doi.org/10.1561/2000000039

  3. 3. Song, M.J. and Daniel, C. (2004) Road Extraction Using SVM and Im-age Segmentation. Photogrammetric Engineering and Remote Sensing, 70, 1365-1371. https://doi.org/10.14358/PERS.70.12.1365

  4. 4. 许夙晖, 慕晓冬, 赵鹏, 马骥. 利用多尺度特征与深度网络对遥感影像进行场景分类[J]. 测绘学报, 2016, 45(7): 834-840.

  5. 5. Zhong, Z.L., Li, J., Cui, W.H., et al. (2016) Fully Convolutional Networks for Building and Road Extraction: Preliminary Results. 2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), 1591-1594. https://doi.org/10.1109/IGARSS.2016.7729406

  6. 6. Ronneberger, O., Fischer, P. and Brox, T. (2015) U-Net: Convolutional Networks for Biomedical Image Segmentation. Lecture Notes in Computer Science (including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 9351, 234-241. https://doi.org/10.1007/978-3-319-24574-4_28

  7. 7. Ioffe, S. and Szegedy, C. (2015) Batch Normalization: Ac-celerating Deep Network Training by Reducing Internal Covariateshift. Proceedings of the International Conference on Machine Learning, Lille, 6-11 July 2015, 448-456.

  8. 8. He, K., Zhang, X., Ren, S. and Sun, J. (2016) Deep Residual Learning for Image Recognition. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, 27-30 June 2016, 770-778. https://doi.org/10.1109/CVPR.2016.90

期刊菜单