油中溶解气体分析(DGA)是目前最为常用的变压器内部故障诊断依据,但传统的各种DGA方法适用情况不同,其诊断准确性非常依赖于使用者的经验,而基于人工智能的DGA方法研究尚不成熟,自适应性较差。因此,本文提出了一种基于基因表达编程的DGA诊断模型,该模型综合多种常用的DGA方法得到最终诊断结果,优化了变压器油色谱分析故障诊断的流程。实验结果表明,文中所提出的模型具有较高的准确性,能为变压器的故障诊断和检修工作提供依据。 Dissolved gas analysis in oil (Dissolved Gases Analysis, the DGA) is one of the most commonly used transformer internal fault diagnoses. However, all of these techniques rely on personnel experience more than standard mathematical formulation. And the DGA method based on artificial intelligence research is not enough mature. This paper introduces an improved model which is built based on incorporating all conventional DGA interpretation techniques in one expert system to identify the fault type in a more consistent and reliable way. Gene Expression Programming is employed to establish this expert system. The experimental results show that the proposed model has high accuracy and provides a basis for transformer fault diagnosis and maintenance.
喻侃源1,何力1,陈佳2
1阳江核电有限公司,广东 阳江
2国网电力科学研究院武汉南瑞有限责任公司,湖北 武汉
收稿日期:2019年9月8日;录用日期:2019年9月23日;发布日期:2019年9月30日
油中溶解气体分析(DGA)是目前最为常用的变压器内部故障诊断依据,但传统的各种DGA方法适用情况不同,其诊断准确性非常依赖于使用者的经验,而基于人工智能的DGA方法研究尚不成熟,自适应性较差。因此,本文提出了一种基于基因表达编程的DGA诊断模型,该模型综合多种常用的DGA方法得到最终诊断结果,优化了变压器油色谱分析故障诊断的流程。实验结果表明,文中所提出的模型具有较高的准确性,能为变压器的故障诊断和检修工作提供依据。
关键词 :变压器,故障诊断,油中溶解气体分析,基因表达编程
Copyright © 2019 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
目前国内油浸式变压器状态检测技术中较为常用的方法为变压器油中溶解气体分析(Dissolved Gases Analysis, DGA),即根据变压器油中溶解气体的组成与含量,及早发现潜伏性的变压器内部故障 [
但是,特征气体法只能粗略判断早期故障是否存在,而不能确定故障性质及变压器状态 [
由于传统DGA方法存在“缺编码,编码规则边界绝对化,故障分类模糊,范围局限”等不足,近年来,专家系统,人工神经网络,模糊理论,遗传算法等多种机器学习算法也被大量应用于变压器故障诊断,如文献 [
因此,考虑到DGA仍然是实践中较为常用的变压器故障诊断依据,故本文提出基于基因表达式编程算法的DGA诊断模型,该模型融合几种传统的DGA方法,考虑特征气体产气速率实时变化情况,且通过样本学习具有参数自适应调整能力。
基因表达编程(GEP)是一种融合了遗传算法(GA)和遗传编程(GP)优点的提升算法。GEP基因用长度固定的符号串来表示,由头、尾组成,由头和尾两部分组成,头部一般可以表征任意符号及变量,而尾部一般只用于表征实际变量。尾部长度t和头部长度h之间满足以下关系:
t = h × ( n − 1 ) + 1 (1)
其中,n代表函数符集中的最大操作目数。
GEP变程主要分为表达式和表达树,每个基因对应一个K表达式和一棵表达式树,两者之间可以互换。以下式:
x 2 + y 2 (2)
为例来说明GEP的染色体编码方法,式(2)对应的基因的基因型为:
0 1 2 3 4 5 6 7 Q + * * x x y y (3)
式(2)对应的表现型为:
图1. 表达式树
对基因树按照从上到下,从左至右的次序遍历,可得到相应的K表达式(3);反之,将K表达式(3)按以上过程的逆过程进行解码可得到图1表达树,中序遍历图1表达式树即可得出对应的数学表达式(2) [
图2. GEP算法基本流程
变压器发生不同故障时产气种类和气体组分均不相同可以区分变压器故障性质,这也是变压器油色谱法的诊断原理,变压器的内部故障从性质上一般可以分为两大类,即过热性故障和放电性故障 [
过热性故障主要表现为变压器内部局部过热导致温度升高,而放电性故障通常是由于变压器内部在高电场的情况下,绝缘材料的性能降低或者劣化而发生放电。本文将长期实践中总结的变压器不同故障类型的产气特性总结如表1。
故障性质 | 特征气体特点 | ||
---|---|---|---|
过热性故障 | 一般过热(<500℃) | 总烃含量较高,C2H2含量 ≈ 0,CH4含量 > C2H4含量 | |
严重过热(>500℃) | 总烃含量高,CH4含量 < C2H4含量,C2H2含量随温度升高而增加, 但占总烃的5.5%以下。H2含量占氢烃含量的30%以下 | ||
放电性故障 | 低能放电 | 局部放电 | 总烃含量不高,H2是主要成分,占氢烃含量的80%~90%, CH4含量占总烃含量的90%以上 |
火花放电 | 总烃含量一般不高,以C2H2 (占总烃含量的25%~90%)和 H2 (占氢烃含量的30%以上)为主,其次是CH4和C2H4 | ||
高能放电 | 电弧放电 | 总烃含量较高,以C2H2 (占总烃含量的20%~70%)和 H2 (占氢烃含量的30%~90%)为主,其次是C2H4、CH4和C2H6 |
表1. 各种故障类型产气特点对比
传统的DGA方法(特征气体法、三比值法、四比值法和大卫三角形法等)分别适用于不同情况,因此对于相同特点的特征气体含量应用不同DGA诊断方法通常会得出不同的诊断结果。本文提出的基于基因表达式编程的DGA诊断模型将特征气体法,三比值法,大卫三角形法以及特征气体产气速率变化情况综合起来进行故障诊断算法的能力提升,其诊断流程如图3所示。通过训练,不断调整各种方法诊断结果对综合诊断结果的权重,提高诊断准确性。
图3. 基于基因表达式编程的DGA诊断模型流程图
图3中计算特征气体的产气速率时,将CO和CO2及CO/CO2的值用于辅助诊断。通常情况下,当变压器故障涉及固体绝缘材料时,CO和CO2的含量会显著增加,因此,可通过CO和CO2及CO/CO2比值来判断变压器故障是否涉及固体绝缘材料,而对于正常运行的变压器,也可以通过分析CO和CO2的增加情况及CO/CO2比值接判断固体绝缘材料的正常老化情况 [
模型运用基因表达编程实现特征气体法,三比值法,大卫三角形法的融合及诊断能力提升。如图3所示,模型的输入为七种特征气体(H2, CH4, C2H6, C2H4, C2H2, CO, CO2)的含量,按照GB/T 7252-2001《变压器油中溶解气体分析和判断导则》(简称《导则》)中推荐的油中溶解气体的注意值进行初步判断,若有超标情况,说明设备内部可能存在异常情况。由于《导则》中的注意值是指导性的,有时候设备特征气体含量超标,并不一定存在故障,因此由特征气体含量只能判断变压器是否处于正常运行状态 [
健康指数 | 故障类型 | 故障实例(参考) | 处理建议 |
---|---|---|---|
0 ≤ h < 2 | 无故障 | / | / |
2 ≤ h < 4 | 低温过热(低于150℃), | 包有绝缘的导线过热, | 关注设备运行状态,减小负载, 每月检查产气速率 |
4 ≤ h < 6 | 低能放电,低温过热(150℃~300℃),绝缘材料老化 | 引线对电位未固定的部件之间连续 火花放电,分解抽头引线和油隙闪络, 分接开关接触不良,导线断股等 | 注意设备运行状态, 建议进行呋喃分析, 每月检查产气速率 |
6 ≤ h < 8 | 高能放电,中温过热(300℃~700℃),高温过热(高于700℃),绝缘材料老化,电弧放电,重要绝缘材料老化,油分解过量 | 线圈匝间、层间短路,相间闪络, 铁芯漏磁,局部短路,层间绝缘不良, 铁芯多点接地,螺丝松动或接头焊接不良,涡流引起铜过热等 | 注意设备运行状态,每天或每周检查产气速率,减小负载,进行变压器油分析,油必须经过脱气/过滤。 计划停电 |
表2. 模型输出结果说明
在模型训练过程中,运用基因表达式编程算法以样本健康指数的真实值和模型预测值的误差来评价个体的适应度,计算方法如式(1)所示:
f i = ∑ j = t C t ( M − | C ( i , j ) − T ( j ) T ( j ) × 100 | ) (1)
式中,M为一常量,用来决定适应值fi的取值上限, C ( i , j ) 表示第i个个体对于第j个样本的数据的输出值, T ( j ) 表示第j个样本的真实值,Ci是样本数据总数。模型通过寻找适应度较大的个体不断改变各种方法诊断结果的权值,减小健康指数真实值和模型预测值的误差,从而不断提高诊断结果的准确性。
为检验文中提出的模型的准确性和可靠性,选取了1000个真实变压器的DGA样本,这些变压器的型号,投运时间和健康状况均不相同。其中700个样本用于模型的训练,剩下300个样本用于模型的验证。
样本均按照图3所示流程进行故障诊断,基因表达编程中设置群体大小为30,基因个数为3,每个基因的头部长度为8。模型输出故障类型也结合了局部放电(PD)、呋喃含量、介电损耗因子等测量方法,利用偏振光和去偏振光电流(PDC)对油样进行水分含量测定,以保证故障诊断的准确性。经过计算,样本健康指数真实值与模型预测值的平方根误差为0.29,相关系数为0.85,可知模型能够较为准确地得出变压器的健康指数。样本健康指数真实值(由实际故障类型对应表2计算得出)与模型预测值对比如图4和表3所示。
图4. 样本健康指数真实值与模型预测值对比图
样本编号 | 特征气体含量(ppm) | 预测 健康指数 | 真实 健康指数 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
H2 | CH4 | C2H6 | C2H4 | C2H2 | CO | CO2 | ||||
1 | 2 | 7 | 0 | 0 | 0 | 0 | 132 | 1 | 1 | |
2 | 47 | 12 | 0 | 8 | 0 | 115 | 1113 | 1 | 1 | |
3 | 594 | 1106 | 210 | 1912 | 50 | 0 | 1477 | 3.8 | 3.8 | |
4 | 217 | 286 | 14 | 458 | 884 | 176 | 1544 | 7.8 | 7.8 | |
5 | 441 | 207 | 43 | 224 | 261 | 161 | 1123 | 7.6 | 7.5 | |
6 | 507 | 1053 | 297 | 1440 | 17 | 22 | 2562 | 3.5 | 3.5 | |
7 | 231 | 3997 | 1726 | 5584 | 0 | 0 | 2194 | 3.8 | 3.8 | |
8 | 80 | 619 | 326 | 2480 | 0 | 268 | 2952 | 3 | 3.1 | |
9 | 54 | 0 | 0 | 4 | 0 | 106 | 1303 | 1 | 1 | |
10 | 127 | 24 | 0 | 32 | 81 | 0 | 2024 | 6.5 | 6.5 | |
表3. 样本健康指数真实值与模型预测值对比
由表3可知,对于样本1、2、9,由于七种特征气体含量均低于《导则》中的注意值,故健康指数真实值和模型预测值均为1,则该样本对应的变压器无故障;对于样本3、6、7、8,CH4,C2H4含量明显高于《导则》中的注意值,健康指数真实值和模型预测值均属于2~4,判断故障类型为过热故障;对于样本4、5、10,C2H2含量明显高于《导则》中的注意值,健康指数真实值和模型预测值均属于6~8,判断故障类型为电弧放电。样本健康指数真实值和模型预测值基本一致,说明文中提出的变压器诊断模型具有较高准确性。
为检验文中提出模型的优越性,分别用传统的DGA方法,包括:特征气体法,大卫三角形法和三比值法对部分样本进行故障诊断,并与文中提出的模型的诊断结果进行对比,结果如表4所示。
样本编号 | 特征气体含量(ppm) | 诊断结果 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
H2 | CH4 | C2H6 | C2H4 | C2H2 | CO | CO2 | 特征 气体法 | 大卫 三角形法 | 三比值法 | 基于GEP的DGA诊断模型 | |
1 | 52 | 0 | 2 | 0 | 0 | 536 | 9254 | F1 | F5 | F5 | F1 |
2 | 54 | 0 | 0 | 0 | 0 | 529 | 7025 | F1 | F5 | F5 | F1 |
3 | 1 | 25 | 48 | 4 | 1 | 356 | 51 | F1 | F4 | F4 | F1 |
4 | 1095 | 62 | 0 | 0 | 0 | 391 | 54102 | F3 | F3 | F5 | F3 |
5 | 124 | 24 | 0 | 32 | 80 | 0 | 2015 | F4 | F4 | F3 | F4 |
表4. 传统DGA方法与基于GEP的DGA诊断模型对比
注:F1:正常;F2:过热故障;F3:低能放电故障;F4:高能放电故障;F5:无效编码。
由表4可知,对于样本1~3,特征气体法和模型得出的结果一致为无故障,大卫三角形法和三比值法得出的结果是编码无效,或是存在故障,由前述流程图3可知原因是模型诊断过程是以特征气体含量判断是否有故障为前提的,因此特征气体法和模型得出的结果一致。然而,样本1~3的诊断结果虽然都是无故障,但CO、CO2、CO/CO2的值差异却非常明显,样本1,2中CO/CO2的值均小于0.1,而样本3中CO/CO2的值约等于7,因此模型会把这些异常含量考虑进来,输出将提示进行呋喃分析,考察固体绝缘材料的老化情况等。样本4中H2的含量较高,对应的变压器可能存在局部放电情况,各种方法得出的结果中三比值法的结果是无效编码,其他三种方法一致为低能放电故障。样本5中C2H2含量较高,对应的变压器可能存在电弧放电情况,各种方法得出的结果中三比值法的结果是低能放电故障,其他三种方法一致为高能放电故障。总的来说,文中提出的模型因为考虑了各种方法在不同情况下的精确性而赋之以不同的权重,所以能得出较为准确的诊断结果。
文中提出了一种基于基因表达式编程的DGA诊断模型,对变压器进行故障诊断能力提升,该模型融合了传统的DGA方法,采用特征气体含量情况,三比值法,大卫三角形法,特征气体产气速率,且考虑CO、CO2、CO/CO2的变化情况,将不同方法按照不同权重综合得到变压器的健康指数,进而判断变压器的故障类型,模型最大优势在于,运用基因表达编程算法不断修正各种方法的权重,使得诊断结果的准确性随之提高。实验表明,文中所提出的模型具有较高的可靠性,且与传统的DGA方法对比具有明显的优越性。可以预见,结合当前的大数据技术,随着样本数据的不断积累,模型参数不断优化,模型的输出结果将更加准确。
5204DY170010:基于多元信息融合的大型电力变压器健康管理及故障预警。
喻侃源,何 力,陈 佳. 基于基因表达编程的DGA诊断模型Transformer DGA Diagnosis Model Based on Gene Expression Programming[J]. 计算机科学与应用, 2019, 09(10): 1815-1822. https://doi.org/10.12677/CSA.2019.910203