本文利用多元统计方法中的主成分分析法计算测量值与主成分的相关系数,得出各传感器的综合支持程度,剔除综合支持程度较低的数据,取得有效数据。对有效数据,利用多传感器数据模糊相关特性,提出了一种基于模糊贴近度的数据融合方法。该数据融合方法计算过程相对固定,计算量小,便于计算机实时实现。 In this paper, we use the principal component analysis in the multivariate statistical method, count the correlation coefficient between the measured value and the principal component, the comprehensive support degree is obtained, the lower comprehensive support level data are ex-cluded. We acquired valid data. For valid data, using fuzzy correlation characteristics of mul-ti-sensor data, a method of data fusion based on fuzzy closeness is proposed. The calculation process of the data fusion method is relatively fixed and the calculation amount is small, which is easy to be realized by computer in real time.
徐晚霞,王博,张贺
中国地质大学(武汉)数学与物理学院,湖北 武汉
收稿日期:2019年5月2日;录用日期:2019年5月17日;发布日期:2019年5月24日
本文利用多元统计方法中的主成分分析法计算测量值与主成分的相关系数,得出各传感器的综合支持程度,剔除综合支持程度较低的数据,取得有效数据。对有效数据,利用多传感器数据模糊相关特性,提出了一种基于模糊贴近度的数据融合方法。该数据融合方法计算过程相对固定,计算量小,便于计算机实时实现。
关键词 :主成分分析法,模糊贴近度,数据融合
Copyright © 2019 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
数据融合 [
多传感器数据融合可以增加测量的可信度,改善系统的可靠度,在工业和军事等方面得到了广泛的应用。本文利用多元统计方法中的主成分分析法计算测量值与主成分的相关系数,得出各传感器的综合支持程度,剔除综合支持程度较低的数据,对于剔除后的有效数据,首先将测量与估计值都进行模糊化,然后计算测量值与估计值之间的模糊贴近度,利用贴近度来描述各个传感器的重要度,确定各个传感器在融合算法中的权重。最后利用融合公式求出融合结果。
主成分分析法 [
定义1:设总体 X = ( x 1 , x 2 , ⋯ , x n ) 的协方差阵为 ∑ ,其特征根为 λ 1 ≥ λ 2 ≥ ⋯ ≥ λ n ,对应的单位化正交特征向量为 e 1 , e 2 , ⋯ , e n ,其中 e i = ( e 1 i , e 2 i , ⋯ , e n i ) ,则第i个主成分为:
y i = e i X = e 1 i x 1 + e 2 i x 2 + ⋯ + e n i x n (1)
定义1中,当总体的协方差未知时,可以用样本的协方差矩阵或相关矩阵代替。
定义2:在主成分分析中,定义主成分 y i 的方差贡献率
a i = λ i ∑ j = 1 n λ j i = 1 , 2 , ⋯ , n (2)
来说明各主成分 y i 概括原变量X信息的大小。称 ∑ j = 1 k a i 为前k个主成分的累计方差贡献率。一般情况下取k使得累计方差贡献率 ∑ j = 1 k a i 达到85%以上。
定理1:总体X的原变量 x i 与主成分 y i 的相关系数为
ρ ( x i , y i ) = e i j λ j σ i (3)
其中, σ i 为 x i 的标准差, e i j 为特征向量 e i 的第j个分量。
定理2:设 ( y 1 , y 2 , ⋯ , y k ) 为总体X的前k个主成分,则 x j 与 ( y 1 , y 2 , ⋯ , y k ) 的复相关系数的平方:
τ j = ρ 2 [ x j , ( y 1 , y 2 , ⋯ , y k ) ] = ∑ i = 1 k ρ 2 ( y i , x j ) (4)
因为 τ j 表示k个主成分 ( y 1 , y 2 , ⋯ , y k ) 对原变量 x j 的贡献率,而这k个主成分 ( y 1 , y 2 , ⋯ , y k ) 概括了原变量X的85%以上的信息,所以在某种程度上, τ j 可以看成是在总体X信息中所在的比重,可以利用 τ j 来定义各传感器的综合支持程度。
定义3:定义第i个传感器的综合支持程度:
z i = τ i ∑ i = 1 n τ i (5)
累计综合支持程度越高,则所包含的信息比重越大,一般情况下,取累计综合支持程度达85%以上的传感器。
基于模糊贴近度的数据融合算法 [
对于第i个传感器,设其对真实值A的m次测量后的测量均值为 x i ,测量方差为 σ i 。则量测值的模糊量表示为
A ˜ i = ( a i 1 , a i 2 , a i 3 ) = ( x i − 2 σ i , x i , x i + 2 σ i ) (6)
定义 A ˜ i 与 A ˜ j 的贴近度为
S ( A ˜ i , A ˜ j ) = 1 1 + d ( A ˜ i , A ˜ j ) (7)
其中
d ( A ˜ i , A ˜ j ) = | a i 1 + 4 a i 2 + a i 3 − a j 1 − 4 a j 2 − a j 3 6 |
第i个传感器权重 r i 为:
r i = S ( A ˜ i , A ˜ 0 ) (8)
将它们归一化后可以得到各个传感器之间的相对权重为:
w i = r i ∑ l = 1 n r l (9)
则融合结果为:
x ¯ = ∑ i = 1 n w i x i
秭归县白水河滑坡8个传感器在2009年~2011年期间,水平位移监测值见图1。ZG91,ZG92,ZG93,ZG94,ZG118,ZG119,ZG120,XD01,8个传感器在秭归县白水河测得2009年1月到2011年12月的水平滑坡位移监测值 [
图1. 白水河滑坡水平位移监测曲线
对于秭归县白水河滑坡8个传感器在2009年~2011年每月的水平位移监测值,运用主成分分析法可知,上面8个传感器的综合支持度分别为0.024,0.022,0.047,0.058,0.064,0.118,0.331,0.358,则根据累计综合支持度大于85%,ZG91、ZG92、ZG93、ZG94的综合支持度不够,融合时删其读数,取其余传感器的测量数据用模糊贴近度的数据融合算法进行融合。传感器个数 n = 4 ,测量次数 m = 36 。模糊数学和主成分与模糊数学融合所得的结果见表1。
月份 | 模糊数学 | 主成分与模糊数学 | 月份 | 模糊数学 | 主成分与模糊数学 | 月份 | 模糊数学 | 主成分与模糊数学 |
---|---|---|---|---|---|---|---|---|
2009-01 | 7.2254 | 6.9157 | 2010-01 | 9.8751 | 9.0554 | 2011-01 | 9.7454 | 9.2193 |
2009-02 | 4.0090 | 4.3692 | 2010-02 | 7.2483 | 7.7973 | 2011-02 | 7.8579 | 7.9652 |
2009-03 | 3.2495 | 3.0972 | 2010-03 | 7.7743 | 7.2560 | 2011-03 | 8.1523 | 9.8117 |
2009-04 | 5.5209 | 4.1866 | 2010-04 | 4.3222 | 6.3234 | 2011-04 | 12.2241 | 12.1453 |
---|---|---|---|---|---|---|---|---|
2009-05 | 9.5001 | 10.2954 | 2010-05 | 6.7060 | 5.2967 | 2011-05 | 12.9376 | 11.8854 |
2009-06 | 55.7504 | 28.2653 | 2010-06 | 16.4983 | 10.6761 | 2011-06 | 11.2149 | 9.4339 |
2009-07 | 48.0232 | 22.5999 | 2010-07 | 7.3084 | 5.4740 | 2011-07 | 25.9504 | 18.9167 |
2009-08 | 8.6906 | 9.2618 | 2010-08 | 8.5564 | 7.0791 | 2011-08 | 20.3569 | 19.8556 |
2009-09 | 5.5021 | 5.9267 | 2010-09 | 10.2850 | 8.6360 | 2011-09 | 15.7700 | 17.4668 |
2009-10 | 9.9850 | 10.0486 | 2010-10 | 13.8203 | 14.8225 | 2011-10 | 7.7023 | 7.2570 |
2009-11 | 3.7874 | 3.5872 | 2010-11 | 10.4971 | 10.8352 | 2011-11 | 6.1310 | 7.9647 |
2009-12 | 8.1161 | 6.7388 | 2010-12 | 8.9062 | 8.0677 | 2011-12 | 12.1885 | 11.8192 |
表1. 数据融合结果比较
由表1可以看到,本文提出的主成分与模糊数学方法与模糊数学融合结果相比,在计算过程中,由于用主成分减少了4个综合支持度不高的数据,在后面用模糊数学融合时,计算量少了很多。
多传感器数据融合综合利用多种传感器的信息以获得有关目标的属性特征,可以避免单一传感器的局限性限制,减少各传感器不确定误差的影响。本文提出了一种基于模糊理论与主成分分析方法集成的多传感器数据融合算法,该方法计算过程相对固定,便于计算机实时实现。
徐晚霞,王 博,张 贺. 基于模糊数学和主成分分析的数据融合算法研究Research on Data Fusion Algorithm Based on Fuzzy Mathematics and Principal Component Analysis[J]. 应用数学进展, 2019, 08(05): 953-957. https://doi.org/10.12677/AAM.2019.85108