长时间序列遥感数据集被广泛应用于全球或区域环境变化、植被动态变化、土地覆盖变化和植物生物物理参数反演等研究,受云、气溶胶、太阳高度角等因素的影响使数据存在很多的噪声。影响了数据分析和应用的效果。本文以MODIS-NDVI数据为基础,黑河流域为研究区,在MATLAB编程环境下,利用时间序列拟合软件TIMESAT3.1,使用Savitzky-Golay (S-G)滤波、非对称高斯函数(AG)和双逻辑曲线拟合(DL)方法对黑河流域2012年NDVI时间序列数据进行了重构。结果表明,TIMESAT3.1软件能有效的对NDVI时间序列进行平滑去噪,三种方法在时间序列曲线上均取得了较好的效果。但是不对称高斯函数和双逻辑曲线拟合结果在植被的生长季起始阶段均存在“翘起”的过度拟合问题。相对而言,S-G滤波拟合效果较好,NDVI曲线在保持原有基本形状的基础上更加有效的揭示所蕴含的物候周期性变化规律,该数据源对黑河流域的植被检测提供了良好的基础。 Long time series remote sensing data set is widely applied to global or regional environmental change, vegetation dynamic change, land cover change and plant biophysical parameters inversion. It is affected by clouds, aerosols, solar elevation and other factors, which make the data has a lot of noise. This paper is based on the MODIS-NDVI data, the Heihe River Basin, in the MATLAB programming environment, using time series fitting software TIMESAT3.1, using Savitzky-Golay (S-G) filter, asymmetric Gauss function (AG) and dual logic curve fitting (DL) method for the re-construction of NDVI time series data of Heihe River Basin in 2012. The results show that the TIMESAT3.1 software can effectively denoise the NDVI time series, and the three methods have achieved good results on the time series curve. However, the unsymmetrical Gauss function and the double logical curve fitting results have the overfitting problem of "warping" in the beginning of the growing season of vegetation. In contrast, the S-G filter has a good fitting effect. The data source provides a good basis for the vegetation detection in the Heihe River Basin.
和萍,高书鹏
云南师范大学旅游与地理科学学院,云南 昆明
收稿日期:2018年2月1日;录用日期:2018年2月15日;发布日期:2018年2月23日
长时间序列遥感数据集被广泛应用于全球或区域环境变化、植被动态变化、土地覆盖变化和植物生物物理参数反演等研究,受云、气溶胶、太阳高度角等因素的影响使数据存在很多的噪声。影响了数据分析和应用的效果。本文以MODIS-NDVI数据为基础,黑河流域为研究区,在MATLAB编程环境下,利用时间序列拟合软件TIMESAT3.1,使用Savitzky-Golay (S-G)滤波、非对称高斯函数(AG)和双逻辑曲线拟合(DL)方法对黑河流域2012年NDVI时间序列数据进行了重构。结果表明,TIMESAT3.1软件能有效的对NDVI时间序列进行平滑去噪,三种方法在时间序列曲线上均取得了较好的效果。但是不对称高斯函数和双逻辑曲线拟合结果在植被的生长季起始阶段均存在“翘起”的过度拟合问题。相对而言,S-G滤波拟合效果较好,NDVI曲线在保持原有基本形状的基础上更加有效的揭示所蕴含的物候周期性变化规律,该数据源对黑河流域的植被检测提供了良好的基础。
关键词 :时间序列数据,MODIS NDVI,去噪,TIMESAT3.1,黑河流域
Copyright © 2018 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
陆地生态系统中的植被在全球物质与能量循坏中起着重要作用,植被通常是遥感观测和记录的第一表层,它影响着能量、生态、气候、水文、地貌、土壤等各种地理环境要素,是遥感工作者重点关注的对象之一 [
尽管目前大多植被指数产品都采用了最大值合成法来部分消除一些干扰的因素 [
黑河流域(97˚21E~101˚44E,98˚36N~100˚48N)发源于青藏高原东北部,全长821 km,流域总面积约14.29万km2,是我国西北地区第二大内陆流域,位于河西走廊中部,远离海洋,周围高山环绕,气候干燥,降水稀少而集中,日照充足,太阳辐射强烈,昼夜温差大。流域内垂直高度变化大,最高海拔5573米,最低海拔1131米,海拔高差达4442米,东西和南北气候差异显著,且上、中、下游的地形地貌特征各不相同。上游以高山、冰川、森林、草甸草原为主,植被覆盖度较高。中、下游分布着大面积戈壁和沙漠。研究区如图1所示。
本论文采用的数据是NASA数据中心(https://wist.echo.nasa.gov/api)免费下载的MODIS数据产品,8天合成的500 m分辨率MOD09A1地表反射率产品,时间范围为2012年1月到2012年12月,共有44期影像。该数据集是通过对原始的MODIS数据进行大气校正、辐射校正、几何校正和拉伸后合成的数据,使用MRT (MODIS Reprojection Tools)软件对数据进行格式转换和投影转换,数据投影为Albers 投影,地理坐标为WGS-84,并完成图像的拼接和裁剪。最后计算研究区的归一化植被指数:
NDVI = ρ n i r − ρ r e d ρ n i r + ρ r e d (1)
式(1)中,NDVI为归一化植被指数, ρ n i r 为近红外通道反射率,MODIS对应第2通道; ρ r e d 为红光通道反射率,对应MODIS第1通道。需要对计算出来的NDVI值进行质量控制,通过ENVI的命令行批处理获得研究区Albers标准投影Geotiff格式的NDVI数据以及相应的质量控制数据,去掉有云的数据。计算时间序列NDVI值。研究区得到的原始的时序NDVI曲线如图2所示,可以看到,曲线有强烈的上下波动。
最早于1964年由Savizky和Goaly [
图1. 研究区地理位置
图2. 原始数据时序曲线
化趋势以及局部的突变信息,且不受时间、空间尺度和传感器的限制 [
Y j * = ∑ i = − m i = m C i Y i + j 2 m + 1 (2)
式中, Y j * 为合成序列数据, Y j + i 代表原始序列数据, C i 为滤波系数。N为滑动窗口所包含的数据点( 2 m + 1 ) [
非对称高斯滤波(AG)由Jönsson和Eklundh [
f ( t ) = f ( t , c 1 , c 2 , a 1 , ⋯ , a 5 ) = c 1 + c 2 g ( t ; a 1 , ⋯ , a 5 ) (3)
其中 g ( t ; a 1 , ⋯ , a 5 ) 为高斯函数,式中 c 1 和 c 2 控制曲线的基准和幅度, a 1 决定峰值和谷值的位置, a 4 、 a 5 和 a 2 、 a 3 分别控制曲线左、右部分的宽度和陡峭度。整体拟合函数为:
F ( t ) = { α ( t ) f L ( t ) + ( 1 − α ( t ) ) f L ( t ) , t L < t < t C β ( t ) f C ( t ) + ( 1 − α ( t ) ) f R ( t ) , t L < t < t R (4)
其中 g [ t L , t R ] 是时序数据中待拟合部分的变化区间, f L ( t ) 、 f C ( t ) 和 f R ( t ) 分别代表 g [ t L , t R ] 区间内左边谷值、中间峰值及右边谷值对应的局部拟合函数, α ( t ) 和 β ( t ) 为介于0和1之间的剪切系数。通过整体拟合函数将局部拟合函数连接起来是该方法的关键之一,这种从局部到整体的拟合策略避免了整体数据对局部拟合的干扰,拟合后的曲线更加接近真实情况。
双重逻辑函数滤波(Double Logistic, DL)是由Beck [
g ( t ; x 1 , ⋯ , x 4 ) = 1 1 + exp ( x 1 − t x 2 ) − 1 1 + exp ( x 3 − t x 4 ) (5)
式中t为生长季内某一时期;𝑥1, 𝑥2, 𝑥3, 𝑥4为曲线形状与位置参数,𝑥1决定了曲线左边拐点的位置,𝑥2确定了左侧曲线的变化率;𝑥3确定了曲线右边拐点位置,𝑥4决定了右侧曲线的变化率。设置𝑥1, 𝑥2, 𝑥3, 𝑥4不同的取值则拟合出不同的曲线位置与形状。
重建过程在Timesat3.1 [
图5中表示的是在MATLAB环境下,利用TIMESAT3.1软件用三种方法对黑河流域时序NDVI曲线实现去噪的结果。三种拟合方法得到的结果如图5的(a)、(b)、(c)所示,从处理的结果看,各种拟合方法均可在一定程度上消除部分噪声的影响,实现了NDVI时序数据的去噪,能有效的对NDVI时间序列进行平滑去噪,可使NDVI曲线在保持原有基本形状的基础上更加有效的揭示所蕴含的物候周期性变化规律,突出了MODIS时间序列的优点,并对物候参数提取有很大的帮助。分析结果,(a)和(b)表示的非对称高斯函数和双逻辑函数的拟合结果在植被的生长季起始阶段存在“翘起”的过度拟合问题,相对而
图3. TIMESAT界面
图4. TIMESAT3.1参数设置窗口
图5. 时间序列曲线去躁前后对比((a):非对称高斯函数;(b):双逻辑回归函数;(c):双S-G滤波)
时间点 | 原始NDVI | 重构后NDVI | 残差 | 时间点 | 原始NDVI | 重构后NDVI | 残差 |
---|---|---|---|---|---|---|---|
1 | 0.099 | 0.105 | −0.872 | 23 | 0.236 | 0.233 | 0.003 |
2 | 0.095 | 0.103 | 0.010 | 24 | 0.276 | 0.200 | 0.076 |
3 | 0.019 | 0.103 | −0.047 | 25 | 0.277 | 0.167 | 0.110 |
4 | 0.026 | 0.103 | −0.031 | 26 | 0.301 | 0.140 | 0.161 |
5 | 0.089 | 0.101 | 0.032 | 27 | 0.238 | 0.120 | 0.118 |
6 | 0.103 | 0.104 | 0.037 | 28 | 0.287 | 0.107 | 0.180 |
7 | 0.092 | 0.108 | 0.007 | 29 | 0.291 | 0.100 | 0.191 |
8 | 0.088 | 0.116 | −0.009 | 30 | 0.268 | 0.098 | 0.170 |
9 | 0.096 | 0.128 | −0.002 | 31 | 0.207 | 0.096 | 0.111 |
10 | 0.103 | 0.146 | 0.005 | 32 | 0.222 | 0.096 | 0.126 |
11 | 0.085 | 0.167 | −0.012 | 33 | 0.179 | 0.096 | 0.083 |
12 | 0.106 | 0.190 | 0.010 | 34 | 0.167 | 0.097 | 0.070 |
13 | 0.092 | 0.212 | −0.004 | 35 | 0.140 | 0.098 | 0.042 |
14 | 0.102 | 0.235 | 0.006 | 36 | 0.148 | 0.099 | 0.049 |
15 | 0.096 | 0.255 | −0.001 | 37 | 0.120 | 0.097 | 0.023 |
16 | 0.108 | 0.269 | 0.008 | 38 | 0.107 | 0.086 | 0.021 |
17 | 0.127 | 0.277 | 0.020 | 39 | 0.125 | 0.066 | 0.059 |
18 | 0.111 | 0.279 | −0.008 | 40 | 0.103 | 0.057 | 0.046 |
19 | 0.130 | 0.279 | −0.010 | 41 | 0.106 | 0.057 | 0.049 |
20 | 0.152 | 0.278 | −0.016 | 42 | 0.100 | 0.065 | 0.035 |
21 | 0.227 | 0.272 | 0.027 | 43 | 0.087 | 0.085 | 0.002 |
22 | 0.233 | 0.257 | 0.000 | 44 | 0.091 | 0.097 | −0.006 |
平均残差 | 0.01975 |
表1. 非对称高斯函数重构前后残差
时间点 | 原始NDVI | 重构后NDVI | 残差 | 时间点 | 原始NDVI | 重构后NDVI | 残差 |
---|---|---|---|---|---|---|---|
1 | 0.099 | 0.086 | 0.013 | 23 | 0.236 | 0.258 | −0.022 |
2 | 0.095 | 0.073 | 0.022 | 24 | 0.276 | 0.272 | 0.004 |
3 | 0.019 | 0.059 | −0.04 | 25 | 0.277 | 0.278 | −0.001 |
4 | 0.026 | 0.054 | −0.028 | 26 | 0.301 | 0.28 | 0.021 |
5 | 0.089 | 0.0593 | 0.030 | 27 | 0.238 | 0.279 | −0.041 |
6 | 0.103 | 0.073 | 0.030 | 28 | 0.287 | 0.274 | 0.013 |
7 | 0.092 | 0.087 | 0.005 | 29 | 0.291 | 0.266 | 0.025 |
8 | 0.088 | 0.095 | −0.007 | 30 | 0.268 | 0.254 | 0.014 |
9 | 0.096 | 0.099 | −0.003 | 31 | 0.207 | 0.236 | −0.029 |
10 | 0.103 | 0.100 | 0.003 | 32 | 0.222 | 0.213 | 0.009 |
11 | 0.085 | 0.099 | −0.014 | 33 | 0.179 | 0.189 | −0.010 |
12 | 0.106 | 0.100 | 0.007 | 34 | 0.167 | 0.166 | 0.001 |
13 | 0.092 | 0.098 | −0.006 | 35 | 0.140 | 0.146 | −0.006 |
14 | 0.102 | 0.098 | 0.004 | 36 | 0.148 | 0.13 | 0.018 |
15 | 0.096 | 0.098 | −0.002 | 37 | 0.120 | 0.1192 | 0.0008 |
16 | 0.108 | 0.101 | 0.007 | 38 | 0.107 | 0.112 | −0.005 |
17 | 0.127 | 0.105 | 0.022 | 39 | 0.125 | 0.107 | 0.018 |
18 | 0.111 | 0.115 | −0.004 | 40 | 0.103 | 0.104 | −0.001 |
19 | 0.130 | 0.135 | −0.005 | 41 | 0.106 | 0.102 | 0.004 |
20 | 0.152 | 0.166 | −0.014 | 42 | 0.100 | 0.101 | −0.001 |
21 | 0.227 | 0.203 | 0.024 | 43 | 0.087 | 0.100 | −0.013 |
22 | 0.233 | 0.235 | −0.002 | 44 | 0.091 | 0.100 | −0.009 |
平均残差 | 0.000723 |
表2. 双逻辑函数重构前后残差
时间点 | 原始NDVI | 重构后NDVI | 残差 | 时间点 | 原始NDVI | 重构后NDVI | 残差 |
---|---|---|---|---|---|---|---|
1 | 0.099 | 0.077 | −0.005 | 24 | 0.236 | 0.236 | 0.004 |
2 | 0.095 | 0.076 | −0.007 | 25 | 0.276 | 0.258 | 0.076 |
3 | 0.019 | 0.075 | −0.084 | 26 | 0.277 | 0.270 | 0.110 |
4 | 0.026 | 0.076 | −0.077 | 27 | 0.301 | 0.276 | 0.161 |
5 | 0.089 | 0.078 | −0.014 | 28 | 0.238 | 0.277 | 0.118 |
6 | 0.103 | 0.080 | −0.001 | 29 | 0.287 | 0.273 | 0.180 |
7 | 0.092 | 0.083 | −0.016 | 30 | 0.291 | 0.263 | 0.190 |
8 | 0.088 | 0.086 | −0.027 | 31 | 0.268 | 0.249 | 0.171 |
9 | 0.096 | 0.089 | −0.032 | 32 | 0.207 | 0.231 | 0.111 |
10 | 0.103 | 0.092 | −0.043 | 33 | 0.222 | 0.212 | 0.125 |
11 | 0.085 | 0.093 | −0.082 | 34 | 0.179 | 0.192 | 0.082 |
12 | 0.106 | 0.095 | −0.083 | 35 | 0.167 | 0.174 | 0.070 |
13 | 0.093 | 0.096 | −0.120 | 36 | 0.140 | 0.157 | 0.041 |
14 | 0.102 | 0.099 | −0.133 | 37 | 0.148 | 0.142 | 0.050 |
15 | 0.096 | 0.104 | −0.159 | 38 | 0.119 | 0.129 | 0.022 |
16 | 0.108 | 0.111 | −0.161 | 39 | 0.107 | 0.118 | 0.022 |
17 | 0.127 | 0.122 | −0.150 | 40 | 0.125 | 0.110 | 0.059 |
18 | 0.111 | 0.137 | −0.168 | 41 | 0.103 | 0.104 | 0.046 |
19 | 0.130 | 0.155 | −0.150 | 42 | 0.106 | 0.100 | 0.049 |
20 | 0.152 | 0.176 | −0.126 | 43 | 0.100 | 0.097 | 0.035 |
21 | 0.227 | 0.199 | −0.044 | 44 | 0.087 | 0.095 | 0.002 |
22 | 0.233 | 0.221 | −0.025 | 45 | 0.091 | 0.094 | −0.007 |
平均残差 | 0.00027 |
表3. 双S-G滤波重构前后残差
言,S-G滤波拟合效果较好,更逼近原始数据,S-G滤波曲线变化趋势相对稳定。对S-G滤波的结果进行第二次S-G滤波,称为双S-G滤波。
如表1、表2、表3分别表示的是时间序列三种滤波方法在重构前后NDVI比较,从表示可以看到三种滤波方式中,双S-G滤波的残差是最小的,为0.00027,其次为双逻辑函数拟合法,残差为0.000723,最后为非对称高斯函数拟合法,残差为0.01975。
本文以MODIS-NDVI数据为基础,综合运用MRT (MODIS Reprojection Tools)、Timesat3.1和ENVI IDL软件中的信息提取、分析等技术,运用相关方法将黑河流域的时序植被指数进行平滑去噪的研究。研究内容概括为以下几个部分,以黑河流域为研究区域,采用MRT对数据进行数据重采样(包括投影转换以及格式转换)、数据提取、图像拼接,计算NDVI值。本文使用ENVI对数据质量控制,去掉有云的数据,进行空间插值。在TIMESAT3.1中用双逻辑回归函数、非对称高斯函数、S-G滤波的三种方法对黑河流域NDVI曲线平滑去噪的实现,对结果进行分析,反映植被变化趋势。结果表明,三种方法在一定程度上均实现了去噪过程,但在黑河流域地区,S-G滤波的方法更适合用于数据重建,非对称高斯函数和双逻辑回归函数均存在起点拟合过度的问题,起点处存在“翘起”过度拟合的现象。双S-G滤波去噪能够有效的去噪,提高了数据质量。不同的地区适用的去噪方法因区域、气候、植被等原因适用的去噪方法均不同的。因此,分为不同植被类型不同区域进行比较研究有待进一步尝试。
和 萍,高书鹏. 黑河流域时间序列植被指数曲线的平滑去噪对比研究 Study on the Smooth Denoising Contrast of the Vegetation Index Curve of the Time Series of the Heihe River Basin[J]. 地球科学前沿, 2018, 08(01): 32-41. http://dx.doi.org/10.12677/AG.2018.81004