Hans Journal of Soil Science
Vol.04 No.01(2016), Article ID:16753,10 pages
10.12677/HJSS.2016.41001

The Study of Quality Control for Observing Data of Automatic Soil Moisture

Dongli Wu1, Tingting Cao1, Hongxi Xue2*

1Atmospheric Observation Center of CMA, Beijing

2National Meteorological Centre, Beijing

Received: Dec. 25th, 2015; accepted: Jan. 8th, 2016; published: Jan. 13th, 2016

Copyright © 2016 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

The quality control for automatic soil moisture of 10 cm was made by using spike tests (soil volumetric water content was greater than 60% recorded as a mistake, the soil volumetric water content was less than or equal to 0 recorded as a mistake), step tests (the relative humidity of soil dumped 20% recorded as suspicious) and runs of constant values (the relative humidity of soil was the same for a month recorded as suspicious) for the years of 2012, 2013 and 2014. Based on the analysis of four factors, i.e. detection rate, regional distribution, temporal regularity and instrument model, the characteristics of detected data (SWC010 indicated that the 10 cm layer of soil volumetric water content, SRH010 indicated that the 10 cm layer of soil relative humidity) were studied. The conclusions were as following. There was the maximum detection rate for the data that the soil volumetric water content of 10 cm was equal to zero, however, there was the minimum for the 10 cm relative humidity sudden dropped by 20 percent, caused by the soil cracking or by the gap between the sensor and the soil. The numbers of detected data were distinctly different in each province, which ranged from one to over ten thousand data. The number of provinces that had the data for SWC010 less than zero was the smallest, however, the other four types of detected data were common in the most provinces in our country. Considering the temporal regularity, the error data were higher in summer than those in winter for the method that soil volumetric water content of 10 cm was larger than 60 percent, and there were the most detected data in the winter for other quality control methods. The detected data of the 10 cm soil moisture which were less than zero were observed by the only instrument model of DZN2, which was caused by the calibration equations.

Keywords:Automatic Soil Moisture Data, Quality Control, Detection Rate, Regional Distribution, Temporal Regularity, Instrument Model

自动土壤水分观测数据质量控制方法及其应用

吴东丽1,曹婷婷1,薛红喜2*

1中国气象局气象探测中心,北京

2国家气象中心,北京

收稿日期:2015年12月25日;录用日期:2016年1月8日;发布日期:2016年1月13日

摘 要

利用范围检查(土壤体积含水量大于60%记为错误,土壤体积含水量小于等于0记为错误)、时变检查(土壤相对湿度突降20%记为可疑)和持续性检查(土壤相对湿度连续一个月不变化记为可疑)等3类方法对2012年、2013年和2014年等3年的10 cm层的自动土壤水分数据(SWC010表示10 cm层的土壤体积含水量,SRH010表示10 cm层的土壤相对湿度)进行质量控制。从检出率、区域分布、时间规律和仪器型号等4个方面统计分析检出数据的特点。结果表明:SWC010等于0的方法检出率最高,因为自动土壤水分观测为新建业务,未业务运行站点存在着无数据上传或数据全为0的现象比较多,导致为0的数据最多而SRH010突降20%的方法检出率最低,可能是由土壤龟裂或者传感器与土壤之间有缝隙引起的。每种方法检出数据分布的省份数量差异较大,最少的省份只有1条,而最多的达上万条。SWC010小于0分布的省份数最少,其他几种错误数据类型在全国大部分省份是普遍存在的。SWC010大于60%的错误数据呈现夏季明显高于冬季的时间特点,其他4种可疑数据则具有冬季最多的特征。SWC010小于0的数据都是由DZN2观测的,可能是由标定方程引起的观测数据偏小。

关键词 :自动土壤水分数据,质量控制,检出率,区域分布,时间规律,仪器型号

1. 引言

土壤水分是反映地表水文过程的一个总体指标 [1] ,影响地表反照率、辐射、土壤热容量及地表植被生长状况等因素 [2] ,是干旱预报、农业生产、作物布局和农业决策的重要指标之一 [3] ,也是气候、水分、生态和农业系统的关键组成要素 [4] - [6] ,同时也是陆气相互作用过程中的重要角色 [7] - [9] 。监测土壤水分的变化对于规划、管理、研究这些系统和过程具有重要意义。但是气象部门传统的人工烘干称重监测土壤水分的方法,在每旬第八天观测一次,一月观测3次,这种人工观测的频率和效率已经远远不能满足决策部门和公众对干旱监测的需求,因此,近年来,中国气象局为了提高农业干旱监测和预警的业务和科研水平,建设了自动土壤水分观测网,截止到2015年5月底,全国业务化运行的自动土壤水分站达到1902个(图1)。

自动土壤水分观测站主要监测8个层次的4个土壤水分要素,8个层次为:分0~10 cm、10~20 cm、20~30 cm、30~40 cm、40~50 cm、50~60 cm、70~80 cm、90~100 cm等8个层次,4个要素包括土壤体积含水量(soil volumetric water content, SWC)、土壤相对湿度(soil relative humidity, SRH)、土壤重量含水率(soil mass content, SMC)、土壤有效水分贮存量(soil water available, SWA)等数据。观测仪分别由上海长望气象科技有限公司(DZN1)、河南气象科学研究所与中电集团第27研究所(DZN2)、中国华云技术开发公

Figure 1. Distribution of automatic soil moisture observation stations for routine operation in China

图1. 全国业务化运行的自动土壤水分观测站分布图

司(DZN3)生产 [10] 。三种型号的仪器都是根据频域反射法原理研制的,由传感器、采集器、无线模块通信和系统电源4部分组成 [11] ,其中DZN1型采用驻波率法,安装方式为埋设式,传感器与土壤直接接触,DZN2和DZN3型采用电容法,安装方式为插管式,传感器非直接接触土壤。

自动土壤水分数据每天每小时上传逐小时资料,监测频次由原来人工一个月监测3次(每旬逢8日)提高为目前1小时一条土壤湿度数据,具有实时性及连续性强、获取方便、节省人力等特点,并且随着气象部门自动土壤水分观测网的建立,将逐步取代人工观测,但是自动土壤水分站的生产厂商没有提供相应的资料质量控制、数据分析应用系统,虽然王良宇等 [12] 通过对土壤水分物理特性参数的统计计算,确定了土壤相对湿度的低值、高值异常值,但是没有分析引起异常数据的具体原因,因此本文计划通过范围检查、时变检查和持续性检查等3类质量控制方法,从检出数据的区域特点、时间规律和型号分布等几个方面分析造成异常数据的原因,以期提高自动土壤水分观测数据质量,提升自动土壤水分资料在业务、科研和服务中的应用效率。

2. 自动土壤水分观测资料质量控制方法

2.1. 质量控制方法

三种型号的自动土壤水分观测仪是利用频域反射原理测定,该技术是通过测量放置在土壤中由两个电极之间的电容形成的震荡回路所产生的信号频率来测量土壤的表观介电常数,从而得到土壤容积含水量 [13] [14] ,然后根据土壤水文、物理常数和相关公式计算出土壤重量含水率、土壤相对湿度和土壤有效水分贮存量等要素。因此,从原理上看,自动观测的四个要素,只需对体积含水量进行质量控制即可,但对其他要素的质控,可以检查土壤水文物理常数是否准确。

自动土壤水分资料质量控制包括范围检查、时变检查和持续性检查等3类质量控制方法5种可疑数据类型。

本文范围检查定义了3个类型,即土壤体积含水量大于60%,记为错误,根据不同土壤类型具有不同的体积含水量,其中沙土为含水量最低的土壤类型,黏土为所有土壤类型中含水量最高的类型,其田间持水量为39%~49%,饱和含水量为51%~55%,因此定义土壤体积含水量大于60%,认为是错误数值。土壤体积含水量等于小于0,标记为错误,根据频域反射原理,即使是空气,观测值也大于0,不可能小于等于零。

时变检查定义为在一个小时内土壤相对湿度突降20%,标记为可疑。根据土壤水分入渗特点,如果有降水,土壤水分可能会快速增加,但是土壤湿度的降低是一个缓慢的过程,不会突然降低,因此判断土壤水分的骤然降低,是不符合土壤水分时间变化规律,并且通过对2010~2011年的自动土壤水分资料统计分析,初步判断相对湿度突降20%,为可疑数据,引起数据突降的原因可能为土壤发生龟裂或者为传感器故障。

持续性检查定义为土壤相对湿度连续一个月不变化,标记为可疑。土壤水分随着气温、地温、湿度、蒸发和降水等多种气象因子的变化而变化,根据中国北方地区冬季土壤封冻,只能观测固态水的原理,并通过对历史自动土壤水分资料的分析,初步判断连续一个月不变化,认为数据出现异常。

2.2. 质量控制要素选择

自动土壤水分观测站共测量8个层次,10 cm层的土壤水分随着气温、蒸发、降水等气象要素变化最为明显,本文只对10 cm层的土壤水分质量控制结果进行分析。下文用SWC010表示10 cm层的土壤体积含水量,SRH010表示10 cm层的土壤相对湿度。

2.3. 计算方法

检出率定义为可疑数据占相应观测数据的百分比,利用检出率评估质量控制结果,可以清晰地看到各类可疑观测数据的分布比例,以此可以分析可疑数据季节、区域和仪器的分布特点,并根据各种分析结果改进观测方法和技术。本文对业务化运行的1902个自动土壤水分观测站的2012年、2013年和2014年的数据进行质量控制检查。其中2012年有14,303,151条数据,2013年有11,601,417条,2014年有13,919,700条。

3.质量控制结果分析

3.1. 检出率

利用上述5种可疑数据类型对2012年、2013年和2014年的自动土壤水分数据进行质量控制。检出率(图2)呈现如下特点:(1) 三年平均检出率分别为SWC010大于60%的方法是0.20%,SWC010小于0的方法是0.18%,SWC010等于0的方法是0.28%,SRH010突降20%的方法是0.09%,SRH010一个月不变化的方法是0.25%。由此可见,SWC010等于0的方法检出率最高,而SRH010突降20%的方法检出率最低。SWC010等于0最高可能由于自动土壤水分观测为新建业务,未业务运行站点存在着无数据上传或数据全为0的现象比较多,或者观测仪器出现问题也可能导致数据为0,因此该种方法检出率最高。SRH010突降20%的方法检出率最低,出现此种问题一方面因为土壤发生龟裂,导致土壤湿度数据突然降低,另一方面也可能是由于传感器与土壤接触不好,引起数据突降。(2) 分析三年检出率的变化特点,总体上呈现2012年的检出率最高,2014年次之,2013年最低。分析其原因可能是2012年业务化运行的站点较少,故检出率较高,而2013年新增加的业务化运行站点较多,数据质量有了明显提高,对于2014年检出率又升高,说明自动土壤水分观测仪器在运行1~2年后,需要检修或维护,才能充分保证观测数据的可靠性和准确性。

3.2. 省份分布特点

五种可疑数据类型的省份分布(表1)具有如下特点,(1) 每种方法检出数据分布的省份数量差异较大,

Figure 2. Distribution of detection rate of automatic soil moisture for quality control methods in different years

图2. 不同年份不同质控方法的自动土壤水分数据检出率分布

Table 1. Distribution of detection of automatic soil data in different provinces by different quality control methods

表1. 不同可疑数据在不同省份检出自动土壤水分数据量等级分布

SWC010大于60%、SWC010小于0、SWC010等于0、SRH010突降20%、SRH010一个月不变化等5种质量控制方法平均检出数据分布的省份数分别为23、9、19、26、19,因此,SRH010突降20%检出的可疑数据分布的省份数最多,SWC010小于0分布的省份数最少,其他3种方法分布在20个省份左右,说明除了SWC010小于0的数据类型,其他几种错误数据类型在全国大部分省份是普遍存在的。(2) 省份之间差异较大,个别省份占到检出数据的绝大多数,而大部分省份检出数据的总和只占到检出数据的很少一部分。除了SRH010突降20%这种可疑数据,其他4种方法检出的数据都是大部分集中分布在个别省份,最多的省份占到上万条,最少的省份只有1条,以SWC010小于0的方法2012年检出的数据为例,2个省份检出的数据总和占到此类错误的数据的88%,而其他8个省份只占到12%。(3) 5种可疑数据类型在3年中,检出数据最多的省份和最少的省份在不断变化,而不是持续出现在某个省份。(4) 5种可疑数据类型在3年中,呈现一致的变化趋势,即在2013年分布的省份数最少,说明在这3年的数据中,2013年的观测数据质量是最高的。

3.3. 台站分布特点

五种可疑数据检出的台站分布(表2)具有如下特点,(1) 每种方法检出数据分布的台站数量差异较大,SWC010大于60%、SWC010小于0、SWC010等于0、SRH010突降20%、SRH010一个月不变化等5种可疑数据类型三年中平均检出数据分布的台站数分别为150、42、135、603、156,可见,SRH010突降20%检出的可疑数据分布的台站数最多,占到总台站数量的32%,SWC010小于0分布的台站数最少,占总台站的2%,此类数据分布在少数省份和少数台站,解决了个别省份的问题,就明显降低了此类型数据错误。其他3种可疑数据类型分布在150个台站左右。(2) 台站之间差异较大,个别台站占到检出数据的绝大多数,而大部分台站检出数据的总和只占到检出数据的很少一部分。(3) 5种可疑数据类型在3年中,检出数据最多的台站和最少的台站在不断变化,而不是持续出现在某个台站。(4) 5种可疑数据类型在3年中,呈现一致的时间变化趋势,即在2013年分布的台站数最少。

3.4. 时间分布特点

统计分析SWC010大于60%的错误数据的时间变化规律,得到7月、8月和9月三个月的错误数据数明显高于其他月份,1月和2月错误数据数最少(图3),因此认为出现这种错误数据夏季明显高于冬季。

SWC010小于0 (图4)、SWC010等于0 (图5)、SRH010突降20% (图6)和SRH010一个月不变(图7)的数据一致表现为1月和12月检出最多,即冬季出现这几类数据明显高于其他季节,尤其是SWC010小于0 的这类数据冬季最多的特征最为显著。

Table 2. Distribution of detection of automatic soil data at different stations by different quality control methods

表2. 不同可疑数据在不同台站检出自动土壤水分数据量等级分布

Figure 3. Erroneous data of SWC010 > 60% Change with time

图3. SWC010大于60%的错误数据数随时间变化

Figure 4. Erroneous data of SWC010 < 0 change with time

图4. SWC010小于0的错误数据数随时间变化

Figure 5. Erroneous data of SWC010 = 0 change with time

图5. SWC010等于0的错误数据数随时间变化

3.5. 仪器型号分布规律

截止2015年5月底,共有1902套自动土壤水分观测站通过了业务化运行,其中,DZN1为390套,占到总数的20%,DZN2为1040套,占55%,DZN3为472套,占25%。

从仪器型号特点分析数据质量控制结果(图8),得到:(1) SWC010小于0的数据都是由DZN2观测的;(2) SWC010等于0、SRH010突降20%和SRH010连续一个月没有变化以上3种质量控制方法所检出的数据都是DZN2最多,DZN1次之,DZN3占的比例最少;(3) SWC010大于60%所检出的数据DZN1、DZN2、DZN3分别占0.06%、0.20%、0.36%,DZN3观测数据所占的比重最多,DZN2次之,DZN1最少。

Figure 6. Suspicious data of SRH010 sudden drop 20% change with time

图6. SRH010突降20%的可疑数据数随时间变化

Figure 7. Suspicious data of SRH010 unchanged for one month change with time

图7. SRH010一个月不变的可疑数据数随时间变化

Figure 8. Distribution of instrument model ratio for the detection of abnormal automatic soil moisture data by different quality control method

图8. 不同可疑数据类型检出自动土壤水分数据比例的仪器型号分布

4. 结论

利用自动土壤水分的SWC010大于60%、SWC010小于0、SWC010等于0、SRH010突降20%、SRH010一个月不变化等5种可疑数据类型对2012年、2013年和2014年等3年业务化运行的1902个站点的10cm层的数据进行质量控制,得到以下结论:

(1) SWC010等于0的可疑数据类型检出率最高,因为自动土壤水分观测为新建业务,未业务运行站点存在着无数据上传或数据全为0的现象比较多,导致为0的数据最多,在仪器方面如果出现传感器与连接槽接触不好或传感器损坏,传感器进水,信号转换模块被雷击等仪器故障,也能引起SWC010观测数据等于0。而SRH010突降20%的可疑数据检出率最低,引起该类型异常数据的原因可能包括土壤与土壤传感器之间有缝隙存在;降水偏少或降水超过20 mm,72 h后,土壤板结龟裂造成观测数据严重偏低;冻土造成数据异常偏低,土壤湿度传感器主要测定土壤体积含水量,土壤未解冻或冻结时,土壤中的水由液态变为固态冰介质发生变化,引起水分测量值急剧下降。虽然该种异常数据检出率较低,但是通过分析观测数据,可知此种方法可以检出突降20%的一条数据,不能检出连续异常的多条突降数据,只有解决了引起数据异常的故障时,数据才能恢复正常值。下一步重点探索解决持续异常一段时间的突降数据。

(2) 检出每种可疑数据分布的省份数量差异较大,最少的省份只有1条,而最多的达上万条。说明个别省份出现某个错误数据的现象比较突出,集中力量解决了个别省份的数据问题,亦能很大程度上提高自动土壤水分数据质量。SWC010大于60%的数据最多的几个省份在我国南方和北方都有分布,而SWC010小于0的数据出现最多的省份主要分布在我国北方地区,而华南地区的省份出现类似的错误数据极少,因而建议在我国干湿季比较明显的省份,分别采用干季和湿季土壤水分标定方程。

(3) SWC010大于60%的错误数据呈现夏季明显高于冬季的时间特点,引起体积含水量大于60%的原因可能是由于标定方程引起的,当夏季降雨量增多时,引起土壤含水量增加,其标定方程与实际含水量出现误差,造成观测的体积含水量偏大,其他4种方法则具有冬季最多的特征,在冬季温度下降,引起仪器故障,造成数据为0或长时间没有变化。

(4) SWC010小于0的数据都是由DZN2观测的,初步分析其原因可能是由于仪器在标定过程中使用的标定方程引起观测数据偏大或偏小,偏小的部分数据下降到了0值以下,建议各级业务应用单位和生产厂家针对观测数据出现小于0的观测站点,进一步实地调研,调整标定方程,找出引起数据小于0的真实原因。

(5) 总的来说,由仪器故障、安装不到位、参数测量不准确和标定方程不精确等四个方面的原因引起自动土壤水分数据错误或异常,为了尽快有效地发挥自动土壤水分数据的业务、科研和服务效益,建议各级业务应用单位和仪器生产厂家,共同查找业务应用中的数据问题,提高观测数据质量,提升自动土壤水分数据观测效益。建议各级业务应用单位的分工如下:台站级承担三个方面的任务,首先保证获取准确的土壤水文物理参数等元数据;其次,消除数据获取过程中由于传感器故障、不稳定和安装不到位带来的错误数据;最后,根据台站的气候阈值进行质量控制。省级承担本省自动土壤水分观测数据站网信息和元数据的准确性检查、一致性检查;组织实施本省观测数据的质量评估,指导台站的质量控制业务,并向国家级反馈质量控制存在的问题。国家级承担全国自动土壤水分观测数据质量的评估和综合分析,配合省级检查数据质量问题;承担观测仪器设备性能指标优良可靠。

致谢

感谢公益性行业专项(GYHY201306045)。

文章引用

吴东丽,曹婷婷,薛红喜. 自动土壤水分观测数据质量控制方法及其应用
The Study of Quality Control for Observing Data of Automatic Soil Moisture[J]. 土壤科学, 2016, 04(01): 1-10. http://dx.doi.org/10.12677/HJSS.2016.41001

参考文献 (References)

  1. 1. 王磊, 文军, 韦志刚, 等. 中国西北区西部土壤湿度及其气候响应[J]. 高原气象, 2008, 27(6): 1257-1266.

  2. 2. 孙丞虎, 李维京, 张祖强, 等. 淮河流域土壤湿度异常的时空分布特征及其与气候异常关系的初步研究[J]. 应用气象学报, 2005, 16(2): 129-138.

  3. 3. 韩俊杰, 高永刚, 南瑞, 等. 1984-2005年黑龙江省主要农区土壤湿度的变化特征[J]. 中国农业气象, 2009, 30(1): 41-44.

  4. 4. 汪潇, 张增祥, 赵晓丽, 等. 遥感监测土壤水分研究综述[J]. 土壤学报, 2007, 44(1): 157-163.

  5. 5. 郭卫华, 李波, 张新时, 等. FDR系统在土壤水分连续动态监测中的应用[J]. 干旱区研究, 2003, 20(4): 247-251.

  6. 6. 欧阳双, 张其林, 李颖, 等. 地表湿度导致土壤电参数变化对雷电电磁场传播的影响[J]. 气象科技, 2012, 40(6): 1018-1024.

  7. 7. 陈海山, 孙照渤. 陆气相互作用及陆面模式的研究进展[J]. 南京气象学院学报, 2002, 25(2): 277-288.

  8. 8. 张艳丽, 张国珍. 黄土高原典型塬区土壤湿度特征分析[J]. 干旱区资源与环境, 2010, 24(5): 190-195.

  9. 9. 杨袁慧, 师春香, 王炜, 等.一次强降水模拟中土壤湿度初值的影响研究[J]. 气象, 2013, 39(11): 1481-1489.

  10. 10. 吴东丽, 梁海河, 曹婷婷, 等. 中国自动土壤水分观测网运行监控系统建设[J]. 气象科技, 2014, 42(2): 278-282.

  11. 11. 陈海波, 冶林茂, 薛龙琴, 等. GStar-I (DZN2)型自动土壤水分观测仪的维护方法及常见故障解析[J]. 气象与环境科学, 2011, 34(S1): 178-181.

  12. 12. 王良宇, 何延波. 自动土壤水分观测数据异常值阈值研究[J]. 气象, 2015, 41(8): 1017-1022.

  13. 13. 黄飞龙, 李昕娣, 黄宏智, 等. 基于FDR的土壤水分探测系统与应用[J]. 气象, 2012, 38(6): 764-768.

  14. 14. 陈怀亮, 张红卫, 刘荣花, 等. 中国农业干旱的监测、预警和灾损评估[J]. 科技导报, 2009, 27(11): 82-92.

期刊菜单