本文简要介绍了无线传感器网络故障管理研究的重要性,详细阐述了故障管理的主要内容,然后重点介绍了目前部分研究学者在无线传感器网络故障检测与故障恢复方面的研究成果,指出了WSNs故障管理方面的研究方向。 The paper briefly introduces the importance of wireless sensor network fault management, details the main contents of the fault management, then focuses on the part of the researchers in the wireless sensor network fault detection and fault recovery research results, and points out the di-rection of fault management in WSNs research.
陈战胜1,2*,刘琮1
1北京联合大学应用科技学院,北京
2北京交通大学计算机与信息技术学院,北京
收稿日期:2016年4月2日;录用日期:2016年4月23日;发布日期:2016年4月26日
本文简要介绍了无线传感器网络故障管理研究的重要性,详细阐述了故障管理的主要内容,然后重点介绍了目前部分研究学者在无线传感器网络故障检测与故障恢复方面的研究成果,指出了WSNs故障管理方面的研究方向。
关键词 :故障管理,故障检测,故障恢复
无线传感器网络(Wireless Sensor Networks, WSNs)具有网络拓扑动态变化、具体应用相关性、节点能量受限及计算能力有限等特性,常常被部署于存在极大变数、环境恶劣的场所。在此场景中,电磁、噪声等干扰因素致使节点电池耗尽、信号丢失,从而导致节点失效、传输中断、数据包丢失等情况发生,直接影响到WSNs数据接收率、传输准确率和传输平均时延等关键性技术指标,降低无线传感器网络稳定性、准确性和可靠性,因此对WSNs故障管理机制的研究具有重要的意义。
无线传感器网络节点资源受限的特点以及所处的恶劣环境,使得无线传感器网络比传统网络更易失效。经分析汇总,导致无线传感器网络发生故障的原因主要有:1) 传感器节点由于电池耗尽或外部事件而失效或损坏,影响节点的感知功能,导致感知数据失真以及数据传输产生误差。2) 网络连接失效导致网络区域分割且改变网络的拓扑结构。3) 由于节点自发组织管理特性以及多跳通信可能会引发网络拥塞导致数据包丢失。
为了在最小化网络能耗的前提下确保网络数据传输的可靠性,下面分别介绍无线传感器网络故障管理的方法和技术。
故障检测 [
网络监测旨在收集网络运行状态信息、预测网络是否存在异常行为,通常可以分为主动监测和被动监测。主动监测是向网络中发送探测(probe)包或收集节点的事件报告,从而获取网络性能参数。其中,探测包或事件报告均会增加网络负载,因为需要考虑探测的数量和频率。被动监测是通过网络流量的变化来推测网络运行是否发生异常的一种技术。其中,监测信息主要包含网络通信性能、链路状态、节点状态、链路拥塞水平以及拓扑变化等。与有线网络类似,传感器网络将数据包的丢失、中断、延迟、以及无规律的流量等都当作网络故障的特征。WSNs故障检测方法与网络的应用类型紧密相关,目前多集中于网络层。
根据故障检测任务执行主体的位置不同,可以分为分布式方法和集中式方法。根据故障检测时是否发送探测包分为主动检测和被动式检测两大类。其中,主动检测是一种主动的、高效自适应检测方法,其形式是通过发送探测包实现快速检测和定位网络故障。被动检测不发送任何信息,仅仅依靠分析已知信息来推测网络故障。
1) 集中式故障检测方法。集中式方法通常由能量不受限的中心节点采用周期性主动探测的方式负责对网络进行监控、追踪失效节点或可疑节点,并对获得的信息进行分析,从而确定节点是否失效。文献 [
2) 分布式故障检测方法。分布式方式支持局部决策,将负载分散在网络中的节点,从而分担了中心节点的负载。文献 [
故障诊断主要包含故障识别与定位,通过参照故障分类从而将故障信息进行归类,分析并找出故障发生的原因,然后定位故障发生的节点。对于无线传感器网络而言,当汇聚节点Sink未接收到某个区域的信息时,需要考虑是区域中所有节点失效还是关键节点失效。文献 [
通常,节点故障包含节点自身故障、链路故障和汇聚节点故障三类。
故障恢复是在确定故障发生节点后,对该节点进行处理,确保网络的正确运行。本文主要讨论如何在故障发生后恢复故障,而非忽略故障。
针对与应用相关的WSNs而言,其以数据为中心,任务驱动的特点,使得WSNs终端用户并不关心单个节点的状态和其采集的信息,而是关注整个监测区域所发生的事件是否被检测出来,如湿度、温度的变化等。面向应用的WSNs故障恢复是从节点故障着手,但其目标是使从整个簇、整个网络的角度出发,保证监测任务能够正常执行,并非要保证每个故障节点都得到修复。因此,本小节将从收集数据和广播数据的角度来对故障容忍协议进行讨论。就数据收集而言,WSNs众多应用中主要是将事件监测的原始感知数据发送给Sink节点,以便进行分析。由于发送的数据量大,当事件检测的数据已经足够则认定该通信可靠,故通常情况下并非每个数据包的丢失都会被记录。其中,ESRT [
在WSNs具体应用中,传感器节点放置方法主要分为诸如智能楼宇系统的“结构化”应用和诸如灾情监控的“非结构化”应用。其中,前者应用中传感器节点位置是预先设定好的,后者应用中传感器节点是随机分布的,其位置服从二维泊松点过程。此外,根据Pareto法则,可知任何系统中很少一部分模块中所发现的故障,就占整个系统所有故障的部分,即常说的“20-80法则” [
为了便于描述,将文中常用符号说明如表1所示。其中,一跳邻居节点定义如下:对于
文中假定传感器节点随机播撒在一定二维区域上,节点编号已知且每个节点具有相同的通信和感知半径。对于节点可能发生的故障表现形式为不正确的感知数据或通信故障。为了统一,参考文 [
通常,传感器节点的故障概率与工作时间长度成正比,时间越长发生故障概率越高。文 [
符号 | 说明 | 符号 | 说明 |
---|---|---|---|
传感器节点 | 网络节点总数 | ||
传感器节点集 | 节点i的一条邻居节点 | ||
故障节点集 | 节点i的一条邻居节点集 | ||
故障节点 | 节点i在时刻t的可靠度 | ||
第k个簇的节点集 | 节点i在时刻t的故障概率 | ||
平均生存时间 | 传感器节点的故障概率 |
表1. 符号说明表
如表1所示,式(1)中
SRSS算法 [
在算法SRSS中,Select Basic Probe Station中探测站点数量和位置确定问题尤为重要。其中探测站点数量与覆盖率、连接状况以及网络拓扑等有密切关系。文 [
下面将介绍基于邻居数据分析的方法。文献 [
Step 1:获取节点
Step 2:计算所有邻居节点的可信水平,构建可信邻居节点集
Step 3:找出邻居节点中可信水平符合要求的所有
Step 4:计算节点
Step 5:根据节点异常次数判断节点是否失效,从而得出可信度。
从算法主要步骤中可获知,算法的关键步骤在于可信水平的计算和节点失效的判定,详细内容可以参考文 [
N-DARA算法采用MATLAB进行仿真,从节点移动数量、移动距离和覆盖能力方面均有一定程度的提高,但是导致网络边缘覆盖能力的想下降。文 [
无线传感器网络故障管理研究主要分为故障检测、故障诊断和故障恢复三个阶段。就面向应用而言,WSNs故障恢复着眼于节点故障,但目标是从整个簇、整个网络的角度出发,保证监测任务能够正常执行,并非要保证每个故障节点都得到修复。其中,故障容错策略能够有效提高无限传感器网络运行的鲁棒性和传输可靠性,从而保证网络在检测中出现异常或故障时,能够在一定时间内寻找出合适的容错控制方案,自适应的处理网络出现的各种异常现象,继续提供高可信度的计算服务。此外,考虑如何高效移动节点来解决故障节点恢复网络正常通信,也值得继续深入研究。
北京联合大学“启明星”大学生科技创新项目(201511417SJ029和201511417SJ045),北京联合大学新起点计划项目资助(zk10201303),北京市职业院校教师素质提高工程资助项目(京教财(2012)21号)。
陈战胜,刘琮. 无线传感器网络故障管理机制的研究综述 Research on Fault Management Mechanism in Wireless Sensor Networks[J]. 计算机科学与应用, 2016, 06(04): 234-241. http://dx.doi.org/10.12677/CSA.2016.64029