本文分析了现有的路由及数据融合算法的优势与缺陷,提出了采用n阶移动平均的数据融合算法,充分利用节点间的数据黏性,使算法不仅可以跟踪环境变化,而且能够迅速捕捉到不符合趋势的环境变动。算法借鉴了半静态聚簇路由机制在节点管理机制的优点,使得WSN可以以较高的效率队簇内节点进行管理,使能耗更加均衡。最后设计了多个模拟场景的实验方案,将本文提出的算法进行各方面的可行性分析,阐释了本文方案在过滤冗余信息、延长网络寿命上的有效性。<br/>In this paper, the advantages and detects of routing and data fusion algorithm are analyzed, and a new method based on n-average value of split is proposed. By using data viscosity, this algorithm could not only sense the changing of environment, but also find the abnormal change. Using the advantages of semi-static clustering in managing sensor nodes, the efficiency of routing is obviously improved, and the energy consumption is more balanced. At last, a series of experiments are designed to prove the performance of this algorithm, and based on the experiment results, the ef-ficiency in data filtering and prolonging networks’ lifetime is analyzed.
刘凯强,杜韬,曲守宁
济南大学信息科学与工程学院,山东 济南
Email: kq0902@163.com, du_t@163.com, qsn@ujn.edu.cn
收稿日期:2015年6月19日;录用日期:2015年7月7日;发布日期:2015年7月14日
本文分析了现有的路由及数据融合算法的优势与缺陷,提出了采用n阶移动平均的数据融合算法,充分利用节点间的数据黏性,使算法不仅可以跟踪环境变化,而且能够迅速捕捉到不符合趋势的环境变动。算法借鉴了半静态聚簇路由机制在节点管理机制的优点,使得WSN可以以较高的效率队簇内节点进行管理,使能耗更加均衡。最后设计了多个模拟场景的实验方案,将本文提出的算法进行各方面的可行性分析,阐释了本文方案在过滤冗余信息、延长网络寿命上的有效性。
关键词 :无线传感器网络,数据融合,半静态聚簇路由,加权移动平均
无线传感器网络WSNs (Wireless Sensor Networks)是一项新型的专用网络,结合无线通信与传感器技术,具有成本低、自组织、容错性好、抗毁性强等特点,在气象检测、火灾报警、地质灾害预警、医疗监控等领域都有广阔的发展前景 [
数据融合算法将来自不同数据源的相同或近似的数据按照一定规则进行合并的处理过程。由于无线传感网中有大量的感知节点,如图1所示,ID分别为1、2和3的这三个节点都将侦测到这一事件的发
图1. 多节点数据感知示意图
生。如果每个感知到事件的节点都向汇聚节点报告,网络中会充斥着大量冗余无效的数据,不仅浪费能量而且可能会造成网络的堵塞,造成有用的数据不能及时传递至汇聚节点,导致网络失效。数据融合的最终目的是减少在网络中流动的数据包。相关研究表明,无线节点在发送与接收状态的能耗要占到节点总能耗的70%左右 [
无线传感器网络由大量传感节点(sensor)和唯一的汇聚节点(sink)组成,所有的传感节点被随机地、均匀地散布在一个广阔的区域内,汇聚节点负责收集数据并通过卫星通信或互联网将信息汇集到监控中心加以分析。用一个连通的图
从图2的能量消耗分布图可以看出,节点在生命周期中的能耗集中在通信模块上,其中发送与接收的功耗占节点总功耗的60%~70% [
图2. 传感器节点能量消耗分布
本文参考经典的信息传输能耗模型来计算节点间的通信能耗:
公式(1)表示节点发送数据的能量消耗,公式(2)表示节点接收数据的能量消耗。L表示信息的长度,d是传输距离,
无线传感网处在研究的最前沿,如网络热点问题、能量空洞、数据融合过滤、多路径路由以及自组织结构形成方式等诸多问题 [
响应式数据融合算法从网络组织结构可分为平面融合结构、树状融合结构与分簇融合结构等 [
第一种基于平面结构的数据融合算法,因为其简单、有效,鲁棒性高等特点赢得广大学者的青睐。该结构需避免“内爆”的冗余数据,同时也存在着不利于设置过滤点,较难形成有效的数据过滤机制的缺点,不适用与大规模的传感网。
第二种基于树结构的数据融合算法一般会包括树结构的生成、维护和数据传送三个阶段 [
第三种基于分簇的融合算法是一种典型的层次结构的数据融合算法。算法首先要对所有传感节点进行聚簇,在每一个簇中,会选举出一个簇头来负责发送、转发数据包,而簇内成员只需要将数据包交给簇头节点即可。簇头因为额外负责了数据的转发、路由工作,其能耗会相对其他的节点高,因此簇头的选择与拓扑的周期维护则是基于簇结构的数据融合路径的关键所在。这类数据融合算法包括LEACH、LEACH-C以及在此基础上改进的HEED、TEED和PEGASIS等。在 [
路由结构作为本算法的次要方面和前提,在杜韬提出的基于划分的半静态聚簇路由算法EESSC [
在无线传感网中,空间距离是衡量能量消耗的最重要的因素欧拉公式是计算空间中任意节点间距离的最常用的方法,计算公式如公式(3):
在公式(3)中,
其中,
半静态聚簇路由算法主要分为4步 [
借鉴半静态聚簇路由算法,形成数据融合的层次结构:
改进的半静态聚簇路由算法使网络在最初阶段每一个节点都是一个簇,如图5所示,在结束时得到如图4的拓扑及簇内、簇间的链接关系。节点3、7、13、16和节点17维护一份簇内的链接关系表,而
图3. 聚簇初始阶段
图4. 聚簇结束、选举簇头和配置转发节点路由
节点9、节点14则维护一份簇间的转发关系表。这样就从宏观上组织起整个网络,作为下一阶段算法正常施行的基础。图5所示为网络运行的整体流程,其中的数据融合算法环节将在下一章节阐述,也是本文的核心内容。
随着硬件电路的发展,传感节点的硬件本身可以携带的存储空间也在随之增大。注意到传感节点在运算上的能量消耗远小于数据传送的能量消耗,本文提出基于历史数据n阶移动平均值的数据融合算法,在末端节点对数据进行充分的冗余过滤,大幅度减少数据包发送。充分利用历史数据对未来事件的预测
图5. 传感网整体架构流程
作用,侦测节点上做像素级数据融合,SINK节点可以综合多组数据进行决策级数据融合,形成响应动作,以最小的数据流量和能量消耗完成消息传递。本文讨论仅有一种传感器的情形,实际中可以扩展为多组传感器,并行运行此算法,在像素级融合后在。
采用移动加权的原因是利用其跟随趋势以减少日志式数据的上报。因为近期数据对未来预测的数据波动的影响最大,因此赋予它较大的权值。常用加权方式分为四种:
· 末日加权移动平均:
· 线性加权移动平均线:
· 梯型加权移动平均:
MA = [(第1组感测值 + 第2组感测值) × 1 + (第2组感测值 + 第3组感测值) × 2 + (第3组感测值 + 第4组感测值) × 3 + (第4组感测值 + 第5组感测值) × 4]/(2 × 1 + 2 × 2 + 2 × 3 + 2 × 4) (以5组数据为例);
· 平方系数加权移动平均:
MA = [(第1组感测值 × 1 × 1) + (第2组感测值 × 2 × 2) + (第3组感测值 × 3 × 3) + (第4组感测值× 4 × 4) + (第5组感测值 × 5 × 5)]/(1 × 1 + 2 × 2 + 3 × 3 + 4 × 4 + 5 × 5) (以5组数据为例)。
移动平均值法用一组最近的实际数据值来预测未来一期或几期内数据的一种常用的方法。当数据趋势既不快速增长也不快速下降,且不存在短周期的变化因素时,移动平均法能有效地消除预测中的随机波动。加权移动平均给固定跨越期限内的每个变量值以相等的权重,给一个长周期内的各变量以不同的权重,远离目标期的变量值的影响力相对较低,应当给予较低的权重,而最近期的数据最能预示未来的情况,因而权重应较大。
加权移动平均法的计算公式如下:
其中
在无线传感器网络中,传感器感知到的数据多为湿度、温度、风速等环境变量,且多具有连续属性。如果这些数据不能够以一种较好策略进行数据包筛选,仅仅是以一种间隔时间段的策略来作日志式发包,则充斥着大量冗余数据。加权移动平均能够充分挖掘了数据间的趋势关联关系,不会局限于环境变量的微量步进,同时又可以跟踪环境的变化规律,当有环境因素持续快速变动时可以迅速上报。结合在生成树路径上的上报记忆元件,过滤掉后期相同时间的数据包的传递。
式中
式中
移动加权平均多用在金融、股票预测领域,因其对近期的数据加以更大的权重,可以很好的跟踪趋势和预测下期数据得到很广泛的应用。通过实验对比发现采用平方系数加权移动平均,相比采用线性加权移动、末日加权移动及梯型加权移动能更好的跟踪环境趋势。每个节点维护一个长度为n的链表(默认设置为n = 20),这个链表保存了最近的n组感测数据,基于此链表数据计算当前的移动加权平均作为预测值,并对告警比率ALERT设置一个阈值F(默认设置为15%),当检测到超过此阈值的变动则发送当前数据。
本文中涉及到的时间序列(Time Tick)单位为“次”,即感知节点感知数据的次数,而每次感知数据
图6. N阶加权移动平均数据融合算法流程
的间隔时间(比如3秒钟)乘以时间序列次数则为正常时间。其中间隔时间会根据具体环境做不同的设置,间隔时间越短,则精确度越高,网络耗电量将越大。图表中不再单独做标注。实验环境及硬件配置详见附录。
设置
图7为算法跟踪正常环境缓慢变化的分析图,x轴为传感节点侦测环境的次数,每次间隔时间为5秒钟(模拟实验时间间隔),左侧y轴为环境的温度值,右侧y轴为ALERT告警比率。Sense线表示传感节点侦测到的环境值,Predict线表示算法根据历史数据做出的跟踪预测值,ALERT线为算法根据公式(7)得到的告警比率。很显然像温度、湿度等这些环境变量正常情况下是在持续的缓慢变化中,从图中我们可以看到在一个比较长的时间段内,温度从31℃升至32℃后降至29℃,算法对环境的跟踪良好,ALERT值保持在2%以下,不触发信息发送。
图8所示模拟环境失火的情况,环境温度迅速上升到60℃以上,传感节点在一分钟内(约12次侦测环境)侦测的快速变化的数据使Predict线明显滞后于Sense线的变化趋势,造成ALERT比率急剧升高至40%,这样的高比率足以触发我们预设的15%~20%的告警阈值。在警报发出后,Predict线会逐渐跟上,ALERT回落不会再持续的报警,可以节约传感节点的能量。
1 | 4 | 9 | 324 | 361 | 400 |
表1. 权重计算结果
图7. 算法跟踪环境温度值的缓慢变化
图8. 算法对环境温度有剧烈跃升时的响应
图9所示情景缩小环境温度粒度,适用于需要对温度精确控制的环境。首先要下调告警阈值ALERT的值为10%,可以看到环境只有四个数据(第38~41次)明显偏离趋势,迅速从31.5℃左右升至近39℃,则引起了16%左右的告警值。突破阈值及时并发出消息。通过这个模拟环境说明本算法可以根据环境做一定的自定义精度,当环境要检测诸如室内火情时,适当的上调告警阈值而不会将比如室内空调的开启造成的温度变化误报;当环境需要较高的精度时,下调告警阈值会更及时的报告环境的变化,但相应的会发送更多数据包消耗更多能量。
图9. 高精确度的环境变化跟踪与告警
在这个情景中,如图10,缩小环境的时间粒度,来看节点侦测出错时的处理。当节点在很短的时间有一个或一两个数据出现错误飘移,如图中Sense本应是一个平滑的增长,但是因为某种因素导致第34次的数据出现错误,而后迅速恢复正常水平。ALERT线增至7.5%左右,Predict线只有较小升幅,算法的预测功能消除了这种随机错误,较低了错误对ALERT线的瞬时影响,最终没有引发告警。此情景展示了算法具有一定的容错能力。
当环境在一个较短时间出现了如图11的波动,我们可以看到当下环境中有明显的三次波动,则视为此节点在这段时间内需要发送三个消息包,即算法在理想状态下感知到此环境的节点仅会作出三次数据上报动作。
图12显示了算法对具有三次波动的环境做出了及时的跟踪及告警。图13展示当算法设置不同的的ALERT值会对冗余数据的过滤产生影响。ALERT值设置的越高,则过滤的数据则越多,造成数据漏报的几率就会越大;ALERT值设置的越低,则算法的告警精确度会越高,数据漏报的几率就越小。在这个实例中,当ALERT值大于50%时会造成数据漏报,ALERT的值在10%~25%之间都是合适的。ALERT在某种程度上指示了环境波动的剧烈性,在这个取值以内不同剧烈程度的波动均可以保持在极低的数据漏报率,因此也可以认为是算法对环境异常具有一定的鲁棒性。
以上分析主要针对的是单个节点对数据的融合、过滤,当同一个聚簇中的多个节点同时感知到此波动时,可以在簇头节点设置过滤点,过滤掉空间距离较近的多节点的冗余数据,在此不作为重点考虑。
本文分析了现有的路由及数据融合算法的优势与缺陷,提出了采用n阶移动平均的数据融合算法,在基于划分的半静态聚簇路由算法的基础上,设计了一套能量节约的数据融合算法,保证了聚簇结果的合理性,充分利用节点间的数据黏性,使算法不会陷于步进跟踪环境变化,而且仍能够迅速捕捉到不符合趋势的环境变动。根据实验数据的分析,在正常的环境下,算法能够密切跟踪当前的趋势,能够过滤掉几乎所有的不必要的正常发包;而在事件发生时,如果阈值设置合理,则能够过滤95%以上的冗余数
图10. 节点对个别误报数据的容错
图11. 具有明显的三次波动的环境
图12. 对复杂环境变化的ALERT值跟踪
图13. 不同ALERT阈值的选取对冗余数据的过滤的影响
据。算法还具有一定的抑制偶然错误的机制,由于利用了历史数据的平滑作用,得以在一定程度上能够抑制由于传感器在随机错误造成的误判。
论文在撰写期间始终得到导师曲守宁教授和杜韬博士在学术上的认真指导,使得本课题的研究能够顺利进行并取得了阶段性成果。在论文的研究和撰写过程中,导师倾注了大量的心血,特别是导师严谨的治学态度、对学术孜孜不倦的探索精神、鼓励创新的开拓风范,以及他长者的博大胸襟都将使作者终生受益。借此论文成稿之际,谨向导师曲守宁教授和杜韬博士致以崇高的敬意和衷心地感谢!
刘凯强,杜 韬,曲守宁. 高效实时的无线传感器网络数据融合算法研究 The Research of High Efficient and Real Time Data Aggregation Method Applied in WSNs[J]. 传感器技术与应用, 2015, 03(03): 33-46. http://dx.doi.org/10.12677/JSTA.2015.33005