一种基于可扩展标记语言的无线传感器网络数据压缩方法

文档序号:6586100阅读:376来源:国知局
专利名称:一种基于可扩展标记语言的无线传感器网络数据压缩方法
技术领域
本发明涉及一种无线传感器网络的数据压缩方法,具体涉及在无线传感器网络中使用可扩展标记语言(Extensible Markup Language, XML)格式的数据作为数据交换时的数据压缩方法。
背景技术
无线传感器网络(Wireless SensorNetworks, WSNs)是由一组在空间中分布的包含自主传感器节点装置构成的一种无线网络,这些装置使用传感器协作地监控不同位置的物理或环境状况(比如压力、运动、温度或声音等)。由于微处理器技术的进步,无线传感器网络被越来越多地应用在各个领域,但由于传感器节点硬件资源有限,这给无线传感器网络中复杂的数据管理带来了新的挑战。传统的传感器网络数据管理主要采用简单数据结构作为数据传输格式,以减少无线传感器网络中因数据交换带来的能量损耗,但这些简单数据结构不能有效地处理大型异构数据集合。异构无线传感器网络由两个或多个不同数据类型的传感器子网组成,由于各个子网提供的数据格式是不同的,因此要求应用层对不同数据格式都能支持。XML是一种高度可替换可扩展的数据格式,它已成为事实上的互联网数据交换标准,采用XML数据格式可以使这些异构传感器子网得到更高水平的网络互连。但由于XML本身的自描述性,其数据格式的冗余度很大,对于能量有限的传感器节点来说是一个很大的难题。因此找到一种适用于传感器网络并能有效支持动态查询的XML数据压缩方法,是在无线传感器网络中使用XML作为数据交换格式以支持异构网络互连的关键。

发明内容
技术问题:本发明的目的在于提供一种基于可扩展标记语言的无线传感器网络数据压缩方法,即无线传感器网络中基于XML节点树结构的XML数据压缩方法(Tree-basedXML data Compression Algorithms in WSNs),简称TXC压缩方法。该方法能够有效降低在无线传感器网络中使用XML作为数据交换格式带来的数据冗余,从而减少因传输和处理数据带来的无线传感器网络能量损耗,提高无线传感器网络的网络寿命。技术方案:本发明的基于可扩展标记语言的无线传感器网络数据压缩方法,对可扩展标记语言XML文档对应的XML节点树进行深度优先遍历并按遍历顺序将各个节点进行编号,XML节点树中的节点个数记为m,第i个节点可描述为Ni=Geqi, Pathi, Iiamei, Parenti,Valuei, atrbI), i ∈ [l,m];其中Seqi表示第i个节点在深度优先遍历下的序号,Pathi表示第i个节点的路径,Iiamei表示第i个节点的名称,Parenti表示第i个节点的双亲节点在深度优先遍历下对应的序号,Valuei表示第i个节点的值,atrbi表示第i个节点的属性或附加信息;将XML节点树用以下式子来表示:T={R00T,N},其中N为XML节点集合即N= (Ni |i∈ [1,m]},ROOT为XML节点树的唯一根节点;深度优先遍历XML节点树,依次将每个节点信息 Ni= (Seqi, Pathi, name” parent” value” atrbj)分别添加到 T= {ROOT, N}中,遍历完毕后得到XML节点树对应的完整节点信息T ;在XML节点树的节点集合N=仉i e [l,m]}中,对于集合N中的节点Ni= (Seqi, path” name” parent” value” atrbi),i e [1,m],合并具有相同路径的冗余节点;若XML节点树中存在两个叶子节点Na和Nb,Na, Nb e N, Na和Nb的路径信息分别为:
权利要求
1.一种基于可扩展标记语言的无线传感器网络数据压缩方法,其特征在于,对可扩展标记语言XML文档对应的XML节点树进行深度优先遍历并按遍历顺序将各个节点进行编号,XML节点树中的节点个数记为m,第i个节点可描述为Ni = (Seqi, Pathi, Iiamei, Parenti,Valuei, atrbi), i e [I, m];其中Seqi表示第i个节点在深度优先遍历下的序号,Pathi表示第i个节点的路径,Iiamei表示第i个节点的名称,Parenti表示第i个节点的双亲节点在深度优先遍历下对应的序号,Valuei表示第i个节点的值,atrbi表示第i个节点的属性或附加信息; 将XML节点树用以下式子来表示:T= {ROOT,N},其中N为XML节点集合即N ={队|ie [1,m]},ROOT为XML节点树的唯一根节点;深度优先遍历XML节点树,依次将每个节点信息 Ni= (Seqi, Pathi, name” parent” value” atrbj)分别添加到 T= {ROOT,N}中,遍历完毕后得到XML节点树对应的完整节点信息T ; 在XML节点树的节点集合N= (Ni |i e [I, m]}中,对于集合N中的节点NiKseqi, Pathi,Iiamei, parent^ Valuei, atrbj,i e [1,m],合并具有相同路径的冗余节点; 若XML节点树中存在两个叶子节点Na和Nb,Na, Nb e N, Na和Nb的路径信息分别为:/A7//J , = / 4 4■…4:> η0, η” η,., nD, η e N ; P— k 二…— ng — nb 若路径深度紙patl = depth{pathnb)且name' = name、,则认为Na等价于Nb,记做Na ^ Nb ;在XML节点树T= {ROOT,N}中,查找等价节点并对其进行合并,修改合并后的等价节点路径表达式,将其置为 pathk=nQ — Oii I I np) —...— (η」I I nq) — nk, n0, Iii, n」,np, nq, nk e N ;分离XML节点结构信息和数据信息,将节点结构信息和数据信息分开进行存储和压缩: 1)XML节点结构信息 在TXC压缩方法中,XML节点结构信息用“节点路径信息+节点初始序号”的混合数据类型来表示,由于同一个XML节点树中的节点路径信息会产生重叠,而浪费很多存储空间,因此对XML节点路径信息加以简化:对消除冗余后的XML节点树再进行一次深度优先遍历,并对各节点名称进行编号,得到XML节点名`称映射表;对照XML节点名称映射表将XML节点路径信息用编号替换对应的节点名称字符串; 2)XML节点数据信息 XML节点的数据信息存储采用哈希表的方式来实现,以节点路径信息作为索引值,建立起XML节点结构信息到对应节点数据信息之间的映射关系,索引值key为简化后的节点路径表达式,key被消除冗余后的节点个数m取模后所得结果即为对应数据存储的哈希地址,即H(key)=key mod m 采用链地址法来处理冲突构造哈希表:节点数据存储的哈希地址为H(key),具有相同索引值的节点数据信息存储在同一哈希单元保存的链表中,并用初始序号来区分该数据在原始XML文档中的位置。
全文摘要
本发明公开了一种基于可扩展标记语言的无线传感器网络数据压缩方法。传统的无线传感器网络数据管理主要采用简单数据结构作为数据交换格式以减少无线传感器网络中因为数据交换带来的能量损耗,但这些简单数据结构不能有效地处理大型异构网络数据集合;当前的互联网数据传输标准XML适用于处理大型异构网络数据,但由于XML本身的自描述性,其数据格式的冗余度很大,对于能量有限的传感器节点来说是一个有待解决的问题。本发明提出了一种基于XML节点树结构的无线传感器网络数据压缩方法,简称TXC压缩方法,本方法适用于无线传感器网络并能有效支持动态查询,可以得到较好的压缩效率,在支持异构网络互连的同时有助于延长无线传感器网络的寿命。
文档编号G06F17/30GK103150346SQ20131004847
公开日2013年6月12日 申请日期2013年2月7日 优先权日2013年2月7日
发明者管有庆, 唐雪娇 申请人:南京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1