一种用于改进mpeg-7和其他的基于xml内容描述的二进制表示法的功能的方法

文档序号:7672579阅读:177来源:国知局
专利名称:一种用于改进mpeg-7和其他的基于xml内容描述的二进制表示法的功能的方法
技术领域
本发明涉及基于XML结构文件的编码和译码,比如在MPEG-7中所指明的,XML(可扩展标记语言)是一种用于文件结构定义的标准,而且在文件中用来表示结构的数据,举例来说,组成用于XHTML语言的基础。这些基于XML的结构文件以大量的结构要素-以下也被称为模式-为基础,比如将可以借助于文件类型定义(DTD)、XML模式或多媒体描述模式(DS)举例详细说明。
由草案ISO/IEC CD 15938-1信息技术一多媒体内容描述的接口系统,ISO/IEC JTC 1 SC29/WG11/N3701(鲍尔(La baule)(法国),2000年10月,特别在第15页到22页)出发,MPEG-7-数据的二进制格式以及借助于树状分支编码表的导航路径结构是为公众所知的。
本发明涉及对具有XML结构的文件最优化编码。本发明的根本目的就在于,一种改善基于XML的内容描述的二进制表示法的功能的方法,特别是MPEG-7-文件描述的,使得这种情况下要传输的数据量尽可能少,在文件内的检索过程尽可能简单,而且在这种情况时在每个展示的模式中没有包含特定文件的扩展使得尽可能减少消耗。
根据发明的目的是通过权利要求1,2,5,7和8的特征来解决的。另外的权利要求是根据本发明的有利组成的方法。
在另外的情况下由上述的ISO/IEC-草案可知,XML-文件的结构可以理解为树状数据,其中每个要素的描述是与该树中的某个节点相对应。节点的结构是通过在模式中的定义确定的,该定义是以文件为基础。尤其子要素的类型和数量是由此阐明的。举例来说,这种节点的范例如在该草案的19页所示出的。这些树状结构节点由要素名称或复合类型,具有编码语句的TBC(树状分支编码)的字段组组成,它用于子要素的参考以及树状分支,它表示所提及的相应的子要素。同样由草案可以得出结论,TBCS划分为两个组成部分,也就是划分为模式分支和位置信息,其中模式信息由要素导出,它在模式中作为子要素出现,当位置信息包含着某一个要素的位置信息,它可以重复地出现。因此子要素可能的形式是,复合类型的要素,该符合类型的要素还可以包含子要素。或简单类型的要素或特征,它不能再包含子要素。#position字段组的长度将由最大数量(“最大发生的”)的相关要素所确定,它是在模式中详细描述的。对于这种情况,在这个例子中最大数量为大于7或者没有限制的,字段组是适当地加长了,直到欲编码的位置可以表示为止。这种划分有其特点,模式-分支编码或SBC#模式分支编码表示的完全一致,与此无关,正如在实际的原文本中可以存在很多子要素一样。
为了在文件中移动,TBC,即模式分支编码,和必要时位置编码相邻排列,使得产生一个在文件中的路径。所希望的要素插入一个终端编码到表中。如果所希望的要素不能有另外的子要素,也就是特征或者简单类型,则这些终端编码是不需要而且不必传输。然后传输已编码的特征或简单类型要素。
下面将根据在附图中的实例详细解释本发明。其中,

图1a至1d 各种不同的要素种类的地址解释压缩的改善。
图2 XML模式文本图2a和2b 在图2的模式文本所属的节点表图3a和3b 表示解释依据本发明的检索能力的改善图4a和4b 数据流的程序段用来解释可扩展性的改善图5a和5b 表示另外的树状分支节点用来解释可扩展性的改善图6a和6b 图2和图2b,还可具有另外的要素。
图7和8跳跃未知要素的译码器序列本发明主要在于使用两种不同的模式分支编码,高频率应用其中之一的模式编码,使得可产生压缩,模式分支编码和位置编码相结合,而且共同传输模式分支编码的位长,因此检索功能由此很容易,仅在第一部分详细说明涉及要素的类型,而且基于一种版本号模式来传输,事先给定固定的扩展策略,这也就是公众熟知的译码器,从而获得可扩展性的改善。
压缩的改善在图1中示出目前的一种简单型要素或特征的地址,在图1b中表示复合型要素的地址,正如它与已知的方法相符合。在图1c和1d中表示按本发明方法的相应的地址。由此可知,可以采用两种不同的模式分支编码SBC-A和SCB-B,而不仅仅是通常的模式分支编码SBC-B。正如上述的,这种链接的地址路径由TBC-编码组成,这就是说,在模式分支编码SBC-A之间也需要当前位置编码#POS,而且只在具有路径终端编码的模式分支编码SBC-A的末端实现,而不再含有一个通常的模式分支编码SBC-B的另外的位置数据,它可以包含简单型要素或特征,形成树状结构的叶。
由所述的链接的路径结构可以清楚TBC编码,在特征或简单类型的要素上可以仅指示路径最后的TBC。在复合型要素上必须指示全部前面所述的TBC,因为也可能只有子要素有。根据本发明方法中的目的,用于在文件中定位的编码长度与开始提到的ISO/IEC-草案相比较是减少了,对于每个节点引入两种不同的表用于#模式分支编码SBC。表A只包含复合型要素,这是说每个要素,它可以有子要素。另一个表包含全部要素,因此也包括特征和简单型要素。因此没有SBC是为路径结束保存的。两个表的#模式分支编码是在下面称为SBC-A和SBC-B。全部路径又由TBC的链接形成,其中全部的直到在最后的具有SBC-A的TBC以及在必要时形成相应的#位置编码。利用表A所形成路径第一部分的末端是用终端编码,例如所有的比特1,信号化。其后跟随一个TBC,取用表B的#模式-分支编码。应该注意到在按照发明的方法中还必须传输终端编码,如果特征或简单型要素是已编址的。因为#模式分支编码的长度取决于可能的要素数,所以在表A中的编码,也是SBC-A编码,相应地缩短。从而使得压缩作用适当,SBC-A编码明显地比SBC-B编码更加频繁地被使用。
在图2中给出了一个XML-模式文本的实例,而在图2a和2b中表示相应的节点表SBC-A和SBC-B。由此很明显,对于SBC-A模式分支编码能够缩短,必须不包括简单型要素和特征。
检索功能的改善然而一个依据ISO/IEC草案的方法的二进制表示法要求保留能用的功能,使得对文件中给定要素的检索简化。这些检索最佳的方式应该可以通过简单的滤波结构实现,通过预先确定的位序列,所检索的文件中的要素清楚定址的,将在位流中每个图形比较进行检索。对树状文件中给定的要素进行快速检索是节省位流的,而且只准确地察看每个要素,它只在适当的路径段寻址。对于这种方法,正如在ISO/IEC-草案中所执行的一样,这种滤波不是无限制地可以执行的,因为#位置编码的长度是不能预定的,如果模式中要素的最大数量至少大于7或者是没有限制的。
根据本发明的方法的目的,尽可能简化位流滤波,执行部分地分类整理所述的树状分支节点的路径(TBCs)。因此#位置-编码在路径终端移动。这具有这个优点,路径的第一部分包含#模式分支-字段,单独地详细说明涉及要素的类型。
在一种可替换的解决办法中,在第一步是使#位置编码划分为具有固定长度的一部分以及具有变化长度的一部分。第二步是具有变化长度的一部分由TBCs取出来,而且在路径的终端移动。
对于绝对地址,对于给定的要素检索首选已经可以实现位模式的确定。在使用相对的地址时模式取决于在文件中的当前实际位置。对于这种情况通过新方法使其简化,滤波的#位置编码不是必须被译码和评估的。
作为完全参考整个路径必须包括全部的#位置-编码和译码,因此在每个节点时可以在涉及的子要素修正其分支。
为了实施简化这个方法,且能在路径开始传输路径整体长度L,在二进位中典型地,而没有忽略#位置编码,将启用一个用于位置编码的指针Z,因此可以使得适当的与SBC平行的位置进行译码。由此附加地对于所检索的要素在给定的位置(#位置)尽可能地检索,对于这种情况检索也支持在下面解释的可扩展性,在这种情况时路径的一部分不是每个译码器所识别的。
图3a示出了现有方法中的一个实例中的简单型要素或特征的地址关系。在图3b中示出的是相应地根据本发明的方法。图3b中很清楚,每个路径的全部模式分支编码SBC-B1...SBC-B5依次地排列,并显示其长度L,同样从起点首先传输的。位置编码#位置1......#位置5是被SBC分开的,而且依次的排列。位模式对于具有位长L的绝对地址是由模式限定而可确定的,因此也可以通过图形比较实现位流的滤波。
可扩展性的改善根据ISO/IEC草案算法的编码模式,是上下文-灵敏度,就是说在每个要素中只有另外的,上下文可能性译码的。如果识别模式-定义,译码器可以仅识别位流并正确地解释。译码器必须是已知的,指示该要素的TBC编码,和在每个要素上的比特码长,因此对于每个路径段将识别正确的比特数。
在实际中常常出现这种情况,一定的模式补充地扩展,围绕新的限制条件,例如新的元数据类别,进行计算。这些扩展可以是任意的要素或者特征。在XML-文本形式所包含的文件中,它按旧的模式-定义建立,就新的定义而言即使在以后也具有其适用性(前向兼容性)。但是它也可以是通过保留导出数据类型,它在限制的情况下(由限制衍生的)保留TBCs或者在扩展时(由扩展衍生的),正如在下面叙述的,得到另外的TBC-表。
在文件的二进制表示法中,举例来说如在ISO/IEC草案中所描述的,但不是这个案例,因为这里可以分配到TBCs供给的新的要素/特征。它预先寻址另一个要素/特征。然而根据本发明的具有下列规定的方法中可以避免这些缺点新的选择元素能够在树形结构节点TSN中,只在已存在的元素并且只在可能存在的路径终端编码之前提供使用。该新的元素目前没有分配已使用的模式分支编码,其中存在的元素在此没有失去模式分支编码安排。
在扩展到具有长地址的寻址时,所有的二进制表示方法根据编码长度的改变不再被编码。为了解决这个问题,按照本发明进行如下的寻址新的要素/特征是涉及对现有的要素/特征的模式分支编码,以及在必要情况时首先在树状结构节点TSN的路径终端登记。在这里不再使用更多的模式分支编码,在此情况下寻址扩展到一个或更多个比特,例如必要的有意义的比特。举例来说,现有的编码是用一个零扩展的。路径终端编码组成一个例外,是用1扩展而成,所以保留了树状结构节点的最后编码。新的要素/特征与指定的当前新的可支配的模式分支编码SBC相适应。模式分支编码的位长变化必须由译码器信号化。为了尽可能有一个增量的可扩展性,对于译码器前述的模式版本必须是已知的。因此没有必要贮存每种版本的完整信息。而应该只存贮保留的与更新的树状结构节点相符合的新版本的模式分支编码的位长或者数量,而且在必要时传输,在这种情况下第二个方法有助于识别有错误的编码。这些信息在编码以前必须传输变化后的模式分支编码。在这种方式时模式分支编码的位长与模式的版本号相结合。在文件以二进位编码以前应该只详细说明所使用的模式版本,不像以前一样传输全部使用的模式。举例来说ISO/IEC-草案的位流定义向着版本说明的领域扩展。如果不实现版本控制,在所利用一个标准中,例如MPEG-7所涉及的模式定义必定是已知的。这些模式定义比如可以确定为版本1。下面将给出有关版本信息的实施例。
在消息头中附加地,正如在ISO/IEC-草案中详细说明的,不仅给出模式信息而且还给出位长信息。对此信息,正如在图4a中表示的一样,将在数据流中存放。
标准化的版本可以使得指定的版本识别清楚。它在图4a中用M7_版本_ID来表示。更进一步,有关的扩展其特征在于利用扩展识别,在图4a中给出了扩展_ID。如果扩展的树状结构节点TSN的位长在位流中给出,这些就可以详细说明。正如在图4a中表示的,这些将通过标记DS_扩展信号化。树状分支编码TBC的位长信息将由扩展的树状结构节点TSN在图4a中提供的DS_Updata_Info()中,正如图4b所表示的,进行编码。表达式Number_of_Changed_nodes表示改变的树状结构节点的数量。这个数量可以用可变的长度来编码,如同在ISO/IEC-草案中推荐的位置信息。
树状结构节点改变的信息可以在位流通过Navigation_Command发出导航指令,导航路径通过Navigation_Path()寻址。接下来传输全部要素的变化信息,如同已编址的节点,为同样的类型。下面是包含在数据流中的改变的编码长度SBC_Length或者的改变树状分支编码数量。而编码长度或数量又取决于编码的方法。它也采用Number_of_Changed_nodes来编码。
在进一步的实施例中,树状结构节点的改变可以通过复合类型在模式中识别的直接寻址来实现。例如这些直接寻址可以通过定义的复合类型的增加而实现。
另一个问题就在于按新的模式编码的文件由译码器译码,以前的模式定义必须为已知的(后向兼容性)。在一个基于XML的文本中可以获得XML-文件,对于在旧的模式中为已知的要素。这些取决于两个特征保留在旧的模式中定义的复合类型要素,但是所包含的要素和特征在数据类型中分别是有区别的。
通过要素的开始和结束标记,所谓的标签,可以使得新要素跳跃而且用已知的方式译码。
树状结构节点的位长变化与上述的地址建议相适应传输不同的版本,正如在上面的实例中所述,所以扩展的树状结构节点的已知要素由旧的译码器译码,仍在原来的模式的基础上进行工作的。然而在一个新要素中的路径说明不可由旧的译码器跳跃,而且译码器不再能够进一步译码。为了要支持这些重要的功能,将在依据发明的方法中采用一个可选择的后向兼容性的编码的文件a)新的要素/特征在TSN中寻址,那么首先附加用于全部的子树或者继承树的比特数量,这些要素/特征包括插入的N比特内容数据都可传输。在这种情况下译码器可以安排以后的N位,它在未知的情况下编码,进行跳跃而且在已知的TSN中重又安排。
b)根据路径传输,该路径包含一个要素/特征,将传输一个清楚的同步序列,它可以在已知的TSN中利用译码器重新设定。
c)路径传输,包括新要素,使得其TSN首先传输,TSN表示完整的模式的一部分。
d)路径传输,首先传输包括新要素的完整模式。
在选择(c)和(d)的情况下译码器也可以对新补充的文件的内容进行译码,而且在必要情况下可以存贮或者进一步处理。
在图5a和5b中示出的实例表示在模式定义的新版本的变化,其中在图5a中示出的是复合型要素的扩展树状结构节点,而在图5b中示出的是改变后模式扩展的树状结构节点。要素3到6是在新的版本中加入的。模式分支编码的长度因此由2延长到3。先前的地址保留直到零扩展,而仍保持MSB。
以下在图6a和6b中示出的是一个模式-扩展要素的编码实例。在与图2结合而使用的实例用作起始点。根据简单性的原因在上述的方法的表示中放弃节点表的分布。原来的模式“购货指令型”应该扩展几个要素。相对于图2,在图6a中更有利地强调了扩展。
要素“支票支付”,“支付方法”以及银行数据都是新附加的。因此新的树状分支编码表必须相应地扩展。其结果是三个二进制位不再够用于全部可能性的编码。
因此树状分支编码的扩展是用四个比特实现的,而且在图6b中详细地描述。
通常情况下有两种事例要处理事例1按旧的模式-定义编码的文件,传输给译码器,其新模式是已知的。基于编码文件的模式版本号码必须首先传输给译码器。译码器有一个表,存放全部要素的每个版本号的比特宽度或模式分支编码SBC的数量。因此在译码器中可以确定,购货指令型的要素不是用四个比特,而只用三个比特编码。可以用这些信息正确地译码这些文件。
事例2按新的模式-定义编码的文件,传输给仅识别旧模式的译码器。译码器通过模式版本号识别传输的未知要素和利用另外的比特宽度编码的已知要素。要素的新比特宽度必须为译码器所知,否则他就不能与编码器的同步。或者在传输文件前这个信息根据每个要素的比特宽度排列的,例如是一个表,或者是译码器在具体指定的地址下(URI)写入这个信息。
根据本发明的方法的编码器有四种对文件进行编码的方法1传输正如在图7中所示树中每个新要素相应的排列的长度。
译码器通过模式分支编码01010识别已编地址的要素,而不必包括在标准模式中。在相近的比特解释相应未知要素的长度L。采用的长度说明可以实现与可变的整体编码相适应,正如在ISO/IEC-草案中描述的一样。利用这些长度说明可以跳跃到后排列的数部分中的“支票支付”,而且在#模式分支-编码0010时重新设定。可以接着译码下面的要素“指令”。
方法2对一个新要素,如图8中所示,传输一个清楚的同步序列。译码器 分辨位流,直到找到标准化的确定的重新同步标记(Resyncmarker)为止,然后再继续译码。在这种方法中给出了可能性,很多新要素成块地编码,并且传输第一个至最后一个重新同步标记。
方法3新要素包括的树状结构节点,以及其在文件树中的位置在原文件前传输。在这些方法中更新的模式,对译码器而言是已知的。与这种情况相适应,如果模式已知,实现文件的传输。另外也可以应用新的传输模式,内部已知要素通过新要素扩展,只要指定一个清楚的版本号,识别新的模式。
方法4将传输一个完整的新模式,在这种情况下,译码器处理文件正如按已知的模式编码的。另外也可以应用新的传输模式,它的内部已知要素绕着新要素扩展,只要指定一个清楚的版本号,识别新的模式。
每个根据本发明的方法可以单独或组合地实现。
权利要求
1.一种方法,用于改善基于XML的内容描述的二进制表示法的功能,其中一个特定的XML文件的结构与一个树状数据结构相适应,在这方面每个树状节点表示一个要素的内容描述和显示一种结构,给出一个固定的模式并且其中该模式具有树状分支编码(TBC)的树状节点,在此树状分支编码具有模式分支编码,只要根据模式的定义所属的子节点多次地出现,显示位置编码(#POS),对于每个节点编码时,使得对于模式分支编码构成两个不同的表,其中第一个表(SBC-A)只包含复合要素和路径终端编码,其数据结构允许在子节点有一个分支,而第二个表(SBC-B)除了复合的要素以外还包括特征和简单要素,它表示了树状数据结构的叶,各自的全部路径通过树状节点形成,使得在一个全部路径的最后节点从第一个表取出树状节点,从第二个表中取出最后的树状节点,而路径的倒数第二个节点包含一个路径—终端—编码。
2.一种方法,用于改善基于XML的内容描述的二进制表示法的功能,其中一个特定的XML文件的结构与一个树状数据结构相适应,在这方面每个树状节点表示一个要素的内容描述和显示一种结构,给出一个固定的模式并且其中该模式具有树状分支编码(TBC)的树状节点,在此树状分支编码显示模式分支编码,只要根据模式的定义所属的子节点多次地出现,显示位置编码(#POS),其中全部路径这样地再分类,使得全部的位置编码在路径终端移动。
3.根据权利要求2的方法,其中在全部路径的开始将传送一个关于路径总长(L)的任务,其中只有模式分支编码,而不考虑位置编码。
4.根据权利要求2的方法,其中位置编码划分为具有固定长度的一部分和具有可变长度的另一部分,而具有可变长度的部分是由树状分支编码取出的,并在路径终端移动。
5.一种方法,用于改善基于XML的内容描述的二进制表示法的功能,其中一个特定的XML文件的结构与树状数据结构相适应,在这方面每个树状节点表示一个要素的内容描述和显示一种结构,给出一个固定的模式并且其中具有树状分支编码(TBC)的树状节点,在此树状分支编码显示模式分支编码,其中使得现有的模式由此扩展,使得扩展在树状节点借助新要素用于改进的预定的模式分支编码,直到全部消耗,于是模式分支编码的位长(B)根据需要增加,其中位长变化通知译码器修正内容描述的译码。
6.根据权利要求5的方法,其中在译码器中至少存贮模式的一种类型,而且基于一种存贮类型仅有用于模式变化的一个调用信息,或者直接发送基于一种存贮类型的模式变化。
7.一种方法,用于改善基于XML的内容描述的二进制表示法的功能,其中一个特定的XML文件的结构与一个树状数据结构相适应,在这方面每个树状节点表示一个要素的内容描述和显示一种结构,给出一个固定的模式并且其中该模式具有树状分支编码(TBC)的树状节点,在此显示树状分支编码,由此译码器浏览了具有未知要素的路径,或者是某一要素依次排列的树状结构的比特数,传输其内容和译码器跳跃的比特数,或者在路径传输后用一个新要素传输明确的同步序列,因此使得译码器首先重新设置已知模式的树状节点。
8.一种方法,用于改善基于XML的内容描述的二进制表示法的功能,其中一个特定的XML文件的结构与一个树状数据结构相适应,在这方面每个树状节点表示一个要素的内容描述和显示一种结构,给出一个固定的模式并且其中具有树状分支编码(TBC)的树状节点,在此树状分支编码具有模式分支编码,其中译码器对新的,而不是先前的模式路径合适的要素进行译码,因此使得译码器不是传输预先所属的树状结构节点就是一个完整的新模式。
全文摘要
本发明主要在于使用两种不同的模式分支编码,高频率应用其中之一的模式编码,使得可产生压缩,模式分支编码和位置编码相结合,而且共同传输模式分支编码的位长,由此使得检索功能容易,仅在第一部分详细说明涉及要素的类型,而且基于一种版本号模式来传输,事先给定固定的扩展方式,也是译码器已知的,从而获得可扩展性的改善。
文档编号H04N7/24GK1526239SQ01822811
公开日2004年9月1日 申请日期2001年12月20日 优先权日2000年12月22日
发明者J·霍伊尔, J 霍伊尔, A·胡特, 旅范, U·尼德梅尔 申请人:西门子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1