专利名称:Html内容对比装置及方法
技术领域:
本发明涉及HTML内容对比技术领域,特别是涉及一种HTML内容对比装置及方法。
背景技术:
超文本置标语言(HyperText Markup Language,简称为HTML)是为网页创建和 其它可在网页浏览器中看到的信息设计的一种置标语言。HTML被用来结构化信息—— 例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。例如,HTML 内容<h2>Golf</h2>中的<h2X/h2>定义了浏览器将〃 Golf"显示为二级标题,HTML 内容<b>boldface</b>中的<b></b>定义了浏览器将〃 boldface"显示为粗体文字, 即〃 boldface"。可以发现HTML利用一个开始标签“<X>”和一个结束标签“</X>”来控制 标签之间的内容的显示格式。HTML标签是用来控制标签中的内容显示格式的,HTML标签是 HTML内容的一部分,但该部分不被HTML内容的用户视觉看到,即用户看到的是有格式的内 容,而不会看到HTML标签本身。本领域技术人员已知,HTML内容中包括各种不同类型的节 点,例如,一个开始标签和一个结束标签构成HTML文档中一个节点;开始标签和结束标签 之间的文本内容,如“Golf”,可被称为文本类型节点,简称文本节点;开始标签和相应的结 束标签以及其中的文本内容一起被称为元素类型节点,简称元素节点。一个节点可以嵌套 一个或多个其他的节点,如 “<htmlXbodyXdiv>A</divXp>B</pX/bodyX/html>”,被嵌 套的节点<div>A</div>和
B</p>为其上一级节点〈bodyX/body〉的子节点,而嵌套有 节点的节点〈bodyX/body〉为其子节点<div>A</div>和
B</p>的父节点。文本内容对比技术已经在很好的服务于大家。文本文件对比软件尤其是版本控制 类软件的文件内容对比功能,可以帮助使用者判断新文件相对于旧文件存在哪些差异,例 如判断并标识新文件相对于旧文件增加了哪些内容,修改了哪些内容,删除了哪些内容。但是,现有技术的文件内容对比技术仅能够以纯文本形式对比新旧文件内容,对 于被HTML标签结构化的内容则不能很好的进行对比如果以纯文本对比方式对HTML内容进 行对比,会将HTML标签视为文本内容进行对比。然而,将HTML标签视为文本内容进行对比 会失去HTML标签用于控制内容格式的存在的意义,有可能损害由HTML标签控制的文本内 容的格式。另一方面也不希望去掉HTML标签而仅对文本内容进行对比,因为对比HTML内 容的用户同样希望在内容对比结果中看到所比较的内容中HTML标签所控制的文本格式的 差异。比如对于两段完全一样的文本内容,其中一个存在HTML标签而另一个不存在,则希 望在对比该两段内容的对比结果中,突出显示具有由HTML标签控制的格式的文本内容。因此,需要一种对比包括HTML标签的HTML内容的对比装置和方法,其中从显示格 式控制的角度将HTML标签作为对比内容的一部分进行对比。
发明内容
为了弥补以上现有技术的不足,本发明提供一种对HTML内容对比的方法,以解决 保持HTML标签对标签中的文本内容的格式控制的同时,对HTML内容进行差异分析对比的问题。本发明通过以下技术手段实现一种用于对比两个HTML内容的装置,包括文本节点分析装置,用于通过循环遍历分别对两个HTML内容进行分析,得到两个 文本节点序列;文本节点对比装置,用于对所述两个文本节点序列中的文本节点进行比较并得到 包括差异文本和相应差异类型的文本节点比较结果; 差异分析装置,用于对所述两个HTML内容中的标签进行比较并得到包括差异标 签和相应差异类型的标签比较结果;差异数据标识装置,用于识别文本节点比较结果中差异文本和相应差异类型以及 标签比较结果中差异标签和相应差异类型,并分别对两个HTML内容中差异文本和差异标 签进行差异标识使得在显示对比结果时方便观看所述两个HTML内容的差异;显示装置,用于分别显示其中差异文本和差异标签被标识的所述两个HTML内容。一种用于对比两个HTML内容的方法,包括通过循环遍历分别对两个HTML内容进行分析,得到两个文本节点序列;对所述两个文本节点序列中的文本节点进行比较并得到包括差异文本和相应差 异类型的文本节点比较结果;对所述两个HTML内容中的标签进行比较并得到包括差异标签和相应差异类型的 标签比较结果;识别文本节点比较结果中的差异文本和相应差异类型以及标签比较结果中差异 标签和相应差异类型,分别对两个HTML内容中的差异文本和差异标签进行差异标识使得 在显示对比结果时方便观看所述两个HTML内容的差异;在HTML页面中分别分别显示其中差异文本和差异标签被标识的所述两个HTML内容。一种用于对比多个HTML内容的装置,包括指定装置,用于将待对比的多个HTML内容之一指定为参考HTML内容;文本节点分析装置,用于通过循环遍历分别对该多个HTML内容进行分析,得到多 个文本节点序列;文本节点对比装置,分别将所述多个文本节点序列中所述参考HTML内容之外的 其他HTML内容的文本节点序列的文本节点与所述参考HTML内容的文本节点序列的文本节 点进行比较并得到包括差异文本和相应差异类型的文本节点比较结果;差异分析装置,将所述其他HTML内容中的标签与所述参考HTML内容中的标签进 行比较并得到包括差异标签和相应差异类型的标签比较结果;差异数据标识装置,用于识别各文本节点比较结果中差异文本和相应差异类型以 及各标签比较结果中差异标签和相应差异类型,分别对差异文本和差异标签进行差异标识 使得在显示对比结果时方便观看其他HTML内容相对于参考HTML内容的差异;显示装置,用于分别显示所述参考HTML内容和其中所述差异文本和所述差异标 签被标识的其他HTML内容。优选地,分别对两个HTML内容中差异文本和差异标签进行差异标识包括分别对所述差异文本增加设置有属性的标签和改变所述差异标签的标签属性。优选地,通过预先定义标签属性使得具有相同差异类型的文本以相同的突出显示 格式显不。优选地,所述差异类型是文本增加,文本删除,文本修改,标签增加,标签删除或标 签修改。优选地,突出显示格式包括改变文本的字体颜色,对文本增加背景色,对文本增加 下划线和对文本增加删除线。本发明的优点为采用本发明所述方法和装置,克服了现有的纯文本对比方法不能比较HTML内容 中的标签并且不能在比较结果中突出显示被比较的HTML内容中的格式差异的技术问题, 使进行HTML内容对比的用户能够在对比结果中直观地观察到不同版本的HTML内容之间文 本内容的变化和显示格式的变化,满足了用户对HTML内容的对比的需求。
图1示出了根据本发明实施例的HTML内容对比装置的结构框图;图2示出根据本发明实施例的实现HTML内容对比方法的流程图;图3为本发明实施例的HTML内容对比的对比结果示意图。
具体实施例方式下面将参照附图对本发明的实施例进行说明。应当理解,这里描述的实施例是示 意性的而非限制性的。本领域技术人员通过阅读说明书,可以对本发明的技术方案有更好 的了解,并可以在本发明的精神和宗旨下对本发明的实施例进行各种修改和变型。本发明 的保护范围仅由随附权利要求书限定。图1示出了根据本发明实施例的一种HTML内容对比装置,该装置包括文本节点分 析装置1,文本节点对比装置2,差异分析装置3,差异数据标识装置4和显示装置5。文本节点分析装置1,用于从,例如两个,待对比的HTML内容的HTML内容中分析 得到,例如两个,文本节点序列。文本节点序列由HTML内容中的文本节点构成。文本节点 分析装置通过对HTML内容进行循环遍历,分析每个节点的节点类型,根据其类型判断该节 点是否为文本节点。如果是,则将该文本节点的文本记录在例如一维变量数组中,由此从 HTML内容当中分析得到例如以一维数组表示的文本节点序列。例如一段简单的HTML内容 "<html><body>hello,<b>world</b> ! </bodyX/html>,,包括两种类型的节点,例如,文本 节点“hello,”和元素节点<b>world</b>。元素节点“<b>world</b>”进一步嵌套有文本节 点“world”。通过循环遍历可以找到该段HTML内容中的所有文本节点“hello,”,“world”, “! ”,并由此形成文本节点序列{ "hello,", "world", "! ”}。文本节点对比装置2,用于接收文本节点分析装置分析得到的两个文本节点序列, 对文本节点序列进行比较并记录它们的文本差异和相应的差异类型,例如,文本的增加,删 除或修改,并将包括文本差异和相应差异类型的文本节点比较结果输出给差异数据标识装 置4。差异分析装置3,用于对待对比的两个HTML内容中的标签进行对比。对标签进行对比包括对两个HTML内容的标签名和标签的内容进行对比。例如,当所对比标签的标签 名和标签内容均相同即该标签名和标签内容构成的元素节点相同时,认为所对比的标签相 同。如果所对比标签的标签名或标签内容存在差异,差异分析装置3记录该差异和该差异 的类型,例如标签的增加,删除或修改。例如,如果标签的标签名不匹配,则认为该标签是被 删除的标签或增加的标签;如果标签的标签名匹配但他们的内容完全不同,则同样将该标 签认为是被删除的标签或增加的标签。如果标签的标签名匹配但是他们的内容部分相同, 则认为是修改的标签。差异分析装置3将包括标签差异和相应的标签差异类型的标签比较 结果输出到差异数据标识装置4。差异数据标识装置4,分别接收文本节点对比装置2和差异分析装置3的比较结 果,识别文本节点比较结果中差异的文本和该差异的类型以及标签比较结果中差异的标签 和该差异的类型,对差异的文本和差异的标签进行差异标识以便在显示所对比的两个HTML 内容时突出显示所述差异的文本和由差异的标签导致的文本的格式差异以方便用户观看。 对差异的文本和差异的标签进行差异标识,例如,包括通过分别对差异的文本增加设置有 属性的标签和对差异的标签的改变标签属性,在显示对比结果时,将差异文本和具有差异 格式的文本以突出显示格式显示。优选地,通过预定义标签属性可以用相同的突出显示格 式显示具有相同差异类型的文本。突出显示格式,例如,但不限于,对差异文本和差异标签 中文本改变其显示格式,比如添加背景色,或改变文本颜色、增加下划线,增加删除线等。显示装置4用于在HTML对比页面中对分别经过差异标识的每个HTML内容进行显
7J\ ο图2示出根据本发明实施例的实现HTML内容对比方法的流程图。在HTML页面 中,用户选择要进行对比的HTML内容并进入HTML内容对比页面。HTML内容对比装置分析 所选择的HTML内容的差异,对分析出的差异进行标识,并在HTML内容对比页面中显示对差 异进行了标识的HTML内容,由此用户在HTML页面显示的对比结果中能够清楚看到所对比 的HTML内容中的差异。本发明将以对比两个HTML内容为例具体描述根据本发明的方法。步骤S11、文本节点分析装置将每个待对比的HTML内容分析出一个文本节点序 列。从HTML内容当中分析文本节点序列的方法是,循环遍历HTML内容的每个节点,分析每 个节点的节点类型,根据其类型判断该节点是否为文本节点。如果该节点是文本节点,则将 该文本节点的文本记录到例如一个变量数组中,由此从HTML内容当中分析得到例如以一 维数组表示的文本节点序列。步骤S12、文本节点对比装置接收文本节点分析装置分析得到的两个文本节点序 列,对文本节点序列进行对比并记录它们的差异和差异类型。在对比两个文本节点序列的 过程当中,分析其中一个文本节点序列相对于另一个文本节点序列的各文本节点的差异, 即差异文本,和差异的类型,例如文本增加、文本修改或文本删除。将这些差异文本和相应 差异的类型作为变量记录并存储在例如数组中,以便在后面的步骤中对差异进行标识。步骤S13、差异分析装置对待对比的两个HTML内容中的标签进行对比。对标签进 行对比包括对两个HTML内容的标签名和标签的内容进行对比。对比方法包括,将其中一个 HTML内容的所有标签,逐一在另一个HTML内容当中查找对比。对标签进行对比包括对两个 HTML内容的标签名和标签的内容进行对比。例如,当所对比标签的标签名和标签内容均相 同即该标签名和标签内容构成的元素节点相同时,认为所对比的标签相同。如果所对比标
7签的标签名或标签内容存在差异,差异分析装置3记录该差异和该差异的类型,例如标签 增加,标签删除或标签修改。例如,如果标签的标签名不匹配,则认为该标签是被删除的标 签或增加的标签;如果标签的标签名匹配但他们的内容完全不同,则同样将该标签认为是 被删除的标签或增加的标签。如果标签的标签名匹配但是他们的内容部分相同,则认为是 修改的标签。将新加的、删除的或被修改的标签记录到数组变量当中,以便在后面步骤中对 差异进行标识。差异分析装置3将包括标签差异和相应差异类型的标签比较结果输出到差异数 据标识装置4。步骤S14、对上述步骤12和步骤S13中得到的所有差异进行标识。首先,识别文本节点比较结果中差异的文本和相应差异的类型以及标签比较结果 中差异的标签和相应差异的类型,对差异的文本和差异的标签进行差异标识以便在显示所 对比的两个HTML内容时突出显示HTML内容中差异以方便用户观看。对差异文本和差异标 签进行差异标识,例如,包括分别对差异的文本增加设置有属性的标签和对差异的标签的 改变其标签属性,在显示对比结果时,将差异文本和由差异的标签结构化的文本以突出显 示格式显示。优选地,通过预定义标签属性可以用相同的突出显示格式显示具有相同差异 类型的文本。突出显示格式,例如,但不限于,对差异文本和差异标签中的文本改变其显示 格式,比如添加背景色,或改变文本颜色、增加下划线或增加删除线等。对差异文本进行标识例如可以为差异文本添加<Span></Span>标签。然后例如通 过定义新增加的标签的属性,给刚创建这个节点中的文本设置一个背景颜色,由此对该差 异文本进行突出显示。如果HTML标签存在,则通过重新定义该标签的属性,将此标签构成 的元素节点设置一个背景颜色以便由显示装置突出显示。依次对所有的差异逐个标识,即 完成对比操作。如果需要对多个HTML内容进行对比,用户例如可以进一步选取其中的两个进行 对比,对比方式如上所述。或者,用户可以将该多个HTML内容中的一个HTML内容指定为作 为参考内容,将该多个HTML内容中除该参考内容的的其他HTML内容与该参考内容进行对 比并分别对相比于该参考内容的差异进行标识。相比于图1所示的HTML内容对比装置,用于对比多个HTML内容的装置进一步包 括用于将该多个HTML内容之一指定为参考内容的指定装置。对比多个HTML内容的装置 中,文本节点分析装置、文本节点对比装置、差异分析装置和差异数据标识装置分别将多个 HTML内容中除参考内容外的其他呢日哦能够与该参考内容进行对比并获得相应的对比结^ ο实施例1对比内容Al "<html><body>hello, world ! </body></html>,,和对比内容 A2 "<html><body>hello, <b>world</b> ! </body></html>,,。文本节点分析装置1分别对对比内容Al和对比内容A2进行分析,获得文本节点 序列 Al{ "hello,world ! ”}和文本节点序列 A2{ "hello,", "world", "! ” },并将所获得 的文本节点序列输出至文本节点对比装置2。文本节点对比装置2接收文本节点分析装置1输出的文本节点序列Al和文本节 点序列A2,并对两个文本节点序列中的每个节点进行比较。通过比较可知,文本节点序列
8Al和文本节点序列A2中的文本内容完全相同。文本节点对比装置将两个文本节点序列文 本内容相同的比较结果输出到差异数据标识装置。差异分析装置3对对比内容Al中的标签和对比内容A2中的标签进行对比。通过 对比可知,相比于对比内容Al,对比内容A2对文本“world”增加了标签<bX/b>。差异分 析装置3将此标签差异例如作为变量存储,并将该变量输出到差异数据标识装置。差异数据标识装置4分别接收文本节点对比装置2和差异分析装置3的分析结果 并对分析结果中的差异进行标识。在本实施例中,因为对比内容Al和对比内容A2之间不 存在文本内容的差异,因而不需要要对文本内容进行差异标识。差异数据标识装置4通过 对对比内容2的元素节点<b>WOrld</b>增加标签属性为该元素节点中的文本增加特殊的 显示格式,例如在该实施例中为该元素节点中的文本增加背景色。显示装置5对经过对比并进行差异标识后的对比内容Al和对比内容A2进行显 示。该实施例的对比内容Al和对比内容A2的对比结果分别示出在图3的左右两个对比框 的第一行中。与对比内容Al相比,对比内容A2中增加了标签“<bX/b>”的元素节点中的 文本“world”在对比框中被背景色突出显示。实施例2对比内容Bl "<html><body>HTML内容对比页面之左侧</bodyX/html>,,和对比 内容 B2 "<html><body>HTML<a> 显示内容 </a> 对比页面之右侧 </bodyX/html>,,文本节点分析装置1分别对对比内容Bl和对比内容B2进行分析,获得文本节点 序列Bl{ "HTML内容对比页面之左侧”}和文本节点序列B2{ ‘‘HTML”,“显示内容”,“对比 页面之右侧” },并将所获得的文本节点序列输出至文本节点对比装置2。文本节点对比装置2接收文本节点分析装置1的输出的文本节点序列Bl和文本 节点序列B2,并对两个文本节点序列中的每个节点进行比较。通过比较可知,与文本节点 序列B 1中的文本节点相比,文本节点序列B2中的文本增加了“显示”,并将“左”修改为 “右”。文本节点对比装置2将文本节点序列Bl不同于文本节点序列B2的差异文本和差异 类型,“左”文本修改;与文本节点序列B2不同于文本节点序列Bl的差异文本和差异类型, “显示”文本增加和“右”文本修改;分别输出到差异数据标识装置。差异分析装置3对对比内容Bl中的标签和对比内容B2中的标签进行对比。通过 对比可知,相比于对比内容B1,对比内容B2对文本节点“显示内容,,增加了标签<aX/a>。 差异分析装置3将此标签差异以及标签增加的差异类型,例如作为变量,存储,并将该变量 输出到差异数据标识装置。差异数据标识装置4分别接收文本节点对比装置2和差异分析装置3的分析 结果。对于节点对比装置2的分析结果,差异数据标识装置4对对比内容B 1中的“左” 和对比内容B2中的“显示”和“右”分别增加例如〈spanX/span〉的差异标识标签并定 义标签属性。增加差异标识标签后,对比内容Bl变为“<htmlXbody>HTML内容对比页 面之〈span class =,,shanchu” > 左 </span> 侧 </bodyX/html>”,对比内容 B2 变为 "<html><body>HTML<aXspanclass =,,zengjia,,> 显示 </span> 内容 </a> 对比页面之 〈span class =,,zengjia,,> 右 </span> 侧 </bodyX/html>,,。本文中,class 属性的内容 使用了 “zengjiWshanchu,,,其中“zengjia,,与“shanchu,,只是用来标识属性的,与其是 什么字符串没有关系。对于差异分析装置3的分析结果,差异数据标识装置4通过对对比内容B2的元素节点<a>显示内容</a>增加标签属性来对文本“显示内容”增加特殊的显示 格式。例如在该实施例中为该元素节点的属性是增加背景色属性。对比内容B2被修改为 "<html><body>HTML<aclass =,,biaoqian_zengjia,,Xspan class =,,zengjia,,> 显不 </ span)内容 </a> 对比页面之 <span class =,,zengjia,,> 右 </span> 侦Ij </body></html>,,。显示装置5对经过对比并进行差异标识后的对比内容Bl和对比内容B2进行显 示。该实施例对比内容Bl和对比内容B2的对比结果分别示出在图3的左右两个对比框的 第二行中。与对比内容B2相比,对比内容Bl中的“左”被突出显示为绿色。与对比内容Bl 相比,对比内容B2中的“显示”和“右”被分别突出显示为绿色,带下划线的“显示内容”被 背景色突出显示。实施例3对比内容Cl "<html><body>ABC</body></html>"和对比内容 C2 “<html><body>XYZ</body></html>,,。文本节点分析装置1分别对对比内容1和对比内容2进行分析,获得文本节点序 列Cl{ “ABC”}和文本节点序列C2{ “XYZ”},并将文本节点序列输出至文本节点对比装置 2。文本节点对比装置2接收文本节点分析装置1的输出的文本节点序列Cl和文本 节点序列C2,并对两个文本节点序列中的每个节点进行比较。通过比较可知,与文本节点序 列Cl的文本节点相比,文本节点序列C2少了 “ABC”,多了 “XYZ”。文本节点对比装置2将 文本节点序列Cl不同于文本节点序列C2的差异和差异属性“ABC”文本删除与文本节点序 列C2不同于文本节点序列Cl的差异和差异属性“XYZ”文本增加分别输出到差异数据标识
直ο差异分析装置3对对比内容Cl中的标签和对比内容C2中的标签进行对比。通过 对比可知,对比内容1与对比内容2的标签名相同而标签内的文本内容不同,确定所述差异 类型为差异修改。差异分析装置3将此分析结果输出到差异数据标识装置。差异数据标识装置4分别接收文本节点对比装置2和差异分析装置3的分析 结果。对于节点对比装置2的分析结果,差异数据标识装置4对比内容Cl中的“ABC” 和对比内容C2中的“XYZ”分别增加例如〈spanX/span〉的差异标识标签并定义标签属 性,以便为存在差异的文本内容增加特殊的显示格式。修改后的对比内容Cl例如变为 “〈htmlXbodyXspanclass = ” shanchu” >ABC</spanX/body></html>”,对比内容 C2 例如 变为 “〈htmlXbodyXspan class =,,zengjia” >XYZ</spanX/body></html>”。由于对比 内容Cl与对比内容C2的标签名相同,并且标签内的文本差异已被标识,在本实施例中,不 对包括该标签和文本的元素节点进一步增加差异标识标签进行突出显示。显示装置5对经过对比并进行差异标识后的对比内容Cl和对比内容C2进行显 示。该实施例的对比内容Cl和对比内容C2的对比结果分别示出在图3的左右两个对比框 的第三行中,其中对比内容Cl中的“ABC”以带删除线的红色字体示出,对比内容C2中的 “XYZ ”以红色字体示出。
权利要求
一种用于对比两个HTML内容的装置,包括文本节点分析装置,用于通过循环遍历分别对两个HTML内容进行分析,得到两个文本节点序列;文本节点对比装置,用于对所述两个文本节点序列中的文本节点进行比较并得到包括差异文本和相应差异类型的文本节点比较结果;差异分析装置,用于对所述两个HTML内容中的标签进行比较并得到包括差异标签和相应差异类型的标签比较结果;差异数据标识装置,用于识别文本节点比较结果中差异文本和相应差异类型以及标签比较结果中差异标签和相应差异类型,并分别对两个HTML内容中差异文本和差异标签进行差异标识使得在显示对比结果时方便观看所述两个HTML内容的差异;显示装置,用于分别显示其中差异文本和差异标签被标识的所述两个HTML内容。
2.根据权利要求1所述的用于对比两个HTML内容的装置,其特征在于,分别对两个 HTML内容中差异文本和差异标签进行差异标识包括分别对所述差异文本增加设置有属性 的标签和改变所述差异标签的标签属性。
3.根据权利要求2所述的用于对比两个HTML内容的装置,其特征在于,通过预先定义 标签属性使得具有相同差异类型的文本以相同的突出显示格式显示。
4.根据权利要求3所述的用于对比两个HTML内容的装置,其特征在于,所述差异类型 是文本增加,文本删除,文本修改,标签增加,标签删除或标签修改。
5.根据权利要求3所述的用于对比两个HTML内容的装置,其特征在于,突出显示格式 包括改变文本的字体颜色,对文本增加背景色,对文本增加下划线和对文本增加删除线。
6.一种用于对比两个HTML内容的方法,包括通过循环遍历分别对两个HTML内容进行分析,得到两个文本节点序列;对所述两个文本节点序列中的文本节点进行比较并得到包括差异文本和相应差异类 型的文本节点比较结果;对所述两个HTML内容中的标签进行比较并得到包括差异标签和相应差异类型的标签 比较结果;识别文本节点比较结果中的差异文本和相应差异类型以及标签比较结果中差异标签 和相应差异类型,分别对两个HTML内容中的差异文本和差异标签进行差异标识使得在显 示对比结果时方便观看所述两个HTML内容的差异;在HTML页面中分别分别显示其中差异文本和差异标签被标识的所述两个HTML内容。
7.根据权利要求6所述的用于对比两个HTML内容的方法,其特征在于,分别对两个 HTML内容中差异文本和差异标签进行差异标识包括分别对所述差异文本增加设置有属性 的标签和改变所述差异标签的标签的属性。
8.根据权利要求7所述的用于对比两个HTML内容的方法,其特征在于,通过预先定义 标签属性使得具有相同差异类型的文本以相同的突出显示格式显示。
9.根据权利要求8所述的用于对比两个HTML内容的方法,其特征在于,突出显示格式 包括改变文本的字体颜色,对文本增加背景色,对文本增加下划线和对文本增加删除线。
10.一种用于对比多个HTML内容的装置,包括指定装置,用于将待对比的多个HTML内容之一指定为参考HTML内容;文本节点分析装置,用于通过循环遍历分别对该多个HTML内容进行分析,得到多个文 本节点序列;文本节点对比装置,分别将所述多个文本节点序列中所述参考HTML内容之外的其他 HTML内容的文本节点序列的文本节点与所述参考HTML内容的文本节点序列的文本节点进 行比较并得到包括差异文本和相应差异类型的文本节点比较结果;差异分析装置,将所述其他HTML内容中的标签与所述参考HTML内容中的标签进行比 较并得到包括差异标签和相应差异类型的标签比较结果;差异数据标识装置,用于识别各文本节点比较结果中差异文本和相应差异类型以及各 标签比较结果中差异标签和相应差异类型,分别对差异文本和差异标签进行差异标识使得 在显示对比结果时方便观看其他HTML内容相对于参考HTML内容的差异;显示装置,用于分别显示所述参考HTML内容和其中所述差异文本和所述差异标签被 标识的其他HTML内容。
全文摘要
本发明涉及HTML内容对比装置和方法。该装置包括文本节点分析装置,用于通过循环遍历分别对两个HTML内容进行分析,得到两个文本节点序列;文本节点对比装置,用于比较两个文本节点序列中的文本节点并得到包括差异文本和相应差异类型的文本节点比较结果;差异分析装置,用于比较两个HTML内容中的标签进行比较并得到包括差异标签和相应差异类型的标签比较结果;差异数据标识装置,用于识别文本节点比较结果中差异文本和相应差异类型以及标签比较结果中差异标签和相应差异类型,并分别对两个HTML内容中差异文本和差异标签进行差异标识使得在显示对比结果时方便观看两个HTML内容中的差异;以及用于显示比较结果的显示装置。
文档编号G06F17/30GK101916255SQ201010224000
公开日2010年12月15日 申请日期2010年7月2日 优先权日2010年7月2日
发明者梅春, 潘海东, 潘雪鹏 申请人:互动在线(北京)科技有限公司