用于检验超级文本的装置、方法和计算机程序产品的制作方法

文档序号:6419877阅读:127来源:国知局

专利名称::用于检验超级文本的装置、方法和计算机程序产品的制作方法本申请基于日本专利申请NO.2002-302585,其内容被结合在此作为参考。
背景技术
:发明领域本发明涉及检验超级文本的装置、方法和计算机程序产品,尤其涉及用于检测链接源描述的错误部分和在超级文本中链接之间的关系的装置、方法和计算机程序产品。相关技术描述近年来,许多公司、组织和公众有很多机会利用在因特网站上公开发布的计算机化的信息。在这些网站上所发布的信息大多数是超级文本信息。已公开的检验超级文本的传统技术的第一个实例是2002年10月9日在因特网URLhttp//www.elsop.com/linkscan/上查到的由ElsopTM(ElectronicSoftwarePublishingCorporation)出版的关于链接检验器“LinkscanTM”的非专利文献,它把因特网上的超级文本作为目标。提供一个工具,在因特网上自动巡视超级文本,出现错误时,在日志上作一条记录。这种链接检验器有若干类型,其中的一种链接检验器适于按照给定目标的地址对这一目标进行在线诊断,而另一类型的链接检验器适于按照给定的硬盘上的特定文件夹对该文件夹进行离线诊断。在日本的未审专利No.2001-273185中公开了检测链接物理失配的传统技术的第二个实例。用这种传统技术的方法,包括步骤把要管理的超级文本的地址存在数据库中;检验在所存储的超级文本地址中是否有一个文件;使得有可能检测在此无效链接中的物理失配。上述传统方法再进一步可以包括这样一个步骤,在系统上事先寄存一个关键字和识别数据库中每一个文件的映射。在这种传统方法中,当无效链接被检测时,有可能用一个搜索引擎找到一个已消失的网页,然后提供一个校正候选项。传统技术的第三个实例是一个用于检验一个文件典型的系统,包括一个例如微软公司生产的Micorsoftword中的自校正功能的文件校正系统。这些文件校正系统可操作来检测一种不适当的表述,如日语后缀的结束和重复的日语字符“kana”的词形变化错误,然后输出一个校正候选项要解决的第一个问题是,在上述传统技术的第一个和第二个实例中,仅能检测到物理失配的链接,而逻辑失配的链接检测不到;因为事实是,在前面的传统技术中,判断是否有失配是基于以下判断结果,即当连接到一个超级文本的地址时,是否有错误从服务器返回。检测逻辑失配的方法除了只能依靠在当前浏览器上的手动或视觉确认之外而别无选择,因为在逻辑失配的情形下没有错误出现。要解决的第二个问题是在上述传统技术的第一个和第二个实例中,不可能对逻辑失配提供一个校正候选项,只能对物理失配提供一个校正候选项,对这一问题的理由类似于上面第一个问题的理由。要解决的第三个问题是,在浏览器上靠手动或视觉的确认需要的代价巨大,原因是网站的规模大,比如一个公司有成千上万的超级文本,并且,文件之间的链接的数量也达到几万到几十万之间。从时间和代价的观点来看,要确认所有这些链接是不现实的。而且靠浏览器确认容易忽略检验一个虚位链接等。要解决的第四个问题是,尽管读者对于这样的事实,即针对同一文件的链接有不同表达的链接源描述感到困惑,但是在上述第三个传统技术中却不能检测出例如在链接源描述中的不统一的逻辑失配。造成此问题的原因是,只要链接源描述没有包括不适当的表达就可以被认为是正常的。发明概述因此,本发明的第一个目的是提供一个装置、方法和计算机程序产品,用于检验一个超级文本,其中不仅物理失配而且逻辑失配均能被检测出耒。本发明的第二个目的是提供一个装置、方法和计算机程序产品,用于检验一个超级文本,其中,它能向管理员提供针对物理失配和逻辑失配的校正候选项。本发明的第三个目的是提供一个装置、方法和计算机程序产品,用于检验一个超级文本,其中失配检验的代价大为降低。根据本发明的一个方面,提供一种用于检验超级文本的装置,以一个超级文本数据库为目标,并且能够检测至少一个逻辑失配链接的部分,包括具有在一个链接源描述和该链接目标网页上的内容之间的失配的一个部分;具有在一个链接源描述和该链接目标网页上的内容之间的失配的一个部分;该失配是由校正该链接目标网页中的信息内容所引起的;引起在具有相同链接目标网页的多个不同链接源描述当中的不统一的部分;引起在同一网页和围绕该网页的几个网页之内的多个不同链接源描述之间的格调不统一的部分;没有链接源描述的一个部分;和一个部分,其中形成一循环并且对应此链接组的一组链接中的全部链接源描述都涉及同一个主题。更具体地说,一个第一超级文本检验装置包括一个信息存储单元,能够以超级文本的形式在其中存储关于一个网页和链接的信息;和一个状态检测单元,用于参考信息存储单元,来检测逻辑失配链接的某些部分。一个第二超级文本检验装置包括一个信息存储单元,用于收集关于一个网页和链接的超级文本信息;一个信息存储单元,能够在其中存储关于该网页和链接的所说的信息;和一个状态检测单元,用于参考所说的信息存储单元,来检测逻辑失配链接的某些部分。一个第三超级文本检验装置包括该第一和第二超级文本检验装置的组成部件;以及一个候选项提供单元,用于计算涉及由所说的状态检测单元检测的所说部分的一个校正候选项。一个第四超级文本检验装置包括该第三超级文本检验装置的组成部件;以及一个重要性计算单元,用于计算并且输出由所说的状态检测单元检测的该部分的重要性值。一个第五超级文本检验装置包括该第三和第四超级文本检验装置的组成部件;以及一个校正反映单元,用于根据由所说的状态检测单元检测的该失配链接部分和由所说的校正提供单元计算的校正候选项而反映所说的超级文本。一个第六超级文本检验装置包括该第四超级文本检验装置的组成部件;和一个总记分计算单元,用于根据至少一个因素或多个因素的组合计算并且输出涉及所说的超级文本的一个总记分,该多个因素包括由所说的重要性计算单元计算的重要性值、由所说的状态检测单元检测的所说部分的数目、以及对应于总计链接数目并且由所说的状态检测单元检测的所说部分的数目的比率。一个第七超级文本检验装置包括该第一和第二超级文本检验装置的组成部件;以及一个重要性计算单元,用于输出由所说的状态检测单元检测的该部分的重要性值。一个第八超级文本检验装置包括该第七超级文本检验装置的组成部件;以及一个总记分计算单元,用于根据至少一个因素或多个因素的一个组合计算并且输出涉及所说的超级文本的一个总记分,该多个因素包括由所说的重要性计算单元计算的重要性值、由所说的状态检测单元检测所说部分的数目、以及对应于该总计链接数目和由所说的状态检测单元检测的所说部分的数目的比率。在第一、第二、第七和第八超级文本检验装置中,所说的状态检测单元可以操作来按照预定的条件而分组关于所说的链接的信息,并且检测关于被从所说的分组中排除的链接的信息。在第一、第二、第七和第八超级文本检验装置中,所说的状态检测单元可以操作来检测在该链接目标网页上的具有在一个链接源描述和内容之间的失配的部分。在此情况中,所说的状态检测单元可被操作来根据多个链接的判据记分至少之一而计算该链接的一个判据记分,该多个链接的判据记分包括(1)通过互相比较用于同一链接目标网页的多个链接的链接源描述而计算的第一判据记分;(2)通过互相比较由同一链接源描述表示的多个链接的目标网页而计算的第二判据记分;(3)通过互相比较基于针对同一链接目标网页和同一链接源描述的多个链接的链接目标网页而计算第三判据记分;和(4)通过比较该链接源描述和在该内容中的链接目标网页而计算第四判据记分,并且所说的状态检测单元被操作来检测具有一个高判据记分的部分。在第一、第二、第七和第八超级文本检验装置中,所说的状态检测单元可以操作来检测在该链接目标网页上的具有在一个链接源描述和内容之间的失配的部分,该失配是由校正在该链接目标网页中的内容引起的。在此情况中,所说的状态检测单元可被操作来根据多个链接的判据记分至少之一而计算该链接的一个判据记分,该多个链接的判据记分包括(1)通过互相比较用于同一链接目标网页的多个链接的链接源描述而计算的第一判据记分;(2)通过检测在该链接目标网页内容中的包括运动提示描述和过期提示描述的一个提示描述而计算的一个第二判据记分;和(3)通过比较在该链接目标网页的内容中描述的有效周期的描述和该当前日期和时间而计算的第三判据记分,并且所说的状态检测单元被操作来检测具有一个高判据记分的部分。在第一、第二、第七和第八超级文本检验装置中,所说的状态检测单元可以操作来检测在具有同一个链接目标网页的多个不同链接源描述当中引起不统一的一个部分。在第一、第二、第七和第八超级文本检验装置中,所说的状态检测单元可以操作来检测在同一网页和周边网页之内的多个不同链接源描述当中引起格调不统一的一个部分。在第三至第六超级文本检验装置中,所说的状态检测单元可以操作来按照一个预定的条件而分组关于所说的链接的信息,并且检测关于被从所说的分组中排除的特定链接的信息,而同时候选项提供单元可以操作来获得该校正候选项,以便把关于所说的特定链接的信息与其它正确链接统一。在第三至第六超级文本检验装置中,所说的状态检测单元可以操作来检测在该链接目标网页上的具有在一个链接源描述和内容之间的失配的部分。在此情况中,所说的状态检测单元可被操作来根据多个链接的记分至少之一而计算该链接的一个判据记分,该多个链接的记分包括(1)通过互相比较用于同一链接目标网页的多个链接的链接源描述而计算的第一判据记分;(2)通过互相比较由同一链接源描述表示的多个链接的目标网页而计算的第二判据记分;(3)通过互相比较基于针对同一链接目标网页和同一链接源描述的多个链接的链接目标网页而计算的第三记分;以及(4)通过比较该链接源描述和该内容中的链接目标网页而计算的第四记分,并且所说的状态检测单元被操作来检测具有一个高判据记分的部分,所说的候选项提供单元被操作来提供下列种类的校正候选项的至少之一,包括(1)通过互相比较针对同一链接目标网页的链接的链接源描述而计算的该链接源描述的一个校正候选项;(2)通过互相比较针对同一链接源描述的、基于多个链接的链接目标网页而计算的该链接源描述的一个校正候选项;(3)通过互相比较针对同一链接目标网页和同一链接源描述的、基于多个链接的链接目标网页而计算的该链接源描述的一个校正候选项;和(4)通过比较在该内容中的链接源描述和链接目标网页而计算的链接源描述的校正候选项;在第三至第六超级文本检验装置中,所说的状态检测单元可以操作来检测在该链接目标网页上的具有在一个链接源描述和内容之间的失配的部分,该失配是由校正在该链接目标网页中的内容引起的。在此情况中,所说的状态检测单元可被操作来根据多个链接的判据记分至少之一而计算该链接的一个判据记分,该多个链接的判据记分包括(1)通过互相比较用于同一链接目标网页的多个链接的链接源描述而计算的第一判据记分;(2)通过检测在该链接目标网页内容中的包括运动提示描述和过期提示描述的一个提示描述而计算的一个第二判据记分;和(3)通过比较在该链接目标网页的内容中描述的有效周期的描述和该当前日期和时间而计算的第三判据记分,并且所说的状态检测单元被操作来检测具有一个高判据记分的部分,所说的候选项提供单元被操作来指定下列种类的校正候选项的至少之一,包括(1)通过互相比较针对同一链接目标网页的链接的链接源描述而计算的该链接源描述的一个校正候选项;和(2)通过从具有链接目标网页的内容提取关于一个移动目的地的信息而计算的链接源描述的一个校正候选项。在该第三至第六超级文本检验装置中,所说的状态检测单元可以操作来检测在具有同一链接目标网页的多个不同链接源描述当中引起不统一的部分,通过互相比较针对同一链接目标网页的链接的链接源描述,所说的候选项提供单元被操作来计算该链接源描述的校正候选项。在该第三至第六超级文本检验装置中,所说的状态检测单元可以操作来检测在同一网页之内的多个不同链接源描述当中和围绕该网页的格调不统一的部分,并且,通过比较在包括该被检测部分和围绕这些网页的该网页之内的多个链接源描述的格调,所说的候选项提供单元被操作来计算该链接源描述的该格调的校正候选项。在第二至第六超级文本检验装置中,所说的信息收集单元可被操作来反复地收集有关该超级文本中的网页和链接的信息,以便进一步在所说的信息存储单元中多次储存关于该网页和链接的所说的信息。在此情况中,所说的状态检测单元可以操作来参考所说的信息存储单元,以便根据时间、对应于在该信息内容中的一个校正网页的目标链接的数目以及随着时间的链接源描述的种类变化而计算一个改变,以便检测其中检测有在该链接源描述和该链接目标网页的内容之间的一个不匹配的部分。在第一至第八超级文本检验装置中,所说的状态检测单元可以操作来检测没有链接源描述的一个链接。在第一至第八超级文本检验装置中,所说的状态检测单元可以操作来检测一个链接,包括不具有被描述为链接源描述的字符串以及图像的一个链接,以及具有被描述为链接源描述的一个字符串和具有难以觉察的彩色和尺寸的一个图像的链接。在第一至第八超级文本检验装置中,所说的状态检测单元可以操作来检测一个部件,其中在形成一个循环且对应本链接组的一组链接中的全部链接源描述都涉及同一个主题。在第四至第七超级文本检验装置中,所说的重要性计算单元可以操作来根据至少一个因素或多个因素的组合来计算重要性值,该因素包括(1)检测部分的出错和不相称的种类;(2)检测部分的出错和不相称的精确度;(3)包括该检测部分的网页的目标链接的数量;(4)用户对包括该检测的部分的网页接入频率的记录;和(5)在包括该检测部分的网页的超级文本中的层化水平,而所说的重要性计算单元能以操作来计算该已检测部分的重要性值,并且根据所说的重要值的等级控制针对该被检测部分的输出状态,包括输出记录的数目以及输出这记录的方法。在该第二至第八超级文本检验装置中,当该链接源描述是一个图像时,该信息收集单元可以操作来通过字符识别提取对应于该链接源描述的字符串,并且把该已提取的字符串作为该关于网页和链接的信息寄存在该信息存储单元。第一至第八超级文本检验装置可以针对一个网站上的超级文本。根据本发明方面的另一方面,提供一个第一超级文本检测方法,包括步骤(a)确定用于一个超级文本数据库的检测的状态,以便检测某些部分,这些部分包括在一个链接源描述中有错误的部分;在链接之间的关系中有错误的部分;在一个链接源描述中有不稳定性的部分;以及在链接之间的关系中有不稳定性的部分;以及(b)在一个显示屏幕上显示一个列表,该列表具有三个选项,包括(1)一个链接源描述;(2)有关一个链接源网页的标识信息;以及(3)有关一个链接目标网页的标识信息。在上述超级文本检验方法中,所说的步骤(b)可以包括显示一个按照三个选项分类列表的步骤,该三个选项包括(1)一个链接源描述;(2)有关一个链接源网页的标识信息;以及(3)有关一个链接目标网页的标识信息。上述超级文本检验方法可以进一步包括步骤(b)在一个显示屏幕上显示一个列表,该列表具有三个选项,包括(1)一个链接源描述;(2)有关一个链接源网页的标识信息;以及(3)有关一个链接目标网页的标识信息;(c)使得一个操作员在所说的显示屏幕上校正所述选项(1)、(2)和(3);以及(d)反映在所说的步骤(c)中校正的全部所说的选项,以便校正所说的超级文本数据库。上述超级文本检验方法可以进一步包括规定该作为目标的超级文本数据库的步骤。一种第二超级文本检测方法,包括步骤(a)收集关于一个网站中的网页和链接的信息;(b)参考所说的步骤(a)的结果,检测逻辑失配链接的某些部分;(c)计算以所说的步骤(b)检测的该部分的重要性值,并且计算涉及一个网站的总记分;(d)针对指定为目标的一个网站周期地执行所说的步骤(a)至(c);并且(e)通知涉及指定网站的所说的总记分中的随着时间的改变。一种第三超级文本检测方法,包括步骤(a)收集关于一个网站中的网页和链接的信息;(b)参考所说的步骤(a)的结果,检测逻辑失配链接的某些部分;(c)计算以所说的步骤(b)检测的该部分的重要性值,并且计算涉及一个网站的总记分;(d)针对指定为目标的一个网站周期地执行所说的步骤(a)至(c);并且(e)当涉及该指定网站的所说的总记分和该检测部分的所说重要性值满足一个预定的条件时提出一个警告。一种第四超级文本检测方法,包括步骤(a)收集关于一个网站中的网页和链接的信息;(b)参考所说的步骤(a)的结果,检测逻辑失配链接的某些部分;(c)计算以所说的步骤(b)检测的该部分的重要性值,并且计算涉及一个网站的总记分;(d)针对每一个被指定为目标的多个网站,周期地执行所说的步骤(a)至(c);和(e)按等级顺序输出该指定的多个网站的所说的总记分的一个排列结果。根据第一至第八超级文本检验装置,本方法包括按照特定状态分组该链接信息的步骤,并且执行对于从该组中排除的一个特定链接的检测,以便使得该状态检测单元检测该逻辑失配的链接,从而使得有可能实现本发明的第一目标。根据第三至第六超级文本检验装置,该候选项提供单元被操作来执行计算该校正候选项的处理,以使该特定链接的链接信息与大多数其它适合的链路的链接信息相一致,从而使得有可能实现本发明的第二目标。根据第一至第六超级文本检验装置,该逻辑失配由状态检测单元自动地检测。根据第三至第六超级文本检验装置,该校正候选项由该校正候选项提供单元自动地计算。在第五超级文本检验装置中,该逻辑失配部分由该校正反映单元自动地校正。因此,能够实现本发明的第三目的。附图简述当参考相关的图来考虑时,本发明和它的许多优越性将能从以下的详细描述中得到更好的理解,其中图1是根据本发明的超级文本检验装置第一个实施例的框图;图2A是指定了某些链接的一个超级文本的格式描述的文件的示意图;图2B是通过浏览器来观察一个文件的显示屏幕的示意图;图3显示了一个因链接错误导致逻辑失配的实例;图4A显示了一个因链接周期过期的导致逻辑失配的实例;图4B显示了一个因链接周期过期的导致逻辑失配的实例;图5显示了一个因链接源描述的不统一导致逻辑失配的实例;图6A显示了一个因链接源描述格调的不统一导致逻辑失配的实例;图6B显示了一个因链接源描述格调的不统一导致逻辑失配的实例;图7A显示了一个因虚位链接导致逻辑失配的实例;图7B显示了一个因虚位链接导致逻辑失配的实例;图8显示了一个因循环链接导致逻辑失配的实例;图9是存储在信息存储单元中的链接信息列表的一个实例;图10是流程图,示出根据本发明图1装置的超级文本检验装置的第一个实施例的操作;图11是根据本发明的超级文本检验装置第一个实施例的设置文件收集条件的显示屏幕的示意图,;图12是根据本发明的超级文本检验装置的第一个实施例的失配链接设置提取状态的显示屏幕的示意图,;图13是它根据本发明超级文本检验装置的第一个实施例的提取的失配链接结果列表的显示屏幕的示意图;图14是流程图,示出了根据本发明的超级文本检验装置的第一个实施例中提取错误链接的过程;图15A到15D是根据本发明超级文本检验装置的第一个实施例的链接信息表的实例,该信息在提取示于图14的错误链接的过程中按对应的步骤提取;图16是流程图,示出了根据本发明超级文本检验装置第一个实施例中的提取过期链接的过程;图17是流程图,示出了根据本发明超级文本检验装置第一个实施例中的提取链接源描述的不统一的过程;图18是根据本发明的超级文本检验装置的第一个实施例的一个链接信息表的实例,该信息来自提取示于图17的链接源描述的不统一的过程;图19是根据本发明超级文本检验装置的第一个实施例流程图,示出了提取链接源网页格调不一致性的过程;图20是根据本发明超级文本检验装置的第一个实施例的一个链接信息表的实例,该信息来自提取示于图19的链接源网页格调的不一致性的过程;图21示出了在本发明超级文本检验装置第一个实施例中提取虚位链接的过程的流程图;图22示出在本发明超级文本检验装置第一个实施例中提取循环链接的过程的流程图;图23示出了在本发明超级文本检验装置第一个实施例中提取链接信息随时间而变的链接的过程的流程图;图24是根据本发明超级文本检验装置的第一个实施例的一个链接信息表的实例,该信息在提取示于图23的随时间而变的链接的链接信息过程中提取的;图25是根据本发明的超级文本检验装置的第二个优选实施例的框图;图26示出了图25的本发明超级文本检验装置第二个优选实施例的操作过程流程图;图27是本发明超级文本检验装置第二个优选实施例中的表格的显示屏幕的示意图,其中示出所提取的失配链接的结果;图28是本发明超级文本检验装置第三个优选实施例的框图;图29是图28的本发明超级文本检验装置第三个优选实施例的操作过程流程图;图30是根据本发明超级文本检验装置的第三个优选实施例的一个总记分数随时间而变的曲线的显示屏幕的示意图,;图31是本发明超级文本检验装置第三优选实施例中的按总记分排序网站的一个柱状图的显示屏幕的示意图;图32是构成本发明超级文本检验程序系统中的第四、第五和第六个优选实施例的框图;优选实施例描述超级文本表示的是用超级链接或链接构成的一组文件,并且包括有提供在文件之间链接的一个结构。www是以HTML(HyperTextMarkupLanguage)格式描述的一种超级文本的集合,如示于图2A的文件。链接和锚点字符串用标记<A>作标志。示于图2A的文件101有多个标记<A>的href属性,指示文件102、103和104的识别信息。文件的识别信息一般认为是在www中的“一个URL”或“网址”,但在本发明中,仅将其简单的视为一个地址“一个地址”。在标记<A>之间插入的字符串“Gx0011”,“Gx0012”和“Gx0013”一般认为是“锚点字符串”。因为图像文件常插入在标记<A>之间,在本发明中,图像也象插在标记<A>之间的字符串那样被认为是“链接源描述”,并且作同样的处理。在文件101中所描述的标记<A>的属性示于图2A,它不仅有href属性,还有目标属性,格调属性或类似的属性。目标属性起这样的作用,即规定以何种窗口显示一个链接目标或一个链接目的地的文件。格调属性起到规定字体的大小和颜色的作用,或以突出显示方式来显示一个链接的链接源描述。当用浏览器观察示于图2A的文件101时,文件101可以显示在示于图2B的显示屏幕上。对文件101来说,文件102、103和104分别具有链接201、202和203,并且分别具有链接源描述“Gx0011”,“Gx0012”和“Gx0013”。当点击在文件101中的链接源描述“Gx0011”时,可通过链接201接入文件102。类似地,当分别被点文件101中的链接源描述“Gx0012”和“Gx0013”时,可分别通过链接202和203接入文件103和104。虽然在上面www已被解释为超级文本的典型实例,但本发明并不局限于仅以www为目标。超级文本可用任何语言描述,不仅包括HTML,而且包括诸如XML(ExtensibleMarkupLanguage)、SGML(StandardGeneralizedMarkupLanguage)等。在本发明中,为避免对术语“用户”的混淆,当一个人接入一个公司、组织或个人的网站去浏览超级文本时,被认为是一个“读者”,而利用本发明去管理超级文本的人,则被认为是一个“管理员”。然而,当因特网上发布的信息量增加时,超级文本的管理变得复杂而困难。因此,失配链接的比率增加了,如链接不适合于链接源描述,或在链接目标时的链接失配等。失配链接大体上可分为两类,包括物理失配和逻辑失配。物理失配意味着物理上不可能实现的对链接目标的接入,例如链接目标的文本不存在,链接目标的服务器关闭等。当具有这些物理失配的文件被接入时,服务器或客户端会答复一个出错的短信。在逻辑失配的情形中,对链接目标的接入可以是物理上可能的,但在网页的链接中形成了一个逻辑错误,比如错误的产品信息,或过期的活动信息。当包含逻失配部分的文件被接入时,服务器并不答复任何出错信息,只要链接目标的文本存在,链接目标的服务器就操作在正常状态。然而,读者有时会因一个链接错误而感到困惑,管理员同样有时也因对听众提交的对于过期活动的申请的响应而烦恼。因此逻辑失配的影响不亚于物理失配的影响。有一些逻辑失配的实例,包括但不局限于(1)置一个链接到一个错误的目的地,(2)置一个链接到一个过期的信息。(3)在链接描述中的不统一,(4)链接源描述格调的不统一,(5)虚位链接,(6)循环链接等。每一逻辑失配的实例在下面详细描述并参照有关的图。(1)置一个链接到一个错误的目的地如图3所示,“置一个链接到一个错误的目的地”意味着耒自链接源描述的预期的内容与链接目标文本的实际内容之间的失配。在图3中,链接211、212、213和214的链接源描述全是一样的,都以“Gx0011”描述。文件111、112和113的链接目标都指向同一个文件116,它是“Gx0011”的产品介绍的表示,但文件114的链接目标指向错误的文件117,它是“Gx0012”的产品介绍的表示。因此,当读者浏览文件111、112和113时,他能接入文件116而得到“Gx0011”的介绍信息,但是如期望的那样,当读者浏览错误的文件114时与预期的相反,他不能接入文件116。读者浏览文件114看到另一个错误的产品介绍,它不同于链接源描述“Gx0011”所预期的信息,这将使读者感到混乱。而且,链接211、212、213和215的目的地全是指向同一文件116,但只有链接215的链接源描述被错误地描述为“Gx0012”。因此,读者浏览文件115看到另一个产品介绍,它不同于链接源描述“Gx0012”所预期的那个信息,这将使读者感到混乱。而且,文件115有两个链接215和216,它分别置于文件116和117。然而,链接215和216都有同样的链接源描述“Gx0012”。因此,读者浏览文件115会发现文件116和117的不同的内容,尽管事实上读者选择了同样的链接源描述”Gx0012”。在本实施例中,把链接置于如上所述的错误目的地的实例,包括对产品信息的链接错误,但不限于此,还可进一步包括置链接于一个英语文件和一个日语文件之间的错误,链接到一个完全不相关的网页的链接错误等。(2)置链接到一个过期的信息如图4所示,“置链接到一个过期的信息“意味着一个失配,起因于对过期活动的保持。图4A显示2002年8月15日的一组文件,而图4B显示2002年9月15日的一组文件。在图4A中,在文件125中宣布,一项要进行的活动的时间限制在2002年7月20日和2002年8月31目之间。文件121、122、123和124有同样的链接源描述“免入场费”,用于把链接221、222、223和224分别置到具有这项活动的内容的文件125。同时,图4B中宣布,在文件125中,因为活动是过期的状态,所以活动已结束。因此,在文件122、122和123中,对文件125的活动内容的链接已被清除。然而,在文件124中,对该已过期的活动的文件125的内容的链接并未清除,所以,链接224到文件125和链接源描述“免入场费”仍然存在。因此与其预期相反,读者浏览文件124不能得到示于链接源描述的“免入场费“的服务。在该实施例中,上述置链接到一个过期的信息的实例包括对过期的活动的链接,但不限于此,并且,还进一步包括起因于以下情况的失配,即从一个原始地址传送一个初始文件到另外一个地址,并在原始地址用另一个文件替换该初始文件。更进一步,原始周期可以是无限的。在本实施例中,对过期的信息的链接可以进一步包括因放弃对链接目标的服务或因故关闭网站而导致的失配。然而,这种情形,当文件由于到期而清除是包括在物理失配中的,因为接入该文件时会出现错误。已过期的链接可被认为是一种错误链接,但在本发明中,对已过期的链接源描述的链接被专门区别于“错误链接”,而规定为“过期的链接”。(3)链接源描述的不统一如图5所示,链接源描述的不统一意味着在由因不统一的链接源描述而引起的波动时的失配。在图5中,文件131,132,133和134置链接231、232、233和234到文件135。除了链接234的链接源描述是“gx系列”之外链接231、232和233的链接源描述都是同样的描述“GX系列”。因此浏览文件134的读者将误解该链接源描述“gx系列”不同于“GX系列”的锚述,并随即跟随链接234。如上所述,在本实施例中的链接源描述中不统一包括在链接源描述中在大写字母与小写字母之间的波动,但不局限于此。还包括在英语和一个日语字符“katakana”的描述之间的波动;不同的“katakana”描述间的波动,如“vaiorin”和“baiorin”,两者对应于英语”violin”;在“katakana”和另一类日语字符描述”hiragana”间的波动;模糊的和类似模糊的表述间的波动,如“事件信息”和“研讨会信息”;以及拼写错误如“Series”和“Selies”。(4)链接源描述格调的不统一如图6所示,链接源描述格调的不统一意味着在点击一个链接按钮时,链接的不同视图或不同效应的失配,例如,由于不同的格调或目标属性。在图6A中,文件141有4个链接241、242、243和244,其中3个的目标属性规定为“_blank”,以便打开一个弹出窗口显示链接目标的网页。因此,读者浏览示于图6B中的文件141,一旦打开显示在屏幕上的文件141时,就会一个接一个的看到链接241、242、和243的链接目标,即文件142、143和144。,链接目标的网页显示在弹出窗口上,非常便于浏览链接的集合,其中,当读者浏览链接集合中的原始文件时,他会一个接一个的看到不同链接目标的某些文件。同时,对链接244没有规定目标属性,在点击链接按钮时,导致文件翻转。因为在点击链接244时文件翻转,读者应寻找一个链接返回原文件141,或者用浏览器上的返回按钮。在本实例中,链接源描述格调的不统一的实例已如所说的,包括文件中目标属性的不统一,但不限于此,并且还可进一步包括下列情形的失配,即某些链接的不同颜色,某些链接不同的突出显示表示法,皆因格调属性不统一。(5)虚位链接如图7所示,虚位链接意味着下列情形的失配,在那里,读者浏览一个文件,但在文件中找不到有关的链接,尽管事实上,该文件的链接是用HTML方式进行描述的。在图7A中的标记<A>用于规定链接目标为“HIDDEN-URL”,它插在一个字符串如标题指示“GX系列的库存状态”,和一个表格的<table>标记指示之间。然而,没有字符串或图像插在这些标记<A>之间。因此,当文件151用浏览器浏览时,读者不可能注意到有一个链接插入到标题和表格之间,如图7B所示。很容易用蠕动器(crawler)去搜索和跟随这样的链接,但对管理员来说,要发现这些链接是困难的。假设链接目标“HIDDEN-URL”是一个保密文件的指示,如一个用户列表,存在保密文件中的信息容易用蠕动器取得,而有引起麻烦的危险,即人们不能发觉这种泄密现象。在本实施例中,所说的虚位链接包括无链接源描述,但不限于此,还可进一步包括下列情形的失配,即其中难于通过浏览器用视觉识别链接。因为事实上该链接源描述被描述为一个透明的图像,相当小,几乎是最小的图像和字符,或者是与背景具有同样颜色的图像或字符。即便是有可能从视觉上看到链接源描述,也不可能把链接和主体文本区别开来,因为链接源描述的链接格调和主体文本的格调是一样的,也没有突出显示表示法。所以,这种情形包括在虚位链接中,因为是在浏览器的显示屏幕上,所以链接不可能用视觉加以确认。(6)循环链接如图8所示,循环链接意味着下列情形的失配,其中的读者跟随一个又一个链接寻找确定的信息,但最后回到了原来的网页。在图8中,文件161有一个链接261到文件162,它有链接源描述“关于当前的信息”。进一步,文件162有一个链接262到文件163,它有链接源描述“数字摄象机现状”。更进一步,文件163有一个链接262到文件161,它有链接源描述“点击此处到当前状态”。当读者浏览文件161时,他可能对文件161中的句子“关于当前的信息”感兴趣,读者就跟随链接261。然而,读者会发现,在文件162中,也有链接262,它有链接源描述”“数字摄象机现状”。因此,读者会期待更多的关于当前的信息将紧随下一次链接而出现,然后就接入文件163。然而,文件163也有一个链接源描述“点击此处到当前状态”。因此,读者想要茯得所期望的信息而跟随链接263。最后,链接263回到了原来的文件161。读者会感到困惑其在何处才能找到正确的信息。这样的循环链接导致一个问题是,读者漫游了许多文件而得不到任何想要的信息。第一最佳实施例参考图1,其中示出根据本发明的超级文本检验装置的第一最佳实施例。参考图1,根据本发明第一实施例的超级文本检验装置包括在程序控制之下操作的数据处理单元1,能够储存信息的存储装置2,例如一个键盘的输入单元3、以及例如一个显示单元、打印机的输出装置4等。数据处理单元1包括信息收集单元11、候选项提供单元12、状态检测单元13和校正反映单元14。存储装置2包括超级文本数据库21和信息存储单元22。信息收集单元11的设计是用于从包括在存储装置2中的超级文本数据库21取得文件,以便恢复链接信息并且把该链接信息存储在信息存储单元22中。在本实施例中,链接信息可以包括某些项,例如链接源网页的地址、链接目标网页的地址、链接源描述、目标属性、格调属性等等。除了链接信息之外,信息存储单元22上可以记录文档的主体、更新日期、收集的日期和时间以及文档获得之时的状态,例如一个出错或成功状态。状态检测单元13被用于根据链接信息分组存储在信息存储单元22中的链接,并且从信息存储单元22提取分组在作为失配链接的同一组中的链接当中的一个特定链接。候选提供单元12被设计用于提供一个校正候选项,该候选项对应于该状态检测单元13提取的作为失配链接的该链接。在本实施例中,该校正候选项包括的信息是关于该失配链接的链接信息哪些选项应该被校正,以及应该如何校正。该候选提供单元12把该校正的候选项输出到校正反映单元14。校正反映单元14被设计用于使得管理员确认该输出端的失配链接和该校正候选项,以便把该确认结果反映到该超级文本数据库21。该超级文本数据库21能够在其中存储包括在将要被检查的目标位置中的一组超级文本。本地存储装置2不需要包括完整的超级文本数据库21,并且超级文本数据库21的某些部分可以在一个网络当中分配,象一组超级文本在互联网络当中分配那样。信息存储单元22能够在其中存储关于包括在该超级文本数据库21中的每一文件中的一个信息。图9示出该链接信息的一个实例。例如,包括在该图2A和2B所示的文件101中的链接信息在图9中示出。从图9中理解到,该文件101具有通过链接源描述″GX0011″链接到文件102的一个链接201;由″_blank″指定的一个目标属性;以及由″st01″指定的一个格调属性。虽然在本实施例中的该链接源描述被描述为一种文本格式,但是当链接源描述被指定为一个图像时,该链接源描述可以由该指定的图像文件的地址所指定。而且,其中可以提供一种字符识别模块。可以对于该图像文件执行该字符识别模块,以便提取嵌入在该图像中的一个文本并且把提取的文本存储在该信息存储单元22中。下面将参考图1以及图9到13描述本第一实施例的超级文本检验装置的操作。首先,该信息收集单元11根据由输入单元3输入的收集状态设置来操作而从超级文本数据库21读出该文件(图10中的步骤S1)。在本实施例中,当该超级文本数据库21是WWW(万维网)时,可以通过HTTP(超文本传送协议)访问该文件。通常,这种功能已经由网页浏览器实现,例如由IE(微软公司生产的互联网浏览器)或所谓的爬虫或蜘蛛的自动类型的网页搜索引擎实现。图11示出当该超级文本数据库21是WWW时的用于该收集的设置显示屏幕。如图11所示,此显示屏幕的设计将允许用户规定用于一个分析目标的网站的域名;针对将要收集的文件的目标页数;目标文件的一个文件扩展;对该服务器接入的一个时间间隔;收集中针对故障的重试次数;针对该收集的超时持续时间;当通过随后的链接循环收集该信息时该循环的分层结构的深度。在图11中,该显示屏幕进一步包括一个被操作来启始该超级文本的收集的一个执行按钮。随后,由信息收集单元11分析收集文件的HTML描述,以便提取如图9所示的链接信息,然后存储在信息存储单元22中(图10中的步骤S2)。随后,状态检测单元13根据由输入单元3输入的提取状态来操作,从信息存储单元22提取满足该提取状态的链接作为失配的链接(图10中的步骤S3)。图12示出用于该提取状态的一个设置显示屏幕。如图12所示,该显示屏幕的设计将使得用户说明失配链接的类型,例如将要被提取的一种失效链接,即一个物理失配的链接、错误链接、过期信息的链接、链接源描述中的不统一、链接源描述的格调中的不统一、虚位链接和循环链接。当该针对一个具体地址的链接已经被证明是失配链接时,此地址可被输入到如图12所示的一个特定URL栏中,使得包括具有该输入地址的该链接目标的链接也可以被提取。当提取太多的失配链接时,能够通过限制将要显示在一个显示屏幕上的记录的数量来规定失配链接的记录数目。还提供了一个执行按钮使得用户发出指令,开始该失配链接的提取。能够通过上述的常规方法来实现在某类型失配链接中的失效链接的提取,从而省略在本实施例中的描述。提取具有针对链接源的一个特定URL的连接的方法对本领域技术人员来说是显而易见的,因此在本实施例中也省略其描述。下面将描述提取其余逻辑失配链接的方法。候选项提供单元12随后操作来提供一个校正候选项,以便消除因为状态检测单元13的失配链接而提取的链接中的失配(图10中的步骤S4),并且在一种显示屏幕上输出一个结果列表(图10中的步骤S5)。图13示出提取的失配链接结果的列表显示屏幕的一个实例。该结果列表具有多项,例如失配链接的类型、校正候选项、链接ID、链接源、链接目标、链接源描述、目标属性和格调属性。如图13所示,该链接被分成几个组,使得具有相同的″链接目标″以及″链接源描述″的链接被分在同一个组中。分组的链接被分别给予失配链接的类型和校正候选项,然后显示在该显示屏幕上。当点击链接源地址或链接目标地址时,可以访问对应的文件。由该系统输出校正候选项被显示在″校正候选项″的栏中。″校正候选项″的栏具有由冒号″″分开的两个部分,一个部分包括将要被校正的链接信息的项,而另一部分包括关于如何校正的信息。例如,表示形式″链接删除″意味着该链接应该删除。表示形式″链接源描述″新内容″″意味着该链接源描述应该改变到″新内容″。在确认以后,此校正候选项可以由管理员重写。管理员能因此确认在该列表上输出的失配的链接和该校正候选项(图10中的步骤S6)。参考图13,具有相同链接目标和链接源描述的链接被分组。因此,一旦该管理员确认每一个失配链接的典型实例,该管理员不需要确认该链接的全部。例如,从图13所示结果列表中理解到具有链接ID271到274的全部链接都具有文件175的相同的链接目标指示、相同的链接源描述指示″o×运动目前进行中″、针对过期信息的链接的失配链接指示的类型、以及″链接删除″的校正候选项指示。因此不言而喻的是链接ID271至274的所有的链接都将被删除。全部管理员都必须访问该文件171,确认该失配链接的有效性以及该链接271的校正候选项。该管理员不必确认全部其余链接272至274。因此,有可能削减该确认的费用。当有多个校正候选项时,该管理员可以提供有多个校正候选项,例如图13中通过″OR″分段的″链接目标文件177OR链接源描述产品B″。在此情况中,管理员可以根据该确认的结果所选一种必要的校正候选项。当该管理员根据该确认的结果断定该校正候选项是错误的时候,该管理员可以校正此错误。例如,链接278和279的校正候选项是图13中的″链接源描述新内容″的指示。如果管理员认为该链接目标地址将改变到该文件180是合理的,则该校正候选项可以被更改为″链接目标文件180″。当管理员断定该校正不应实行时,则校正候选项的栏可以被消隐,从而使得有可能以下列步骤取消该校正。当该管理员操作图13所示的″反映校正″的按钮时,该校正反映单元14被操作来根据由该管理员确认的校正候选项而校正超级文本数据库21中的每一个文件(图10中的步骤S7)。当在此级有多个校正候选项仍然由″或″彼此关连时,仅可以反映该第一个校正候选项。如图13所示,该结果列表的显示屏幕进一步包括在该链接源的选项的链接″种类″、链接目标以及链接源描述。通过使用每一选项作为该分类关键字,这些链接被采用来分类提取的结果的记录。例如,响应该选项″链接源″的″种类″的一个点击,该提取结果的记录可以按照该链接源文件分类。因此,有可能控制失配链接出现的每一个类型的趋向,为此,其用手校正该失配链接是有用的。响应该选项″链接目标″的″分类″的链接的点击,提取结果的记录能够按照该链接目标文件来分类。因此,有可能控制在一个特定文件中发生失配链接的情形,为此能够调查引起对一个重要文献,例如对随接入而被充满一个文件的失配的链接。响应该选项″链接源描述″的″分类″的链接的点击,提取结果的记录能够按照该″链接源描述″来分类。因此,有可能控制引起失配的该链接源描述的每一类型的趋向,为此能够调查针对该链接源描述的表达的适用性。虽然在本实施例中描述了该管理员校正该链接源描述、链接目标等等,描述了显示在图13中的结果列表的显示屏幕上显示的″校正候选项″的栏,但是并不局限于该实施例。该管理员可以直接重写在该栏中的记录,例如在该显示屏幕上″链接源″、″链接目标″和″链接源描述″。而且,虽然在本实施例中描述了用于该超级文本的收集设置的显示屏幕以及用于该提取状态设置的显示屏幕是分别提供的,但是在另一个实施例中,可以在开始该分析之时提供用于针对超级文本的收集的设置和针对提取状态的设置的单独显示。在此情况中,图10所示的步骤S1到S5可以自动地执行。本发明并不局限于上述实施例描述的情况。此外,虽然在本实施例中的描述中虽然在步骤S6中该管理员确认该输出的失配链接和校正候选项,但是在另一个实施例中可以省略该步骤S6而自动地执行步骤S1到S7的其余步骤。本发明并不局限于上述实施例描述的情况。而且,虽然在本实施例中描述了该管理员决定开始该分析的定时,但是并不局限于该实施例。在另一个实施例中,可以提供一个具有下列步骤的方法预先设置该收集和提取状态;以固定的间隔自动地执行步骤S1到S5;并且通过一个电子邮件等提示该管理员该获得的结果。本发明并不局限于上述实施例描述的情况。错误链接检测的实施例参照图3、14和15A到15D详细描述状态检测单元13和候选项提供单元12的操作。在本实施例中,信息存储单元22能够存储关于图3示出的文件组的链接信息。首先,状态检测单元13的操作从该信息存储单元22读出链接信息,以便根据该链接信息把该链接划分为一些分组。状态检测单元13把具有相同链接源描述的链接划分在同一个组中。随后,状态检测单元13把划分在同一个组中的具有相同链接目标的链接进一步划分在同一个子组中。随后,该状态检测单元13提取具有不同链接目标的链接。状态检测单元13进一步操作来根据包括在该子组中的链接的数量把一个判据记分给到每一个链接(图14中的步骤T11)。图15A示出步骤T11中给出的该提取的链接和判据记分的一个实例。从图15A能够理解到,链接211、212、213和214是按照具有一个相同的链接源描述″GX0011″而被分组的,同时链接215和216是按照具有一个相同的链接源描述″GX0012″而被分组的。在具有链接源描述″GX0011″的分组中的三个链接211、212和213被进一步细分组为具有同一个链接目标″文件116″的链接的子组,而链接链接214被分组到具有链接目标″文件117″的一个子组。在具有链接源描述″GX0012″中的链接215被分组到具有链接目标″文件116″的一个子组中,同时链接216被分组到具有链接目标″文件117″的一个子组中。给出判据记分的方法包括下列步骤把用于每一个组的判据记分设置为″1″;把用于每一个子组的判据记分设置为一个值,该值是通过把该判据记分分配到在该子组中的链接数的反比数而获得的一个值,并且把用于每一个链接的判据记分设置到一个值,该值是通过把每一个子组的判据记分相等地划分到该子组中的链接数而获得的一个值。例如,如图15A所示,该链接源描述″GX0011″的组被给予判据记分″1″。当该判据记分被分配成在该子组中的链接数的反比数时,该链接目标地址″文件116″的子组被给予判据记分″1/4″,而该链接目标地址″文件117″的子组被给予判据记分″3/4″。该子组的判据记分″1/4″被相等地划分到三个链接211、212和213中,从而给出用于链接211、212和213的每一个的判据记分为″1/12″。类似地,给予链接215和216的每一个的判据记分为″1/2″在图14的随后的步骤T12中,该状态检测单元13被操作来从信息存储单元22读出该链接信息,以便根据该链接信息把该链接划分成一些分组。状态检测单元13把具有相同链接目标的链接划分在同一个组中。随后,状态检测单元13把划分在同一个组中的具有相同链接源描述的链接进一步划在同一个子组中。随后,该状态检测单元13提取具有不同链接源描述的链接。状态检测单元13进一步操作来根据包括在该子组中的链接的数量把一个判据记分给到每一个链接。图15B示出一个提取的链接和在步骤T12中给出的判据记分的实例。从图15B能够理解到,链接211、212、213和215是按照具有一个相同的链接目标″文件116″而被分组的,同时链接214和216是按照具有一个相同的链接目标″文件117″而被分组的。在具有链接目标″文件116″的分组中的三个链接211、212和213被进一步细分组为具有同一个链接源描述″GX0011″的链接子组,而链接链接215被分组到具有链接源描述″GX0012″的一个子组。在具有链接目标″文件117″中的链接214被分组到具有链接源描述″GX0011″的一个子组中,同时链接216被分组到具有链接源描述″GX0012″的一个子组中。给出该判据记分的方法与步骤T11的方法相同。因此,在步骤T12中,链接211、212和213的每一个的判据记分变成″1/12″,链接215的判据记分变成″3/4″,而214和216的每一个的判据记分变成″1/2″。在图14的随后的步骤T13中,该状态检测单元13被操作来从信息存储单元22读出该链接信息,以便根据该链接信息把该链接划分成一些分组。状态检测单元13把具有相同链接源和链接源描述的链接划分在同一个组中。随后,状态检测单元13把划分在同一个组中的具有相同链接目标的链接进一步划在同一个子组中。随后,该状态检测单元13提取具有不同链接目标的链接。状态检测单元13进一步操作来根据包括在该子组中的链接的数量把一个判据记分给到每一个链接。图15C示出一个提取的链接和在步骤T13中给出的判据记分的实例。从图15C能够理解到,链接215和216被分组在同一个组中,作为具有相同的链接源″文件115″和链接源描述″GX0012″的链接。链接215被进一步分组为具有链接目标″文件116″的一个子组,同时该链接216被分组为具有链接目标″文件117″的一个子组。给出该判据记分的方法也与步骤T11的方法相同。因此,在步骤T13中,链接215和216的判据记分是″1/2″。在图14的随后步骤T14中,状态检测单元13根据该链接信息而操作,从信息存储单元22读出链接信息,以便提取包括有不在该标题中的单词的链接源描述的链接、该链接目标文件中的标题或高亮度字符串。该状态检测单元13把该判据记分″1″给到每一个提取的链接。图15D示出一个提取的链接和在步骤T14中给出的判据记分的实例。从图3能够理解到,就图15D示出的链接214和215而言,包括在该链接源描述中的单词不被表示在该链接目标文件中。在随后的步骤T15中,状态检测单元13被操作来取和每一个链接的判据记分。因此,链接211、212和213每一个的判据记分变成通过等式″1/12+1/12=1/6″而获得的″1/6″。链接214的判据记分变成通过等式″3/4+1/2+1=9/4″而获得的″9/4″。链接215的判据记分变成通过等式″1/2+3/4+1/2+1=9/4″而获得的″11/4″。链接216的判据记分变成通过等式″1/2+1/2+1/2=3/2″而获得的″3/2″。在图14中的随后步骤T16中,状态检测单元13被操作来把子组的判据记分的取和互相比较,并且随即提取具有较高的判据记分的链接作为一个失配链接。候选项提供单元12被操作来提供在每一状态下的用于提取链接的该校正候选项,以便协调在同一组中的关于具有高记分的链接与具有低记分的链接的链接信息。如图15A所示,在链接源描述″GX0011″的组中,包括链接211、212和213的子组的判据记分的取和变成由等式″1/6+1/6+1/6=1/2″而获得的″1/2″,而包括链接214的子组的判据记分的取和变成″9/4″。因此,具有高判据记分的链接214被确定为在此情况中的失配的链接。为了协调关于该链接214与包括该链接211、212和213的子组的链接信息,可以理解用于该链接214的校正候选项被适当地获得为″链接目标文件116″。而且,在图15A中的该链接源描述″GX0012″的组中,包括链接215的子组的判据记分的取和变成″11/4″,而包括链接216的子组的判据记分的取和变成″3/2″。因此,该链接215被确定为在此情况中的失配的链接。为了协调关于该链接215与包括该链接216的子组的链接信息,可以理解用于该链接215的校正候选项被适当地获得为″链接目标文件117″。出于同样原因,在图15B中,链接215被决定为失配的链接,由此该校正候选项被确定为″链接源描述GX0012″。出于同样原因,在图15C中,链接215被决定为失配的链接,由此该校正候选项被确定为″链接目标文件117″。从上述结果理解到,该失配的链接是链接214和215,链接214和215的校正候选项分别是″链接目标文件116″OR″链接源描述″GX0012″,和″链接目标文件117″OR″链接源描述″GX0011″。虽然在本实施例中描述了具有该判据记分的高取和的链接被确定为失配的链接,但是并不局限于该实例。在另一个实施例中,提供的确定该失配的链接的一个方法具有下列步骤设置用于该判据记分的一个预定门限值;以及,即使该判据记分高于其它的判据记分,也仅当该判据记分高于该阈值时才把该链接确定为失配的链接。本发明并不局限于如上所述实施例描述的情况。而且,虽然在本实施例中描述了例如根据每一个子组中的链接数目计算该判据记分,但是并不局限于该实例。该判据记分可以简单地是提取的数目。另一个实施例中,可以提供的计算该判据记分的一个方法具有下列步骤按照在该子组中的链接数目规定该链接的一个特征向量;准备该失配的链接的一个特征向量作为一个指教数据;以及计算该链接的特征向量和该失配的特征向量之间的距离的一个平均数,以便获得该判据记分。本发明并不局限于上述实施例描述的情况。而且,虽然在本实施例中描述了该出错链接的提取状态是通过取和包括下列判据记分而计算(1)通过互相比较用于同一链接目标网页的多个链接的链接源描述而计算第一判据记分;(2)通过互相比较由同一链接源描述表示的多个链接的目标网页而计算第二判据记分;(3)通过互相比较基于针对同一链接源网页和同一链接源描述的多个链接的链接目标网页而计算第三判据记分;以及(4)通过比较该链接源描述和该内容中的链接目标网页而计算第四判据记分,但是并不局限于该实例。在另一个实施例中,可以根据至少一个上述判据记分、或根据基于每一个状态的加权的判据记分来计算该判据记分。本发明并不局限于上述实施例的方法。过期链接的检测的实施例下面参照图4和图16详细描述在过期链接的检测中的状态检测单元13和候选项提供单元12的操作。首先,状态检测单元13被操作来提取在该链接源描述中包括日期表达或包括日期表达的指示文件的链接。随后,状态检测单元13被操作来计算与该提取的链接相关的该日期表达的截止日期,并且判断该当前日期和时间是否在该截止日期之前(图16中的步骤T21)。在图16的随后步骤T22中,状态检测单元13被工作来从相关该提取的链接的链接目标文件提取该过期的表达。在本实施例中,该过期表达意味着在服务被终止、关闭或移动之时更多是通常用于一个提示语句的一个表达,例如″关闭″,″移动″,″结束″,″几秒之后自动跳跃″,″在[日期]中有效″,″我们欣赏你过去的光顾″,″我们欣赏你过去的参与″等等。除上面的过期表达之外,如果HTML中的描述被指示该文件在几秒钟之后能够被自动跳跃,则此文件将被提取作为该过期表达。在图16中的步骤T23之后,通过综合在步骤T21中的判断该当前日期和时间是否包括在截止日期内的判断结果以及步骤T22中提取的过期表达的数字,状态检测单元13被工作来计算该链接的判据记分。当此判据记分高于或等于一个预定门限值时,具有该判据记分的链接被输出作为该失配的链接。可以提供一个计算该链接的判据记分的方法实例,包括把作为过期日期获得的日期数字与提取的过期表达的状态数字相乘的步骤。另一实施例中,可能提供一种包括下列步骤的计算判据记分的方法根据作为该过期日期获得的日期数字和提取的过期表达的状态数字而指定一个该链接的特征向量;计算在该链接的指定的特征向量和作为指教数据准备的该失配链接的特征向量之间的距离的平均值;并且把该平均值设置为判据记分。本发明并不局限于上述实施例描述的情况。在随后步骤T24中,候选项提供单元12被操作来从该链接目标文件提取用于作为该失配的链接输出的该链接的移动的新地址,以便把该新地址规定为该校正候选项。在本实施例中,该新地址意味着该文件能够根据该HTML而自动地跳至的一个地址。不是该文件的自动跳跃,而是可以提取该表达″在此点击″或″移到下一个URL″。随后,包括在该表达中或写入该表达的外围的一个链接的目标地址可被指定为作为新地址的校正候选项。另一方面,当不能提取该新地址时,该校正候选项可被输出作为″链接删除″。下面参照图4A描述该状态检测单元13和候选项提供单元12的操作实例。其中使用如上所述的一个计算该链接的判据记分的方法,包括把作为过期日期获得的日期数字与提取的过期表达的状态数字相乘的步骤。同样参考图16的步骤T21,当文件125包括例如″2002年7月20日至2002年8月31日″的日期表达时,该状态检测单元13被操作来提取该链接211、222、223和224。假设当前日期是2002年8月15日,则该状态检测单元13断定该当前日期先于该文件125的到期日,从而断定该链接211、222、223和224没有过期。在图16的随后步骤T22中,因为文件125不包括过期表达,则不提取任何数据。利用步骤T21中获得的该当前日期先于该到期日的该结果、以及步骤T22中获得的没有提取到表示该过期日的表达的该结果,作为提取的过期表达的该过期日和状态数的两个日期数都被计算为″0″。因此,链接211、212、223和224每一个的判据记分变成通过等式″0×0=0″获得的″0″。因此,判定全部链接221、222、223和224都是适当的,即适合于图16的下一个步骤T23。下面参照图4B描述该状态检测单元13和候选项提供单元12的操作的另一实例。同样参考图16的步骤T21,当文件125包括例如″2002年7月20日至2002年8月31日″的日期表达时,该状态检测单元13被操作来提取该链接211。假设该当前日期是2002年9月15日,则该状态检测单元13断定该当前日期超过了文件125的到期日,从而判断该链接244过期。在图16的随后步骤T22中,状态检测单元13被操作来提取例如″关闭″的过期表达。利用步骤T21中获得的该当前日期超过到期日的该结果、以及步骤T22中获得的提取了例如″关闭″的过期表达的该结果,作为过期日获得的日期数被计算为″15″,并且该提取的过期表达的状态数被计算为″1″。实现的事实是该链接224的判据记分通过一个等式″15×15=15″获得为″15″。因此,当阈值被设置为″10″时,判定该链接224是失配的链接。在图16的随后步骤T24中,该候选项提供单元12被操作来提取该新地址。但是,因为图4B所示的文件125不包括对应的地址,则该候选项提供单元12不能获得该新地址。因此,候选项提供单元12输出该″链接删除″作为链接224的校正候选项。虽然在本实施例的描述中通过日期表达和到期表达检测了该过期的链接,但是本发明不局限于该方法。例如,类似于如上所述的出错链接的检测的检测方法包括下列步骤分组具有相同链接目标网页的链接;并且检测在同一个组中的具有不同链接源描述的子组。此外,在另一个实施例中,该检测方法可以包括下列步骤分组具有相同链接源描述的链接;并且检测在同一个组中的具有不同链接目标的子组。检测在链接源描述中的不统一的实施例下面将参照图5、17和18详细描述该状态检测单元13和该候选项提供单元12针对在该链接源描述中的不统一的检测的操作。首先,状态检测单元13的操作从该信息存储单元22读出链接信息,以便根据该链接信息把该链接划分为一些分组。状态检测单元13把具有相同链接目标的链接划分在同一个组中。随后,状态检测单元13把划分在同一个组中的具有相同链接源描述的链接进一步划在同一个子组中。随后,该状态检测单元13提取具有不同链接源描述的链接。状态检测单元13进一步操作来根据包括在该子组中的链接的数量,以图17中的步骤T31把一个判据记分给到每一个链接。图18示出在文件之间相互关系如图5所示时该步骤T31中给出的提取的链接和判据记分的一个实例。从图18的描述能够理解,因为链接231、232、233、和234有相同的链接目标″文件135″,所以它们被建组。三个链接231、232、和233被进一步形成为相同的链接源描述″GX系列″的一个子组,而链接234被建组为链接源描述″gX系列″的一个子组。给出判据记分的方法包括下列步骤把用于每一个组的判据记分设置为″1″;把用于每一个子组的判据记分设置为一个值,该值是通过把该判据记分分配到在该子组中的链接数的反比数而获得的一个值,并且把用于每一个链接的判据记分设置到一个值,该值是通过把每一个子组的判据记分相等地划分到该子组中的链接数而获得的一个值。因此,图17的步骤T31给出的链接231、232和233的每一个的判据记分变成″1/12″,而同样以图17的步骤T31给出的链接234的判据记分变成″3/4″,如图18所示。随后该状态检测单元13操作来互相比较子组的判据记分的取和,并且随后提取有高判据记分的连接作为一个失配的链接。在图18中,链接234的判据记分″3/4″高于链接231、232和233的判据记分的取和″1/4″。因此,该链接234被提取作为失配的链接。在图17中的随后步骤T32中,候选项提供单元12被操作来调查该提取链接的链接源描述是否被寄存在一个词汇表中。在本实施例中,该词汇表是指一个表格,具有将被与针对一个单词描述变动的关键字相统一的几个表达。例如,单词″自由软件″是指无需许可即能提供的软件,并且具有多个表达描述的变动,例如″自由制品″和自由软体″。当管理员能够把这些单词合并为一个单词″自由软件″时,该单词″自由制品″和″自由软体″被认为是关键字,而单词″自由软件″被认为是一个值。这些单词可以寄存在该词汇表中。当该提取链接的链接源描述已经寄存在该词汇表中时,图17中的步骤T32的结果为“是”,在图17中的步骤T33中,候选项提供单元12被操作来输出校正候选项,作为对应于该关键字的统一的表达。为了完全包容描述的变动,当检索关键字时可以执行模糊检索。在另一个实施例中,计算该校正候选项的方法可以包括步骤针对没有描述变动的单词的统一的表达执行模糊检索;判断字符串中的近似程度是否高于或等于一个阈值;并且当作出该字符串中的近似程度高于或等于该阈值的判断时,把该校正候选项假设为该搜索的统一的表达。另一方面,当提取的链接的链接源描述没有寄存在该词汇表中时,图17中的步骤T32的结果为“否”,在图17中的步骤T34中,候选项提供单元12被操作来提供该校正候选项,以便对具有高于判据记分的链接源描述与同一组中的低于判据记分的链接源描述进行协调。在图18所示的情况中,候选项提供单元12输出″链接源描述GX系列″作为校正候选项。假设图18所示的两个单词″GX系列″和″gX系列″都没有寄存在该词汇表中。虽然在本实施例中描述了例如根据每一个子组中的链接数目计算该判据记分,但是本发明并不局限于该上述实施例。在另一个实施例中,提供的计算该判据记分的一个方法具有下列步骤根据在该子组中包括的链接数而指定该链接的一个特征向量;计算在该链接的指定的特征向量和作为指教数据准备的该失配链接的特征向量之间的距离的平均值;并且把该平均值设置为判据记分。本发明并不局限于上述实施例描述的情况。检测在链接源描述的格调中的不统一的实施例下面将参照图6、19和20详细描述该状态检测单元13和该候选项提供单元12用于检测在链接源描述的格调中的不统一的操作。首先,状态检测单元13的操作从该信息存储单元22读出链接信息,以便根据该链接信息把该链接划分为一些分组。状态检测单元13把具有相同链接源文件的链接划分在同一个组中。随后,状态检测单元13把划分在同一个组中的具有相同目标属性的链接进一步划在同一个子组中。随后,该状态检测单元13提取具有不同目标属性的链接。在图19中的步骤T41中,状态检测单元13进一步操作来根据包括在该子组中的链接的数量把一个判据记分给到每一个链接。图20示出在文件之间相互关系如图6所示情况下,该步骤T41中给出的提取的链接和判据记分的一个实例。从图20的描述能够理解,因为链接241、242、243、和244有相同的链接源″文件141″,所以它们被建组。三个链接241、242、和243被进一步形成为相同的目标属性″_消隐″的一个子组,而链接244被建组为目标属性是″未指定″的一个子组。给出判据记分的方法包括下列步骤把用于每多个组之一的判据记分设置为″1″;把用于每一个子组的判据记分设置为一个值,该值是通过把该判据记分分配到在该子组中的链接数的反比数而获得的一个值,并且把用于每一个链接的判据记分设置到一个值,该值是通过把每一个子组的判据记分相等地划分到该子组中的链接数而获得的一个值。因此,如图20所示,在步骤T41中,链接241、242和243的每一个的判据记分变成″1/12″,而链接244的判据记分变成″3/4″。随后该状态检测单元13操作来互相比较子组的判据记分的取和,并且随后提取有高判据记分的连接作为一个失配的链接。在图20中,链接244的判据记分″3/4″高于链接241、242和243的判据记分的取和″1/4″。因此,该链接244被确定为失配的链接。在图19的随后步骤T42中,候选项提供单元12被操作来提供校正候选项,以便对同一组中的具有高判据记分的目标属性与具有低判据记分的目标属性进行协调。在图20示出的情况中,候选项提供单元12输出″目标属性_消隐″作为校正候选项。虽然在本实施例中的描述中,在图19的步骤T41中被分组的目标是具有相同链接源文件的链接,但是本发明并不局限于本实施例。在另一个实施例中,可以提供一种方法包括步骤把具有相同链接源描述并且包括在一个特定区域中的,例如一个表格、以及链接的一个列表中的链接分组到一个相同的组中。在另一个实施例中,可以提供一个包括下列步骤的方法根据该格调,在多个文件中,例如在一个特定文件和存储在同一个目录中作为特定文件的文件中分组该链接;并且检测在网页周边的链接格调对于特定文件的不统一。已经在上面描述了在本实施例中的检测目标属性中的不统一和计算校正候选项的方法,可以提供检测在格调属性中的不统一和计算该校正候选项的类似方法。在本实施例中,根据例如每一个子组中的链接数目计算该判据记分。本发明并不局限于本实施例。在另一个实施例中,提供的计算该判据记分的一个方法具有下列步骤按照在该子组中的链接数目指定该链接的一个特征向量;按照一个指教数据准备该失配的链接的一个特征向量;以及计算该链接的特征向量和该失配的特征向量之间的距离的一个平均值,以便获得该判据记分。虚位链接的检测的实施例下面参照图7和图21详细描述在虚位链接的检测中的状态检测单元13和候选项提供单元12的操作。首先,该状态检测单元13被操作从该信息存储单元22读出该链接信息,在图21中的步骤T51中,根据该链接信息,提取具有一个不可见链接源描述的链接。在本实施例中,该不可见链接源描述是指一个空字符串,一个透明图像、一个非常小的图像或字符、或与背景彩色相同的一个图像或字符。图7A中,提取具有指定一个空字符串的一个链接源描述的链接。在图21中的随后步骤T52中,候选项提供单元12被操作来输出该校正候选项,以便按照″链接删除″而删除该链接。检测循环链接的一个实施例下面参照图8和图22详细描述针对该循环链接,即被循环的链接的检测的状态检测单元13和候选项提供单元12的操作。首先,操作该状态检测单元13从该信息存储单元读出该链接信息,以便在图22中的步骤T61中,把从该信息存储单元22读出的该链接的链接源描述分离成单词。把该链接源描述分离成单词的方法可以通过实施一个形态分析、以字符的种类的改变分离该链接源描述、或以每几个字母地分离该链接源描述而执行。在图22中的随后步骤T62中,操作该状态检测单元13以提取形成一个循环并且在对应于该循环链接的链接源描述中的单词完全相同的一组链接。在图8中,包括单词″当前″的全部链接261、262和263形成一个循环,因此被认为是一个将要被输出的循环链接。虽然在本实施例中描述了提取其中所有的链接源描述都包括相同单词的循环链接的方法,但是本发明并不局限于本实施例。在另一个实施例中,可以提供一个包括下列步骤的方法准备包括在每一个特定主题之下分类的特征单词的一个辞典;以及通过判断每一个链接源描述是否包括针对同一个主题而分类的特征单词来提取该循环链接。本发明并不局限于上述实施例描述的情况。检测随着时间改变的失配链接的方法虽然在本实施例中描述的是根据在同一个时间收集的每一个链接的链接信息检测某些类型的失配链接的方法,但是本发明并不局限于本实施例。在另一个实施例中,提供的检测全部种类的失配链接的方法包括下列步骤周期地重复该链接信息的收集;并且通过集中监视(focusingon)链接信息随着时间的改变而检测全部种类的失配链接。下面参照附图1、4、23和24描述在检测集中在根据时间的一个变化上的失配链接的方法中该状态检测单元13和候选项提供单元12的操作。图1所示的信息存储单元22被用于在其中存储在时间T和T’的链接信息。首先参考图23中的T71,操作该状态检测单元13分组在时间T和T’之时该链接信息的至少一个选项是相同的那些链接。图24示出在文件的相互关系是如图4所示时,根据在时间2002年8月15日和2002年9月15的链接信息被建组为链接目标″文献125″的一组链接的实例。在图23中的随后步骤T72中,从同一组中提取使得许多链接在链接信息中改变的链接作为该失配链接。在图24的情况下,有链接目标″文件125″四个链接是在2002年8月15日,但只有链接目标″文件125″的一个链接是在2002年9月15日。因此,该链接224被提取作为失配链接。在图23中的随后步骤T72中,工作候选项提供单元12来提供校正候选项,以便补偿在时间T和T’之间的变化。参考图23,由于该链接的删除将造成在2002年8月15日和2002年9月15日之间的其余链接221、222和223的删除,所以该候选项提供单元12提供″链接删除″作为校正候选项。如上所述,在本实施例中在时间T和T’具有相同链接目标文件的链接被分别建组作为同一个组,并且当包括在同一个组中的链接的某些当中在时间T和T’有所改变时,在该组中的其余一个或多个链接将被提取作为失配链接。虽然在本实施例中描述的变化是某些链接是删除的变化,但是本发明并不局限于该实例。例如,当在用于某些链接的链接目标文件中有变化时,候选项提供单元12可以提供一个校正候选项,指示用户校正该链接源描述。虽然在本实施例中描述的是在时间T和T’具有相同链接目标文件的链接被分别建组作为同一个组,但是本发明并不局限于本实施例。在另一个实施例中,一个可提供的方法包括下列步骤把具有相同链接源描述的链接分组为同一个组;并且检测在该格调或目标属性中的变化。下面将描述本实施例的效果。在本实施例中,能够检测全部种类的逻辑的失配。更具体地说,在本实施例中可检测的逻辑失配的种类可以包括(1)把一个链接放置到一个错误的目的地或目标;(2)把一个链接放置到过期的信息;(3)在该链接源描述中的不统一;以及(4)链接源描述的格调中的不统一,因为该失配链接检测方法包括下列步骤从超级文本数据库提取链接信息;分组该链接信息的每一个选项的链接;并且检测从该组排除的认为是一个失配链接的特定链接。可以通过周期地重复该链接信息的收集、并且集中监视链接信息随着时间的改变来检测逻辑失配,例如(2)的对于过期信息的链接。而且,(5)对于逻辑失配的一个例如的虚位链接可以通过检测该没有链接源描述的链接来检测,并且(6)对于逻辑失配的另一实例的循环链接可以通过检测包括在形成一个循环并且具有对应相关一个主题的链接组的链接源描述的一个组中的链接来检测。在本实施例中,逻辑失配的校正候选项能够提供给管理员。更具体地说,本候选项校正方法可以包括自动地计算那校正候选项的处理,以便把从该组中排除的特定链接的链接信息与该组中的其余链接的链接信息相协调。因此,不需要管理员考虑如何校正失配的链接,并且有可能自动地反映该校正。而且,在本实施例中,该分组的失配链接能够被综合地显示在一个显示屏幕上。因此,全部管理员都必须进行这种显示,以便确认链接的一部分,从而使得有可能判断其余的链接是否为失配。因此,能够大大提高该管理员由检测效率。在本实施例中,可以提供显示屏幕,在其上显示按照三个选项的每一个分类的列表,包括(1)一个链接源描述;(2)有关一个链接源网页的标识信息;以及(3)有关一个链接目标网页的标识信息。因此,管理员能够控制该校正选项的每一网页,集中地检查对于一个关键网页的失配,并且检查被用于该链接源描述的该表达的适用性。在本实施例中,数据处理单元1包括信息收集单元11,但是此信息收集单元11可以从该数据处理单元1省略,因为关于一个网页的信息的收集和存储以及在本实施例中由信息收集单元11执行的来自该超级文本数据库21的链接可以由没示出的另一数据处理单元执行。当管理员能够在超级文本数据库21中用手校正该失配的部分同时观看图13示出的结果列表的显示屏幕时,而且,在本实施例中的校正反映单元14可以从该数据处理单元1省略。即使没有关于失配链接的类型或校正候选项的信息,管理员也能够从如图13的显示屏幕上所示的除了失配链接类型或校正候选项之外的信息中得出一个校正候选。所以,在本实施例中的候选项提供单元12可以从该数据处理单元1中省略。第二最佳实施例参考图25,其中示出根据本发明的超级文本检验装置的第二最佳实施例。如图25所示,该数据处理单元5包括在构造上与第一实施例的图1所示的数据处理单元1相同的部件。另外,本实施例的数据处理单元5包括一个重要性计算单元15。该重要性计算单元15被用于根据对在检测的失配链接中的文件的访问频率、或失配链接的严重程度来计算由该状态检测单元13提取的该失配链接的一个重要性值,并且输出具有等级的该计算的重要性值。下面参照附图描述在本实施例中的数据处理单元5的操作。本实施例的信息收集单元11和状态检测单元13在图26示出的步骤S1至S3的操作与图10示出的第一实施例的信息收集单元11和状态检测单元13那些操作相同,因此对这些步骤的描述被省略。随后,在步骤S4中,操作该候选项提供单元12提供一个校正候选项,以便消除由该状态检测单元13作为失配链接提取的该链接中的失配,这一操作与图10示出的第一实施例的步骤S4的操作相同。随后,不是执行图10所示的第一实施例的步骤S5,而是转到控制该重要性计算单元15,使得该重要性计算单元15计算针对该失配链接的重要性值,如图26中的步骤S8所示。操作该重要性计算单元15来计算被该状态检测单元13提取为失配链接的该链接的重要性值,并且输出该计算的重要性值作为一个等级列表,如图26中的步骤S8和S9所示。在本实施例中,可以根据至少一个因素或多个因素的组合计算该重要性值,这些因素包括(1)检测部分的出错和不相称的种类;(2)检测部分的出错和不相称的精确度;(3)包括该检测部分的网页的目标链接的数量;(4)用户对包括该检测的部分的网页访问频率的记录;和(5)在包括该检测部分的网页的超级文本中的层次级别。参考附图27,其中所示包括输出的失配链接的等级列表的显示屏幕。图27所示的显示屏幕的等级列表除了包括同样包括在图13的列表中的″失配类型″和″校正候选项″等之外,还包括″重要性值″。更具体地说,除了失配的类型和校正候选项之外,通过把具有相同链接目标和相同链接源描述的链接分组为同一个组、并且计算每一个分组的失配链接的重要性值而获得该失配链接的重要性值。如此获得的该失配链接的重要性值被按次序列表在该组中,具有高重要性值被列表在上面。管理员能够执行图26中的步骤S6,参考等级列表来执行该校正候选项的确认和重写。由于等级列表包括按如上所述次序列出的重要性值,该管理员容易执行图26中的步骤S6。在此之后,校正反映单元14以图26的步骤S7中根据该确认或校正的校正候选项把针对每一个文件的校正反映在该超级文本数据库21中。如此步骤类似第一实施例执行的步骤。虽然在本实施例中描述了该重要性计算单元15被操作来计算该失配链接的重要性值并且在该候选项提供单元12被操作来提供该校正候选项之后输出该计算的重要性值作为一个等级列表,但是本发明并不局限于本实施例。处理的次序能任意变化。例如在另一个实施例中,该重要性计算单元15被操作来计算该失配链接的重要性值、并且输出该计算的重要性值作为一个等级列表是在该候选项提供单元12被操作来提供该校正候选项之前。虽然在本实施例中描述了该管理员在图26的步骤S6中执行输出的失配链接和校正候选的确认,但是本发明并不局限于本实施例。在另一个实施例中,可以省略步骤S6,并且步骤S1至S7可以自动地执行。虽然在本实施例中描述了该管理员决定确认的一个定时,但是本发明并不局限于本实施例。例如在另一个实施例中,可以预先确定收集状态和提取状态,并且可以自动周期地执行步骤S1至S4、S8和S9。在此情况中,可以通过一个电子邮件等将结果提示该管理员。在本实施例中由图25所示的信息收集单元11执行的从超级文本数据库21收集和存储关于一个网页和一个链接的信息的操作可以通过没有在附图中示出的另一数据处理单元执行。在这种情况中,本实施例的图25所示的数据处理单元5不需要包括该信息收集单元11。而且,管理员能够在观看图27示出的结果列表的显示屏幕的同时,用手校正在该超级文本数据库21中的失配部分。在这种情况中,本实施例的图25所示的数据处理单元5不需要包括该校正反映单元14。而且,即使该列表不包括失配链接和校正候选项的类型,管理员也能够独自借助于图27中的显示屏幕的列表示出的信息选择一个校正候选项。在这种情况中,本实施例的图25所示的数据处理单元5不需要包括该候选项提供单元12。第三最佳实施例参考图28,其中示出根据本发明的超级文本检验装置的第三最佳实施例。如图28所示,第三实施例的数据处理单元6包括在构造上与第二实施例的图25所示的数据处理单元5相同的部件。本实施例的数据处理单元6与图25所示的数据处理单元5的不同在于,包括一个总记分计算单元16而不是校正反映单元14。该总记分计算单元16被用于根据由该状态检测单元13检测的失配链接和由该重要性计算单元15计算的该失配链接的重要性值而计算该目标网站的一个总记分。在本实施例中,除了使用由重要性计算单元15计算的该失配链接的值的取和之外,也可以根据该失配链接的数或失配链接的数对链接的总数的比例来计算该总记分。下面参照附图描述根据本发明超级文本检验装置的操作。本实施例的信息收集单元11、候选项提供单元12、状态检测单元13及重要性计算单元15的操作在图29中的步骤S1到S4和S8中示出,与图26示出的第二实施例的那些操作相同,因此这些步骤的描述被省略。在上述第二实施例中,在检测该失配链接之后,根据该校正候选项把该校正反映到超级文本数据库21。如图29的步骤S10中所示,在步骤S3中的检测该失配链接之后,根据由该重要性计算单元计算的该重要性值,该总记分计算单元16被操作来计算该目标网站的总记分。随后,该总记分计算单元16输出该计算的总记分。该总记分计算单元16可以周期地执行该计算。该总记分计算单元16可以随即输出该计算的总记分。图30示出根据时间的该总记分的输出结果。利用这些结果,有可能理解该目标网站的质量的改善进程。参考图30,随着时间的进行,在总记分中的上升变成饱和。从这一结果理解到,用于改进该目标网站的质量的过程结束了。在本实施例中,该总记分计算单元16能以规则的间隔计算该总记分,并且当一个预定状态被实现时提示一个告警,使得该总记分或被检测为失配链接的部分的重要性值超出一个预定门限值。据此功能,管理员能够在网站的质量下降时接收这种告警。该总记分计算单元16可以计算多个不同网站″A″至″M的每一个的总记分。图31示出利用该总记分计算单元16输出的结果的一个实例。其中,该结果以降序等级列出。据此结果,管理员能够互相比较网站之间的定量质量。例如从图31看到,网站″A″的质量是网站″E″的质量的两倍出色。下面将描述本实施例的效果。在本实施例中,根据该检测的失配链接的数目和重要性值来计算该目标网站的质量的总记分。为此原因,有可能控制网站质量的改善进程,并且定量地互相比较不同网站的质量。虽然本实施例的数据处理单元6包括该信息收集单元11,但是该信息收集单元11可以从该数据处理单元6中省略,因为事实上在本实施例中由该信息收集单元11执行的有关一个网页的信息的收集和存储以及从超级文本数据库21开始的链接可以由没示出的另一数据处理单元执行。虽然没有提到,但是在该超级文本数据库21中检测的失配部分的反映或校正可以依据请求执行。当执行该反映时,管理员可以在观看图27所示的结果列表的显示屏幕的同时,用手校正在该超级文本数据库21中的失配部分。另外,其中可以提供类似于第二实施例的校正反映单元14。即使没有关于失配链接的类型或校正候选项的信息,管理员也能够从如图27的显示屏幕上所示的除了失配链接类型或校正候选项之外的信息中得出一个校正候选。所以,在本实施例中的候选项提供单元12可以从该数据处理单元1中省略。第四最佳实施例下面参照附图描述根据本发明的超级文本检验计算机程序产品的第四最佳实施例。该超级文本检验程序产品的第四最佳实施例包括一台可用存储介质的计算机,附图中没有示出该存储介质,比如CD-ROM、DVD-ROM、MO、硬盘、EPROM、EEPROM等,或从例如互联网络的一个网络服务器下载的介质,具有计算机可读取代码包括在其中,用于检验一个超级文本。参考附图32,其中示出的系统实例包括输入单元501、数据处理单元502、输出装置503和存储装置504,在构造上类似于第一最佳实施例的装置。该系统进一步包括一个超级文本检验程序500,用于执行根据本发明的该超级文本检验程序产品的第四最佳实施例的功能,其功能类似于该超级文本检验装置的第一实施例的功能。输入单元501用于使得一个操作器经过该输入单元输入一个指令。该输入单元501例如是一个鼠标、键盘等。输出装置503用于从该数据处理单元502输出一个处理结果。该输出装置503例如是显示单元的显示屏幕、打印机等。该超级文本检验程序500被从计算机可用存储介质读出到该数据处理单元502。然后由该数据处理单元502执行该超级文本程序500,控制该数据处理单元502的操作,并且在该存储装置504中创建一个输入存储器505和一个工作存储器506。作为该数据处理单元502,该超级文本检验程序500因此可以建立图1示出的该超级文本检验装置的第一实施例的信息收集单元11、候选项提供单元12、状态检测单元13和校正反映单元14的功能。如此构成的数据处理单元502能够通过执行该超级文本检验程序500而执行与第一实施例的所执行的相同的那些步骤。图32所示的数据处理单元502和存储装置504分别对应于图1所示的数据处理单元1和存储装置2。在本实施例中,除了图1所示的存储在存储装置2中的超级文本数据库21和用于该检测的一个目标之外,该数据处理单元502可以被操作来通过例如因特网的一个网络访问一个外部数据库。第五个最佳实施例下面参照附图描述根据本发明的超级文本检验计算机程序产品的第五个最佳实施例。图32示出该第五实施例的构形,它与上述第四实施例的构形相同。该超级文本检验程序产品的第五最佳实施例包括没示出的计算机可用存储介质,其中具有用于检验一个超级文本的计算机可读代码。该超级文本检验程序500被从计算机可用存储介质读出到该数据处理单元502。然后由该数据处理单元502执行该超级文本程序500,控制该数据处理单元502的操作,并且在该存储装置504中创建一个输入存储器505和一个工作存储器(或工作区域)506。作为该数据处理单元502,该超级文本检验程序500因此可以建立图25示出的该超级文本检验装置的第二实施例的信息收集单元11、候选项提供单元12、状态检测单元13、校正反映单元14和重要性计算单元15的功能。如此构成的数据处理单元502能够通过执行该超级文本检验程序500而执行与第二实施例的所执行的相同的那些步骤。图32所示的数据处理单元502和存储装置504分别对应于图25所示的数据处理单元5和存储装置2。在本实施例中,除了图1所示的存储在存储装置2中的超级文本数据库21和用于该检测的一个目标之外,该数据处理单元502可以被操作来通过例如因特网的一个网络访问一个外部数据库。第六最佳实施例下面参照附图描述根据本发明的超级文本检验计算机程序产品的第六最佳实施例。图32所示的第六实施例的构形与上述第四实施例相同。该超级文本检验程序产品的第六最佳实施例包括一个没示出的计算机可用的存储介质,其中具有用于检验一个超级文本的计算机可读代码。该超级文本检验程序500被从计算机可用存储介质读出到该数据处理单元502。由该数据处理单元502执行该超级文本程序500,控制该数据处理单元502的操作,并且在该存储装置504中创建一个输入存储器(或输入缓冲器)505和一个工作存储器506。作为该数据处理单元502,该超级文本检验程序500因此可以建立图28示出的该超级文本检验装置的第二实施例的信息收集单元11、候选项提供单元12、状态检测单元13重要性计算单元15和总记分计算单元16的功能。如此构成的数据处理单元502能够通过执行该超级文本检验程序500而执行与第三实施例的所执行的相同的那些步骤。图32所示的数据处理单元502和存储装置504分别对应于图28所示的数据处理单元6和存储装置2。在本实施例中,除了图1所示的存储在存储装置2中的超级文本数据库21和用于该检测的一个目标之外,该数据处理单元502可以被操作来通过例如因特网的一个网络访问一个外部数据库。如上所述,根据本发明的实施例能够实现下列效果。本发明具有的超过已有技术的第一个优点在于,其有可能检测全部种类的逻辑失配。从下面的描述理解本发明具有该第一优点的原因。根据本发明,一种可检测的逻辑失配包括(1)把一个链接放置到一个错误的目的地;(2)用于该过期信息的链接;(3)在该链接源描述中的不统一;和(4)链接源描述的格调中的不统一,因为该失配链接检测方法包括下列步骤从超级文本数据库提取链接信息;分组该链接信息的每一个选项的链接;并且检测从该组排除的特定链接,认为该检测的特定链接是一个失配链接。可以通过周期地重复该链接信息的收集、并且集中监视链接信息随着时间的改变来检测逻辑失配,例如(2)的对于过期信息的链接。而且,(5)对于逻辑失配的一个例如的虚位链接能够够通过检测该没有链接源描述的链接来检测,并且(6)对于逻辑失配的另一实例的循环链接能够够通过检测包括在形成一个循环并且具有对应相关同一个主题的链接组的链接源描述的一个组中的链接来检测。本发明具有超过已有技术的第二优点在于,能够自动地确定该失配链接的校正方法,从而使得该管理员无需考虑如何校正该失配的链接。由于该候选项校正方法包括自动地计算那校正的一个处理,以便把该特定链接的链接信息与该组中的其它链接的链接信息相协调,从而能够获得上述优点。本发明具有的超过已有技术的第三优点在于,能够大大提高管理员的检验效率。由于该分组的失配链接能够综合地显示在一个显示屏幕上,管理员必须做的只是确认链接的一部分,从而使得有可能判断其余链接是否失配。本发明具有的超过已有技术的第四优点在于,使得有可能控制逐个网页地校正选项,集中检查抵抗一个关键网页的一个失配链接,并且检查被用于该链接源描述的该表达的适用性。由于可以提供显示屏幕,在其上显示具有三个选项一个列表包括(1)一个链接源描述;(2)有关一个链接源网页的标识信息;以及(3)关于一个链接目标网页的标识信息,能够获得上述优点。本发明具有的超过已有技术的第五优点在于,使得有可能控制网站的质量改善进程,并且定量地互相比较不同网站的质量。由于该目标网站的质量的总记分是根据该检测的失配链接的数目和该重要性计算的,因此能够获得上述优点。权利要求1.用于检测一个超级文本的装置,以一个超级文本数据库为目标,能够在所说的超级文本数据库中检测包括一个逻辑失配链接的部分。2.按照权利要求的用于检验一个超级文本的装置,被操作来检测作为所说的部分的至少下列部分之一,所说的部分包括具有在链接源描述和链接目标网页内容之间的失配的一个部分,所说的链接目标网页被与所说的链接源描述链接;具有在链接源描述和链接目标网页内容之间的失配的一个部分,所说的链接目标网页的内容被改变,所说的链接目标网页被与所说的链接源描述链接;在具有相同链接目标网页的多个链接源描述当中具有一个不统一的一个部分;在同一网页或周边网页中包括的多个链接源描述当中具有格调不统一的一个部分;没有链接源描述的一个部分;和包括形成一个循环的一组链接的一个部分,所说的链接的链接源描述与同一个主题相关。3.一种用于检测超级文本的装置,包括一个信息存储单元,储存关于与所说的超级文本相关的链接的一个信息;和一个状态检测单元,参考所说的信息存储单元,以便检测包括一个逻辑失配链接的部分。4.按照权利要求3的用于检验一个超级文本的装置,还包括一个信息收集单元,收集关于与所说的超级文本相关的链接的所说的信息,其中所说的信息存储单元存储关于由所说的信息收集单元收集的该链接的所说的信息。5.按照权利要求3的用于检验一个超级文本的装置,还包括一个候选项提供单元,提供与所说的包括由所说的状态检测单元检测的逻辑失配链接的部分相关的一个校正候选项。6.按照权利要求5的用于检验一个超级文本的装置,还包括一种重要性计算单元,计算包括由所说的状态检测单元检测的该逻辑失配链接的所说的部分的重要性值。7.按照权利要求5的用于检验一个超级文本的装置,还包括一个校正反映单元,根据由所说的状态检测单元检测的逻辑失配链接和由所说的校正提供单元提供的校正候选项,校正所说的超级文本。8.按照权利要求6的用于检验一个超级文本的装置,还包括一个总记分计算单元,根据至少下列因素之一计算与所说的超级文本相关的一个总记分由所说的重要性计算单元计算的重要性值,由所说的状态检测单元检测的所说的部分的数目,以及,由所说的状态检测单元检测的所说的部分的数目对应于该链接的总数的比率。9.按照权利要求3的用于检验一个超级文本的装置,还包括一种重要性计算单元,计算包括由所说的状态检测单元检测的该逻辑失配链接的部分的重要性值。10.按照权利要求9的用于检验一个超级文本的装置,还包括一个总记分计算单元,根据下列因素至少之一计算与所说的超级文本相关的一个总记分由所说的重要性计算单元计算的重要性值,由所说的状态检测单元检测的所说的部分的数目,以及,由所说的状态检测单元检测的所说的部分的数目对应于该链接的总数的比率。11.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来根据预定的状态把关于该链接的所说的信息划分成一些分组,并且检测作为包括该逻辑失配链接的所说的部分的一个子组。12.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测包括在其中的链接源描述和链接目标网页的内容失配的一个部分,作为所说的包括该逻辑失配链接的部分。13.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过互相比较具有同一链接源描述的多个链接的链接目标网页计算的一个第二记分;(3)通过互相比较具有同一链接目标网页和同一链接源描述的多个链接的链接目标网页计算的一个第三记分;和(4)通过比较一个链接源描述的内容和一个链接目标网页的内容计算的一个第四记分,所说的链接源描述被与所说的链接目标网页链接;14.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测具有在一个链接源描述和一个链接目标网页的内容之间的失配的一个部分,所说的链接源描述被与所说的链接目标网页链接,并且所说的失配是由改变所说的链接目标网页的内容引起的。15.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过检测包括在一个链接目标网页内容中的包括运动提示描述或过期提示描述的一个提示描述而计算的一个第二记分;和(3)通过检测包括在一个链接目标网页内容中的一个有效期描述并且比较所说的有效期和当前日期和时间而计算的一个第三记分。16.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测具有在多个链接源描述当中的一个不统一的部分,该多个链接源描述具有同一个链接目标网页。17.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测在同一个网页式或周边网页中包括的多个链接源描述当中具有格调不统一的一个部分。18.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来根据一个预定的状态把关于该链接的所说的信息划分成包括一个主组和一个子组的一些分组,并且检测作为包括该逻辑失配链接的所说的部分的所说的子组。19.按照权利要求18的用于检验一个超级文本的装置,其中所说的候选项提供单元被操作来提供一个校正候选项,使得所说的子组与所说的主组相同。20.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测包括在其中的链接源描述和链接目标网页的内容失配的一个部分,作为所说的包括该逻辑失配链接的部分。21.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过互相比较具有同一链接源描述的多个链接的链接目标网页计算的一个第二记分;(3)通过互相比较具有同一链接目标网页和同一个链接源描述的多个链接的链接目标网页而计算的一个第三记分;和(4)通过比较一个链接源描述的内容和一个链接目标网页的内容而计算的一个第四记分,所说的链接源描述被与所说的链接目标网页链接;22.按照权利要求21的用于检验一个超级文本的装置,其中所说的候选项提供单元被操作来提供下列校正候选项的至少之一,包括(1)一个第一校正候选项,用于通过互相比较具有同一链接目标网页的多个链接的链接源描述获得的该链接源描述;(2)一个第二校正候选项,用于通过互相比较具有同一链接源描述的多个链接的目标网页获得的该链接目标候选项;(3)一个校正候选项,用于通过互相比较具有同一链接目标网页和同一链接源描述的多个链接的链接目标网页获得的该链接目标;和(4)一个校正候选项,用于通过比较一个链接源的内容和一个链接目标网页的内容获得的该链接源描述,所说的链接源描述被与所说的链接目标网页链接。23.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测具有在一个链接源描述和一个链接目标网页的内容之间的失配的一个部分,所说的链接源描述被与所说的链接目标网页链接,并且所说的失配是由改变所说的链接目标网页的内容引起的。24.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过检测包括在该链接目标网页内容中的包括运动提示描述或过期提示描述的一个提示描述而计算的一个第二记分;和(3)通过检测包括在一个链接目标网页内容中的一个有效期描述并且比较所说的有效期和当前日期和时间而计算的一个第三记分。25.按照权利要求24的用于检验一个超级文本的装置,其中所说的候选项提供单元被操作来提供下列校正候选项的至少之一,包括(1)一个第一校正候选项,用于通过互相比较具有同一链接目标网页的多个链接的链接源描述获得的该链接源描述;和(2)一个第二校正候选项,用于通过从一个链接目标网页内容提取新的已移动地址的描述而获得的该链接目标。26.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测具有在多个链接源描述当中的一个不统一的部分,该多个链接源描述具有同一个链接目标网页,并且通过比较具有同一链接目标网页的多个链接的链接源描述与由所说的状态检测单元检测的所说的部分的链接源描述,所说的候选项提供单元提供用于该链接源描述的一个校正候选项。27.按照权利要求5的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测在同一个网页或周边网页中包括的多个链接源描述当中具有格调不统一的一个部分,并且通过比较包括在由所说的状态检测单元检测的该检测部分中的多个链接源描述的格调,所说的候选项提供单元被操作来提供用于该链接源描述的格调的所说的校正候选项。28.按照权利要求4的用于检验一个超级文本的装置,其中所说的信息收集单元被操作来反复地收集关于在该超级文本中的链接的所说的信息,并且所说的信息存储单元储存在多个不同时间收集的关于该链接的多个所说的信息。29.按照权利要求28的用于检验一个超级文本的装置,其中通过参考所说的信息存储单元并且计算在所说的时间期间该链接的数目或链接源描述的类型对于其内容被改变的该链接目标网页的变化,所说的状态检测单元被操作来检测在一个链接源描述和一个链接目标网页的内容之间的具有一个失配的一个部分。30.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测一个没有链接源描述的一个链接作为包括该逻辑失配链接的所说的部分。31.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测具有其中不包括字符串或图像的链接源描述的链接源描述的一个链接、或具有其中包括以一种难以觉察的彩色或尺寸的一个字符串或一个图像的链接源描述的一个链接来作为所说的包括该逻辑失配链接的部分。32.按照权利要求3的用于检验一个超级文本的装置,其中所说的状态检测单元被操作来检测形成一个循环的一组链接作为所说的部分,所说的链接的链接源描述涉及同一个主题。33.按照权利要求6的用于检验一个超级文本的装置,其中所说的重要性计算单元被操作来根据下列因素的至少之一计算重要性值,包括(1)由所说的状态检测单元检测的检测部分的一种错误或不相称;(2)所说的检测部分的错误或不相称的精确度;(3)连接到包括所说的被检测部分的网页的链接数目;(4)对于包括所说的检测的部分的网页访问频率的记录;和(5)在包括所说的已检测部分的该网页的超级文本中的层次级别。34.按照权利要求6的用于检验一个超级文本的装置,其中所说的重要性计算单元被操作来计算由所说的状态检测单元检测的该已检测部分的重要性值,并且根据所说的重要性值而控制用于所说的已检测部分的输出状态,所说的输出端状态包括输出端所说的已检测部分的数目或输出端所说的已检测部分的一种方法。35.按照权利要求4的用于检验一个超级文本的装置,其中当该链接源描述是一个图像时,所说的信息收集单元被操作来通过字符识别而提取对应于该链接源描述的字符串,并且把所说的已提取的字符串作为所说的关于链接的信息寄存在所说的信息存储单元。36.按照权利要求1的用于检验一个超级文本的装置,具有在将是被检验目标的一个网站上的超级文本。37.按照权利要求3的用于检验一个超级文本的装置,具有在将是被检验目标的一个网站上的超级文本。38.一种检验一个超级文本的方法,包括步骤(a)接受从一个超级文本数据库检测一个部分的一种状态,所说的部分包括具有在一个链接源描述或链接之间的一个关系中的一个错误或一种失配的一个部分;(b)根据所说的状态检测所说的部分;(c)在一个显示屏幕上以三个选项把该检测的结果显示为一个列表,三个选项包括(1)一个链接源描述;(2)有关一个链接源网页的标识信息;以及(3)有关一个链接目标网页的标识信息。39.按照权利要求38的检验一个超级文本的方法,其中在所说的步骤(c)中通过把所说的三个选项之一作为一个关键字而分类所说的列表。40.按照权利要求38的检验一个超级文本的方法,进一步包括步骤(d)接受用于所说的三个选项的一个校正候选项;以及(e)根据在所说的步骤(d)中接受的所说的校正候选项而校正所说的超级文本数据库。41.按照权利要求38的检验一个超级文本的方法,进一步包括该步骤指定将要被检验的一个超级文本数据库。42.一种检验一个超级文本的方法,包括步骤(a)收集关于一个网站中的链接的信息;(b)通过参考在所说的步骤(a)中收集的信息检测包括一个逻辑失配链接的一个部分;(c)计算在所说的步骤(b)中检测的所说的部分的重要性值;(d)计算与所说的网站相关的一个总记分;(e)针对所说的网站周期地执行所说的步骤(a)至(d);以及(f)提示相关所说的网站的所说的总记分随着时间的变化。43.一种检验一个超级文本的方法,包括步骤(a)收集关于一个网站中的链接的信息;(b)通过参考在所说的步骤(a)中收集的信息检测包括一个逻辑失配链接的一个部分;(c)计算在所说的步骤(b)中检测的所说的部分的重要性值;(d)计算与所说的网站相关的一个总记分;(e)针对所说的网站周期地执行所说的步骤(a)至(d);以及(f)当与所说的网站相关的所说的总记分或所说的部分的所说的重要性值满足一个预定状态时,提示一个告警。44.一种检验一个超级文本的方法,包括步骤(a)收集关于一个网站中的链接的信息;(b)通过参考在所说的步骤(a)中收集的信息检测包括一个逻辑失配链接的一个部分;(c)计算在所说的步骤(b)中检测的所说的部分的重要性值;(d)计算与所说的网站相关的一个总记分;(e)针对指定为目标的多个网站周期地执行所说的步骤(a)至(d);以及(f)按照一个等级列表输出所述多个网站的所说的总记分。45.由其中包括有计算机可读代码的计算机可用的存储介质组成的一种计算机程序产品,所说的计算机可读代码由一个计算机执行,该计算机包括一个信息存储单元,存储关于涉及一个超级文本的链接的一个信息,所说的计算机可读代码包括一个码链(cord),用于把所说的计算机用作一个状态检测单元,其参考所说的信息存储单元来检测包括一个逻辑失配链接的一个部分。46.由其中包括有计算机可读代码的计算机可用的存储介质组成的一种计算机程序产品,所说的计算机可读代码由一个计算机执行,该计算机具有一个信息存储单元,所说的计算机可读代码包括一个码链,用于把所说的计算机用作一个信息收集单元,收集关于涉及一个超级文本的链接的一个信息,并且把所说的信息存储在所说的信息存储单元上;以及一个状态检测单元,参考所说的信息存储单元,来检测包括一个逻辑失配链接的部分。47.按照权利要求46的计算机程序产品,其中所说的计算机可读代码包括一个码链,用于将所说的计算机用作一个候选项提供单元,提供涉及包括由所说的状态检测单元检测的该逻辑失配链接的所说部分的一个校正候选项。48.按照权利要求47的计算机程序产品,其中所说的计算机可读代码包括一个码链,用于将所说的计算机用作一个重要性计算单元,计算包括由所说的状态检测单元检测的该逻辑失配链接的所说部分的重要性值。49.按照权利要求47的计算机程序产品,其中所说的计算机可读代码包括一个码链,用于将所说的计算机用作一个校正反映单元,其根据由所说的状态检测单元检测的包括该逻辑值失配链接的所说的部分以及由所说的校正提供单位提供的所说的校正候选项而校正所说的超级文本。50.按照权利要求48的计算机程序产品,其中所说的计算机可读代码包括一个码链,用于将所说的计算机用作一个总记分计算单元,根据几个因素的至少之一计算与所说的超级文本相关的一个总记分,所说的几个因素包括由所说的重要性计算单元计算的该重要性值、由所说的状态检测单元检测的所说的部分的数量、以及由所说的状态检测单元检测的所说部分的数量对应于该链接的总数的比率。51.按照权利要求45的计算机程序产品,其中所说的计算机可读代码包括一个码链,用于将所说的计算机用作一个重要性计算单元,计算包括由所说的状态检测单元检测的该逻辑失配链接的所说部分的一个重要性值。52.按照权利要求51的计算机程序产品,其中所说的计算机可读代码包括一个码链,用于将所说的计算机用作一个总记分计算单元,根据几个因素的至少之一计算与所说的超级文本相关的一个总记分,所说的几个因素包括由所说的重要性计算单元计算的该重要性值、由所说的状态检测单元检测的所说的部分的数量、以及由所说的状态检测单元检测的所说部分的数量对应于该链接的总数的比率。53.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来根据预定的状态把关于该链接的所说的信息划分成一些分组,并且检测作为包括该逻辑失配链接的所说的部分的一个子组。54.按照权利要求45的计算机程序产品,所说的状态检测单元被操作来检测包括在其中的链接源描述和链接目标网页的内容失配的一个部分,作为所说的包括该逻辑失配链接的部分。55.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过互相比较具有同一链接源描述的多个链接的链接目标网页计算的一个第二记分;(3)通过互相比较具有同一链接目标网页和同一个链接源描述的多个链接的链接目标网页而计算的一个第三记分;以及(4)通过比较一个链接源描述的内容和一个链接目标网页的内容而计算的一个第四记分,所说的链接源描述被与所说的链接目标网页链接;56.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来检测具有在一个链接源描述和一个链接目标网页的内容之间的失配的一个部分,所说的链接源描述被与所说的链接目标网页链接,并且所说的失配是由改变所说的链接目标网页的内容引起的。57.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过检测包括在该一个链接目标网页内容中的包括运动提示描述或过期提示描述的一个提示描述而计算的一个第二记分;以及(3)通过检测包括在一个链接目标网页内容中的一个有效期描述并且比较所说的有效期和当前日期和时间而计算的一个第三记分。58.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来检测具有在多个链接源描述当中具有一个不统一的一个部分,该多个链接源描述具有同一个链接目标网页。59.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来检测在同一个网页式或周边网页中包括的多个链接源描述当中具有格调不统一的一个部分。60.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来根据一个预定的状态把关于该链接的所说的信息划分成包括一个主组和一个子组的一些分组,并且检测作为包括该逻辑失配链接的所说的部分的所说的子组。61.按照权利要求60的计算机程序产品,其中所说的候选项提供单元被操作来提供一个校正候选项,使得所说的子组与所说的主组相同。62.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来检测包括其中的链接源描述和链接目标网页的内容失配的一个部分,作为所说的包括该逻辑失配链接的部分。63.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过互相比较具有同一该信源描述的多个该的该目标网页计算的一个第二记分;(3)通过互相比较具有同一链接目标网页和同一个链接源描述的多个链接的链接目标网页而计算的一个第三记分;以及(4)通过比较一个链接源描述的内容和一个链接目标网页的内容而计算的一个第四记分,所说的链接源描述被与所说的链接目标网页链接;64.按照权利要求63的计算机程序产品,其中所说的候选项提供单元被操作来提供下列校正候选项的至少之一,所说的校正候选项包括(1)一个第一校正候选项,用于通过互相比较具有同一链接目标网页的多个链接的链接源描述而获得的该链接源描述;(2)一个第二校正候选项,用于通过互相比较具有同一链接源描述的多个链接的目标网页而获得的该链接目标候选项;(3)一个校正候选项,用于通过互相比较具有同一链接目标网页和同一链接源描述的多个链接的链接目标网页而获得的该链接目标;以及(4)一个校正候选项,用于通过比较一个链接源的内容和一个链接目标网页的内容而获得的该链接源描述,所说的链接源描述被与所说的链接目标网页链接。65.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来检测具有在一个链接源描述和一个链接目标网页的内容之间的失配的一个部分,所说的链接源描述被与所说的链接目标网页链接,并且所说的失配是由改变所说的链接目标网页的内容引起的。66.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来根据下列记分的至少之一计算该链接的判据记分,并且检测具有一个高判据记分的链接作为所说的部分,所说的记分包括(1)通过互相比较具有同一链接目标网页的多个链接的链接源描述计算的一个第一记分;(2)通过检测包括在该一个链接目标网页内容中的包括运动提示描述或过期提示描述的一个提示描述而计算的一个第二记分;以及(3)通过检测包括在一个链接目标网页内容中的一个有效期描述并且比较所说的有效期和当前日期和时间而计算的一个第三记分。67.按照权利要求66的计算机程序产品,其中所说的候选项提供单元被操作来提供下列校正候选项的至少之一,所说的校正候选项包括(1)一个第一校正候选项,用于通过互相比较具有同一链接目标网页的多个链接的链接源描述而获得的该链接源描述;以及(2)一个第二校正候选项,用于通过从一个链接目标网页内容提取新的已移动地址的描述而获得的该链接目标。68.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来检测具有在多个链接源描述当中的一个不统一的部分,该多个链接源描述具有同一个链接目标网页,以及通过比较具有同一链接目标网页的多个链接的链接源描述与由所说的状态检测单元检测的所说的部分的链接源描述,所说的候选项提供单元提供用于该链接源描述的一个校正候选项。69.按照权利要求47的计算机程序产品,其中所说的状态检测单元被操作来检测在同一个网页或周边网页中包括的多个链接源描述当中具有格调不统一的一个部分,以及通过比较包括在由所说的状态检测单元检测的该检测部分中的多个链接源描述的格调,所说的候选项提供单元被操作来提供用于该链接源描述的格调的所说的校正候选项。70.按照以权利要求46提出的权利要求任意之一的计算机程序产品,其中所说的信息收集单元被操作来反复地收集关于在该超级文本中的链接的所说的信息,并且所说的信息存储单元储存在多个不同时间收集的关于该链接的多个所说的信息。71.按照权利要求70的计算机程序产品,其中通过参考所说的信息存储单元并且计算在所说的时间期间该链接的数目或链接源描述的类型对于其内容被改变的该链接目标网页的变化,所说的状态检测单元被操作来检测在一个链接源描述和一个链接目标网页的内容之间的具有一个失配的一个部分。72.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来检测一个没有链接源描述的一个链接作为包括该逻辑失配链接的所说的部分。73.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来检测具有其中不包括字符串或图像的链接源描述的链接源描述的一个链接、或具有其中包括以一种难以觉察的彩色或尺寸的一个字符串或一个图像的链接源描述的一个链接来作为所说的包括该逻辑失配链接的部分。74.按照权利要求45的计算机程序产品,其中所说的状态检测单元被操作来检测形成一个循环的一组链接作为所说的部分,所说的链接的链接源描述涉及同一个主题。75.按照权利要求48的计算机程序产品,其中所说的重要性计算单元被操作来根据下列因素的至少之一计算重要性值,包括(1)由所说的状态检测单元检测的检测部分的一种错误或不相称;(2)所说的检测部分的错误或不相称的精确度;(3)连接到包括所说的被检测部分的网页的链接数目;(4)对于包括所说的检测的部分的网页访问频率的记录;以及(5)在包括所说的已检测部分的该网页的超级文本中的层次级别。76.按照权利要求48的计算机程序产品,其中所说的重要性计算单元被操作来计算由所说的状态检测单元检测的该已检测部分的重要性值,并且根据所说的重要性值而控制用于所说的已检测部分的输出状态,所说的输出端状态包括输出端所说的已检测部分的数目或输出端所说的已检测部分的一种方法。77.按照权利要求46的计算机程序产品,其中当该链接源描述是一个图像时,所说的信息收集单元被操作来通过字符识别而提取对应于该链接源描述的字符串,并且把所说的已提取的字符串作为所说的关于链接的信息寄存在所说的信息存储单元。78.按照权利要求45的计算机程序产品,具有在将是被检验目标的一个网站上的超级文本。79.按照权利要求46的计算机程序产品,具有在将是被检验目标的一个网站上的超级文本。全文摘要一个超级文本检验装置包括一个超级文本数据库21,存储有关一个网页以及一个链接的信息;一个信息收集单元11,收集关于从该超级文本数据库21获得的该超级文本中的网页和该链接的一个信息;一个状态检测单元13,参考该超级文本数据库21,来检测包括逻辑失配链接的一个部分;一个候选项提供单元12,提供与该状态检测单元13检测的该部分相关的一个校正候选项;和一个校正反映单元14,根据由该状态检测单元13检测的该部分以及由该校正提供单元12提供的校正候选项而校正该超级文本。文档编号G06F17/30GK1497478SQ20031010138公开日2004年5月19日申请日期2003年10月16日优先权日2003年10月16日发明者河合英纪,福岛俊一,一申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1