内容管理系统的制作方法

文档序号:6424824阅读:148来源:国知局
专利名称:内容管理系统的制作方法
技术领域
本发明涉及在管理多媒体内容的计算机系统中把元数据指定给诸如视频和音频之类的非文本内容。
背景技术
因特网的普及使我们可以访问各种各样的内容。并且,近年来,利用诸如ADSL(非对称数字用户线)和FTTH(光纤到家庭)之类的技术的宽带通信网络提供了使诸如视频和音频之类的多媒体信息,以及主要包括数据量相对较小的文本和/或图像的内容能够得到适当使用的环境,并且,预期在未来还将提供更多各种各样的内容。
因此,随着可用内容不断增加,诸如所需内容的检索和消除无用内容的过滤之类的技术越来越重要。尤其是,诸如视频和音频之类的多媒体内容与基于文本的内容不同,并且,除非经过处理,不会成为搜索和过滤的目标。
然后,为了进行这样的检索和/或过滤,描述内容的特征的元数据是必不可少的,因此,需要为此服务的技术。对于描述内容的要点含义的元数据,对基于文本的内容进行了各种各样的研究。美国政府组织的Tipster项目推荐了有关文本处理的技术,其中,从文本中提取信息的技术得到研究和开发(对于Tipster项目,参见Junichi Fukumoto,Satoshi Sekine,and Yoshio Eriguchi,″Reports on the MUC-7 and Tipster 18-month Meeting″,Infor-mation ProcessingSociety,Natural Language Processing,127-14,1998)。
同时,用于诸如视频和音频之类的基于非文本的内容的元数据的构架的例子包括MPEG-7(运动图像专家组-7)(″Multimedia Content DescriptionInterface″,[ISO/IEC 15938])。MPEG-7是规定描述多媒体信息的内容的描述符,和旨在利用描述,根据多媒体内容的要点含义实现检索和过滤的全球标准。
但是,在作为在MPEG-7标准下指定元数据的目标的诸如视频和音频之类的基于非文本的内容的情况下,还不存在这样的自动提取元数据的技术,该元数据例如针对新闻节目的内容的时间段指示新闻的内容,当前,还要人工指定元数据。
由于这样人工指定元数据是需要花费大量时间和精力的低效方法,就成本而言,内容提供者不能把各种各样的元数据指定给基于非文本的内容。
并且,由于人工指定的元数据不是多种多样的,因此,不可能高精确性地检索其它新闻相关视频内容。

发明内容
本发明的目的是提供一种能够根据至少由人工指定给基于非文本的内容的要点含义有关的元数据,把更多各种各样的元数据指定给基于非文本的内容,以及能够得出在要点上的基于非文本的内容段之间的关系的内容管理系统。
根据本发明的一个方面,内容管理系统含有处理基于非文本的内容的基于非文本的内容管理设备、和处理基于文本的内容的基于文本的内容管理设备。其中,基于非文本的内容管理设备含有第1发送部分,用于向基于文本的内容管理设备发送附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;第1接收部分,用于从基于文本的内容管理设备接收附加元数据;和指定部分,用于把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。以及基于文本的内容管理设备含有第2接收部分,用于从基于非文本的内容管理设备接收附加元数据请求;检索部分,用于根据包括在接收的附加元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取部分,用于获取事先指定给检索的基于文本的内容的元数据,作为附加元数据;和第2发送部分,用于向基于非文本的内容管理设备发送获取的附加元数据。
根据本发明的另一个方面,内容管理系统含有处理基于非文本的内容的基于非文本的内容管理设备、和处理基于文本的内容的基于文本的内容管理设备,其中,基于非文本的内容管理设备含有第1发送部分,用于向基于文本的内容管理设备发送相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;第1接收部分,用于从基于文本的内容管理设备接收相关内容指定元数据;和生成部分,用于根据接收的相关内容指定元数据,生成与作为生成相关内容信息的处理的目标的基于非文本的内容有关的相关内容信息。以及基于文本的内容管理设备含有第2接收部分,用于从基于非文本的内容管理设备接收相关内容指定元数据请求;检索部分,用于根据包括在接收的相关内容指定元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取部分,用于获取事先指定给与检索的基于文本的内容有关的基于文本的内容的元数据,作为相关内容指定元数据;和第2发送部分,用于向基于非文本的内容管理设备发送获取的相关内容指定元数据。


图1是例示本发明的第1实施例中的内容管理系统的方块图;图2是显示本发明的第1实施例中基于非文本的内容和内容的元数据的一个例子的图形;图3是显示在本发明的第1实施例中基于文本的内容和内容的元数据的一个例子的图形;图4是例示在本发明的第1实施例中加入与基于非文本的内容有关的元数据的处理流的流程图;图5是显示在本发明的第1实施例中,在对新闻项211完成了加入元数据的处理的阶段,加入的元数据的例子的图形;图6是显示在本发明的第1实施例中,在加入与基于非文本的内容有关的元数据的处理中,内容和元数据之间的关系的综合图;图7是例示本发明的第2实施例中的内容管理系统的方块图;图8是显示本发明的第2实施例中基于非文本的内容和内容的元数据的一个例子的图形;图9是显示在本发明的第2实施例中基于文本的内容和内容的元数据的一个例子的图形;图10是显示在本发明的第2实施例中,相关内容信息生成部分721自动生成的相关内容信息的一个例子的图形;图11是例示在本发明的第2实施例中,生成与基于非文本的内容有关的相关内容信息的处理流的流程图;
图12是显示在本发明的第2实施例中,存储在非文本相关内容信息存储部分713中的相关内容信息的一个例子的图形;图13是显示在本发明的第2实施例中,在生成与基于非文本的内容有关的相关内容信息的处理中,内容和元数据之间的关系的综合图;图14是例示众所周知的例1中文档处理设备的配置的方块图;和图15是例示众所周知的例2中文档检索设备的配置的方块图。
实施本发明的最佳方式下面参照附图具体描述本发明的实施例。本发明不限于这些实施例,可以借助于它们的各种变型加以实施,而不偏离本发明的范围。
(第1实施例)图1是例示本发明的第1实施例中内容管理系统的配置的方块图。如图1所示的内容管理系统含有基于非文本的内容管理部分110和基于文本的内容管理部分120。
基于非文本的内容管理部分110管理诸如视频和音频之类的基于非文本的内容和内容的元数据,它含有基于非文本的内容存储部分111、非文本元数据存储部分112、元数据输入部分113、请求发送部分114、和附加元数据获取部分115。
基于非文本的内容存储部分111存储基于非文本的内容数据。
非文本元数据存储部分112存储与存储在基于非文本的内容存储部分111中的内容相联系的元数据。
元数据输入部分113供把元数据人工指定给基于非文本的内容之用。
请求发送部分114向基于文本的内容管理部分120做出附加元数据请求。
附加元数据请求是对加入存储在非文本元数据存储部分112中的元数据中的元数据的请求。
附加元数据获取部分115获取从基于文本的内容管理部分120提供的附加元数据,将其存储在非文本元数据存储部分112中。
基于文本的内容管理部分120管理文本文档和文档的元数据,它含有基于文本的内容存储部分121、文本元数据存储部分122、元数据提取部分123、请求接收部分124、相似的基于文本的内容检索部分125、和附加元数据发送部分126。
基于文本的内容存储部分121存储基于文本的内容数据。
文本元数据存储部分122存储与存储在基于文本的内容存储部分121中的内容相联系的元数据。
元数据提取部分123从存储在基于文本的内容存储部分121中的文本数据中自动提取元数据。
请求接收部分124从基于非文本的内容管理部分110接收附加元数据请求。
相似的基于文本的内容检索部分125检索与为其做出附加元数据请求的基于非文本的内容相似的基于文本的内容,和获取指定给相似的基于文本的内容的元数据。
附加元数据发送部分126把在相似的基于文本的内容检索部分125中获得的元数据发送到基于非文本的内容管理部分110,作为附加元数据。
下面利用具体例子描述本实施例中加入元数据的处理。
图2是显示存储在基于非文本的内容存储部分111中的新闻节目的视频和指定给新闻节目的新闻项的元数据的一个例子的图形。根据新闻的要点将新闻节目视频210划分成多个项目。这里假设新闻项211是与棒球运动有关的新闻视频。在这种情况下,元数据220是与新闻视频的要点有关和通过元数据输入部分113人工指定给新闻项122、和被存储在基于非文本的内容存储部分112中的元数据。这里还假设元数据220存在与新闻的要点有关的最小元数据,和把“NEW_211”指定给新闻项211,作为唯一指示新闻项内容的ID。
图3是显示存储在基于文本的内容存储部分121中的报纸文章和指定给报纸文章的元数据的一个例子的图形。这里,报纸文章310在要点上与图2中的新闻节目视频210的新闻项211相似的。在这一方面,新闻文章310与作为相似的内容的新闻项211没有什么联系。元数据320是元数据提取部分123自动提取和存储在文本元数据存储部分122中的元数据。把“ARTICLE_310”指定给报纸文章310,作为唯一指示报纸文章内容的ID。
另外,从文本数据中提取元数据的方法的一个例子包括实现利用在日本待审专利公布第2001-75959号中描述的方法(下文称之为众所周知的例1)的方法。图14是例示众所周知的例1中文档处理设备的配置的方块图。众所周知的例1中的配置配有词法分析部分1402,用于对从输入部分1401输入的文档进行词法分析;具体表达式候选者获取部分1430,用于获取词法序列的一部分的加权序列,作为具体表达式候选者;具体表达式词典1404,用于事先存储大量具体表达式;具体表达式词典检索部分1405,用于输出词法序列与具体表达式词典1404中的表达式相匹配的实数,作为具体表达式词典1404的检索结果;判定分析执行部分1406,用于把指定给具体表达式候选者的权重和与具体表达式词典1404有关的具体表达式候选者的检索结果用作变量,计算判定分值,和删除判定分值在预定值之下的候选者;和输出部分1407,用于输出含有在判定分析执行部分1406中没有删除的候选者的词法字符序列。通过词典的提取和通过匹配的提取较好地结合在一起,从而,可以精确地提取名称等。并且,对如上所述,以及众所周知的例1中从文本数据中提取元数据的方法进行了各种各样的研究,这里,对方法没有特别限制。并且,与人工指定的元数据220相比,自动提取的元数据320不仅包括与新闻的要点有关的元数据,而且包括与上下方有关地详述的关键字。
另外,在图2和3中,元数据是以XML(可扩充标记语言)格式描述的,XML格式是元数据的描述格式的一个例子,也可以使用任何其它描述格式。加之,虽然元数据在描述中包括数个关键字,但是,也可以把诸如5W1H之类的含义提供给每个关键字和/或提供具有自由文本格式的元数据。
图4是例示在第1实施例中加入与基于非文本的内容有关的元数据的处理流的流程图。从现在开始,参照图4描述,例如,加入与如图2所示的新闻项211有关的元数据的处理。
步骤401基于非文本的内容管理部分110中的请求发送部分114从非文本元数据存储部分112中获取指定给用于加入元数据的处理的目标的基于非文本的内容的元数据,和将获取的元数据(下文称之为原始元数据)与附加元数据请求一起发送到基于文本的内容管理部分120。在本例中,该部分114获取元数据220作为原始元数据,将它与附加元数据请求一起发送。
步骤402基于文本的内容管理部分120中的请求接收部分124从基于非文本的内容管理部分110接收附加元数据请求(包括原始元数据)。
步骤403相似的基于文本的内容检索部分125利用包括在附加元数据请求中的原始元数据,检索相似的基于文本的内容,和从文本元数据存储部分122中获取指定给相似的基于文本的内容的元数据。当检索到多段相似的基于文本的内容时,获取指定给相似的度最高的基于文本的内容的元数据。“相似的”指的是基于非文本的内容和基于文本的内容之间的信息重叠度满足预定标准的情况。
例如,利用关键字的信息检索方法的例子包括实现利用在日本待审专利公布第H10-49549号中描述的方法(下文称之为众所周知的例2)的方法。图15是例示众所周知的例2中文档检索设备配置的方块图。在众所周知的例2中,频率分值计算部分1508从文档的总数、出现字的文档的个数、文档中字的出现频率、和从字频计算部分1507输出的字的权重参数中计算指示因字频所致的文档与检索请求之间的匹配度的频率分值,文档分值计算部分1509从频率分值中计算指示文档与检索请求之间的匹配度的文档分值和指定优先级,从而可以获取与检索内涵更相似的检索结果。并且,例如,对如上所述的USA的Tipster项目和SIGIR(参见Proceedings of the 23rd Annual Inter-national ACM SIGIR Conference on Research and Development in Informa-tionRetrieval,July 24-28,2000),以及众所周知的例2中,利用元数据(关键字)的信息检索方法进行了各种各样的研究,这里,对方法没有特别限制。在本例中,当作为检索相似的基于文本的内容的结果,得出报纸文章310时,获得指定给报纸文章310的元数据320。
步骤404附加元数据发送部分126把在相似的基于文本的内容检索部分125中获得的元数据发送到基于非文本的内容管理部分110,作为附加元数据。
步骤405基于非文本的内容管理部分110中的附加元数据获取部分115从基于文本的内容管理部分120接收附加元数据,和把附加元数据存储在非文本元数据存储部分112中,作为指定给用于加入元数据的处理的目标的基于非文本的内容的附加元数据。
另外,通过把执行上述步骤的程序安装在计算机上,可以实现如步骤401到405所述的基于非文本的内容管理部分110和基于文本的内容管理部分120的处理。
图5是显示在附加元数据获取部分115已经完成了加入与新闻项211有关的元数据的处理的阶段,加入的元数据的例子的图形。在元数据501的例子中,不经处理地加入在附加元数据获取部分115中接收的附加元数据。同时,在元数据502的例子中,加入通过将在附加元数据获取部分115中接收的附加元数据与原始元数据相比较和删除重叠元数据获得的附加元数据。上述两种方法的每一种都可应用在本实施例中。
图6是显示在本发明的第1实施例中,在加入与基于非文本的内容有关的元数据的处理中,内容和元数据之间的关系的综合图。这个图表示,当与作为加入元数据的处理的目标的基于非文本的内容相对应要求相似的基于文本的内容时,对应于作为加入元数据的处理的目标的基于非文本的内容加入与相似的基于文本的内容相对应提取的多种元数据,因此,对应于基于非文本的内容获得多种元数据。
如上所述,根据本实施例,利用人工指定给作为加入元数据的处理的目标的基于非文本的内容的元数据,检索相似的基于文本的内容,获得与相似的基于文本的相关内容地自动提取的元数据,作为加入元数据的处理的目标的基于非文本的内容的附加元数据,从而,可以从人工指定的有限项元数据的出发,增加基于非文本的内容的元数据的项数。
并且,如此获取内容的多种元数据导致的次要效果是,在利用元数据检索基于非文本的内容的过程中,提高了内容的可重复性。
另外,虽然作为基于文本的内容的例子,本实施例描述了如图3所示的纯文本的报纸文章,但是,也可以使用包括图形和/或照片的HTML(超文本标记语言)格式的文档。
并且,在本实施例中,可以把基于非文本的内容管理部分110和基于文本的内容管理部分120当作具有两个部分存在于同一个计算机中的功能的单个内容管理设备来实现,或者,可以把它们当作两个部分存在于各自分开的计算机中并通过可发送信息的网络相互连接的内容管理系统来实现。
加之,虽然本实施例描述了存在单个基于非文本的内容管理部分110和单个基于文本的内容管理部分120的一对一(one-to-one)结构,但是,也可应用单个基于非文本的内容管理部分110向数个基于文本的内容管理部分120发送附加元数据请求的一对多(one-to-n)结构。
本实施例中的图2例示了作为例子,把元数据指定给作为新闻节点视频210的内容的一部分的新闻项211的情况。但是,整个内容或一部分内容都可用作指定元数据的目标。
本实施例中的图4中的步骤403描述了当检索到数个相似的基于文本的内容时,获取相似的度最高的基于文本的内容的元数据的情况。除了这种情况之外,例如,可以按照相似的度的降序获取与多个(例如,10段)内容段相对应的元数据,并且,在步骤405中将多个内容段的元数据作为附加元数据存储在基于非文本的内容存储部分112中。
并且,在相似的基于文本的内容的检索部分125中的检索处理中和在元数据提取部分123中的元数据提取处理中,替代执行完全自动处理的是可以使用人工检验所得结果加以选择/放弃,以便提高精确性的方法。
(第2实施例)下面描述本发明的第2实施例。除了删除附加元数据获取部分115和附加元数据发送部分126和加上相关内容指定元数据获取部分711、相似的基于非文本的内容的检索部分712、非文本相关内容信息存储部分713、相关内容信息生成部分721、文本相关内容信息存储部分722、和相关内容指定元数据发送部分723之外,本实施例的内容管理系统具有与图1中的内容管理系统相同的配置。
相关内容指定元数据获取部分711获取基于文本的内容管理部分120a提供的相关内容指定元数据。
相似的基于非文本的内容的检索部分712根据相关内容指定元数据,生成与基于非文本的内容有关的相关内容信息。
非文本相关内容信息存储部分713存储指示存储在基于非文本的内容存储部分111中的内容段之间的关系的相关内容信息。
相关内容信息生成部分721根据存储在基于文本的内容存储部分122中的元数据,自动生成指示存储在基于文本的内容存储部分121中的内容段之间的关系的相关内容信息。
文本相关内容信息存储部分722存储在相关内容信息生成部分721中生成相关内容信息。
相关内容指定元数据发送部分723向基于非文本的内容管理部分110a发送指定给与在相似的基于文本的内容检索部分125中获得的相似的基于文本的内容相对应的一组相关内容的一组元数据。
下面利用具体例子描述本实施例中生成相关内容信息的处理。
与图2中一样,图8显示了存储在基于非文本的内容存储部分111中的新闻节目的视频和指定给新闻节目的新闻项的元数据的另一个例子的图形。这里也假设新闻项813是与棒球运动有关的新闻视频,和元数据820是与新闻视频的要点有关和人工指定给新闻项813的元数据。还假设把“NEW_813”指定给新闻项813,作为唯一指示该新闻项内容的ID。
与图3中一样,图9是显示存储在基于文本的内容存储部分121中的报纸文章和指定给报纸文章的元数据的另一个例子的图形。这里,报纸文章910在要点上与图2中的新闻视频810的新闻项813相似的。元数据920是元数据提取部分123自动提取并存储在文本元数据存储部分122中的元数据。把“ARTICLE_910”指定给报纸文章910,作为唯一指示该报纸文章内容的ID。
图10是显示相关内容信息生成部分721自动生成的相关内容信息的例子。例如,在图10中的相关内容信息1001的情况下,与ID为“ARTICLE_310”的内容的相关文章一样,存在ID为“ARTICLE_910”的内容。另外,与检测文本数据之间的关系的文本处理有关的技术主要是与如第1实施例中的步骤403所述,利用关键字检索相似的内容的信息检索方法相似的技术。在说明书中,“相似的”用在基于非文本的内容和基于文本的内容之间的信息重叠度满足预定要求标准的情况中,而“相关”用在多段基于文本的内容或多段基于非文本的内容在预定方法中彼此相关的情况中。
并且,在基于文本的内容中,由于存在多段内容含有相关信息(跟进文章和/或链路)的情况,可以根据这样的信息生成相关内容信息。
正如通过图10中的相关内容信息1002所示的那样,可以生成这样的相关内容信息,使单段内容含有多段相关内容。
图11是例示在第2实施例中生成与基于非文本的内容有关的相关内容信息的处理流的流程图。从现在开始,参照图11描述,例如,生成与如图2所示的新闻项211有关的相关内容信息的处理。
步骤1101基于非文本的内容管理部分110中的请求发送部分114从非文本元数据存储部分112中获取指定给作为生成相关内容信息的处理的目标的基于非文本的内容的元数据,和将相关内容指定元数据请求与获得的原始元数据一起发送到基于文本的内容管理部分120a。在本例中,部分114获取元数据220作为原始元数据,将它与相关内容指定元数据请求一起发送。
这里,相关内容指定元数据请求指示对获取与一项基于非文本的内容数据有关的其它多段基于非文本的内容所需的元数据的请求,尤其指示对指定给与基于非文本的内容相似的基于文本的内容,以便获取与存储在基于非文本的内容存储部分111中的一段基于非文本的内容有关的其它数项基于非文本的内容数据的元数据的请求。
步骤1102基于文本的内容管理部分120中的请求接收部分124从基于非文本的内容管理部分110a接收相关内容指定元数据请求(包括原始元数据)。
步骤1103相似的基于文本的内容检索部分125利用包括在相关内容指定元数据请求中的原始元数据,检索相似的基于文本的内容,和获取该相似的基于文本内容的内容ID。当检索到多段相似的基于文本的内容时,获取指定给相似的度最高的基于文本的内容的元数据。在本例中,作为相似的基于文本的内容的检索结果,得出报纸文章310时,获得内容ID“ARTICLE_310”。
步骤1104相关内容指定元数据发送部分723参照存储在文本相关内容信息获取部分722中的信息,获取在相似的基于文本的内容的检索部分125中获取的内容ID的相关内容ID。在这种情况下,从图10中的相关内容信息1001中可以看出,获得“ARTICLE_910”。
步骤1105相关内容指定元数据发送部分723还从文本元数据存储部分122中获取指定给通过在步骤1104中获取的相关内容ID所指定的基于文本的内容的元数据,并且将元数据作为相关内容指定元数据发送到基于非文本的内容管理部分110a。在这种情况下,部分723发送指定给通过内容ID“ARTICLE_910”指定的报纸文章910的元数据920。
步骤1106基于非文本的内容管理部分110a中的相关内容指定元数据获取部分711从基于文本的内容管理部分120a接收相关内容指定元数据。
步骤1107相似的基于非文本的内容的检索部分712利用在相关内容指定元数据获取部分711中获取的相关内容指定元数据,检索相似的基于非文本的内容,并且获取相似的基于非文本内容的内容ID。当检索到多段相似的基于非文本的内容时,获取相似的度最高的基于非文本内容的内容ID。在本例中,作为相似的基于非文本的内容的检索结果,得出图8中的报纸文章310时,获得内容ID“NEWS_310”。
步骤1108相似的基于非文本的内容检索部分712利用在步骤1107中获得的内容ID和作为生成相关内容信息的处理的目标内容的内容ID,生成相关内容信息,并且把信息存储在非文本相关内容信息存储部分713中。
另外,本实施例中的图11中的步骤1103描述了当检索到数个相似的基于文本的内容时,获取指定给相似的度最高的基于文本的内容的元数据的情况。除了这种情况之外,例如,可以按照相似的度的降序获取与多个(例如,10段)内容段相对应的元数据。
在步骤1104中,替代指定给通过内容ID“ARTICLE_910”指定的基于文本的内容的元数据,相关内容指定元数据发送部分723可以向基于非文本的内容管理部分110a发送指定给通过在步骤1103中获得的内容ID“ARTICLE_310”指定的基于文本的内容的元数据。在这种情况下,相似的基于非文本的内容的检索部分712检索含有与指定给通过内容ID“ARTICLE_310”指定的基于文本的内容的元数据相似的元数据的基于非文本的内容。
并且,可以进行诸如与在步骤1104中获得的内容ID“ARTICLE_910”有关的内容ID的检索之类的链接检索。
当在步骤1104中存在数个相关内容ID时,在步骤1105中,与数个相关内容ID的每一个相对应地获取相关内容指定元数据。在步骤1107中,为多个相关内容指定元数据的每一个检索相似的基于非文本的内容,和为相似的基于非文本的内容的每一个获取内容ID。在步骤1108中,利用在步骤1107中获得的一组数个ID和作为生成相关内容信息的处理的目标内容的内容ID,生成相关内容信息。
图12例示了在上述例子中,在生成与新闻项211有关的相关内容信息的处理完成的阶段,存储在非文本相关内容信息存储部分713中的相关内容信息的一个例子。
图13是例示在第2实施例中,在生成与基于非文本的内容有关的相关内容信息的处理中,内容和元数据之间的关系的综合图。例如,只利用如图13所示人工指定的元数据220和820不能确定新闻项211和新闻项813是彼此相关的内容。但是,通过把作为与两段基于非文本的内容相似的基于文本的内容的文章310和910的相关信息传送到基于非文本的内容方,得出两种基于非文本的内容是与在同一天-5月21日进行的“A term vs.B term”的比赛有关的相关新闻项。换句话说,通过执行如图11所示的步骤,得出新闻项211和813是相关内容。
如上所述,在本实施例中,利用人工指定给作为生成相关内容信息的处理的目标的基于非文本的内容的元数据,检索相似的基于文本的内容。然后,利用与事先与相似的基于文本的内容相联系的基于文本的内容相关自动提取的元数据(相关内容指定元数据),检索相似的基于非文本的内容。从而,可以得出仅从人工指定的最小元数据中得不出的多个基于非文本的内容段之间的关系。
并且,在本实施例中,与第1实施例中一样,也可以把基于非文本的内容管理部分110a和基于文本的内容管理部分120a当作具有两个部分的功能存在于同一个计算机中的单个内容管理设备来实现,或者,也可以把它们当作两个部分存在于各自分开的计算机中和通过网络相互连接的内容管理系统来实现。
加之,通过把执行这些步骤的程序安装在计算机上,也可以实现在步骤1101到1108中描述的基于非文本的内容管理部分110a和基于文本的内容管理部分120a的处理。
如上所述,根据本发明,利用人工指定给作为加入元数据的处理的目标的基于非文本的内容的元数据,检索相似的基于文本的内容,相关地自动提取的元数据,对应于作为加入元数据的处理的目标的基于非文本的内容的附加元数据而获得的相似的基于文本的内容自动地提取元数据,从而,可以从人工指定的有限项元数据的出发,增加作为在MPEG-7标准下指定元数据的处理的目标的基于非文本的内容的元数据的项数。
并且,如此获取内容的多种元数据导致的次要效果是,在利用元数据检索基于非文本的内容的过程中,提高了内容的可重复性。
加之,利用人工指定给作为生成相关内容信息的处理的目标的基于非文本的内容的元数据,检索相似的基于文本的内容。然后,利用与事先与相似的基于文本的内容相联系的基于文本的内容相关自动提取的元数据(相关内容指定元数据),检索相似的基于非文本的内容。从而,可以得出仅从人工指定的最小元数据中得不出的多个基于非文本的内容段之间的关系。
本申请基于2001年6月11日提出的日本专利申请第2001-175136号,特此全文引用,以供参考。
工业可应用性本发明可应用于包括基于非文本的内容管理部分和基于文本的内容管理部分的内容管理系统,其中,基于非文本的内容管理部分管理诸如视频和音频之类的基于非文本的内容和内容的元数据,和基于文本的内容管理部分管理文本文档和文档的元数据。
权利要求
1.一种基于非文本的内容管理设备,包括发送部分,用于发送附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;接收部分,用于接收附加元数据;和指定部分,用于把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。
2.根据权利要求1所述的基于非文本的内容管理设备,其中,指定部分不作任何其它处理地把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。
3.根据权利要求1所述的基于非文本的内容管理设备,其中,指定部分把从中删除了与原始元数据重叠的部分的接收附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。
4.一种基于文本的内容管理设备包括接收部分,用于接收附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;检索部分,用于根据包括在接收的附加元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取部分,用于获取事先指定给检索的基于文本的内容的元数据,作为附加元数据;和发送部分,用于发送获取的附加元数据。
5.根据权利要求4所述的基于文本的内容管理设备,其中,当检索到数个相似的基于文本的内容时,获取部分获取事先指定给数个检索的相似的基于文本的内容当中,相似的度最高的基于文本的内容的元数据,作为附加元数据。
6.根据权利要求4所述的基于文本的内容管理设备,其中,当检索到数个相似的基于文本的内容时,获取部分按照相似的度的降序,获取事先指定给数个检索的相似的基于文本的内容当中,预定个基于文本的内容的每一个的一组元数据。
7.一种内容管理系统,包括处理基于非文本的内容的基于非文本的内容管理设备和处理基于文本的内容的基于文本的内容管理设备,其中,基于非文本的内容管理设备含有第1发送部分,用于向基于文本的内容管理设备发送附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;第1接收部分,用于从基于文本的内容管理设备接收附加元数据;和指定部分,用于把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容;和基于文本的内容管理设备含有第2接收部分,用于从基于非文本的内容管理设备接收附加元数据请求;检索部分,用于根据包括在接收的附加元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取部分,用于获取事先指定给检索的基于文本的内容的元数据,作为附加元数据;和第2发送部分,用于向基于非文本的内容管理设备发送获取的附加元数据。
8.根据权利要求7所述的内容管理系统,其中,基于非文本的内容管理设备和基于文本的内容管理设备存在于同一计算机中。
9.根据权利要求7所述的内容管理系统,其中,基于非文本的内容管理设备和基于文本的内容管理设备各自存在于不同的计算机中和以信息可发送方式相互连接。
10.一种基于非文本的内容管理设备,包括发送部分,用于发送相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;接收部分,用于接收相关内容指定元数据;和生成部分,用于根据接收的相关内容指定元数据,生成与作为生成相关内容信息的处理的目标的基于非文本的内容有关的相关内容信息。
11.根据权利要求10所述的基于非文本的内容管理设备,其中,相关内容信息包括事先指定给与作为生成相关内容信息的处理的目标的基于非文本的内容相似的基于非文本内容的内容ID,和生成装置含有检索部分,用于根据接收的相关内容指定元数据,检索与作为生成相关内容信息的处理的目标的基于非文本的内容相似的基于非文本的内容;和获取部分,用于获取事先指定给检索的基于非文本内容的内容ID。
12.根据权利要求11所述的基于非文本的内容管理设备,其中,当检索到多个相似的基于非文本的内容时,获取部分获取事先指定给在多个检索的相似的基于非文本的内容当中,相似的度最高的基于非文本内容的内容ID。
13.根据权利要求11所述的基于非文本的内容管理设备,其中,当检索到多个相似的基于非文本的内容时,获取部分按照相似的度的降序,获取事先分别指定给在多个检索的相似的基于非文本的内容当中,预定数量个基于非文本内容的内容ID。
14.一种基于文本的内容管理设备,包括接收部分,用于接收相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;检索部分,用于根据包括在接收的相关内容指定元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取部分,用于获取事先指定给与检索的基于文本的内容有关的基于文本的内容的元数据,作为相关内容指定元数据;和发送部分,用于发送获取的相关内容指定元数据。
15.根据权利要求14所述的基于文本的内容管理设备,其中,当检索到多个相似的基于文本的内容时,获取部分获取事先指定给在多个检索的相似的基于文本的内容当中,相似的度最高的基于文本的内容的元数据,作为相关内容指定元数据。
16.根据权利要求14所述的基于文本的内容管理设备,其中,当检索到多个相似的基于文本的内容时,获取部分按照相似的度的降序,获取事先分别指定给在多个检索的相似的基于文本的内容当中,预定数量个基于文本的内容的一组元数据。
17.一种内容管理系统,包括处理基于非文本的内容的基于非文本的内容管理设备、和等互利基于文本的内容的基于文本的内容管理设备,其中,基于非文本的内容管理设备含有第1发送部分,用于向基于文本的内容管理设备发送相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;第1接收部分,用于从基于文本的内容管理设备接收相关内容指定元数据;和生成部分,用于根据接收的相关内容指定元数据,生成与作为生成相关内容信息的处理的目标的基于非文本的内容有关的相关内容信息,和基于文本的内容管理设备含有第2接收部分,用于从基于非文本的内容管理设备接收相关内容指定元数据请求;检索部分,用于根据包括在接收的相关内容指定元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取部分,用于获取事先指定给与检索的基于文本的内容有关的基于文本的内容的元数据,作为相关内容指定元数据;和第2发送部分,用于向基于非文本的内容管理设备发送获取的相关内容指定元数据。
18.根据权利要求17所述的内容管理系统,其中,基于非文本的内容管理设备和基于文本的内容管理设备存在于同一计算机中。
19.根据权利要求17所述的内容管理系统,其中,基于非文本的内容管理设备和基于文本的内容管理设备各自存在于不同的计算机中和以信息可发送方式相互连接。
20.一种利用与另一个基于非文本的内容相似的基于文本的内容,检索与另一个基于非文本的内容有关的基于非文本内容的内容管理设备。
21.根据权利要求20所述的内容管理设备,其中,利用与另一个基于非文本的内容相似的基于文本的内容有关的另一个基于文本的内容执行检索。
22.一种在含有处理基于非文本的内容的基于非文本的内容管理设备和处理基于文本的内容的基于文本的内容管理设备的内容管理系统中,加入元数据的方法,包括在基于非文本的内容管理设备中,向基于文本的内容管理设备发送附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;在基于文本的内容管理设备中,从基于非文本的内容管理设备接收附加元数据请求;根据包括在接收的附加元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取事先指定给检索的基于文本的内容的元数据,作为附加元数据;和向基于非文本的内容管理设备发送获取的附加元数据;在基于非文本的内容管理设备中,从基于文本的内容管理设备接收附加元数据;和把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。
23.一种在含有处理基于非文本的内容的基于非文本的内容管理设备、和处理基于文本的内容的基于文本的内容管理设备的内容管理系统中,生成相关内容信息的方法,包括步骤在基于非文本的内容管理设备中,向基于文本的内容管理设备发送相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;在基于文本的内容管理设备中,从基于非文本的内容管理设备接收相关内容指定元数据请求;根据包括在接收的相关内容指定元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取事先指定给与检索的基于文本的内容有关的基于文本的内容的元数据,作为相关内容指定元数据;向基于非文本的内容管理设备发送获取的相关内容指定元数据;在基于非文本的内容管理设备中从基于文本的内容管理设备接收相关内容指定元数据;和根据接收的相关内容指定元数据,生成与作为生成相关内容信息的处理的目标的基于非文本的内容有关的相关内容信息。
24.一种使计算机执行如下步骤的内容管理程序发送附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;接收附加元数据;和把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。
25.一种使计算机执行如下步骤的内容管理程序接收附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;根据包括在接收的附加元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取事先指定给检索的基于文本的内容的元数据,作为附加元数据;和发送获取的附加元数据。
26.一种使计算机起处理基于非文本的内容的基于非文本的内容管理部分和处理基于文本的内容的基于文本的内容管理部分作用的内容管理程序,包括在基于非文本的内容管理部分中,向基于文本的内容管理部分发送附加元数据请求,附加元数据请求包括事先指定给作为加入元数据的处理的目标的基于非文本的内容的原始元数据;在基于文本的内容管理部分中,从基于非文本的内容管理部分接收附加元数据请求;根据包括在接收的附加元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取事先指定给检索的基于文本的内容的元数据,作为附加元数据;和向基于非文本的内容管理部分发送获取的附加元数据;在基于非文本的内容管理部分中,从基于文本的内容管理部分接收附加元数据;和把接收的附加元数据指定给作为加入元数据的处理的目标的基于非文本的内容。
27.一种使计算机执行如下步骤的内容管理程序发送相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;接收相关内容指定元数据;和根据接收的相关内容指定元数据,生成与作为生成相关内容信息的处理的目标的基于非文本的内容有关的相关内容信息。
28.一种使计算机执行如下步骤的内容管理程序接收相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;根据包括在接收的相关内容指定元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取事先指定给与检索的基于文本的内容有关的基于文本的内容的元数据,作为相关内容指定元数据;和发送获取的相关内容指定元数据。
29.一种使计算机起处理基于非文本的内容的基于非文本的内容管理部分和处理基于文本的内容的基于文本的内容管理部分功能的内容管理程序,该程序包括在基于非文本的内容管理部分中,向基于文本的内容管理部分发送相关内容指定元数据请求,相关内容指定元数据请求包括事先指定给作为生成相关内容信息的处理的目标的基于非文本的内容的原始元数据;在基于文本的内容管理部分中,从基于非文本的内容管理部分接收相关内容指定元数据请求;根据包括在接收的相关内容指定元数据请求中的原始元数据,检索与对应于原始元数据的基于非文本的内容相似的基于文本的内容;获取事先指定给与检索的基于文本的内容有关的基于文本的内容的元数据,作为相关内容指定元数据;向基于非文本的内容管理部分发送获取的相关内容指定元数据;在基于非文本的内容管理部分中,从基于文本的内容管理部分接收相关内容指定元数据;和根据接收的相关内容指定元数据,生成与作为生成相关内容信息的处理的目标的基于非文本的内容有关的相关内容信息。
全文摘要
一种用于不那么费力地把与内容的主旨相关的元数据指定给诸如视频和音频的多媒体内容的内容处理系统。人工指定给基于非文本的内容的原始元数据从基于非文本内容的管理部分(110)发送到基于文本的内容管理部分(120)。基于文本的内容管理部分(120)的相似的基于文本的内容的检索部分(125)利用原始元数据,检索相似的基于文本的内容。将对相似的基于文本的内容自动提取的元数据作为基于非文本的内容的附加元数据发送到基于非文本的内容管理部分(110)。
文档编号G06F17/30GK1533541SQ02814439
公开日2004年9月29日 申请日期2002年6月7日 优先权日2001年6月11日
发明者下岛崇, 野口直彦, 彦 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1