在分级的基于信任的配置中结构化并搜索数据的制作方法

文档序号:6348990阅读:196来源:国知局
专利名称:在分级的基于信任的配置中结构化并搜索数据的制作方法
技术领域
本发明涉及在服务器系统和/或数据库系统上结构化(structuring)数据。更具体地,本发明涉及在分级的基于信任(confidence)的配置中结构化并搜索数据。
背景技术
搜索服务器的数据是客户端计算机可以通过诸如因特网的网络发起的操作。在客户端计算机向其发送查询的服务器中以某种方式组织数据。数字媒体(例如,音频、视频和元数据)的出现已经使数据的绝对尺寸(sheer size)变得庞大。当客户端计算机查询服务器时,服务器可能必须搜索非常大量的数据以提供针对该查询的结果。检索数据的传统方法效率正在降低,因为搜索数据集的方法的演进并不像数据集的变大一样迅速。

发明内容
在传统服务器中,数据的范围可以从高信任质量数据到低信任质量数据。高信任质量数据是以相对高的已知关注量和已知控制量而输入的数据。低信任质量数据是以相对低的已知关注量和已知控制量而输入的数据。高信任质量数据的示例是由拥有服务器的公司的编辑部员工输入到该服务器中的数据。低信任质量数据的示例是由服务器的非附属的公众用户输入到该服务器的数据。不幸的是,传统服务器上的数据通常不是根据数据的信任质量而组织的。因此,当将查询发送至传统服务器用以搜索时,传统服务器不在高信任质量数据与低信任质量数据之间区分。因此,搜索很可能是低效的,因为传统服务器可能搜索所有的数据,而不是首先集中于最高信任质量数据。需要一种具有用于解决上述问题的特征以及还未讨论的新特征的改进方法。一般来说,这里提供的创造性实施例通过提供用于在分级的基于信任的配置中结构化并搜索数据的方法和系统,来满足这些需要。下面描述创造性实施例。在一个实施例中,提供了用于在分级的基于信任的配置中结构化数据的方法。该方法包括接收数据并将信任质量等级分配给该数据。信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。将特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数据之前被搜索。该方法还包括根据信任质量等级在服务器系统的所选服务器中组织该数据。所选服务器在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。在第二实施例中,提供了用于在分级的基于信任的配置中搜索数据的方法。该方法包括将查询接收至服务器系统中。从最高信任质量等级到最低信任质量等级组织服务器系统中的数据。将特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数据之前被搜索。该方法还包括搜索最高信任质量等级的数据以力图满足查询。在搜索较低信任质量等级的数据之前进行最高信任质量等级的数据的搜索。
5
在第三实施例中,提供了用于在分级的基于信任的配置中结构化数据的系统。该系统被配置用于接收数据并向数据分配信任质量等级。信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。 将特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数据之前被搜索。 该方法还被配置用于根据信任质量等级在服务器系统的所选服务器中组织数据。所选服务器在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。在第四实施例中,提供了用于在分级的基于信任的配置中搜索数据的系统。该系统被配置用于将查询接收至服务器系统中。从最高信任质量等级到最低信任质量等级组织服务器系统中的数据。将特定信任质量等级的数据配置为优选地在相对较低的信任质量等级的数据之前被搜索。该系统还被配置用于搜索最高信任质量等级的数据以力图满足查询。在搜索较低信任质量等级的数据之前进行最高信任质量等级的数据的搜索。一种计算机可读介质包括一个或多个指令用于结构化数据。当由一个或多个处理器执行所述一个或多个指令时,所述一个或多个指令使所述一个或多个处理器执行下列步骤接收数据;向数据分配信任质量等级,其中信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中,并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索;以及根据信任质量等级在服务器系统的所选服务器中组织数据,其中所选服务器在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。本发明涵盖如上所述配置的以及具有其它特征和替代的其它实施例。应当理解, 这些实施例可以以许多方式来实施,包括作为方法、处理、装置、系统或设备。


通过结合附图的下列详细描述,将容易地理解创造性实施例。为了便于此描述,相同的参考数字指代相同的结构单元。图1是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的系统的框图;图2是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的图1的系统的示意图;图3是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的另一系统的框图;图4是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的图3的系统的示意图;图5是根据某些实施例的用于在分级的基于信任的配置中结构化数据的方法的流程图;以及图6是根据某些实施例的用于在分级的基于信任的配置中搜索数据的方法的流程图。
具体实施例方式对于用于在分级的基于信任的配置中结构化并搜索数据的方法和系统公开了发明。阐述了许多具体细节以便提供对各个实施例的全面理解。然而,本领域技术人员将理解所述实施例可以通过其它具体细节而实现。为了清楚起见,下面定义一些术语。这些术语并非严格限制于这些定义。这些术语和其它术语也可以通过它们在此描述的上下文中的使用而定义。“计算机”(例如,“客户端计算机”或“客户端”或“服务器”)可以指单个计算机或互联计算机的系统。计算机是硬件系统、软件操作系统以及或许一个或多个软件应用程序的组合。计算机的示例包括(并非限制)膝上型计算机、掌上型计算机、智能电话、蜂窝电话、移动电话、mp3播放器、数字音频记录器、数字录像机、CD播放器、DVD播放器、具有诸如 Microsoft Windows 的操作系统的IBM式个人计算机(PC)、具有诸如MAC-OS的操作系统的Apple 计算机、具有JAVA-OS操作系统的硬件、以及具有UNIX操作系统的Sim微系统工作站。“信任质量^t思是已经用于将数据输入服务器和/或数据库的已知关注和已知控制的最小量。高信任质量数据的示例是由拥有服务器的公司的编辑部员工手动输入服务器的数据。这样的公司可以是例如Macrovision 。低信任质量数据的示例是由服务器的非附属的公众用户输入该服务器的数据。“信任质量等级(tier),,(例如,“等级”)意思是与特定信任质量的数据关联的信任质量级别。当相关联的数据具有特定信任质量时,服务器和/或数据库可被称为在特定信任质量等级内。“数据库”意思是以计算机程序可以迅速选择所期望的数据的方式所组织的数据的集合。数据库是电子编档(filing)系统。在某些实例中,术语“数据库”用作“数据库管理系统”的简略表示。“设备”意思是硬件、软件或它们的组合。设备有时可以称为装置。每个设备被配置为执行在分级的基于信任的配置中结构化并搜索数据的方法的一个或多个步骤。“指纹”(例如,“音频指纹(audio fingerpoint)”或“声学指纹”)是从可用于识别音频样本和/或在音频数据库中迅速定位相似项的音频信号确定性地生成的对某些声学属性的数字度量。“指纹识别(fingerprinting)”是生成指纹的过程。对音频指纹识别的实际使用包括识别歌曲、记录、旋律、曲调或广告;无线电广播和对等网络监视;音效库管理;视频文件识别;等等。指纹是不受元数据影响的独立数据。Macrovision 公司具有存储针对各个音频样本的超过两千五百万个唯一的指纹的数据库。题目为“Method and System for Analyzing Digital Audio Files”的美国专利 7,277,766 (,766 专利)通过引用合并在此,其提供了用于对音频波形进行指纹识别的装置的示例。题目为“Methods and Apparatus for Identifying Media Objects”的美国专利 7,451,078 (,078 专利)通过引用将其合并在此,其提供了用于生成音频记录的音频指纹的装置的示例。“模糊搜索”(例如,“模糊字符串搜索”或“近似字符串搜索”)意思是对于近似地或基本上匹配给定文本字符串模式的文本字符串的搜索。模糊搜索还可以称为近似或非精确匹配。在执行模糊搜索时可以发生精确匹配。
7
“元数据”通常意思是描述数据的数据。更具体地,元数据的意思是描述数字音频记录的内容的数据。这样的元数据可以包括例如歌曲名称、艺术家信息(例如,姓名、生日、唱片分类目录等)、曲集信息(例如,曲集标题、评论、音轨列表、声音样本等)、相关信息 (例如,相似的艺术家和曲集、流派等)、以及其它类型的补充信息。传统的光盘(例如,CD、 DVD和蓝光盘(Blu-ray Discs))典型地并不包含元数据。可以在数据记录已经被从光盘分离(rip)之后将元数据附至数字记录(例如,歌曲、曲集、影片或视频),将所述元数据转换为另一数据音频格式并存储在硬盘驱动器上。“网络”意思是任何两个或多个计算机之间的连接,其允许数据的传输。网络可以是包括(并非限制)因特网、局域网、广域网、无线网络和蜂窝式网络的网络的任何组合。“服务器”意思是向同一或其它计算机中的其它计算机程序(和它们的用户)提供服务的软件应用。服务器还可以指已经被留出以运行专用服务器应用的物理计算机。例如,当软件Apache HTTP krver用作用于公司的网站的网络服务器时,运行Apache的计算机也称为网络服务器。依赖于工作负荷,可以在极端范围上在服务器计算机之中划分服务器应用。“内容表”(TOC)意思是光盘(诸如,蓝光盘、⑶或DVD)上的音轨(章节)、音轨(章节)起始时间和结束时间的列表。盘上的音轨起始时间典型地被表示为六位十六进制值。 题目为“Digital Audio Track Set Recognition System,,的美国专利 7,359,900 (,900 专利)通过引用合并在此,其提供了使用TOC数据来识别CD或DVD的方法的示例。’900专利还描述了使用盘的识别在数据库中查找元数据、然后将该元数据发送至终端用户的方法。“音轨”意思是诸如⑶的光盘上的音频数据块。音轨至少存储音频记录的一部分。“网络浏览器”意思是可以显示来自网站上的网页的文本、图形或两者的任何软件应用。网络浏览器的示例包括(并非限制)Mozilla Firefox 和Microsoft Internet Explorer 。“网页”意思是以包括(并非限制)HTML (超文本标记语言)或VRML(虚拟现实建模语言)、动态HTML、XML(可扩展标记语言)或其有关计算机语言的标记语言所写的任何文档,以及意思是通过一个具体因特网地址可达或在一个具体网站的文档的任何集合、或通过特定URL(统一资源定位符)可获得的任何文档。“网络服务器”指能够向网络浏览器提供至少一个网页的应用、计算机或其它电子设备。网络服务器的示例是Apache网络服务器。“网站”意思是至少一个网页,更一般是意思是虚拟地连接以形成相关组 (coherent group)的多个网页。对于本系统的实施,软件应用可以以基本上任何可由本领域普通技术人员容易地选择的合适的编程语言来编写。所选的编程语言应当与要执行软件应用的计算机兼容,特别地与该计算机的操作系统兼容。合适的编程语言的示例包括(并非限制)0bject Pascal, C、C++、Java和Jav必cript。另外,当被描述为方法的一系列步骤时,某些实施例的功能可以实施为用于由处理器操作的一系列软件指令,从而实施例可以实施为软件、硬件或它们的组合。下面在单独的部分中更详细地讨论计算机可读介质。图1是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的
8系统100的框图。网络105将客户端计算机110和服务器系统115耦接在一起。网络105 还可以耦接至其它客户端计算机(未示出)。服务器系统115耦接至(或包括)数据库系统 130。服务器系统115包括多个服务器,范围从等级1服务器到等级η服务器。服务器系统115的全部服务器可以共同耦接至数据库系统130。作为选择,服务器系统115的每个服务器可以各自分别耦接至其自己的数据库。服务器系统115可以存储和/或有权访问从一个或多个客户端计算机110收集和/或生成的数字媒体数据。例如,服务器系统115可以存储和/或有权访问指纹和关联的元数据。服务器系统115包括结构化设备120和搜索设备125。结构化设备120和搜索设备125执行系统100的更重要的操作。服务器系统115的组件以使得服务器系统115能够结构化数据并为客户端计算机110执行搜索的这样的方式连接。图1的客户端计算机110包括配置用于与服务器系统115通信以搜索服务器系统 115的分级的基于信任的配置的硬件和/或软件。例如,客户端计算机110可以具有带有图形用户界面(GUI)以访问因特网的操作系统,并优选地配备有可操作以从和向网络上的超文本传输协议(HTTP)服务器读取和发送超文本标记语言(HTML)形式的万维网(网络) 浏览器软件,诸如Mozillar Firefox 。单机盘播放器(例如,⑶播放器、DVD播放器或蓝光盘播放器)可以具有内置接口,其使得盘播放器能够通过网络105、直接地或通过另一计算机与服务器系统115通信。例如,⑶播放器可以具有数据接口(例如,IDE接口或USB接口),其使得CD播放器能够发送并从膝上型计算机接收数据,所述膝上型计算机转而耦接至网络105。同样,服务器系统115包括用于与客户端计算机110通信的硬件和/或软件。例如,服务器系统115可以具有HTTP兼容软件、操作系统和公共网关接口(CGI)软件,用于通过网络105与客户端计算机110相连接。作为选择,服务器系统115和客户端计算机110 可以运行使得它们能够通过网络105通信的专有软件。容易理解,图1的框图中的配置是为了说明的目的,并且许多变型是可能的。例如,服务器系统115可以耦接至局域网(LAN),该局域网转而可以耦接至网络105。在另一示例中,服务器系统115可以耦接至多个网络服务器。系统100还可以包括以不同于这里描绘的数据库系统130的配置而布置的数据库系统。例如,下面在下一个部分中,参照图1-4 讨论混合配置。图2是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的图1的系统100的示意图。系统100被结构化为最优化从客户端计算机110发起的模糊搜索。模糊搜索意思是对于近似地或基本上匹配给定模式字符串的字符串的搜索。在搜索发生之前,图1的结构化设备120被配置为基于信任质量来对服务器系统 115中的数据进行分类。信任质量意思是已经投入到将数据存储到服务器和/或数据库中的已知关注和已知控制的最小量。最高信任质量数据对查询提供最高信任结果。最低信任质量数据对查询提供最低信任结果。结构化设备120被配置为分解数据,并从最高信任质量到最低信任质量跨越多个服务器而分布数据。结构化设备120将数据结构化到分等级的服务器中,从等级1服务器到等级η服务器,其中η是正整数。例如,等级1数据包含在等级1服务器中。等级2数据包含在等级2服务器中,等等。将数据按照需要分等级到η个服务器中。等级1数据是最高信任质量数据。等级 1数据的示例可以是由拥有服务器系统115的公司的编辑部员工手动输入服务器系统115 的编辑数据。这样的公司可以是例如Maerovision 。等级2是次高的信任质量数据。等级 2数据的示例可以是从拥有服务器系统115的公司的合作伙伴提交的数据。数据的等级按照需要以更小的信任质量继续。更小的信任质量数据的示例包括下列从服务器系统115 的非附属的公众用户挖掘的数据;和/或由服务器系统115的非附属的公众用户输入的数据。图1的搜索设备125被配置为首先搜索等级1数据。搜索设备125试图通过搜索等级1数据来满足查询。如果等级1服务器返回对该查询的结果,那么搜索设备125不需要汇总(aggregate)来自服务器系统115中的全部服务器的全部结果。然而,如果等级 1服务器未返回对该查询的结果,那么搜索设备125继续前进,并优选地接下来搜索等级2 数据。等级2服务器试图从等级2数据来满足查询。如果等级2服务器返回对该查询的结果,那么搜索设备125不需要汇总来自服务器系统115中的全部服务器的全部结果。该处理按照需要继续至等级η服务器中的等级η数据。重要的是,注意,结构化设备120被配置为不考虑找到对查询的匹配的可能性而组织数据。在多个搜索中,最不可能找到查询匹配的源可能结果是等级1数据。然而,此基于信任的方法可以以至少两种方式改善搜索效率。第一,搜索设备125可以立即找到结果并且不需要查看所有数据。第二,通过首先找到并返回最高信任质量数据,该结果不需要在被返回至客户端计算机110之前对于优先级而分类。在执行搜索之前,已经通过信任质量而存储了该数据。因此,在找到结果之后对于优先级而分类是不必要的。因此,客户端计算机110可以通过网络105访问服务器系统115。客户端计算机 110可以例如发送对与服务器系统115中的经识别的唯一标识符关联的元数据的查询。服务器系统115中的每个唯一标识符可能已经例如从CD的内容表(TOC)生成。作为选择,每个唯一标识符可以是例如从音轨生成的指纹。指纹是从可用于识别音频样本和/或在数据库中迅速定位相似项的音频信号确定性地生成的某些声学属性的数字度量。在另一实施例中,客户端计算机110可以使用网络浏览器向服务器系统115发出字符串查询。也存在搜索配置的其它示例。图3是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的另一系统300的框图。图3的系统300基本上与图1的系统100相同。然而,在图3的系统300中,将数据库系统330组织为等级,并且服务器系统315优选地包括一个服务器。网络105将客户端计算机110与服务器系统315耦接在一起。网络105还可以耦接至其它客户端计算机(未示出)。服务器系统315耦接至数据库系统330。数据库系统330包括多个数据库,范围从等级1数据库到等级η数据库。数据库系统330的全部数据库都可以共同耦接至服务器系统315。数据库系统330可以存储从一个或多个客户端计算机110收集和/或生成的数字媒体数据。例如,数据库系统330可以存储指纹和关联的元数据。服务器系统315包括结构化设备320和搜索设备325。结构化设备320和搜索设备325执行系统300的更重要的操作。服务器系统315的组件以使得服务器系统315能够结构化数据并为客户端计算机110执行搜索的方式连接。图3的客户端计算机110包括配置用于与服务器系统315通信以搜索数据库系统 330的分级的基于信任的配置的硬件和/或软件。例如,客户端计算机110可以具有带有图形用户界面(GUI)的操作系统以访问因特网,并优选地配备有可操作以从和向网络上的超文本传输协议(HTTP)服务器读取和发送超文本标记语言(HTML)形式的万维网(网络) 浏览器软件,诸如,Mozillar Firefox 。独立的盘播放器(例如,⑶播放器、DVD播放器或蓝光盘播放器)可以具有内置接口,其使得盘播放器能够通过网络105直接地或通过另一计算机与数据库系统330通信。例如,CD播放器可以具有数据接口(例如,IDE接口或USB接口),其使得CD播放器能够发送并从膝上型计算机接收数据,所述膝上型计算机转而耦接至网络105。同样,服务器系统315包括用于与客户端计算机110通信的硬件和/或软件。例如,服务器系统315可以具有HTTP兼容软件、操作系统和公共网关接口(CGI)软件,用于通过网络105与客户端计算机110相接。作为选择,服务器系统315和客户端计算机110可以运行使得它们能够通过网络105通信的专有软件。将易于理解,图3的框图中的配置是为了说明的目的,并且许多变型是可能的。例如,数据库系统330可以耦接至局域网(LAN),该局域网转而可以耦接至网络105。在另一示例中,数据库系统330可以耦接至多个网络服务器。系统300还可以包括以不同于这里描绘的数据库系统330的配置而布置的数据库系统。例如,下面参照图1-4讨论混合配置。图4是根据某些实施例的用于在分级的基于信任的配置中结构化并搜索数据的图3的系统300的示意图。在实施例中,图4的系统300可以与图2的系统100基本上类似。然而,在此系统300中,将数据库系统330组织为等级,并且服务器系统315优选地具有一个服务器。系统300被结构化为最优化从客户端计算机110发起的模糊搜索。模糊搜索意思是对于近似地或基本上匹配给定模式字符串的字符串的搜索。在搜索发生之前,图3的结构化设备320被配置为基于信任质量来对服务器系统 315中的数据进行分类。最高信任质量数据对查询提供最高信任结果。最低信任质量数据对查询提供最低信任结果。如上面参照图1所述,信任质量意思是已经投入到将数据存储到服务器和/或数据库中的已知关注和已知控制的最小量。结构化设备320被配置为分解数据,并从最高信任质量到最低信任质量跨越多个服务器而分布数据。结构化设备320将数据结构化到分等级的数据库中,从等级1数据库到等级η数据库,其中η是正整数。例如,等级1数据包含在等级1数据库中。等级2数据包含在等级2数据库中,等等。数据按照需要分等级到η个数据库中。等级1数据是最高信任质量数据。等级1 数据的示例是由拥有数据库系统315的公司的编辑部员工手动输入数据库系统315的编辑数据。这样的公司可以是例如Maerovision 。等级2是次高的信任质量数据。等级2数据的示例是从拥有数据库系统330的公司的合作伙伴提交的数据。数据的等级按照需要以更小的信任质量继续。更小的信任质量数据的示例包括下列从数据库系统315的非附属的公众用户挖掘的数据;和/或由数据库系统315的非附属的公众用户输入的数据。图3的搜索设备325被配置为首先搜索等级1数据。搜索设备325试图从等级1数据来满足查询。如果等级1数据库返回对该查询的结果,则搜索设备325不需要汇总来自数据库系统330中的全部数据库的全部结果。然而,如果等级1数据库不具有对该查询的结果,那么搜索设备325继续前进,并优选地接下来搜索等级2数据。等级2数据库可能从等级2数据来满足查询。如果等级2数据库具有对该查询的结果,则搜索设备325不需要汇总来自数据库系统330中的全部数据库的全部结果。该处理按照需要继续至等级η数据库中的等级η数据。重要的是,注意,结构化设备320被配置为不考虑找到对查询的匹配的可能性而组织数据。在多个搜索中,最不可能找到查询匹配的源可能结果是等级1数据。然而,该基于信任的方法可以以至少两种方式改善搜索效率。第一,搜索设备325可以立即找到结果并不需要查看所有数据。第二,通过首先找到并返回最高信任质量数据,该结果不需要在被返回至客户端计算机110之前对于优先级而分类。例如,在执行搜索之前,已经通过信任质量而分类了该数据。因此,在找到结果之后对于优先级而分类是不必要的。因此,客户端计算机110可以通过网络105访问数据库系统330。客户端计算机 110可以例如发送对与数据库系统330中的经识别的唯一标识符关联的元数据的查询。数据库系统330中的每个唯一标识符可能已经例如从CD的内容表(TOC)生成。作为选择,每个唯一标识符可以是例如从音轨生成的指纹。指纹是从可用于识别音频样本和/或在数据库中迅速定位相似项的音频信号确定性地生成的对某些声学属性的数字度量。在另一实施例中,客户端计算机110可以使用网络浏览器向数据库系统330发出字符串查询。也存在搜索配置的其它示例。参见图1-4,注意,某些实施例可以包括上面讨论的实施例的混合。例如,服务器系统可以包括多个服务器,同时服务器系统中的至少一个服务器耦接至多个数据库。可以根据信任质量等级以预定方式对多个服务器和多个数据库分等级。同样,可以跨越多个服务器和多个数据库,根据信任质量等级结构化数据。还存在其它变型。方法概述图5是根据某些实施例的用于在分级的基于信任的配置中结构化数据的方法500 的流程图。在某些实施方式中,可以由图1的结构化设备120执行方法500的步骤。方法500在步骤505中开始,在步骤505系统接收数据。方法500然后移动至步骤510,在步骤510系统将信任质量等级分配至数据。信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。优选地,系统预先确定服务器和/或数据库中的数据的信任质量等级。例如,系统可以预先确定信任质量等级以包括最高信任质量等级、最低信任质量等级和一个或多个中间信任质量等级。特定信任质量等级的数据被配置为优选地在相对较低的信任质量等级的数据之前被搜索。因此,在步骤515中,系统根据信任质量等级在所选服务器中组织数据。所选服务器在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。方法然后进行至判定操作520,在判定操作520中系统确定是否要接收更多的数据。例如,服务器系统的编辑可以手动输入更多的数据。如果要接收更多的数据,那么方法 500返回至步骤505,在步骤505系统接收数据。方法500从那里继续。然而,如果系统在判定操作520确定将不接收更多数据,那么方法500在判定操作520之后结束。
图6是根据某些实施例的用于在分级的基于信任的配置中搜索数据的方法600的流程图。在某些实施方式中,可以由图1的搜索设备125执行方法600的步骤。方法在步骤605中开始,在步骤605系统将来自客户端计算机的查询接收至服务器系统中。从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内地组织服务器系统中的数据。某些实施例使用图5的方法500以在搜索发生之前在服务器和/或数据库中组织数据。如上面参照图5讨论的,系统优选地预先确定服务器和/或数据库的信任质量等级。例如,系统可以预先确定信任质量等级以包括最高信任质量等级、最低信任质量等级和一个或多个中间信任质量等级。特定信任质量等级的数据被配置为优选地在相对较低的信任质量等级的数据之前被搜索。因此,在步骤610中,系统通过搜索最高信任质量等级的数据以力图满足该查询而开始搜索。接下来,在判定操作615中,系统确定该查询是否被处于最高信任质量等级的任何数据所满足。如果该查询被满足,那么方法600移动至步骤635,在步骤635系统将查询结果返回至客户端计算机。然而,如果系统在判定操作615确定该查询未被满足,那么该方法进行至步骤620,在步骤620系统搜索下一信任质量等级的数据以力图满足该查询。优选地,在此步骤620搜索的数据具有比在上面的步骤610搜索的数据低的信任质量。接下来,在判定操作625中,系统确定该查询是否被在上面的步骤620搜索的信任质量等级的任何数据所满足。如果该查询被满足,那么方法600移动至步骤635,在步骤635 系统将查询结果返回至客户端计算机。然而,如果系统在判定操作625中确定该查询未被满足,那么该方法600进行至判定操作630。在判定操作630中,系统确定是否已经搜索了最低信任质量等级的数据。如果还未搜索最低信任质量等级的数据,那么方法600返回至步骤620,在步骤620系统搜索下一信任质量等级的数据。优选地,在步骤620搜索的数据具有比之前搜索的数据低的信任质量。方法600从步骤620继续,直到找到结果或者搜索了所有的信任质量等级为止。在判定操作630中,如果系统确定已经搜索了最低信任质量等级的数据,那么方法600移动至步骤635,在步骤635系统将查询结果返回至发送该查询的客户端计算机。在步骤635,该查询结果可能是系统不能找到对该查询的匹配。在步骤635之后,方法600结束ο注意,这些方法可以包括此方法概述中未讨论的其它细节和步骤。上面参照适当的附图讨论了其它细节和步骤,并且取决于实施例,其它细节和步骤可以是方法的一部分。计算机可读介质实施方式如将对计算机领域内的技术人员所显然的,可以通过使用根据本公开的教示编程的传统通用计算机或专用数字计算机或者微处理器来方便地实施某些实施例的部分。可以由熟练的程序员基于本公开的教示来容易地准备适当的软件编码。还可以通过准备专用集成电路或者通过互联传统组件电路的适当网络来实施所述方法和系统。一种实施方式可以包括计算机程序产品,其是具有存储在其上/其中的指令的存储介质,所述指令可用于控制或使计算机执行实施方式的任何处理。存储介质可以包括 (并非限制)任何类型的盘,包括软盘、迷你盘(MD)、光盘、DVD、CD-R0M、微驱动器、以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪存设备(包括闪卡)、磁或光卡、纳米系统(包括分子存储器IC)、RAID设备、远程数据存储器/存档库/储存库、或适于存储指令和/或数据的任何类型的介质或设备。存储在计算机可读介质的任何一个上,某些实施方式包括用于控制通用/专用计算机或微处理器的硬件并用于使得计算机或微处理器与利用特定实施例的结果的人类用户或其它机构交互的软件。这样的软件可以包括(并非限制)设备驱动器、操作系统和用户应用。最后,这样的计算机可读介质还包括用于执行如上所述的方法和系统的方面的软件。包括在通用/专用计算机或微处理器的编程(软件)中的是用于实施上述处理的软件模块。上述处理包括(并非限制)下列步骤接收数据;将信任质量等级分配给数据, 其中信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中,并且其中特定信任质量等级的数据被配置为在相对较低的信任质量等级的数据之前被搜索;以及根据信任质量等级在服务器系统的所选服务器中组织数据,其中所选服务器在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。系统的实施例允许根据数据的信任质量在服务器上结构化并搜索所述数据。系统高效地跨越服务器结构化数据以改善响应性并降低总体负荷。系统以至少两种方式改善搜索的效率。第一,系统可以立即找到结果并不需要查看所有数据。第二,通过首先找到并返回最高信任质量数据,该结果不需要在被返回至客户端计算机之前对于优先级而分类。在执行搜索之前,已经通过信任质量而分类了数据。因此,不必在找到结果之后对于优先级而分类。所述改善向用户和客户提供改善的体验,同时消耗较少的昂贵的服务器资源。在前面的说明书中,已经参照本发明的具体实施例而讨论了本发明。然而,将显而易见的是,在不脱离本发明的较宽泛的精神和范围的情况下,可以对其进行各种修改和改变。因此,说明书和附图被认为在说明性的意义上而非限制性的意义上。
1权利要求
1.一种用于结构化数据的方法,所述方法包括 接收数据;将信任质量等级分配给所述数据,其中所述信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中,并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索;以及根据所述信任质量等级在服务器系统的所选服务器中组织所述数据,其中所选服务器在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级和所述最低信任质量等级在内的所述范围中。
2.如权利要求1所述的方法,其中信任质量等级是与特定信任质量的数据关联的特定信任质量级别,并且其中信任质量是已经用于将数据输入到所述服务器系统的服务器中的已知关注和已知控制的最小量。
3.如权利要求1所述的方法,还包括至少下列步骤之一根据与服务器系统的服务器关联的数据的信任质量等级,组织所述服务器; 从等级1服务器到等级η服务器来布置所述服务器,其中η是正整数,并且其中所述等级1服务器处于所述最高信任质量等级,并且其中所述等级η服务器处于所述最低信任质量等级。
4.如权利要求1所述的方法,其中不考虑找到对查询的匹配的可能性而进行所述数据的组织。
5.如权利要求1所述的方法,其中所述服务器系统被配置为耦接至存储从一个或多个客户端计算机收集的数字媒体数据的数据库系统。
6.如权利要求1所述的方法,其中所述服务器系统被配置用于模糊搜索,其中模糊搜索搜索基本上匹配给定文本字符串模式的字符串,并且其中组织所述数据最优化模糊搜索。
7.一种用于搜索数据的方法,所述方法包括将查询接收至服务器系统中,其中从最高信任质量等级到最低信任质量等级组织服务器系统中的数据,并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索;以及搜索所述最高信任质量等级的数据以力图满足所述查询,其中在搜索较低信任质量等级的数据之前进行所述最高信任质量等级的数据的搜索。
8.如权利要求7所述的方法,还包括至少下列步骤之一在最高信任质量等级中找到对所述查询的一个或多个基本匹配;以及返回所述一个或多个基本匹配。
9.如权利要求7所述的方法,还包括至少下列步骤之一 在最高信任质量等级中找不到对所述查询的匹配;搜索下一信任质量等级的数据以力图满足所述查询;在所述下一信任质量等级中找到对所述查询的一个或多个基本匹配;以及返回所述一个或多个基本匹配。
10.如权利要求7所述的方法,还包括至少下列步骤之一 在最高信任质量等级找不到对所述查询的匹配;搜索下一信任质量等级的数据以力图满足所述查询; 在所述下一信任质量等级找不到对所述查询的基本匹配; 确定已经搜索了所述最低信任质量等级;以及返回对所述查询的结果。
11.一种用于结构化数据的系统,其中所述系统被配置用于 接收数据;将信任质量等级分配给所述数据,其中所述信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中,并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索;以及根据所述信任质量等级在服务器系统的所选服务器中组织所述数据,其中所选服务器在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级和所述最低信任质量等级在内的所述范围中。
12.如权利要求11所述的系统,其中信任质量等级是与特定信任质量的数据关联的特定信任质量级别,并且其中信任质量是已经用于将数据输入到所述服务器系统的服务器中的已知关注和已知控制的最小量。
13.如权利要求11所述的系统,其中所述系统还被配置用于至少下列之根据与服务器系统的服务器关联的数据的信任质量等级,组织所述服务器;从等级1服务器到等级η服务器来布置所述服务器,其中η是正整数,并且其中所述等级1服务器处于所述最高信任质量等级,并且其中所述等级η服务器处于所述最低信任质量等级。
14.如权利要求11所述的系统,其中不考虑找到对查询的匹配的可能性而进行所述数据的组织。
15.如权利要求11所述的系统,其中所述服务器系统被配置为耦接至存储从一个或多个客户端计算机收集的数字媒体数据的数据库系统。
16.如权利要求11所述的系统,其中所述服务器系统被配置用于模糊搜索,其中模糊搜索搜索基本上匹配给定文本字符串模式的字符串,并且其中组织所述数据最优化模糊搜索。
17.一种用于搜索数据的系统,其中所述系统被配置用于将查询接收至服务器系统中,其中从最高信任质量等级到最低信任质量等级组织服务器系统中的数据,并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索;以及搜索所述最高信任质量等级的数据以力图满足所述查询,其中在搜索较低信任质量等级的数据之前进行所述最高信任质量等级的数据的搜索。
18.如权利要求17所述的系统,其中所述系统还被配置用于至少下列之一 在最高信任质量等级中找到对所述查询的一个或多个基本匹配;以及返回所述一个或多个基本匹配。
19.如权利要求17所述的系统,其中所述系统还被配置用于至少下列之一 在最高信任质量等级中找不到对所述查询的匹配;搜索下一信任质量等级的数据以力图满足所述查询;在下一信任质量等级中找到对所述查询的一个或多个基本匹配;以及返回所述一个或多个基本匹配。
20.如权利要求17所述的系统,其中所述系统还被配置用于至少下列之一 在最高信任质量等级找不到对所述查询的匹配;搜索下一信任质量等级的数据以力图满足所述查询; 在所述下一信任质量等级找不到对所述查询的基本匹配; 确定已经搜索了所述最低信任质量等级;以及返回对所述查询的结果。
21.一种执行用于结构化数据的一个或多个指令的计算机可读介质,其中当由一个或多个处理器执行时,所述一个或多个指令使得所述一个或多个处理器执行下列步骤接收数据;将信任质量等级分配给所述数据,其中所述信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中,并且其中将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索;以及根据所述信任质量等级在服务器系统的所选服务器中组织所述数据,其中所选服务器在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级和所述最低信任质量等级在内的所述范围中。
全文摘要
提供了用于在分级的基于信任的配置中结构化并搜索数据的方法和系统。在一个示例中,该系统接收数据并将信任质量等级分配给该数据。所述信任质量等级在跨越从最高信任质量等级到最低信任质量等级并包含最高信任质量等级和最低信任质量等级在内的范围中。将特定信任质量等级的数据配置为在相对较低的信任质量等级的数据之前被搜索。该系统根据所述信任质量等级在服务器系统的所选服务器中组织数据。所选服务器在跨越从所述最高信任质量等级到所述最低信任质量等级并包含所述最高信任质量等级和所述最低信任质量等级在内的范围中。
文档编号G06F17/30GK102365640SQ201080017874
公开日2012年2月29日 申请日期2010年1月26日 优先权日2009年1月28日
发明者D.J.威廉斯, J.N.韦斯林, R.D.卡尔鲍姆 申请人:罗威科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1