重新使用在通信网络如互联网中预先接收的信息的方法和装置的制作方法

文档序号:6474531阅读:199来源:国知局
专利名称:重新使用在通信网络如互联网中预先接收的信息的方法和装置的制作方法
技术领域
本发明涉及一种在电信网络特别是互联网中重新使用由接收实体预先接收的信息的方法和装置。接收实体是指电信网络的本地部件,用户能够通过该本地部件访问电信网络中所包含的信息。例如,当电信网络是互联网时,可以包括主机中存有企业站点的局域网络。
在类似互联网这样的电信网络中,可以在分布于网络的多个站点上获得信息,并且可从任何接入点如用户终端访问信息。象万维网这样的分布式信息系统供用户通过超文本链接访问彼此连接的分布式合成多媒体文件集。可以访问由称为URL(统一资源定位符)的地址所识别的Web站点和文件,并且可以通过称为浏览器的软件对其进行浏览。还存在其它信息系统。在由用户〔sic〕选定的个人方式中,对象可以由文件如通用文件构成;形成HTML(超文本链接标示语言)页面的图象、声音等内容的一组数据被称为对象。术语链接将指定访问对象的方式。例如可以是超文本链接。
通用类型的信息访问是通过服务器。服务器的一种功能是根据用户的请求传递一项信息,该项信息有效包含在与其关联的一组信息中。服务器允许用户访问包含在远程局部网中的信息。例如,Web服务器接收由用户终端发出的访问一个对象的HTTP请求消息,然后以消息形式发送至请求的对象来作为答复。术语HTTP(超文本传输协议)指定用于Web URL地址的公知访问协议。
在该技术领域中要解决的第一个问题涉及访问数据的速度。在互联网上,消息的发送面临通信量问题,其限制了数据传输速度并延长了等待时间。
缓解这一问题的一种解决方案是使用安装在服务器上的所谓代理高速缓存器,以便协助始发服务器管理其传播的对象。术语代理高速缓存器将指定该公知类型的装置。当由用户终端发送访问对象的HTTP请求消息时,如果相同在先请求已经使对象包含在高速缓存器内,则相关的代理高速缓存器能够直接返回对象。否则,从代理高速缓存器向主机中存有URL的始发服务器发送HTTP请求消息以便向用户传输对象。代理高速缓存器随之标引并存储该对象。高速缓存器的一个优点是,它使信息和用户之间更为密切。如果由始发服务器进行的传输花费一定成本,则代理高速缓存器的使用导致响应时间的缩短,并最终转化为成本的节约。
另一个解决访问数据速度问题的解决方案是,在其它称为镜像的服务器中再现始发服务器的内容。由此避免了在始发服务器上连接的集中。
本领域中要解决的的另一个问题涉及访问数据的选择性,包括为用户提供自动支持,使得可以改进该用户的信息搜索。
搜索引擎是一种使用户搜索位于Web上的信息的公知装置。它们向用户提供指向这些内容的指针。
上面所引用的不同装置和方法不能独自提供解决数据访问速度和数据访问选择性这两个问题的任何解决方案,并且还带来其它问题。
高速缓存器仅能在由一种算法来控制的确定的一段时间内保存对象,该算法是输入日期、容量、访问历史的函数。高速缓存器常常被配置为仅存储不太大的对象。原则上,如果不再次迅速请求对象的话,则从高速缓存器上将其删除以便为更多的最新请求对象释放空间。如果代理高速缓存器与企业站点相关联,除非十分频繁地对其进行请求,否则文件的平均使用寿命仅为几天。高速缓存器是一种其行为是随机性的元件,因此难于控制其内容的性质和使用寿命。
与高速缓存器相反,镜像的内容是确定的。管理员必须主动拷贝信息,这表示管理员控制所有与内容相关联的参数,如寿命、拷贝量、位置等等。镜像站点的管理常常是系统的。它通常包括相同的内容组织。换句话说,该类型的系统没有构成可由最终用户访问的内容的自主性。
搜索引擎仅提供指向信息的指针。因此这些引擎需要与始发服务器连接以重新获得信息。
公知的系统CDN(内容传送网络)是一种改进版本的镜像(mirror),它克服了某些缺陷。它基于的是象镜像或高速缓存器这样的存储元件的分布式结构。目的在于组合高速缓存器和镜像的某些优点。可以具有一定自主性实现从始发服务器向存储部件的信息拷贝。另一方面,不存在建立内容的自主性CDN系统仅仅复制始发服务器的组织和内容。
在某些现有的装置和方法中,通过手动操作完成拷贝操作。当拷贝不是由信息处理者主动进行时,处理者没有关于访问数量的反馈。如果信息处理者是基于访问数量而获酬金时,则这是非常不利的。
本发明的目的在于提供一种系统,以便扩大现有解决方案的范围,从而改进电信系统中访问数据的速度和选择性,可以解决上面所述的问题。
为此,提出一种重新使用由接收实体所预先接收的信息的方法,该接收实体与电信网络中的中间存储设备相联,所述的中间存储设备设置成暂时存储组成对象的信息,在所述接收实体的连续请求之后,将所述信息发送给所述接收实体,所述方法的特征在于包括以下步骤拷贝包含在所述中间存储设备内满足预置标准的的所有对象,并且采用合适的标引将由所述对象制成的拷贝存储在与所述接收实体相联的对象管理设备中。
中间存储设备,例如代理高速缓存器,将高速缓存所有发送给接收实体如企业站点的对象,已经至少一次发送给站点的所有满足预置标准的所有对象,例如所有大型对象,将被存储在对象管理设备如Web服务器中。由于此操作可以使某些选定的对象彼此更接近,因此可以提高数据访问速度并具有更好的选择性。接收用户,例如企业站点的用户,发出请求导致将以自主方式设置对象管理设备例如Web服务器的内容。该Web服务器的内容组成通常符合站点兴趣区域,因为这是依据来自该站点用户的请求得到的。现在,由站点用户请求的对象非常有可能引起该站点的另一用户的兴趣。还可以以自主方式管理包含在该对象管理设备如Web服务器中的对象的使用寿命,而不依赖于专用于中间存储设备例如代理高速缓存器的特殊命令。
有利的是,拷贝包含在所述中间存储设备中满足预置标准的所有对象的所述步骤仅拷贝大于预置容量的对象。
与高速缓存器中发生的情况相反,存储的费用被认为是低于组织拷贝管理的费用。由于一方面能够较迅速地从始发服务器检索到这些小容量对象,另一方面由于这些小容量对象太多而难于管理,因此对拷贝小容量对象不感兴趣。
根据本发明另一方面,拷贝包含在所述中间存储设备中满足预置标准的所有对象的所述步骤仅仅拷贝易于重新使用的自主对象。
例如,就Web来说,不拷贝非高度自主或难于重新使用的文件如“.cla”文件。
根据本发明另一方面,拷贝包含在所述中间存储设备中满足预置标准的所有对象的所述步骤仅仅拷贝符合与接收实体相联的兴趣区域的对象。
根据网络中已请求给定对象的次数,能够首先测量对象与联系接收实体如企业站点的兴趣区域的一致性。接着,采用给定对象关于全访问和/或借助对象管理的访问的主体接近水平,能够测量该一致性。
根据本发明的另一方面,该方法还包括步骤自动生成一些文件,这些文件包含指向存储在所述对象管理设备中的所述对象的链接,以及采用合适的标引将所述文件存储在所述对象管理设备中。这些类型的文件,例如HTML页面,除了包含连接对象的链接外,还可以包含这些对象的说明。
有利的是,采用合适的标引将所述文件存储在所述对象管理设备中的所述步骤自动地根据主题层次对所述文件分类。
有利的是,通过关键词搜索可以访问所述文件。
根据本发明另一方面,拷贝包含在所述中间存储设备中满足预置标准的所有对象的所述步骤,在与每个对象相同的时间,拷贝形成取得每个对象的上下文的要素,所述步骤自动生成包含连接所述对象的链接的文件,所述对象存储在使所述要素与包含连接所述对象的链接的文件相联的所述对象管理设备中。
形成取得对象的上下文的该类型元素是包含连接对象的链接和该对象的文本说明的Web页面。生成的文件接着还可以是基于被检索Web页面的Web页面。这样就生成了与被拷贝对象在主题上一致的Web页面环境。
根据本发明另一方面,所述方法包括步骤管理包含在所述对象管理设备中的对象的使用寿命,所述步骤从所述对象管理设备中删除在给定时间间隔后不满足预置标准的对象。
所述的标准可以是访问该对象的次数、该对象在始发服务器上的存在或与接收实体的兴趣区域的一致性。
有利的是,所述对象管理设备是可通过标准浏览器访问的HTTP Web服务器。
因此,从用户的角度来看,每件事情发生好象是可在以传统方式访问的单个服务器上获得可能引起该用户兴趣的信息,该服务器是本地的,因而可迅速访问数据。
根据本发明的另一方面,执行重新使用信息的方法的装置,该信息是在互联网上由接收实体预先接收的信息,该装置包括代理高速缓存器、Web服务器和自主复制系统,自主复制系统包括需要性分析级、关联重建级、内容生成级和内容管理级。
通过下面对实施例进行说明会更清楚理解本发明的上述特征和其它特征,仅参照一个附图
来进行说明,附图示出了示意性表明本发明装置的操作和本发明方法的实施的流程图。
参照该附图,根据本发明实施例的重新使用信息的装置1可应用于Web站点,如企业站点,在下面的说明中指接收站点。当然,本发明还能够适于任何其它互联网访问上下文,例如通过因特网接入服务商(ISP)的访问。
代理高速缓存器10以传统的方式与接收站点相联。例如这可以是属于公知领域的Squid代理高速缓存器。该类型的代理高速缓存器包括存储磁盘11。通过控制单元13对其进行操作。跟踪文件和访客流量统计文件与代理高速缓存器10也相联。按照惯例,当由接收站点发送访问对象的HTTP请求消息时,如果预先已有相同请求的结果包含在高速缓存器中,则代理高速缓存器能够直接返回对象。否则,从代理高速缓存器向主机中存有URL的始发服务器发送HTTP请求消息以将对象传输给用户。对象在磁盘11中的存储是暂时的。每个对象仅储存固定的时间,该时间由作为输入数据和对象容量的函数的算法控制。
根据本发明,分析代理高速缓存器10的内容以检测大对象的存在,如果必要的话,确定这些对象的特征,以便评价将其拷贝到对象管理设备的需要性。大对象表示容量大于预置有限容量的对象,如容量为100kb。以作为代理高速缓中平均对象寿命的函数的时间间隔有规律地完成该分析,以便拷贝满足对象管理设备需要性标准的所有对象。
为此,除了代理高速缓存器10外,重新使用信息的装置1包括自主复制系统20和HTTP Web服务器30。
构成管理器的Web服务器30是位于接收站点的传统服务器,例如属于公知领域的Apache服务器。该类型服务器包括存储磁盘31和控制单元33。可通过标准浏览器访问该类型服务器。根据以下说明将更清楚理解,该Web服务器的内容包括由系统自动生成的页面32和由高速缓存器再复制到磁盘31上的大对象。
安装在接收站点的自主复制系统20包括需要性分析级21、关联重建级22、内容生成级23和内容管理级24等四级。
需要性分析级21的功能是分析形成磁盘11上所包含对象的拷贝需要性,磁盘11与磁盘31上的代理高速缓存器10相联,磁盘31与形成管理器的Web服务器30相联。为此,使用需要性标准。在反复查对了访客流量统计文件后应用这些标准,以便仅考虑有效存在于高速缓存器中的对象。
应用的第一需要性标准是与对象容量有关的标准。只拷贝大于100kb的大对象。
应用的第二需要性标准是与对象的可重新使用性相关的标准。低自主的或难于重新使用的对象是不被拷贝的“.cla”文件。因此,只拷贝传统类型对象如“.mp3”、“.mpg”、“.doc”、“.avi”、“.jpg”等文件。
应用的第三需要性标准是与接收站点用户兴趣区域的一致性相关的标准。该一致性首先被检测一定次数,该次数是网络中请求给定对象的次数;通过分析访客流量统计文件12显示该次数。接着,通过给定对象关于全部访问和关于对Web服务器30的访问的主题接近性水平,能够检测该一致性。采用语义分析引擎以公知方式检测主题接近性水平。
关联重建级22的功能是联合形成上下文的元素,要拷贝的对象是从该上下文获得的。这一级从分析Web页面开始,在该Web页面中发现连接上述对象的链接。被看作是很重要的上下文元素被检索到。例如,我们能够检索到包含连接压缩文件(“.zip”)的链接的Web页面,该压缩文件使其可能具有对象的文本说明。在某些情况下,检索对应较高水平超文本树的元素,以便获得更全面的说明。例如,能够检索包含一个链接的页面,该链接与包含连接对象的链接的页面连接。
内容生成级23的功能是在磁盘31上拷贝由级21中选择的对象,以便同时生成Web页面树结构32,该树结构包含指向所拷贝对象的链接,并描述这些被拷贝的对象。Web页面树结构是根据如杜威(Dewey)体系而形成的。该体系提供分级的、语义相关的主题结构。通过连接对应其它语义链接主体的页面的链接,可以访问对应这些主题的页面。包含指向被拷贝对象的链接的自动生成页面和在级22中从高速缓存器检索到的形成上下文的元素的Web页与树的节点和叶相联。如Luigi Lancieri的文献“分布式多媒体文件建模”中所述的那样,在1998“神经网络上的IEEE联合会议会志”中,使用语义网络检测形成上下文元素的Web页面和树结构每个节点之间的距离。与相应对象形成链接的Web页面放置在语义距离是最短的树节点。每次将对象添加到服务器上时,该页面和链接则作相应修改。通过GCI(网关通用接口)程序或所有类型的动态反应信息,使页面的生成对于静态访问或根据需要可以是动态的。在磁盘11和高速缓存器10和服务器30的磁盘31之间拷贝对象包括相应MIME(多用途因特网邮件扩展)文件的特殊处理和删除由高速缓存器生成的特殊标题。
从用户的角度看,接口类似于为搜索引擎或传统目录而产生的。还可以通过关键词访问内容。如上面引证的文献“分布式多媒体文件建模”中所述的那样,可以通过自动检测每个用户简档或由用户手动操作提供其简档的关键词特征或通过两个方法的组合来定制可由每个用户看到的内容。
以适于高速缓存器中对象平均寿命的节奏执行在级21、22和23中完成的拷贝和存储步骤。
内容管理器24的功能是根据预置项目和条件管理对象的使用寿命。一方面,它通过发送相应的HTTP请求消息,确定是否对象还预置在始发服务器上。另一方面,它检测访问当前对象的数量。访问的数量将被作为标准,该标准确定是否应该从构成管理器的Web服务器30上删除该对象。
在该系统中,与现有技术的系统相比,磁盘的容量很大,使所存储对象的最小使用寿命为一到两周。如果对象结合了几个不宜的因素,例如如果它从未被访问过、它不再在始发服务器上以及它与接收站点的兴趣区域不一致,则在该时期结束时删除该对象。
权利要求
1.一种在电信网络中重新使用信息的方法,所述信息是由与中间存储设备(10)关联的接收实体预先接收到的信息,所述中间存储设备(10)适于暂时存储构成应所述接收实体的连续请求而发送给所述接收实体的发送对象的信息,其特征在于包括步骤拷贝包含在所述中间存储设备(10)中的满足预置标准的所有对象,并且采用合适标引,将由所述对象构成的拷贝存储在与所述接收实体相关联的对象管理设备(30)中。
2.如权利要求1所述的方法,其中所述的拷贝包含在所述中间存储设备(10)中满足预置标准的所有对象的步骤仅仅拷贝大于预置容量的对象。
3.如权利要求1或2所述的方法,其中所述的拷贝包含在所述中间存储设备(10)中满足预置标准的所有对象的步骤仅仅拷贝易于重新使用的自主对象。
4.如前述任一权利要求所述的方法,其中拷贝包含在所述中间存储设备(10)中满足预置标准的所有对象的步骤仅仅拷贝与所述接收实体相联的兴趣区域相一致的对象。
5.如前述任一权利要求所述的方法,其特征在于还包括步骤
自动生成文件(32),所述文件包含指向所述对象管理设备(30)中存储的所述对象的链接,以及
采用合适标引将所述文件存储到所述对象管理设备中。
6.如权利要求5所述的方法,其中在所述的采用合适标引将所述文件(32)存储在所述对象管理设备(30)中的步骤,根据主题层次自动对所述文件进行分类。
7.如权利要求5或6所述的方法,其中通过关键词搜索可访问所述文件(32)。
8.如权利要求5至7任一所述的方法,其中拷贝包含在所述中间存储设备(10)中满足预置标准的所有对象的所述步骤,在拷贝每个对象的同时,拷贝形成取得每个对象的上下文的要素。
9.如前述权利要求任一所述的方法,其中所述方法包括步骤管理包含在所述对象管理设备(30)中的对象的使用寿命,所述步骤是在给定时间间隔后从所述对象管理设备中消除不满足预置标准的对象。
10.如前述权利要求任一所述的方法,其中所述对象管理设备(30)是可通过标准浏览器访问的HTTP Web服务器。
11.一种实现前述权利要求任一所述在互联网上重新使用由接收实体预先接收到的信息的方法的装置,其中所述装置(1)包括代理高速缓存器(10)、Web服务器(30)和自主复制系统(20),所述自主复制系统(20)包括需要性分析级(21)、关联重建级(22)、内容生成级(23)和内容管理级(24)。
12.欲与代理高速缓存器(10)和Web服务器(30)相联以便执行如权利要求1至10任一所述重新使用信息的方法的自主复制装置(20),所述信息由互联网上的接收实体预先接收,所述装置(20)的特征在于包括需要性分析级(21)、关联重建级(22)、内容生成级(23)和内容管理级(24)。
全文摘要
一种在电信网络中重新使用信息的方法,所述信息是由与中间存储设备(10)关联的接收实体预先接收的信息。所述中间存储设备(10)适于暂时构成存储应所述接收实体的连续请求而发送给所述接收实体的构成对象的信息。所述方法包括步骤拷贝满足预置标准的包含在所述中间存储设备(10)中的所有对象,以及步骤在与所述接收实体相联的对象管理设备(30)如Web服务器中采用合适的标引将所述对象构成的拷贝存储。特别是,仅仅拷贝大于预置容量的对象。
文档编号G06F12/00GK1527977SQ01818906
公开日2004年9月8日 申请日期2001年10月16日 优先权日2000年10月17日
发明者路易吉·兰切里, 路易吉 兰切里 申请人:法国电信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1