专利名称:因特网数据的搜寻方法
技术领域:
本发明涉及一种搜寻方法,尤其涉及一种因特网数据的搜寻方法。
背景技术:
由于因特网(Internet)的快速发展,使得当前的因特网使用者面临了信息爆炸的问题,如何能在最短的时间内从庞大的因特网数据中找到使用者所需要的数据已经成为使用者以及相关厂商或是服务提供者所欲解决的重要课题,而因特网上的搜寻引擎 (search engine)便是此种需要下的产物。依据数据的搜寻范围可以将搜寻引擎分为以下几种其一可称为本地端档案搜寻引擎,主要是针对本地端的档案建立索引(index)之后,以另一种结构化的组织方式将数据的索引储存下来(或是丢到数据库中);另一种可称为远程网页数据搜寻引擎,这种搜寻引擎所搜寻的数据由本地端移至达端众多的网页服务器,利用一种名为网络爬行者(web crawler)的程序对远程的网页服务器进行数据收集,而搜寻引擎所在的服务器可视为一个因特网数据的集中站,储存庞大的因特网数据以服务搜寻引擎的使用者进行因特网数据的寻。现有的搜寻引擎对于将由web crawler搜集回来的数据也有两种不同的处理方法,其中一种是建立关键字索引,由一组团队进行分类工作,同时也提供一般网站登录他们的数据;另一种则会对抓回来的资料作全文检索,而不将收集到的信息作目录式的分类,所以每次使用者查询任一关键字符合的项目几乎高达几十万笔。不过该搜寻引擎会对数据进行符合程度的计算,会把符合程度越高的排在越前面,但是网站排序服务大兴其道,第一页往往是广告商角力的结果,不是使用者真正要的数据。在已公开的中国台湾发明专利200636512号的「结合使用者加入信息之检索方法及系统」,揭露一种使用使用者输入信息以响应因特网搜寻询问而回传更有意义信息的方法和系统一种接收来自搜寻引擎之使用者之输入的方法和系统,以提供系统使用者更佳的搜寻结果。根据本发明,一个使用者社群可管理一个数据库,而搜寻结果和其它关于该搜寻的信息会由该数据库产生,在其它方面,使用者可在结果列表票选组件的相关性、增加相关网站连结的补充信息、并利用使用者输入和计算机产生的搜寻名项目执行其它搜寻。依此方式,搜寻结果可提供使用者相关度更高的信息。另外在已公开的中国台湾发明专利200612262号「用于提供个人化搜寻及信息存取的系统以及方法」,是有关于运用使用者模型以根据相关于个别使用者特征之信息,将一般化查询及/或搜寻结果予以个人化的系统及方法。提供一种系统可有助于产生个人化的信息搜寻。该系统包含一用以决定使用者之特征的使用者模型。该使用者模型可为透过一使用者之内容、活动及整体背景的分析而自动地组装。一个人化组件会依照该使用者模型而自动地修改各项查询及/或搜寻结果,以将对该使用者之信息搜寻予以个人化。一使用者接口接收各项查询并显示该等来自一或更多本地及/或远程搜寻引擎的搜寻结果,其中可在从较为个人化搜寻到较为一般化搜寻之范围内调整该接口。该使用者模型可从复数个来源导算出,包含考虑到过去使用者事件、先前客户端互动、搜寻或历史日志、使用者背景数据、人口统计数据及/或基于对于其它使用者之类似度(即如协力过滤)的丰富索引。同时,可应用其它像是机器学习之技术,以在时间上监视使用者行为,来决定及/或细致化使用者模型。这些模型可合并于离线或在线搜寻方法(该等组合),以修改搜寻结果俾产生个别使用者最可能有兴趣的信息撷取结果。如此,这些使用者模型可按一自动及有效率的方式,将个人化搜寻与一般化搜寻予以差异化。虽然,以上的两种专利技术都提出了可以改善搜寻结果的方法,但是很显然的都需要较为复杂的技术才能实现。
发明内容
本发明的主要目的在提出一种可以改善网络内容搜寻结果之准确性的方法,降低含有商业化目的之搜寻结果所伴随而来的大量噪声。为达到上述目的,本发明采用了如下的技术方案一种因特网数据搜寻方法,其主要是以使用者书签(bookmark)中所记录的网页或是网站为优先搜寻的范围,将书签的搜寻结果优先排列在搜寻结果的前面,再将其余的搜寻结果排列在后,因此可以找到较接近使用者需要的内容,提高因特网数据搜寻结果的准确性,并且降低含有商业化目的之搜寻结果所伴随而来的大量噪声。较佳的,本发明提供了一种因特网数据搜寻方法,在因特网的搜寻引擎提供一书签登录界面,由使用者透过这个书签登录界面上传使用者自订的书签内容,搜寻引擎在处理使用者提出的搜寻请求过程中,先以使用者书签(bookmark)中所记录的网页或是网站为优先搜寻范围,再搜寻书签内容以外的其它网络资源,然后将全部的搜寻结果传回给使用者,其中搜寻结果的内容排序系将书签的搜寻结果优先排列在全部的搜寻结果的前面, 再将其余的搜寻结果排列在后。较佳的,本发明提供了一种因特网数据搜寻方法,由运行于使用者端的上网软件将使用者输入的搜寻关键字或其它的附加搜寻条件发送至因特网搜寻引擎,向因特网搜寻引擎提出搜寻请求,再对因特网搜寻引擎传回的搜寻结果进行排序,从搜寻结果中找出在书签所记录之范围内的搜寻结果优先排列在全部的搜寻结果的前面,再将其余的搜寻结果排列在后。较佳的,本发明提供了一种因特网数据搜寻方法,由运行于使用者端的桌面搜寻手段处理使用者提出的搜寻请求,这个桌面搜寻手段依据使用者提出的搜寻条件或关键字向网络的搜寻引擎提出搜寻请求,同时对使用者端的本地端档案进行搜寻,然后将本地端档案的搜寻结果和搜寻引擎传回的搜寻结果整合为一个搜寻结果的集合,再对这个搜寻结果的集合进行排序,优先将本地端档案的搜寻结果排序在前,其次的排序是从搜寻引擎传回的搜寻结果中找出落在书签所记录之范围内的搜寻结果,而将其余的搜寻结果排序在最后。对于习惯很系统化收集浏览过网站、建立书签的使用者而言,其实会有「先搜寻书签中网站数据」的需求,透过本发明所提出的技术手段,可以更快速或是优先找到符合需求的搜寻结果,以及优先呈现使用者所关心之数据来源的内容,并且降低含有商业化目的之搜寻结果所伴随而来的大量噪声。
有关本发明的技术手段与较佳实施例,兹配合图示作最佳实施例详细说明如下。
图1为本发明之第一种较佳实施例的系统架构图。图2揭示了本发明之主要方法的的一种较佳实施例步骤。图3为实现前述主要方法的另一种较佳实施例步骤。图4为实现前述主要方法的另一种较佳实施例步骤。图5为实现前述主要方法的另一种较佳实施例步骤。
具体实施例方式首先请参阅图1,其中揭示了实施本发明方法的系统架构,包括使用者端设备10,具有可以连接因特网的能力,一般而言可以是一部个人计算机 (personal computer)或是其它具有相同功能的电子装置;上网软件20,在使用者端设备10运行,提供了使用者阅览因特网数据的浏览界面 21,上网软件20可供使用者自行设定书签22 (bookmark)并且记录于使用者端设备10的计算机可存取记录媒体(例如内存或是硬盘机),具体而言,这个上网软件20可以是但不限于网络探险家(internet explorer, IE)或是火狐(firefox)这类网络浏览软件(browser);网络搜寻引擎数据库30,具有可以连接因特网的能力,其中储存有大量来自因特网内容的搜寻结果;搜寻引擎服务器40,具有可以连接因特网的能力,在搜寻引擎服务器40之中运行有网络搜寻引擎软件41可以接受使用者端设备10提出的搜寻请求(searching request), 再从网络搜寻引擎数据库30之中找出符合搜寻条件的内容,并将搜寻的结果返还给使用者端设备10的上网软件20。图2是本发明所揭露之方法的较佳实施例,包括1.取得使用者自订之书签(bookmark)内容的步骤;2.取得使用者提出之搜寻条件的步骤;3.依据搜寻条件在因特网中搜寻并取得搜寻结果的步骤;以及4.对搜寻结果进行排序然后显示排序结果的步骤。在上述的步骤1中会先取得使用者自行设定的书签22的内容,而这里所指的书签 22的内容就是使用者自行设定的经常浏览或的访问的网站或是网页的网址,一般而言可以是例如但不限于网络探险家(IE)这种网络浏览器中的「我的最爱」之中所储存的内容。上述的步骤2则是取得使用者想要搜寻的内容的关键字或是其它附加的搜寻条件,例如但不限于特定的档案格式,或是含有特定字符的网址(URL)等搜寻条件,一但取得了使用者提出的搜寻条件之后,再于上述的步骤3中,将关键字或其它的搜寻条件发送至网络搜寻引擎软件41,而这个网络搜寻引擎软件41就是运行于因特网搜寻引擎服务器40 搜寻程序,搜寻引擎服务器40会在网络搜寻引擎数据库30之中搜寻符合关键字或是搜寻条件的因特网数据再返回给使用者端设备10的上网软件20。前述的步骤4有关于搜寻结果的内容排序方式,主要是把落在书签22所记录之范围内的搜寻结果优先排列在全部的搜寻结果的前面,再将其余的搜寻结果排列在后。
关于具体实现前述方法之技术手段,本发明提出了以下几种较佳的实施方式,分别说明如下。第一种技术手段如图3所示,包括下列步骤A-1.在网络搜寻引擎软件41提供一上传书签22的登录界面,供使用者透过这个登录界面上传使用者自订的书签内容至网络搜寻引擎软件41 ;A-2.取得使用者提出之关键字或其它的搜寻条件,具体的方式可以由网络搜寻引擎软件41提供一个关键字的输入字段,让使用者可以在这个输入字段输入搜寻的关键字, 当然也可以再提供其它附加搜寻条件的输入字段;A-3.由网络搜寻引擎软件41依据关键字或其它的搜寻条件在网络搜寻引擎数据库30中搜寻并取得搜寻结果;A-4.由网络搜寻引擎软件41对搜寻结果的内容进行排序,将落在书签22所记录之范围内的搜寻结果优先排列在全部的搜寻结果的前面,再将其余的搜寻结果排列在后;A-5.由网络搜寻引擎软件41将排序完成的搜寻结果返回使用者端设备10的上网软件20 ;以及A-6.由使用者端设备10的上网软件20将排序完成的搜寻结果显示给使用者。第一种技术手段是透过设置在网络搜寻引擎软件41中的登录界面,提供使用者自行设定书签22的内容,而网络搜寻引擎软件41在将因特网的搜寻结果返回给使用者端设备10的上网软件20之前,会先对搜寻结果的内容进行排序,将落在书签22所记录之范围内的搜寻结果优先排列在全部的搜寻结果的前面,再将其余的搜寻结果排列在后,然后由网络搜寻引擎软件41将排序完成的搜寻结果返回使用者端设备10的上网软件20。第二种技术手段如图4所示,包括下列步骤B-1.取得使用者提出之关键字或其它搜寻条件,具体的方式可以由网络搜寻引擎软件41提供一个关键字的输入字段,让使用者可以在这个输入字段输入搜寻的关键字,当然也可以再提供其它附加搜寻条件的输入字段;B-2.由网络搜寻引擎软件41依据关键字或其它的搜寻条件在网络搜寻引擎数据库30中搜寻;B-3.将搜寻结果返回使用者端设备10的上网软件20 ;B-4.由使用者端设备10的一排序手段读取使用者端设备10之上网软件20中的书签22的内容;B-5.由使用者端设备10的排序手段对网络搜寻引擎软件41传回的搜寻结果进行排序,将落在书签22所记录之范围内的搜寻结果优先排列在全部的搜寻结果的前面,再将其余的搜寻结果排列在后,并将排序完成的搜寻结果发送给使用者端设备10的上网软件 20 ;B-6.由使用者端设备10的上网软件20将排序完成的搜寻结果显示给使用者。第二种技术手段主要是透过一个在使用者端设备10之中运行的排序手段,对网络搜寻引擎软件41传回的搜寻结果进行排序,不需要依赖网络搜寻引擎软件41的支持,就可以对网络搜寻引擎软件41传回的搜寻结果进行排序,将落在书签22所记录之范围内的搜寻结果优先排列在全部的搜寻结果的前面,再将其余的搜寻结果排列在后。第三种技术手段如图5所示,包括下列步骤
C-1.取得使用者提出之关键字或其它搜寻条件,具体的方式是由一个运行于使用者端设备10的本机搜寻引擎提供一个关键字的输入字段,让使用者可以在这个输入字段输入搜寻的关键字,当然也可以再提供其它附加搜寻条件的输入字段;C-2.由本机搜寻引擎依据关键字或搜寻条件在本地端的档案中搜寻产生本地端的搜寻结果;C-3.由网络搜寻引擎软件41依据关键字或其它的搜寻条件在网络搜寻引擎数据库30中搜寻;C-4.将网络搜寻结果返回使用者端的上网软件;C-5.由使用者端的一排序手段读取使用者端设备10之上网软件20中的书签22 的内容;C-6.由使用者端设备10的排序手段对本地端的搜寻结果和网络搜寻引擎软件41 传回的网络搜寻结果进行排序,优先将本地端档案的搜寻结果排序在前,其次的排序是从网络搜寻引擎软件41传回的网络搜寻结果中落在书签22所记录之范围内的搜寻结果,而将其余的搜寻结果排序在最后,并将排序完成的搜寻结果发送给使用者端设备10的上网软件20 ;C-7.由使用者端设备10的上网软件20将排序完成的搜寻结果显示给使用者。在第三种技术手段中,更增加了对本地端档案的搜寻,具体的方式可以利用像桌面搜寻程序来进行本案端档案的搜寻,然后将本地端档案的搜寻结果和网络搜寻引擎软件 41传回的网络搜寻结果整合为一个搜寻结果的集合,再对这个搜寻结果的集合进行排序, 优先将本地端档案的搜寻结果排序在前,其次的排序是从网络搜寻引擎41传回的搜寻结果中找出落在书签22所记录之范围内的搜寻结果,而将其余的搜寻结果排序在最后;可以更快速或是优先找到符合需求的搜寻结果,以及优先呈现使用者所关心之数据来源的内容,并且降低含有商业化目的之搜寻结果所伴随而来的大量噪声。在本发明的一较佳实施例,对于落在书签22所记录之范围内的搜寻结果,还可以依据相应的书签22在多个书签22中的顺序进行排序,然后显示于使用者端设备10的上网软件20,这种排序的方式更能符合使用者的使用习惯,有助于使用者快速找到真正需要或是有兴趣的因特网数据。虽然本发明的技术手段已透过前述之较佳实施例揭露如上,然其并非用以限定本发明,任何熟习相像技艺者,在不脱离本发明之精神和范围内,当可作些许之更动与润饰, 因此本发明之专利保护范围须视本说明书所附之申请专利范围所界定者为准。
权利要求
1.一种因特网数据的搜寻方法,借由包含使用者端设备、上网软件、网络搜寻服务器、 运行于该网络搜寻服务器之网络搜寻引擎软件和网络搜寻引擎数据库的系统运行下列的步骤,以帮助使用者找到需要的内容,其特征在于,包括步骤A 取得使用者自订之书签内容的步骤; 步骤B 取得使用者提出之搜寻条件的步骤; 步骤C 依据该搜寻条件在因特网中搜寻并取得一搜寻结果的步骤; 步骤D 对该搜寻结果进行排序,将落在该书签所记录之范围内的该搜寻结果优先排列在全部的该搜寻结果的前面,再将其余的该搜寻结果排列在后;以及步骤E 显示该排序完成之搜寻结果的步骤。
2.根据权利要求1所述之因特网数据的搜寻方法,其特征在于该步骤A还包括由使用者将自行设定之书签内容上传至该网络搜寻引擎软件的步骤; 该步骤B还包括由该网络搜寻引擎软件提供一字段,以供使用者输入搜寻之关键字的步骤;以及该步骤D还包括由该网络搜寻引擎软件对该搜寻结果进行排序的步骤,将落在该书签所记录之范围内的该搜寻结果优先排列在全部的该搜寻结果的前面,再将其余的该搜寻结果排列在后。
3.根据权利要求2所述之因特网数据的搜寻方法,其特征在于,还包括落对在该书签所记录之范围内的搜寻结果,依据相应的该书签在该多个书签中的顺序进行排序。
4.根据权利要求1所述之因特网数据的搜寻方法,其特征在于该步骤A还包括由该使用者端设备的一排序手段读取该使用者端设备之上网软件中的该书签内容的步骤;该步骤B还包括由该网络搜寻引擎软件提供一字段,以供使用者输入搜寻之关键字的步骤;以及该步骤D还包括由该排序手段对该搜寻结果进行排序的步骤,将落在该书签所记录之范围内的该搜寻结果优先排列在全部的该搜寻结果的前面,再将其余的该搜寻结果排列在后,并将排序完成的该搜寻结果发送给该使用者端设备的该上网软件。
5.根据权利要求4所述之因特网数据的搜寻方法,其特征在于,还包括落对在该书签所记录之范围内的搜寻结果,依据相应的该书签在该多个书签中的顺序进行排序。
6.根据权利要求1所述之因特网数据的搜寻方法,其特征在于该步骤A还包括由该使用者端设备的一排序手段读取该使用者端设备之上网软件中的该书签内容的步骤;该步骤B还包括由该网络搜寻引擎软件提供一字段,以供使用者输入搜寻之关键字的步骤;该步骤C还包括由一本机搜寻引擎依据该关键字在本地端的档案中搜寻产生本地端的搜寻结果的步骤,以及由该网络搜寻引擎软件依据该关键字在该网络搜寻引擎数据库中搜寻,以产生网络搜寻结果的步骤;以及该步骤D还包括由该排序手段对该本地端的搜寻结果和该网络搜寻结果进行排序的步骤,优先将该本地端档案的搜寻结果排序在前,其次的排序是该网络搜寻结果中落在该书签所记录之范围内的搜寻结果,而将其余的该搜寻结果排序在最后,并将排序完成的该搜寻结果发送给该使用者端设备的该上网软件。
7.根据权利要求6所述之因特网数据的搜寻方法,其特征在于,还包括落对在该书签所记录之范围内的搜寻结果,依据相应的该书签在该多个书签中的顺序进行排序。
全文摘要
本发明提供了一种因特网数据的搜寻方法,包括取得使用者自订之书签(bookmark)内容的步骤,取得使用者提出之搜寻条件的步骤,依据搜寻条件在因特网中搜寻并取得搜寻结果的步骤,以及对搜寻结果进行排序然后显示排序结果的步骤。本发明以使用者书签中所记录的网页或是网站为优先搜寻的范围,将书签涵盖范围的搜寻结果优先排列在全部搜寻结果的前面,再将其余的搜寻结果排列在后,因此可以找到较接近使用者需要的内容,提高因特网数据搜寻结果的准确性,并且降低含有商业化目的之搜寻结果所伴随而来的大量噪声。
文档编号G06F17/30GK102184173SQ20091030918
公开日2011年9月14日 申请日期2009年10月31日 优先权日2009年10月31日
发明者周柏岳 申请人:佛山市顺德区汉达精密电子科技有限公司