一种检索排序方法及系统的制作方法
【技术领域】
[0001] 本发明涉及一种电子信息领域中的数字信息资源的检索排序方法,具体地说是一 种基于用户参与的检索排序方法及系统。
【背景技术】
[0002] 现代科技的发展将人类文明带入了一个崭新的时代一因特网时代,而因特网的盛 行和普及则推动了电子出版物的蓬勃发展,使人们进入了"数字图书馆"时代。现在许多读 者足不出户,就可以"畅游知识的海洋",极大地方便了他们的学习和生活,同时也促进了电 子产业的快速发展。数字资源是文献信息的表现形式之一,是将计算机技术、通信技术及多 媒体技术相互融合而形成的以数字形式发布、存取、利用的信息资源总和。由于数字资源的 信息量非常巨大,因此用户在阅读这些数字资源时,为了方便区分和记录,很多数字资源如 电子书等,允许用户进行标记,用户可以使用圈点、横线、书签、注释等等方式对其阅读的数 字资源进行标记,这些数字资源也会针对不同的用户保存其阅读时的特殊标记,不仅便于 用户后续阅读,同时也可以体现出不同用户对于不同数字资源的关注程度。
[0003] 此外,由于数字资源信息量非常巨大,用户为了获取所需资源,进行检索是必不可 少的,如用户可以通过关键字等方式进行检索,以便获取期望的信息。目前的检索方式,基 本上都是根据用户提供的关键词扩展后进行搜索,然后根据数字资源的命中程度的高低返 回检索结果。该类检索方案中,不会考虑检索到的数字资源中用户的关注程度的高低,仅仅 是根据命中程度进行的排序,在传统的检索方式中会根据传统的检索策略对命中资源分配 权重,从而返回检索结果。但是,实际使用中,对于用户关注程度高的数字资源,往往是大多 数用户关注的信息,如果能将这些信息优先推荐给用户,则可以大大提高检索结果的有效 程度。而现有技术中的检索返回的结果,只针对用户提供的关键词等检索信息,未有效结合 多数用户的反馈信息,使得检索结果中不能将有价值、关注程度高的信息优先体现,检索结 果的可参考性降低。
【发明内容】
[0004] 为此,本发明所要解决的技术问题在于现有技术中的检索排序方法,只针对用户 提供的检索信息进行检索,检索结果的针对性弱,不能将最有效的检索结果提供给用户,从 而提出一种提高了检索结果的有效性的基于用户参与的检索排序方法。
[0005] 为解决上述技术问题,本发明提供一种检索排序方法,包括:
[0006] 获取用户对数字资源的标记信息;
[0007] 对所述标记信息进行分析;
[0008] 对所述分析的结果进行处理,确定用户关注度;
[0009] 根据用户的输入进行检索,得到检索结果后,将该用户关注度结合到检索结果中, 返回用户参与的检索结果。
[0010] 另外,本发明中还提供一种检索排序系统,包括: toon] 获取单元:获取用户对数字资源的标记信息;
[0012] 分析单元:对所述标记信息进行分析;
[0013] 处理单元:对所述分析的结果进行处理,确定用户关注度;
[0014] 检索单元:根据用户的输入进行检索,得到检索结果后,将该用户关注度结合到检 索结果中,返回用户参与的检索结果。
[0015] 本发明的上述技术方案相比现有技术具有以下优点,
[0016] (1)本发明提供一种检索排序方法,获取用户对数字资源的标记信息,对所述标记 信息进行分析,然后对所述分析结果进行处理,确定所述标记信息表示的用户关注度。当用 户进行检索时,根据用户输入会得到传统的检索结果,然后将该用户关注度结合到检索结 果中,返回用户参与的检索结果。该方案当用户进行数字资源内部检索时,可以将用户的关 注度作为检索权重值检索排序的方法,即用户关注度越高的一页的数字资源,在检索的权 重值越高。该方案有效避免了现有技术中的检索排序方法只针对用户提供的检索信息进行 检索,检索结果的针对性弱的技术问题,将最有效的检索结果提供给用户,是一种提高了检 索结果的有效性的基于用户参与的检索排序方法。
[0017] (2)本发明所述的检索排序方法,将用户关注度结合到检索结果中,采用叠加或者 加权叠加的方式,将用户关注度与普通的检索结果中数字资源的权重组合,将组合后的值 作为最终权重值进行检索结果排序并返回检索结果,这样就实现了将用户反馈的信息与检 索结果的结合,提高了检索结果的针对性,更有利于提高检索效率。
[0018] (3)本发明所述的检索排序方法,可根据简单标记信息确定用户关注度,采用次数 统计以及权重设置的方式来计算,简单标记信息可以体现出用户的关注程度,如圈点、划线 等操作,使得用户的关注程度得以体现,并参与到检索结果的排序中。
[0019] (4)本发明所述的检索排序方法,可根据文字标记信息确定用户关注度,对文字标 记信息进行分类,对每种文字标记信息的类型设置权重,然后通过统计每种类型的次数和 权重,计算出用户关注程度,由于文字标记信息中可以解读出用户的多种信息,因此可根据 需要进行分类,如正面类型、负面类型、积极类型、消极类型等等其他自定义的类型,根据不 同的数字资源来进行合理分类并设置权重,将用户的关注程度得以全面的体现出。
[0020] (5)本发明所述的检索排序方法,根据用户属性信息确定用户关注度,用户属性信 息可以包括年龄、职业、行业等信息,将该用户的这些信息也综合进来,从而可以为用户提 供更具有针对性的检索结果,提高检索结果的针对性。
[0021] (6)本发明所述的检索排序方法,可根据简单标记信息、文字标记信息和用户属性 信息中的任意组合来确定用户关注度,融合多种信息数据,使得检索结果在返回用户时可 以更加全面的反应出这些信息,从而使得检索结果以更有效的排序反馈给用户,提高用户 的参与性和检索的高效性。
[0022] (7)本发明所述的检索排序方法,还可以将数字资源的来源渠道也作为确定用户 关注度的一部分,根据该数字资源的来源正规化程度来设置权重,将该权重也加入到用户 关注度中,通过数字信息的来源渠道可以将更加权威、更具有可信性的信息在检索匹配程 度相同时,优先呈现给用户,使用户优先获得具有可靠性的信息。
[0023] (8)本发明所述的检索排序方法,对所述标记信息进行分析的过程,包括获取所述 标记信息所出自用户的用户属性信息,统计数字资源中该标记信息的位置、标记内容和标 记次数,根据所述标记内容将标记信息分为文字标记信息和简单标记信息。这样就得到了 标记信息的完整信息,包含了其位置、内容、出现次数以及分类信息,为后续计算用户关注 度提供了依据,也保证了该方案的客观性。
[0024] (9)本发明所述的检索排序方法,还包括将所述文字标记信息中的文字内容解析 为文字信息,并对该文字信息根据其含义进行分类,将文字内容进一步分为:正面类型、负 面类型、争议性类型、记录类型、积极情绪类型、消极情绪类型以及其他自定义类型,由于不 同类型的标准所表达出的用户关注程度不同,为了更好的体现用户的关注程度,针对文字 信息进行分类,根据分类设置不同的权重,这样就便于针对不同的场合设置不同的权重,方 便了以后的针对性设置。对于非文字信息统一统计并分类,进而体现出文字信息与非文字 信息的不同处理方式。
[0025] (10)本发明所述的检索排序方法,根据用户的输入进行检索,得到传统的检索结 果后,将所述用户关注度与检索结果中的数字资源的权重进行叠加,将叠加后的值最为最 终的权重值,根据最终的权重值进行检索结果排序,返回用户参与的检索结果,这种方式不 仅简单,实现起来方便,而且不改变前期的检索策略,只需要对传统检索结果进行干预,获 得了更具有针对性和更有效的检索结果,提高了检索的效率。
[0026] (11)本发明还提供一种检索排序系统,包括获取单元、分析单元、处理单元、检索 单元,当用户进行检索时,根据用户输入会得到传统的检索结果,然后将该用户关注度结合 到检索结果中,返回用户参与的检索结果。该方案有效避免了现有技术中的检索排序方法 只针对用户提供的检索信息进行检索,检索结果的针对性弱的技术问题,将最有效的检索 结果提供给用户,是一种提高了检索结果的有效性的基于用户参与的检索排序方法。
【附图说明】
[0027] 为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合 附图,对本发明作进一步详细的说明,其中
[0028] 图1是本发明所述的检索排序方法的流程图;
[0029] 图2、图3是本发明所述的检索排序方法的另一个实施例的示意图;
[0030] 图4和图5是本发明所述的检索排序方法的一个应用实例的示意图;
[0031] 图6是是本发明所述的检索排序系统的结构框图。
【具体实施方式】
[0032] 实施例1 :
[0033] 本实施例中提供一种检索排序方法,该方法将用户在数字资源某页或者某个章节 的标记(如圈,横线,注释,书签等),作为书内检索的排序依据,当用户在数字资源内进行 检索时,同样命中检索关键字的页码,用户参与标记的页码的权重更高,可以更优先的显示 在刖。
[0034] 本实施例中的检索排序方法,流程图如图1所示,包括如下过程:
[0035] (1)获取用户对数字资源的标记信息,此处的标记信息包括标记的位置和标记的 内容,标记的位置包括页码、章节数,所述标记的内容包