搜索结果排序的方法和系统与流程

文档序号:13050976阅读:269来源:国知局
搜索结果排序的方法和系统与流程
本发明涉及计算机技术领域,尤其涉及搜索结果排序的方法和系统。

背景技术:
计算机网络技术的发展极大的提高了人们获取信息的便利性,计算机网络中存储了海量的信息,为了使人们查找到自己所需的信息,搜索引擎被广泛使用,现有的搜索引擎一般根据输入的检索词的相关度进行排序,但是,一般通过检索词搜索获得的满足条件的搜索结果非常多,检索词搜索结果相对而言比较客观,不能将高质量的、用户感兴趣的结果自动排到输出结果的最前端,需要用户自己在输出结果的基础上寻找自己感兴趣的网页,用户体验比较差。社会性网络服务(SocialNetworkingServices,简称SNS)分享指的是在一些网站上将自己感兴趣的内容通过分享控件分享到自己的博客、微博上的过程。是用户主观选择的结果,所以SNS网站上的分享数据可以反映用户对一些网页的喜欢程度,也可以在一定程度上反映网页本身的质量。所以,利用SNS的分享数据进行搜索可以改善搜索的质量和用户体验,但是现有技术还没有利用SNS的分享数据进行搜索的方法。

技术实现要素:
本发明的实施例提供一种搜索结果排序的方法和系统,利用SNS的分享数据进行搜索,改善了搜索的质量和用户体验。为达到上述目的,本发明实施例采用的技术方案是,一方面,本发明实施例提供一种搜索结果排序的方法,其特征在于,包括:分享服务器收集社会性网络服务(SNS)平台的分享数据,并记录每一个分享数据的统一资源定位符(URL);根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值;将所述社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。优选的,所述根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值,包括:根据预设的更新周期,在每个更新周期中根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值并进行更新。优选的,计算当前更新周期的每一个所述分享数据的URL社会化分享排名值的方法,包括:根据每个更新周期内分享服务器记录的每一个所述分享数据的分享次数,计算每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值,将每一个所述分享数据所有更新周期内的子社会化分享排名值分别相加得到每一个所述分享数据的URL的社会化分享排名值。优选的,计算当前更新周期的每一个所述分享数据的URL社会化分享排名值的方法,包括:根据每个更新周期内分享服务器记录的每一个所述分享数据的分享次数,计算每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值;对每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值乘以不同的衰减因数进行修正,其中,所述衰减因数根据与当前更新周期相隔时间的长短确定;将每一个所述分享数据的URL修正后的所有更新周期内的子社会化分享排名值分别相加得到每一个所述分享数据的URL的社会化分享排名值。优选的,在根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值之前或者之后,还包括:若在设定个数的更新周期内,根据分享服务器记录的一个分享数据的分享次数均大于设定的分享次数阀值,或者根据分享服务器记录的该分享数据的分享次数计算所得的子社会化分享排名值均大于设定的子社会化分享排名值阀值,则将该分享数据过滤。优选的,在根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值之前或者之后,所述方法还包括:将所述收集的社会性网络服务SNS平台的分享数据分成新闻、图片、和视频三类分享数据。优选的,所述将所述社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果包括,将每一类的分享数据的社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述每一类分享数据的URL进行排序,并输出排序结果。一方面,本发明实施例提供一种搜索结果排序的系统,其特征在于,包括:收集单元,用于收集社会性网络服务SNS平台的分享数据,并记录每一个分享数据的统一资源定位符URL;计算单元,用于根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值;前台单元,用于接收检索词,并将所述检索词发送给排序单元;排序单元,用于将所述社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。优选的,所述计算单元包括更新模块,用于根据预设的更新周期,在每个更新周期中根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算一个社会化分享排名值并进行更新。优选的,所述计算单元还包括计算模块,用于根据每个更新周期内分享服务器记录的每一个所述分享数据的分享次数,计算每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值,将每一个所述分享数据所有更新周期内的子社会化分享排名值分别相加得到所述分享数据的URL的社会化分享排名值。或者,用于根据每个更新周期内分享服务器记录的每一个所述分享数据的分享次数,计算每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值;对每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值乘以不同的衰减因数进行修正,其中,所述衰减因数根据与当前更新周期相隔时间的长短确定;将每一个所述分享数据的URL修正后的所有更新周期内的子社会化分享排名值分别相加得到每一个所述分享数据的URL的社会化分享排名值。优选的,所述系统还包括过滤模块,用于若在设定个数的更新周期内,根据分享服务器记录的一个分享数据的分享次数均大于设定的分享次数阀值,或者根据分享服务器记录的该分享数据的分享次数计算所得的子社会化分享排名值均大于设定的子社会化分享排名值阀值,则将该分享数据过滤。优选的,所述系统还包括分类模块,用于将所述收集社会性网络服务SNS平台的分享数据分成新闻、图片、和视频三类分享数据;所述排序单元还用于将每一类的分享数据的社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述每一类分享数据的URL进行排序,并输出排序结果给所述前台单元。本发明实施例提供的搜索结果排序的方法和系统,通过收集社会性网络服务SNS平台的分享数据,根据分享服务器记录的所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值,然后将所述社会化分享排名值与预设的排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。改善了搜索的质量和用户体验。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的一种搜索结果排序的方法流程图;图2为分享活动的分享量的柱状线;图3为新闻的分享量的柱状图线;图4为本发明实施例提供的一种搜索结果排序的系统图;图5为本发明实施例提供的另一种搜索结果排序的系统图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供了一种搜索结果排序的方法,参见图1,包括,S101:分享服务器收集社会性网络服务SNS平台的分享数据,并记录每一个分享数据的统一资源定位符URL;示例性的,因为用户将数据分享到一个SNS平台时,是通过该SNS平台的分享服务器实现的,所以,通过SNS平台的分享服务器可以得到数据分享的次数、分享人、数据的发布时间和发布站点等信息。所以,在本实施例中,可以利用SNS平台的分享服务器来收集分享数据,当然也可以选择另外的收集单元从社会性网络服务平台的分享服务器来收集分享数据。另外,可以选择一个SNS平台的分享服务器来收集该SNS平台的分享数据,但是优选的,可以选择多个SNS平台的分享服务器收集多个SNS平台的分享数据,然后将多个SNS平台的分享数据进行汇总,具体的,可以将相同的分享数据在多个SNS平台中的分享次数相加得到该分享数据的分享次数,也可以给不同的SNS平台设置不同的权重,将多个SNS平台中的分享次数进行线性加权得到该分享数据的分享次数。本实施例对此不做限定,在实际应用中,可以根据需要进行变通。所述分享数据可以包括新闻、视频、图片等多种数据类型,通过记录分享数据的URL可以非常方便的定位到分享的内容。其中,URL是指该分享数据最初被分享的门户网站的地址。S102:根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值;示例性的,可以直接根据分享服务器记录的每一个所述分享数据的分享次数给每一个分享数据的一个URL计算一个社会化分享排名值,优选的,在实际应用中,也可以给分享数据的分享次数、分享人、数据的发布时间和发布站点各设定一个权值,将这些信息进行线性加权后得到分享数据的社会化分享排名值。另外,在步骤S102中,可以设定一个更新周期,在每个更新周期中根据分享服务器记录的每一个所述分享数据的分享次数,给每一个分享数据的URL计算社会化分享排名值并进行更新。下面简单介绍计算当前更新周期的社会化分享排名值的方法。以一个分享数据为例,且以直接根据分享服务器记录的分享数据的分享次数计算社会化分享排名值为例进行说明,包括,根据每个更新周期内分享服务器记录的分享数据的分享次数,计算所述分享数据的URL在每个更新周期内的子社会化分享排名值,将所述分享数据的URL所有更新周期内的子社会化分享排名值相加得到所述分享数据的URL的社会化分享排名值。例如,将当前更新周期称为最近的第一个周期,处于当前更新周期的前一个更新周期称为最近的第二个周期,以此类推。最近的第一个周期的分享次数为N1,则最近的第一个周期的子社会化分享排名值可以记做N12;最近的第二个周期的分享次数为N2,则最近的第二个周期的子社会化分享排名值可以记做N22;最近的第三个周期的分享次数为N3,则最近的第三个周期的子社会化分享排名值可以记做N32,依次类推,最近的第X个周期的分享次数为NX,最近的第X个周期的子社会化分享排名值可以记做NX2;则当前更新周期的社会化分享排名值为N12+N22+N32+......+NX2。其中,X的取值可以根据设备的计算能力和实际需要确定。需要说明的是,这仅作为子社会化分享排名值计算的一个例子,具体根据每个周期内的分享数据的分享次数计算该每个周期内子社会化分享排名值的方法可以根据需要选择,例如三次方或者一次方的关系等,只要能清楚表示随着分享次数的增加获得的子社会化分享排名值也越大即可。另外,为了实现最新的分享数据能够排在前面,一种优选的计算当前更新周期的社会化分享排名值的方法为,根据每个更新周期内分享服务器记录的分享数据的分享次数,计算所述分享数据在每个更新周期内的URL的子社会化分享排名值,对所述分享数据的URL在每个更新周期内的子社会化分享排名值乘以不同的衰减因数进行修正;再将所述分享数据的URL修正后的所有更新周期内的子社会化分享排名值相加得到所述分享数据的URL的社会化分享排名值,其中,所述衰减因数根据与当前更新周期相隔时间的长短确定,例如,最近的一至四个周期的衰减因数为1,最近的五至八个周期的衰减因数为0.9,最近的九至十二个周期的衰减因数为(0.9)2,以此类推。其中,每个更新周期的子社会化分享排名值的计算方法同上,最近的第一个周期的子社会化分享排名值可以记做N12;最近的第二个周期的子社会化分享排名值可以记做N22;最近的第三个周期的子社会化分享排名值可以记做N32,依次类推,最近的第X个周期的子社会化分享排名值可以记做NX2。则当前更新周期的社会化分享排名值为(N12+N22+N32+N42)+(N52+N62+N72+N82)*0.9+(N92+N102+N112+N122)*(0.9)2+(N132+N142+N152+N162)*(0.9)3......。其中,取最近多少个周期的子社会化分享排名值的和可以根据设备的计算能力和实际需要确定。需要说明的是,这仅作为利用时间进行衰减计算社会化分享排名值的一个例子,具体每个更新周期的衰减因数的值取多少本实施例不进行限定,只要能清楚表示随着更新周期的提前衰减因子越小,说明衰减的越厉害即可。S103:将所述社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。示例性的,预设排序因子至少包括文本相关性,优选的,还可以包括数据的发布时间、发布站点等。根据用户输入的检索词,将社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对分享数据的URL进行排序,并输出排序结果。优选的,接收到用户的检索词后,可以从网络上抓取与用户检索词匹配的网页资源,并记录URL,然后将从网络上抓取的网页资源与收集的SNS平台的分享数据集合起来,然后利用社会化分享排名值与检索词的预设排序因子进行线性加权,对从网络上抓取的网页资源的URL与收集的SNS平台的分享数据的URL按照加权结果一起进行排序,并输出排序结果。优选的,在排序时还可以进行排同处理,如果两个以上URL的数据内容相差不多,可以只选择其中一个URL,或者将所有包含相差不多的数据内容的URL赋予一个新的URL,通过该新的URL可以定位到所有包含该数据内容的URL。优选的,步骤S102或者步骤103还可以进一步对收集的SNS平台的分享数据进行分类,根据用户的需要对一类分享数据进行排序然后输出结果,这样可以减少计算量。例如,用户输入的检索词包含视频,则只需将视频类的数据进行处理然后排序输出即可,用户输入的检索词是新闻类的,则只需将新闻类的数据进行处理然后排序输出即可。具体的,可将收集的社会性网络服务SNS平台的分享数据分成新闻、图片、和视频三类分享数据;将每一类的分享数据的社会化分享排名值与检索词的预设排序因子进行线性加权,按照加权结果对所述每一类分享数据的URL进行排序,并输出排序结果。另外,由于新闻、图片和视频的时效性不同,例如新闻的更新十分迅速,上述的更新周期可针对新闻、图片和视频三类数据设置不同的时长,新闻需要保证至少一小时更新计算一次,所以,对于新闻来说,更新周期应小于等于一小时,具体时间可根据计算能力确定。对于图片和视频来说,对时间的要求没有新闻那么高,所以,可以一天更新一次。另外,在SNS平台上,经常会出现一些推广活动,例如分享赢免单活动,用户为了获得免单机会,会大量分享该内容,造成这类内容的分享的数量远远大于本身的热度和质量,所以,需要将这些活动的URL过滤掉。所以,步骤S102或者步骤103还可以进一步包括,若在设定个数的更新周期内,根据分享服务器记录的一个分享数据的分享次数均大于设定的分享次数阀值,或者根据分享服务器记录该分享数据德的分享次数计算所得的子社会化分享排名值均大于设定的子社会化分享排名值阀值,则将该分享数据过滤。以新闻为例进行说明,参见图2和图3,图2为分享活动的分享量的柱状线,图3为新闻的分享量的柱状图线,可以发现,新闻集中大量分享的持续时间较短,一般持续时间小于一天;而活动持续时间一般比新闻要长很多,一般持续时间大于一天,甚至持续多天。所以,对于新闻来说,可以设置在24个周期内,若每个周期的分享量均大于等于10万,则将该数据过滤,具体的过滤办法为现有技术,最简单可以直接将该数据的URL删除。本发明实施例提供的搜索结果排序的方法,通过收集社会性网络服务SNS平台的分享数据,根据分享服务器记录的分享数据的分享次数,给每一个所述分享数据的URL计算一个社会化分享排名值,然后将所述社会化分享排名值与预设的排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。改善了搜索的质量和用户体验。本发明实施例提供了一种搜索结果排序的系统,应用于图1所示的方法,参见图4,该系统包括,收集单元401,用于收集社会性网络服务SNS平台的分享数据,并记录所述分享数据的统一资源定位符URL;示例性的,收集单元401可以配置在SNS平台的分享服务器上,从SNS平台的分享服务器收集分享数据,当然也可以选择单独配置的收集单元401从SNS平台的分享服务器收集分享数据。另外,可以选择从一个SNS平台的分享服务器来收集该SNS平台的分享数据,但是优选的,可以选择从多个SNS平台的分享服务器收集多个SNS平台的分享数据,然后将多个SNS平台的分享数据进行汇总,具体的,可以将相同的分享数据在多个SNS平台中的分享次数相加得到该分享数据的分享次数,也可以给不同的SNS平台设置不同的权重,将多个SNS平台中的分享次数进行线性加权得到该分享数据的分享次数。本实施例对此不做限定,在实际应用中,可以根据需要进行变通。所述分享数据可以包括新闻、视频、图片等多种数据类型,通过记录分享数据的URL可以非常方便的定位到分享的内容。其中,URL是指该分享数据最初被分享的门户网站的地址。计算单元402,用于根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算社会化分享排名值;前台单元403,用于接收检索词,并将所述检索词发送给排序单元;排序单元404,用于将所述社会化分享排名值与预设的排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。进一步,参见图5,所述计算单元402包括更新模块4021,用于根据预设的更新周期,在每个更新周期中根据分享服务器记录的每一个所述分享数据的分享次数,给每一个所述分享数据的URL计算一个社会化分享排名值并进行更新。计算模块4022,用于根据每个更新周期内分享服务器记录的每一个所述分享数据的分享次数,计算每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值,将每一个所述分享数据所有更新周期内的子社会化分享排名值分别相加得到每一个所述分享数据的URL的社会化分享排名值。或者,用于根据每个更新周期内分享服务器记录的每一个所述分享数据的分享次数,计算每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值;对每一个所述分享数据的URL在每个更新周期内的子社会化分享排名值乘以不同的衰减因数进行修正,其中,所述衰减因数根据与当前更新周期相隔时间的长短确定;将每一个所述分享数据的URL修正后的所有更新周期内的子社会化分享排名值分别相加得到每一个所述分享数据的URL的社会化分享排名值。过滤模块405,用于若在设定个数的更新周期内,根据分享服务器记录的一个分享数据的分享次数均大于设定的分享次数阀值,或者根据分享服务器记录的该分享数据的分享次数计算所得的子社会化分享排名值均大于设定的子社会化分享排名值阀值,则将该分享数据过滤。分类模块406,用于将所述收集社会性网络服务SNS平台的分享数据分成新闻、图片、和视频三类分享数据;所述排序单元404还用于将每一类的分享数据的社会化分享排名值与预设的排序因子进行线性加权,按照加权结果对所述每一类分享数据的URL进行排序,并输出排序结果。其中,所述过滤模块405和分类模块406可以单独设置,也可以设置在计算单元402中或者排序单元404中,具体设置位置不做限定。本发明实施例提供的搜索结果排序的系统,通过收集社会性网络服务SNS平台的分享数据,根据分享服务器记录的分享数据的分享次数,给每一个所述分享数据的URL计算一个社会化分享排名值,然后将所述社会化分享排名值与预设的排序因子进行线性加权,按照加权结果对所述分享数据的URL进行排序,并输出排序结果。改善了搜索的质量和用户体验。本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1