一种搜索关键词排序方法、装置和搜索引擎的制作方法

文档序号:6576497阅读:233来源:国知局

专利名称::一种搜索关键词排序方法、装置和搜索引擎的制作方法
技术领域
:本发明属于数据挖掘领域,尤其涉及一种搜索关^t词排序方法、装置和搜索引擎。
背景技术
:现有的大部分搜索引擎均提供了根据用户的搜索操作对搜索关键词按搜索频率排序并输出的方法,现有的搜索关键词排序方法一般通过对搜索关键词进行领域分类,并按照领域分类,对搜索关键词按照搜索频率排序并输出,这种搜索关键词排序方法展现了在特定时间段内和指定分类下网络用户搜索热度比较高的搜索关键词,但是这种搜索关键词排序方法由于缺少了网络用户的个人属性信息,如用户的年龄、性别、地区、职业等,从而无法真正意义上从网络用户出发挖掘出反映用户搜索习惯的数据信息,难以达到通过对搜索关键词进行排序,来挖掘重要数据信息的要求。
发明内容本发明实施例的目的在于提供一种搜索关键词排序方法,旨在解决现有的搜索关键词排序方法难以挖掘出真实反映用户搜索习惯的数据的问题。本发明实施例是这样实现的,一种搜索关键词排序方法,所述方法包括下述步骤采集用户的搜索日志信息和属性信息,所述搜索日志信息包括用户标识和搜索关键词,所述属性信息包括用户标识和用户属性;根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系;根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值;根据搜索关键词的属性加权值对搜索关键词进行排序。本发明实施例的另一目的在于提供一种搜索关键词排序装置,所述装置包括信息釆集单元,用于采集用户的搜索日志信息和属性信息,所述搜索日志信息包括用户标识和搜索关^t词,所述属性信息包括用户标识和用户属性;数据挖掘单元,用于根据所述信息采集单元采集的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系;加权值计算单元,用于根据所述数据挖掘单元得到的用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值;搜索关键词排序单元,用于根据所述加权值计算单元得到的搜索关键词的属性加权值对搜索关4建词进行排序。本发明实施例的另一目的在于提供一种搜索引擎,所述搜索引擎包括所述搜索关键词排序装置。在本发明实施例中,根据用户的搜索日志信息和用户的属性信息建立用户属性与搜索关4建词的对应关系,根据用户属性与搜索关键词的对应关系,釆用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值,根据搜索关键词的属性加权值对搜索关键词进行排序并输出,从而可以准确、快速地挖掘出既具有较高搜索热度,又能代表各种不同用户群体搜索习惯的数据信息,从而获取能真实反映网络用户搜索习惯的信息,为进一步了解并满足用户需求提供数据支持。图i是本发明实施例提供的搜索关键词排序方法的实现流程图;图2是本发明实施例提供的对搜索关键词排序后的效果示意图3是本发明实施例提供的搜索关键词装置的结构框图4是本发明另一实施例提供的搜索关键词装置的结构框图。具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。在本发明实施例中,釆集用户的搜索日志信息和用户的属性信息,其中搜索日志信息包括用户标识和搜索关键词,属性信息包括用户标识和用户属性,根据用户的搜索日志信息和用户的属性信息建立用户属性与搜索关键词的对应关系,根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值,根据搜索关键词的属性加权值对搜索关键词进行排序并输出,从而可以准确、快速的挖掘出既具有较高搜索热度,又能代表各种用户群体搜索习惯的数据信息。图1示出了本发明实施例提供的搜索关键词排序方法的实现流程,详述如下在步骤S101中,采集用户的搜索日志信息和属性信息。其中搜索日志信息包括用户标识和搜索关键词。属性信息包括用户标识和用户属性。在本发明实施例中,用户属性包括但不限于性别、年龄、地区、职业、星座、生肖、血型中的一个或者多个维度。还可以根据用户的需要为用户属性设置其他维度。其中每个维度的用户属性包括一个或者多个属性值,如性别包括男性和女性两个属性值,年龄包括但不限于七十年代(70s)、八十年代(80s)和九十年代(卯s)三个属性值,地区包括但不限于根据预设的划分标准得到的地区。其中根据预设的划分标准得到的地区可以为根据一个国家的省份划分得到的不同地区,如广东、广西等34个地区中的一个或者多个,也可以根据地球中的国家划分得到的不同地区,如中国、美国、印度等。当然,根据上述原理,用户可以根据需要自行设置其他维度的用户属性或者每个维度用户属性的属性值,在此不再赘述。在本发明实施例的下文中,均以用户属性包括性别、年龄和地区三个维度,其中性别包括男性和女性两种属性值,年龄包括70s、80s和90s三种属性值,地区包括按照中国的省份划分得到的广东、广西、香港等34个地区为例,对本发明实施例进行-说明。在本发明实施例中,在采集用户的搜索日志信息时,可以采集用户在预设时间段内的搜索日志信息,如釆集用户在最近一个月内的搜索日志信息。在步骤S102中^艮据用户的搜索日志信息和属性信息建立用户属性与搜索关《建词之间的对应关系。在本发明实施例中,根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词的对应关系的具体步骤可以如下A、以用户标识为主键值创建用户属性表,用于存储用户的属性信息。该用户属性表包括用户标识和用户属性,其中用户属性包括但不限于性别属性、年龄属性和地区属性三个字^:。如表1.1为本发明实施例提供的用户属性表的其中一个示例。表1.1<table>tableseeoriginaldocumentpage8</column></row><table>B、从采集的搜索日志信息中读取搜索关键词,并提取每条搜索关键词的用户标识,根据每条搜索关键词的用户标识,将每条搜索关键词增加至用户属性表中,生成标识-属性-词串表。该标识-属性-词串表包括用户标识、用户属性和搜索关键词三个字段,其中用户属性包括但不限于性别属性、年龄属性和地区属性三个字段。举例说明如下^i殳搜索日志信息如表1.2所示,则从采集的搜索日志信息中读取的搜索关键词的用户标识,根据每条搜索关键词的用户标识,将每条搜索关键词增加至用户属性表之后,生成的标识-属性-词串表如表1.3所示。表1.2用户标识搜索关键词1租房网2公务员3公交查询表1.3用户标识用户属性搜索关键词性别年龄地区1女70s广东租房网2男70s广东公务员3女80s广西7>交查询c、创建属性-词串表,该属性-词串表用于存储用户属性与搜索关键词之间的对应关系。该属性-词串表包括用户属性和搜索关键词,其中用户属性包括但不限于性别属性、年龄属性和地区属性,性别属性包括男性和女性两个属性值,年龄属性包括但不限于70s、80s和90s三个属性值,地区包括但不限于广东、广西等34个地区等属性值。表1.4是本发明实施例提供的未包括搜索关键词时的属性-词串表的一个示例,〗旦不以该示例为限。表1.4用户属性搜索关键词性别男女<table>tableseeoriginaldocumentpage10</column></row><table>D、从标识-属性-词串表中读取搜索关键词,并根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中。举例说明如下假设标识-属性-词串表如表1.3所示,未添加搜索关键词的属性-词串表如表1.4所示,则根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中后,属性-词串表如表1.5所示<table>tableseeoriginaldocumentpage10</column></row><table>在本发明另一实施例中,根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词的对应关系的具体步骤还可以如下A、以用户标识为主键值创建搜索日志信息表,该搜索日志信息表用于存储搜索日志信息。该搜索日志信息包括但不限于用户标识和搜索关键词。如表1.6为本发明实施例提供的搜索日志信息表的一个示例。表1.6<table>tableseeoriginaldocumentpage11</column></row><table>B、从釆集的属性信息中读取用户属性,并提取每条用户属性的用户标识。根据每条用户属性的用户标识,将每条用户属性增加至搜索日志信息表中,生成标识-词串-属性表。举例说明如下假设从采集的属性信息中读取的用户属性如表1.7所示,则根据每条用户属性的用户标识,将每条用户属性增加至搜索日志信息表的对应记录之后,生成的标识-词串-属性表如表1.8所示。表1.7<table>tableseeoriginaldocumentpage11</column></row><table>表1.8<table>tableseeoriginaldocumentpage11</column></row><table>c、创建属性-词串表,用于存储用户属性与搜索关键词之间的对应关系。表1.4是本发明实施例提供的未包括搜索关键词时的属性-词串表的一个示例,j旦不以该示例为限。D、从标识-词串-属性表中读取搜索关键词,并根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中。举例说明如下假设标识-词串-属性表如表1.8所示,未添加搜索关键词的属性-词串表如表1.4所示,则根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中后,属性-词串表如表1.9所示表1.9用<table>tableseeoriginaldocumentpage12</column></row><table>在步骤S103中,根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值。其具体过程如下A、根据用户属性与搜索关键词的对应关系获取搜索关键词的热度值和搜索关键词的属性特征值。其中搜索关键词的属性特征值是指该搜索关键词被具有某用户属性(如男性)的用户搜索的次数相对于被具有其他用户属性(如女性以及其他用户属性)的用户搜索的次数的区别度。搜索关键词的热度值是指搜索关键词被搜索的频率。B、根据搜索关^:词的热度值和搜索关键词的属性特征值,采用预设的搜索关键词加权公式计算搜索关键词的属性加权值。其中预设的搜索关键词加权公式为S*(TA3),其中S为搜索关键词的搜索热度值,T为搜索关键词的属性特征值。在本发明另一实施例中,当用户属性包括多个维度的用户属性,如用户属性包括性别、年龄、地区、职业、星座、生肖、血型中的多个维度,每个维度用户属性包括一个或多个属性值时,则根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值的具体过程如下:A、根据用户属性与搜索关键词的对应关系获取搜索关键词的热度值和搜索关键词的属性值特征值。其中搜索关键词的属性值特征值是指在某个维度(如性别)的用户属性中,该搜索关键词被具有该维度用户属性中的某个属性值(如男性)的用户搜索的次数相对于被具有该维度用户属性中的其他属性值(如女性)的用户搜索的次数的区别度。举例说明如下假设搜索关键词"NBA"—共被100个用户搜索过,其中被男性用户搜索的次数为95,为被女性用户搜索的次数为5,则该搜索关键词"NBA"在男性属性值时的特征值为95,或者为95%,在女性属性值时的特征值为5,或者为5%。再举例说明如下假设搜索关键词"NBA"一共被100个用户搜索过,其中被70s的用户搜索的次数为50,^皮80s的用户搜索的次数为5,纟皮90s的用户搜索的次数为45,则该搜索关4定词"NBA"在70s属性值时的特征值为50,或者为50%,在80s属性值时的特征值为5,或者为5%,在90s属性值时的特征值为45,或者为45%。搜索关键词的热度值是指搜索关键词被搜索的频率。举例说明如下假设搜索关键词"NBA"—共被100个用户搜索过,则该搜索关4建词"NBA"的搜索频率为100。B、根据搜索关键词的热度值和搜索关键词的属性值特征值,采用预设的搜索关键词加权公式计算搜索关键词的属性加权值。其中预设的搜索关键词加权公式为:S*(RA3),其中S为搜索关键词的热度值,R为搜索关键词的属性值特征值。在步骤S104中,根据搜索关键词的属性加权值对搜索关键词进行排序并输出。其具体过程如下按照用户属性或者每个维度的用户属性的属性值,根据搜索关键词的属性加权值对搜索关键词进行排序并输出。其中对搜索关键词进行排序时,可以按照升序、降序或者其他排列顺序对搜索关键词进行排序。请参阅图2,为本发明实施例提供的按照每个维度的用户属性的属性值,根据搜索关键词的属性加权值对搜索关键词进行排序后的结果示意图。其中在用户属性的维度为性别时,包括按照属性值为男性的搜索关键词的排序,属性值为女性的搜索关键词的排序;在用户属性的维度为年龄时,包括按照属性值为70s的搜索关键词的排序,属性值为80s年代的搜索关键词的排序,属性值为卯s年代的搜索关键词的排序。为了为用户提供数据支持,进一步了解并满足用户的需求,在本发明另一实施例中,在步骤S103之后,该方法还包括下述步骤在步骤S105中,根据搜索关4建词的属性加权值为用户推送对应的业务。其具体过程属于现有技术,在此不再赘述。图3示出了本发明实施例提供的搜索关键词排序装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分。该搜索关键词排序装置可以是内置于搜索引擎中的软件单元、硬件单元或者软硬件相结合的单元,或者作为独立的挂件集成到:溲索引擎或者^:索引擎的应用系统中。其中信息采集单元1采集用户的搜索日志信息和属性信息。其中搜索日志信息包括用户标识和搜索关^:词。属性信息包括用户标识和用户属性。在本发明实施例中,用户属性包括但不限于性别、年龄、地区、职业、星座、生肖、血型中的一个或者多个维度。还可以根据用户的需要为用户属性设置其他维度。其中每个维度的用户属性包括一个或者多个属性值,如性别属性包括男性和女性两个属性值,年龄属性包括但不限于七十年代(70s)、八十年代(80s)和九十年代(90s)三个属性值,地区属性包括但不限于根据预设的划分标准得到的地区。其中根据预设的划分标准得到的地区可以为根据一个国家的省份划分得到的不同地区,如广东、广西等34个地区中的一个或者多个,也可以根据地球中的国家划分得到的不同地区,如中国、美国、印度等。当然,根据上述原理,用户可以根据需要自行设置其他维度的用户属性或者每个维度用户属性的属性值,在此不再赘述。在本发明实施例中,在采集用户的搜索日志信息时,可以采集用户在预设时间段内的搜索日志信息,如采集用户在最近一个月内的搜索日志信息。在本发明另一实施例中,该装置还包括日志信息服务器和属性信息服务器,其中日志信息服务器为在线服务器,用于存储用户的搜索日志信息,或者用户在预设时间段内的搜索日志信息。属性信息服务器可以为在线或者离线服务器,用于存储用户的属性信息。在本发明实施例中,日志信息服务器和属性信息服务器可以是同一物理服务器,或者相互独立的物理服务器。数据挖掘单元2根据信息采集单元1采集的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系。该数据挖掘单元2包括用户属性表创建模块21、标识-属性-词串表生成模块22、属性-词串表创建模块23和属性-词串表填充模块24。其中用户属性表创建模块21以用户标识为主键值创建用户属性表,用于存储用户的属性信息。该用户属性表包括用户标识和用户属性,其中用户属性包括但不限于性别属性、年龄属性和地区属性三个字段。如表1.1为本发明实施例提供的用户属性表的其中一个示例。标识-属性-词串表生成模块22从采集的搜索日志信息中读取搜索关键词,并提取每条搜索关键词的用户标识,根据每条搜索关键词的用户标识,将每条搜索关键词增加至用户属性表中,生成标识-属性-词串表。该标识-属性-词串表包括用户标识、用户属性和搜索关4定词三个字段,其中用户属性包括但不限于性别属性、年龄属性和地区属性三个字段。属性-词串表创建模块23创建属性-词串表,该属性-词串表用于存储用户属性与搜索关键词之间的对应关系。该属性-词串表包括用户属性和搜索关键词,其中用户属性包括但不限于性别属性、年龄属性和地区属性,性别属性包括男性和女性两个属性值,年龄属性包括但不限于70s、80s和90s三个属性值,地区包括但不限于广东、广西等34个地区等属性值。表1.4是本发明实施例提供的未包括搜索关键词时的属性-词串表的一个示例,但不以该示例为限。属性-词串表填充模块24从标识-属性-词串表中读取搜索关键词,并根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中。举例说明如下假设标识-属性-词串表如表1.3所示,未添加搜索关键词的属性-词串表如表1.4所示,则根据该搜索关4建词对应的用户属性将该搜索关键词添加至属性-词串表中后,属性-词串表如表1.5所示属性加权值计算单元3根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值。该属性加权值计算单元3包括热度值获取模块31、特征值获取模块32和加权值计算模块33。其中热度值获取模块31根据用户属性与搜索关键词的对应关系获取搜索关键词的热度值。其中搜索关键词的热度值是指搜索关键词被搜索的频率。举例说明如下假设搜索关键词"NBA"—共被100个用户搜索过,则该搜索关键词"NBA"的搜索频率为100。特征值获取模块32根据用户属性与搜索关键词的对应关系获取搜索关键词的属性特征值或者属性值特征值。其中搜索关键词的属性特征值是指该搜索关键词被具有某用户属性(如男性)的用户搜索的次数相对于被具有其他用户属性(如女性以及其他用户属性)的用户搜索的次数的区别度。搜索关键词的属性值特征值是指在某个维度(如性别)的用户属性中,该搜索关键词被具有该维度(性别)用户属性中的某个属性值(如男性)的用户搜索的次数相对于被具有该维度(性别)用户属性中的其他属性值(如女性)的用户搜索的次数的区别度。。16加权值计算模块33根据搜索关键词的热度值和搜索关键词的属性特征值或者搜索关键词的属性值特征值,采用预设的搜索关键词加权公式计算搜索关键词的属性加权值。,其中预设的搜索关键词加权公式为S*(TA3),其中S为搜索关键词的热度值,T为搜索关键词的属性特征值。搜索关键词排序单元4根据搜索关键词的属性加权值对搜索关键词进行排序并输出。其具体过程如下按照用户属性或者每个维度的用户属性的属性值,根据搜索关键词的属性加权值对搜索关键词进行排序并输出。其中对搜索关键词进行排序时,可以按照升序、降序或者其他排列顺序对搜索关键词进行排序。请参阅图2,为本发明实施例提供的按照不同维度用户属性的属性值,根据搜索关键词的属性加权值对搜索关键词进行排序后的结果示意图。为了为用户提供数据支持,进一步了解并满足用户的需求,在本发明另一实施例中,该装置还包括业务推送单元5。该业务推送单元5根据排序后的搜索关键词为用户推送对应的业务。其具体过程属于现有技术,在此不再赘述。图4示出了本发明另一实施例提供的搜索关键词排序装置的结构,其与图3所示的搜索关键词排序装置的区别仅在于数据挖掘单元2。在本发明实施例中,该数据挖掘单元2包括日志信息表创建^^莫块25、标识-词串-属性表生成冲莫块26、属性-词串表创建模块23和属性-词串表填充模块24。其中曰志信息表创建模块25以用户标识为主键值创建搜索日志信息表,用于存储搜索日志信息。该搜索日志信息包括但不限于用户标识和搜索关键词。如表1.6为本发明实施例提供的搜索日志信息表的一个示例。标识_词串-属性表生成模块26从采集的属性信息中读取用户属性,并提取每条用户属性的用户标识。根据每条用户属性的用户标识,将每条用户属性增加至搜索日志信息表中,生成标识-词串-属性表。举例说明如下假设从采集的属性信息中读取的用户属性如表1.7所示,17则根据每条用户属性的用户标识,将每条用户属性增加至搜索日志信息表的对应记录之后,生成的标识-词串-属性表如表1.8所示。属性-词串表创建模块23创建属性-词串表,该属性-词串表用于存储用户属性与搜索关键词之间的对应关系。表1.4是本发明实施例提供的未包括搜索关键词时的属性-词串表的一个示例,但不以该示例为限。属性-词串表填充模块24从标识-词串-属性表中读取搜索关键词,并根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中。举例说明如下假设标识-词串-属性表如表1.8所示,未添加搜索关键词的属性-词串表如表1.4所示,则根据该搜索关键词对应的用户属性将该搜索关键词添加至属性-词串表中后,属性-词串表如表1.9所示在本发明实施例中,根据用户的搜索日志信息和用户的属性信息建立用户属性与搜索关键词的对应关系,根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值,根据搜索关键词的属性加权值对搜索关键词进行排序并输出,从而可以准确、快速的挖掘出既具有较高搜索热度,又能代表各种用户群体搜索习惯的数据信息,从而获取能真实反映网络用户搜索习惯的信息,为进一步了解并满足用户需求提供数据支持。通过采集用户的多个维度的用户属性,从而全面的挖掘出可以反映不同用户群体搜索习惯的凄史据信息。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。权利要求1、一种搜索关键词排序方法,其特征在于,所述方法包括下述步骤采集用户的搜索日志信息和属性信息,所述搜索日志信息包括用户标识和搜索关键词,所述属性信息包括用户标识和用户属性;根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系;根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值;根据搜索关键词的属性加权值对搜索关键词进行排序。2、如权利要求l所述的方法,其特征在于,所述根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系的步骤具体为以用户标识为主键:值创建用户属性表,所述用户属性表用于存储用户的属性信息;从采集的搜索日志信息中读取搜索关键词,并提取每条搜索关键词的用户标识,根据每条搜索关键词的用户标识,将每条搜索关4定词增加至用户属性表中,生成标识-属性-词串表;创建属性_词串表,所述属性-词串表用于存储用户属性与搜索关键词之间的对应关系;从所述标识-属性-词串表中读取搜索关键词,并根据搜索关键词对应的用户属性将搜索关键词添加至属性-词串表中。3、如权利要求l所述的方法,其特征在于,所述根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系的步骤具体为以用户标识为主4建值创建搜索日志信息表,所述搜索日志信息表用于存储搜索日志信息;从采集的属性信息中读取用户属性,并提取每条用户属性的用户标识。根据每条用户属性的用户标识,将每条用户属性增加至搜索日志信息表中,生成标识-词串-属性表;创建属性-词串表,所述属性-词串表用于存储用户属性与搜索关键词之间的对应关系;从所述标识-词串-属性表中读取搜索关键词,并根据搜索关键词对应的用户属性将搜索关键词添加至属性-词串表中。4、如权利要求l所述的方法,其特征在于,所述根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值的步骤具体包括根据用户属性与搜索关键词的对应关系获取搜索关键词的热度值和搜索关键词的属性值特征值;根据搜索关键词的热度值和搜索关键词的属性值特征值,采用预设的搜索关键词加权公式,计算搜索关键词在不同属性值时的加权值。5、如权利要求l所述的方法,其特征在于,当所述用户属性包括多个维度的用户属性,每个维度用户属性包括一个或多个属性值时,所述根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值的步骤具体包括根据用户属性与搜索关键词的对应关系获取搜索关键词的热度值和搜索关键词的属性值特征值;根据搜索关键词的热度值和搜索关键词的属性值特征值,采用预设的搜索关键词加权公式,计算搜索关键词的属性加权值。6、如权利要求4或5所述的方法,其特征在于,所述预设的搜索关键词加权公式为S、T"),其中S为搜索关键词的热度值,T为搜索关键词的属性特征值或者属性值特征值。7、如权利要求1至5任一权利要求所述的方法,其特征在于,在所述根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值的步骤之后,所述方法还包括下述步骤根据搜索关键词的属性加权值为用户推送对应的业务。8、一种搜索关键词排序装置,其特征在于,所述装置包括信息采集单元,用于采集用户的搜索日志信息和属性信息,所述搜索曰志信息包括用户标识和搜索关键词,所述属性信息包括用户标识和用户属性;数据挖掘单元,用于根据所述信息釆集单元采集的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系;属性加权值计算单元,用于根据所述数据挖掘单元得到的用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值;搜索关键词排序单元,用于根据所述加权值计算单元得到的搜索关键词的属性加权值对搜索关键词进行排序。9、如权利要求8所述的装置,其特征在于,所述属性加权值计算单元包括热度值获取模块,用于根据用户属性与搜索关键词的对应关系获取搜索关键词的热度值;特征值获取模块,用于根据用户属性与搜索关键词的对应关系获取搜索关键词的属性特征值或者属性值特征值;加权值计算模块,用于根据搜索关键词的热度值和搜索关键词的属性特征值或者搜索关键词的属性值特征值,采用预设的搜索关键词加权公式,计算搜索关键词的属性加权值,所述预设的搜索关键词加权公式为S*(TA3),其中S为搜索关键词的热度值,T为搜索关键词的属性特征值或者属性值特征值。10、一种搜索引擎,其特征在于,所述搜索引擎包括所述8或9所述的搜索关键词排序装置。全文摘要本发明适用于数据挖掘领域,提供了一种搜索关键词排序方法、装置和搜索引擎,所述方法包括下述步骤采集用户的搜索日志信息和属性信息,所述搜索日志信息包括用户标识和搜索关键词,所述属性信息包括用户标识和用户属性;根据用户的搜索日志信息和属性信息建立用户属性与搜索关键词之间的对应关系;根据用户属性与搜索关键词的对应关系,采用预设的搜索关键词加权公式计算每个搜索关键词的属性加权值;根据搜索关键词的属性加权值对搜索关键词进行排序。本发明实施例可以准确、快速的挖掘出既具有较高搜索热度,又能代表各种用户群体搜索习惯的数据信息,从而获取能真实反映网络用户搜索习惯的信息,为进一步了解并满足用户需求提供数据支持。文档编号G06F17/30GK101620625SQ20091010918公开日2010年1月6日申请日期2009年7月30日优先权日2009年7月30日发明者牮翟,赵世勇,伟陆申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1