文件推荐方法和装置的制造方法_2

文档序号:8380956阅读:来源:国知局
二 关键词集合,该第二关键词集合包括该第二名称分词得到的至少一个关键词。
[0039] 可选地,获取该每个第二名称包括的匹配关键词在该第一名称中的权重之前,该 方法还包括:
[0040] 根据该第一关键词集合中每个关键词的类型和出现频率中的至少一项,获取该每 个关键词在该第一名称中的权重。
[0041] 可选地,根据该第一关键词集合中每个关键词的类型和出现频率中的至少一项, 获取该每个关键词在该第一名称中的权重包括:
[0042] 根据该每个关键词的类型对应的权重级别,按照权重级别从高到低的顺序为该每 个关键词分配权重,使得权重级别高的关键词所分配的权重大于权重级别低的关键词所分 配的权重;或,
[0043] 按照该每个关键词的出现频率从高到低的顺序为该每个关键词分配权重,使得出 现频率高的关键词所分配的权重大于出现频率低的关键词所分配的权重;或,
[0044] 根据该每个关键词的类型对应的权重级别,按照权重级别从高到低的顺序为该每 个关键词分配权重,使得权重级别高的关键词所分配的权重大于权重级别低的关键词所分 配的权重;
[0045] 根据该每个关键词的出现频率,对该每个关键词所分配的权重进行调整。
[0046] 可选地,该关键词的类型包括名词、动词或虚词,名词的权重级别高于动词和虚词 的权重级别;
[0047] 该关键词的出现频率为该关键词在已存储的文件名称中出现的频率,或者,该关 键词的出现频率为该关键词在已存储的指定类别的文件名称中出现的频率,该指定类别为 该当前打开文件所属的类别。
[0048] 可选地,名词中姓名的权重级别高于其他名词的权重级别。
[0049] 可选地,根据该每个第二名称包括的匹配关键词在该第一名称中的权重,确定待 推荐的第二名称包括:
[0050] 根据该每个第二名称包括的匹配关键词在该第一名称中的权重,确定该每个第二 名称的权重;
[0051] 按照该每个第二名称的权重从大到小的顺序,将预设数目的第二名称确定为该待 推荐的第二名称。
[0052] 可选地,根据该每个第二名称包括的匹配关键词在该第一名称中的权重,确定该 每个第二名称的权重包括:
[0053] 将该每个第二名称包括的匹配关键词在该第一名称中的权重的和值确定为该每 个第二名称的权重;或,
[0054] 根据该每个第二名称所指示文件的发布时间,确定该每个第二名称的时间权重, 按照预设比例,对该每个第二名称包括的匹配关键词在该第一名称中的权重的和值以及该 时间权重进行加权计算,得到加权和值,将该加权和值确定为该每个第二名称的权重。
[0055] 上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再 --赘述。
[0056] 图2是本发明实施例提供的一种文件推荐方法的流程图。该发明实施例的执行主 体为服务器,参见图2,所述方法包括:
[0057] 201、该服务器对第一名称进行分词,得到第一关键词集合,该第一名称为当前打 开文件的名称,该第一关键词集合包括该第一名称分词得到的至少一个关键词。
[0058] 本发明实施例应用于用户已打开文件,该服务器根据当前打开文件的名称,为用 户推荐其他文件的场景下。该服务器可以为与当前打开文件关联的服务器或者与当前打开 文件关联的服务器中的功能模块,本发明实施例对此不做限定。
[0059] 进一步地,本发明实施例应用于当前打开文件的名称为发布者自定义的名称的场 景下。与电影名称或电视剧名称等在发布时已规定好的名称不同,发布者自定义的名称可 能很长或者很短,可能为一个简单的词语,也可能为一个复杂的句子,本发明实施例即根据 发布者自定义的个性化名称,为用户推荐文件。
[0060] 其中,该文件可以为服务器所提供的视频文件、音频文件或者文本文件等,如视频 网站服务器提供的网络视频文件、音频网站提供的音频文件或文档共享服务器所提供的网 络文档等,本发明实施例对此不做限定。
[0061] 具体地,该服务器在检测到用户打开文件时,获取当前打开文件的名称作为第一 名称,并对该第一名称进行分词,得到该第一名称的至少一个关键词,将该至少一个关键词 组成该第一关键词集合。
[0062] 例如,该第一名称为"刘德华出席张学友的演唱会时穿的服装",则对该第一名称 进行分词,得到该第一关键词集合{刘德华,张学友,演唱会,服装}。
[0063] 其中,该服务器在对该第一名称分词时,可以采用基于字符串匹配的分词方法或 者基于统计的分词方法,本发明实施例对此不做限定。
[0064] 202、该服务器根据预设对应关系,获取该至少一个第二名称,该第二名称为该第 一关键词集合中的关键词对应的文件名称,该预设对应关系包括关键词与包含该关键词的 文件名称之间的对应关系。
[0065] 其中,该第一关键词集合包括至少一个关键词,而对于该第一关键词集合中的每 个关键词来说,该服务器通过查询该预设对应关系,即可得到包含该第一关键词集合中的 任一个或多个关键词的文件名称。
[0066] 例如,该第一名称、该第一关键词集合中的关键词以及每个关键词对应的第二名 称之间的对应关系如表1所不。
[0067] 表 1
【主权项】
1. 一种文件推荐方法,其特征在于,所述方法包括: 对第一名称进行分词,得到第一关键词集合,所述第一名称为当前打开文件的名称,所 述第一关键词集合包括所述第一名称分词得到的至少一个关键词; 根据预设对应关系,获取至少一个第二名称和所述至少一个第二名称对应的第二关键 词集合,所述第二名称为所述第一关键词集合中的关键词对应的文件名称,所述预设对应 关系包括关键词与包含所述关键词的文件名称之间的对应关系; 获取所述第一关键词集合和每个第二名称对应的第二关键词集合中相同的关键词,将 所述相同的关键词作为匹配关键词; 获取所述每个第二名称包括的匹配关键词在所述第一名称中的权重; 根据所述每个第二名称包括的匹配关键词在所述第一名称中的权重,确定待推荐的第 二名称; 推荐所述确定的第二名称所指示的文件。
2. 根据权利要求1所述的方法,其特征在于,根据预设对应关系,获取至少一个第二名 称和所述至少一个第二名称对应的第二关键词集合包括: 根据所述预设对应关系,获取所述至少一个第二名称; 对于所述至少一个第二名称中的每个第二名称,对所述第二名称进行分词,得到第二 关键词集合,所述第二关键词集合包括所述第二名称分词得到的至少一个关键词。
3. 根据权利要求1所述的方法,其特征在于,获取所述每个第二名称包括的匹配关键 词在所述第一名称中的权重之前,所述方法还包括: 根据所述第一关键词集合中每个关键词的类型和出现频率中的至少一项,获取所述每 个关键词在所述第一名称中的权重。
4. 根据权利要求3所述的方法,其特征在于,根据所述第一关键词集合中每个关键词 的类型和出现频率中的至少一项,获取所述每个关键词在所述第一名称中的权重包括: 根据所述每个关
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1