本发明涉及搜索,特别是涉及一种搜索推荐词的排序方法、装置及电子设备。
背景技术:
1、目前,很多网络应用都会提供展示搜索推荐词的功能,即根据用户在搜索框中输入的查询文本检索得到多个搜索推荐词,进而在搜索框下方向用户展示检索到的各个搜索推荐词,以供用户选取,进而可以根据用户选取的搜索推荐词进行网络资源的查询,从而提升用户的搜索体验。
2、然而,所检索到的各个搜索推荐词中往往存在很多不符合用户查询意图的搜索推荐词,因此,如何对检索到的各个搜索推荐词进行排序,以使用户更方便地找到符合查询意图的搜索推荐词,是亟待解决的问题。
技术实现思路
1、本发明实施例的目的在于提供一种搜索推荐词的排序方法、装置及电子设备,以使得用户更方便地找到符合查询意图的搜索推荐词。具体技术方案如下:
2、在本发明实施的第一方面,首先提供了一种搜索推荐词的排序方法,所述方法包括:
3、接收客户端发送的查询文本,作为待处理查询文本;
4、利用预先训练的文本嵌入模型,对所述待处理查询文本进行向量化处理,得到第一文本向量;其中,所述文本嵌入模型为基于各个样本文本训练得到的神经网络模型;每一样本文本包括:所述用户历史输入的历史查询文本和对应的推荐词;每一历史查询文本对应的推荐词表示:用户从基于该历史查询文本检索到的各个搜索推荐词中所选取的推荐词;
5、针对基于所述待处理查询文本检索到的每一搜索推荐词,利用所述文本嵌入模型,对该搜索推荐词进行向量化处理,得到该搜索推荐词的第二文本向量;
6、基于各个搜索推荐词的第二文本向量与所述第一文本向量之间的相似度,对各个搜索推荐词进行排序,得到每一搜索推荐词对应的次序;
7、向所述客户端发送次序最高的指定数量个搜索推荐词,及对应的次序,以使所述客户端按照次序展示所接收到的各个搜索推荐词。
8、可选地,所述基于各个搜索推荐词的第二文本向量与所述第一文本向量之间的相似度,对各个搜索推荐词进行排序,包括:
9、针对每一搜索推荐词,计算该搜索推荐词的第二文本向量与所述第一文本向量之间的相似度;
10、计算所得到的相似度与该搜索推荐词的辅助属性值的加权和,得到该搜索推荐词与所述待处理查询文本的匹配度;其中,一搜索推荐词的辅助属性值包括:将该搜索推荐词、所述待处理查询文本,以及所述用户的用户特征,输入预设的点击率预估模型,所得到的点击率预估值;和/或,该搜索推荐词与所述待处理查询文本的字面相关性的相关属性值;
11、按照各个搜索推荐词与所述待处理查询文本的匹配度的大小,对各个搜索推荐词进行排序。
12、可选地,在该搜索推荐词的辅助属性包括相关属性值的情况下,在所述计算所得到的相似度与该搜索推荐词的辅助属性值的加权和,得到该搜索推荐词与所述待处理查询文本的匹配度之前,所述方法还包括:
13、确定该搜索推荐词,与所述待处理查询文本是否相同;若相同,则确定所述相关属性值为第一预设数值;
14、若不相同,确定该搜索推荐词与所述待处理查询文本是否前缀匹配,若前缀匹配,则确定所述相关属性值为第二预设数值;其中,所述前缀匹配表示,该搜索推荐词与所述待处理查询文本存在相同的文本片段,且该相同的文本片段位于该搜索推荐词和所述待处理查询文本的最前端;所述第二预设数值小于所述第一预设数值;
15、若不前缀匹配,确定该搜索推荐词与所述待处理查询文本是否后缀匹配;若后缀匹配,则确定所述相关属性值为第三预设数值;其中,所述后缀匹配表示,该搜索推荐词与所述待处理查询文本存在相同的文本片段,且该相同的文本片段位于该搜索推荐词和所述待处理查询文本的最后端;所述第三预设数值小于所述第二预设数值;
16、若既不前缀匹配也不后缀匹配,则确定所述相关属性值为第四预设数值;其中,所述第四预设数值小于所述第三预设数值。
17、可选地,所述文本嵌入模型的训练过程包括:
18、针对每一样本文本,将该样本文本中的历史查询文本,和对应的推荐词进行拼接,得到拼接文本;
19、基于初始结构的文本嵌入模型对所得到的拼接文本进行处理,得到针对该拼接文本中每一分词的预测结果;
20、基于每一分词的预测结果及该分词的真值标签,计算模型损失,以对所述初始结构的文本嵌入模型进行模型调参,直至达到模型收敛,得到训练完成的文本嵌入模型。
21、可选地,每一样本文本还包括:所述用户在搜索框中输入历史查询文本的过程中的各个指定时刻,所述搜索框中存在的搜索文本;每一指定时刻表示:除得到该历史查询文本的时刻以外,所述搜索框中新增文本、和/或删减文本的时刻;
22、所述针对每一样本文本,将该样本文本中的历史查询文本,和对应的推荐词进行拼接,得到拼接文本,包括:
23、针对每一样本文本,按照时间先后顺序对该样本文本中各个指定时刻的搜索文本进行拼接,得到拼接后的搜索文本;
24、将拼接后的搜索文本与该样本文本中的历史查询文本,和对应的推荐词进行拼接,得到拼接文本。
25、可选地,在所述针对基于所述待处理查询文本检索到的每一搜索推荐词,利用所述文本嵌入模型,对该搜索推荐词进行向量化处理,得到该搜索推荐词的第二文本向量之前,所述方法还包括:
26、从预设的各备选推荐词中,获取包含所述待处理查询文本的推荐词,作为搜索推荐词;
27、和/或,基于所述待处理查询文本进行模糊搜索,从预设的各备选推荐词中确定与所述待处理查询文本相匹配的推荐词,作为搜索推荐词。
28、可选地,所述方法还包括:
29、在所述待处理查询文本为英文字母的情况下,从预设的各中文备选推荐词中,获取拼音所组成的字符串中包含所述待处理查询文本的推荐词,作为搜索推荐词;
30、和/或,在所述待处理查询文本为英文字母的情况下,基于所述待处理查询文本进行模糊搜索,从预设的各中文备选推荐词的拼音中,确定与所述待处理查询文本相匹配的拼音,并将所确定的拼音对应的备选推荐词,作为搜索推荐词。
31、在本发明实施的第二方面,还提供了一种搜索推荐词的排序装置,所述装置包括:
32、查询文本接收模块,用于接收客户端发送的查询文本,作为待处理查询文本;
33、第一向量化模块,用于利用预先训练的文本嵌入模型,对所述待处理查询文本进行向量化处理,得到第一文本向量;其中,所述文本嵌入模型为基于各个样本文本训练得到的神经网络模型;每一样本文本包括:用户历史输入的历史查询文本和对应的推荐词;每一历史查询文本对应的推荐词表示:所述用户从基于该历史查询文本检索到的各个搜索推荐词中所选取的推荐词;
34、第二向量化模块,用于针对基于所述待处理查询文本检索到的每一搜索推荐词,利用所述文本嵌入模型,对该搜索推荐词进行向量化处理,得到该搜索推荐词的第二文本向量;
35、排序模块,用于基于各个搜索推荐词的第二文本向量与所述第一文本向量之间的相似度,对各个搜索推荐词进行排序,得到每一搜索推荐词对应的次序;
36、发送模块,用于向所述客户端发送次序最高的指定数量个搜索推荐词,及对应的次序,以使所述客户端按照次序展示所接收到的各个搜索推荐词。
37、在本发明实施的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
38、存储器,用于存放计算机程序;
39、处理器,用于执行存储器上所存放的程序时,实现上述任一所述的搜索推荐词的排序方法。
40、在本发明实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的搜索推荐词的排序方法。
41、在本发明实施的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的搜索推荐词的排序方法。
42、本发明实施例提供的搜索推荐词的排序方法,由于训练文本嵌入模型的样本文本包括用户历史输入的历史查询文本,以及对应的推荐词,使得该文本嵌入模型能够学习用户输入的历史查询文本,与从基于该历史查询文本检索到的各个搜索推荐词中所选取推荐词之间的关联关系,进而,利用该文本嵌入模型分别对查询文本,以及每一搜索推荐词进行向量化处理,得到第一文本向量以及每一搜索推荐词的第二文本向量,能够使得若一搜索推荐词的第二文本向量与第一文本向量的相似度越高,则该搜索推荐词与待处理查询文本之间的关联度越高,即更可能符合用户的查询意图,从而基于各个搜索推荐词的第二文本向量与第一文本向量之间的相似度,对各个搜索推荐词进行排序,能够使得用户更加容易找到符合查询意图的搜索推荐词,提高了用户查询的效率,因此也提高了用户体验。