本申请涉及互联网,尤其涉及一种信息推荐方法、装置、电子设备及存储介质。
背景技术:
1、人工智能(ai,artificial intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
2、其中,信息推荐是人工智能的一个重要应用场景,信息推荐涉及搜索过程,搜索整体上可以分为召回和排序两大过程,在召回层面,文本召回依赖非必留结果。相关技术提供的非必留包括一次非必留、二次非必留、静态多路非必留和动态多路非必留。然而,一次非必留和二次非必留是两个任务串行进行的,模型的拟合能力不足,需要依赖其他输入特征,例如意图、实体等,同时还依赖复杂的后处理策略;此外,静态多路非必留和动态多路非必留的效果参差不齐,缺少衡量分词组合的召回预估能力,所有候选分词组合都下发会加大索引平台召回的压力。
3、也就是说,如何衡量候选分词组合的召回预估能力,并从中选择优质的分词组合,以提升信息推荐的效果和效率,相关技术尚无有效的解决方案。
技术实现思路
1、本申请实施例提供一种信息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提高信息推荐效果和效率。
2、本申请实施例的技术方案是这样实现的:
3、本申请实施例提供一种信息推荐方法,包括:
4、接收搜索请求,从所述搜索请求携带的待查询文本提取多个候选的分词组合;
5、对所述多个候选的分词组合进行第一排序处理,从得到的第一排序结果中获取从首位开始的第一数量的分词组合;
6、从第一索引集群中获取与所述第一数量的分词组合匹配的第一信息列表,基于所述第一信息列表确定每个所述分词组合的相关性特征;
7、基于所述待查询文本以及每个所述分词组合的相关性特征,对所述第一数量的分词组合进行第二排序处理,从得到的第二排序结果中获取从首位开始的第二数量的分词组合,其中,所述第二数量小于所述第一数量;
8、从第二索引集群中获取与所述第二数量的分词组合匹配的第二信息列表,基于所述第二信息列表响应所述搜索请求,其中,所述第二索引集群包括所述第一索引集群。
9、本申请实施例提供一种信息推荐装置,包括:
10、接收模块,用于接收搜索请求;
11、提取模块,用于从所述搜索请求携带的待查询文本提取多个候选的分词组合;
12、排序模块,用于对所述多个候选的分词组合进行第一排序处理;
13、获取模块,用于从得到的第一排序结果中获取从首位开始的第一数量的分词组合;以及用于从第一索引集群中获取与所述第一数量的分词组合匹配的第一信息列表;
14、确定模块,用于基于所述第一信息列表确定每个所述分词组合的相关性特征;
15、所述排序模块,还用于基于所述待查询文本以及每个所述分词组合的相关性特征,对所述第一数量的分词组合进行第二排序处理;
16、所述获取模块,还用于从得到的第二排序结果中获取从首位开始的第二数量的分词组合;以及用于从第二索引集群中获取与所述第二数量的分词组合匹配的第二信息列表,其中,所述第二数量小于所述第一数量,所述第二索引集群包括所述第一索引集群;
17、响应模块,用于基于所述第二信息列表响应所述搜索请求。
18、本申请实施例提供一种电子设备,包括:
19、存储器,用于存储可执行指令;
20、处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的信息推荐方法。
21、本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,用于被处理器执行时,实现本申请实施例提供的信息推荐方法。
22、本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,用于被处理器执行时,实现本申请实施例提供的信息推荐方法。
23、本申请实施例具有以下有益效果:
24、从小规模的第一索引集群中获取与大量的分词组合匹配的第一信息列表,基于第一信息列表确定的分词组合的相关性特征进行重排序,以从大量的分词组合中筛选出少量的分词组合,进而从大规模的第二索引集群获取与少量的分词组合匹配的第二信息列表,如此,能够通过基于第一信息列表确定的分词组合的相关性特征,准确地衡量该分词组合的预估召回能力,并从中选择出少量优质的分词组合进行大规模索引集群的下发,减轻了索引集群的压力,同时也提升了信息推荐的效果和效率。
1.一种信息推荐方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述多个候选的分词组合进行第一排序处理,包括:
3.根据权利要求2所述的方法,其特征在于,所述确定所述分词序列的嵌入向量表示,包括:
4.根据权利要求2所述的方法,其特征在于,所述对所述文本特征向量进行回归处理,得到所述待查询文本与所述候选的分词组合之间的语义匹配度,包括:
5.根据权利要求2所述的方法,其特征在于,
6.根据权利要求1所述的方法,其特征在于,
7.根据权利要求6所述的方法,其特征在于,
8.根据权利要求1所述的方法,其特征在于,所述基于所述待查询文本以及每个所述分词组合的相关性特征,对所述第一数量的分词组合进行第二排序处理,包括:
9.根据权利要求8所述的方法,其特征在于,所述相关性特征包括整数型数值特征和浮点型数值特征;
10.根据权利要求8所述的方法,其特征在于,所述对所述分词组合的相关性特征进行编码处理,得到所述分词组合的相关性特征向量,包括:
11.根据权利要求8所述的方法,其特征在于,
12.根据权利要求11所述的方法,其特征在于,所述获取针对所述训练样本对标记的标签数据,包括:
13.根据权利要求1所述的方法,其特征在于,所述从所述搜索请求携带的待查询文本提取多个候选的分词组合,包括:
14.一种信息推荐装置,其特征在于,所述装置包括:
15.一种电子设备,其特征在于,包括:
16.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时,实现权利要求1至13任一项所述的信息推荐方法。
17.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时,实现权利要求1至13任一项所述的信息推荐方法。