本发明实施例涉及人工智能,尤其涉及一种基于大语言模型的交叉检索方法、装置、设备及存储介质。
背景技术:
1、大语言模型(large language model,llm)在自然语言处理、图像识别、语音识别等多个领域得到了广泛应用。随着基于解码器transformer变体的模型的快速发展,大型语言模型正逐步替代原有的私域自然语言模型,并在实际应用获得了不错的成果。
2、然而,大语言模型在处理复杂的检索任务时,可能会因为对问题的理解不够深入等,导致检索结果不够准确。此外,大语言模型在理解用户意图和查询语义方面可能存在偏差,也就是说,大语言模型的处理能力仍然十分有限。
技术实现思路
1、本发明提供了一种基于大语言模型的交叉检索方法、装置、电子设备及存储介质,以提升问题的检索质量。
2、第一方面,本发明实施例提供了一种基于大语言模型的交叉检索方法,包括:
3、通过至少两个候选大语言模型基于目标场景的知识库分别为待处理问题生成候选回答;
4、针对每一候选大语言模型,根据待处理问题对各候选回答进行交叉验证,得到各候选回答的交叉验证结果;其中,所述交叉验证结果包括第一验证结果和第二验证结果,所述第一验证结果用于判断对应的候选回答的正确性,所述第二验证结果用于判断对应的候选回答是否能够完成对待处理问题的检索;
5、根据各候选回答的第一验证结果从各候选回答中选择当前回答;
6、根据所述当前回答的第二验证结果判断当前回答是否能够完成对待处理问题的检索,并根据当前回答的判断结果进行处理得到回答结果。
7、第二方面,本发明实施例还提供了一种基于大语言模型的交叉检索装置,包括:
8、候选回答模块,用于通过至少两个候选大语言模型基于目标场景的知识库分别为待处理问题生成候选回答;
9、交叉验证模块,用于针对每一候选大语言模型,根据待处理问题对各候选回答进行交叉验证,得到各候选回答的交叉验证结果;其中,所述交叉验证结果包括第一验证结果和第二验证结果,所述第一验证结果用于判断对应的候选回答的正确性,所述第二验证结果用于判断对应的候选回答是否能够完成对待处理问题的检索;
10、当前回答模块,用于根据各候选回答的第一验证结果从各候选回答中选择当前回答;
11、回答结果模块,用于根据所述当前回答的第二验证结果判断当前回答是否能够完成对待处理问题的检索,并根据当前回答的判断结果进行处理得到回答结果。
12、第三方面,本发明实施例还提供了一种电子设备,包括:
13、至少一个处理器;以及
14、与至少一个处理器通信连接的存储器;其中,
15、存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的一种基于大语言模型的交叉检索方法。
16、第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时,使得计算机处理器能够执行本发明实施例提供的任意一种基于大语言模型的交叉检索方法。
17、本发明实施例通过至少两个候选大语言模型基于目标场景的知识库对待处理问题进行检索知识增强,能够提高候选回答的可靠性;通过各候选大语言模型分别对各候选回答进行交叉验证得到各候选回答的交叉验证结果,并根据各候选回答的交叉验证结果确定待处理问题的回答结果,还能够提高基于大语言模型的交叉检索效率和质量。
18、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的目标或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.基于大语言模型的交叉检索方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述当前回答的第二验证结果判断当前回答是否能够完成对待处理问题的检索,并根据当前回答的判断结果进行处理得到回答结果,包括:
3.根据权利要求1所述的方法,其特征在于,根据各候选回答的第一验证结果从各候选回答中选择当前回答,包括:
4.根据权利要求1-3中任一项所述的方法,其特征在于,通过至少两个候选大语言模型基于目标场景的知识库分别为待处理问题生成候选回答,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于交叉注意力机制对中间特征向量和辅助编码向量进行融合得到融合特征向量,包括:
6.基于大语言模型的交叉检索装置,其特征在于,包括:
7.根据权利要求6所述的装置,其特征在于,回答结果模块包括:
8.根据权利要求6或7所述的装置,其特征在于,所述候选回答模块包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一项所述的方法。