本申请涉及人工智能,尤其是指一种基于大语言模型的问答方法及电子设备。
背景技术:
1、现有的知识问答系统通常依赖于预训练语言模型(如gpt-4、bert等)和外部知识库进行回答生成。然而,生成的回答往往存在引用不准确、不完整或不相关的问题。这种不准确性不仅影响用户体验,还可能导致错误信息的传播。
技术实现思路
1、为了解决现有技术的不足,本申请的目的在于提供一种可以提升检索增强生成的知识问答引用准确性的方法及使用该方法的电子设备。
2、为实现上述目的,本申请采用如下技术方案:
3、第一方面,本申请提供一种基于大语言模型的问答方法,包括:
4、根据用户输入的问题,得到目标输入信息;
5、基于目标输入信息从数据库中检索,得到与目标输入信息相关的检索结果,将检索结果中满足第一排序条件的内容确定为第一内容块,并基于大语言模型将多个第一内容块整合为第一答案;
6、基于所述大语言模型将第一答案拆分为多个第二内容块,每个第二内容块包括一段独立的语句;对每个第二内容块与对应的第一内容块进行相似度计算,按照计算结果对多个第一内容块进行排序,并从多个第一内容块中提取满足第二排序条件的目标内容块;
7、根据大语言模型获得的提示语句,确定与提示语句相对应的目标内容块,将目标内容块返回大语言模型,大语言模型基于目标内容和提示语句生成第二答案,并将第二答案作为结果输出。
8、进一步地,对每个第二内容块与对应的第一内容块进行相似度计算,包括:
9、对多个第二内容块与对应的第一内容块进行余弦相似度计算,得到第一余弦相似度,其中,第一余弦相似度满足以下关系式:
10、;
11、表示第i个第二内容块,表示第j个第一内容块。
12、根据获得的多个第一余弦相似度建立第一相似度矩阵。
13、进一步地,对每个第二内容块与对应的第一内容块进行相似度计算,还包括:获取第一内容块的文章摘要;计算多个第二内容块与对应的文章摘要的相似度,并基于计算的结果得到第二相似度矩阵。
14、进一步地,对每个第二内容块与对应的第一内容块进行相似度计算,包括:从第一内容块中提取第一关键信息,和从第二内容块中提取第二关键信息,并对第一关键信息和第二关键信息进行向量表示;对经过向量表示的第一关键信息和第二关键信息进行余弦相似度计算,得到第二余弦相似度;根据获得的多个第二余弦相似度建立第三相似度矩阵。
15、进一步地,所述按照计算结果对多个第一内容块进行排序,包括:基于设定的权重,对第一相似度矩阵、第二相似度矩阵和第三相似度矩阵中相应位置的数据进行加权计算,得到综合得分矩阵;基于综合得分矩阵,确定每个第二内容块对应的第一内容块的综合得分,并基于综合得分对多个第一内容块进行排序。
16、进一步地,基于目标输入信息从数据库中检索,得到与目标输入信息相关的检索结果,包括:将目标输入信息拆分为多个关键词,并对每个关键词与数据库中的文档进行相关性计算,根据计算记得结果进行加权求和,得到目标输入信息与数据库中的文档之间的第一相关性评分,其中,第一相关性评分满足以下关系式:
17、;
18、n表示关键词的频数,表示第i个关键词,表示逆文档频率,n表示文档总数,表示包含关键词的文档数,表示关键词在文档d中出现的次数,表示文档d的长度,表示所有文档的平均长度,和b表示调整参数。基于第一相关性评分从数据库中的文档中获得相应的检索结果。
19、进一步地,基于目标输入信息从数据库中检索,得到与目标输入信息相关的检索结果,还包括:基于大语言模型将目标输入信息和数据库中的文档向量化,以得到目标输入信息与数据库中的文档的内积,基于内积确定目标输入信息与数据库中的文档的第二相关性评分;对第一相关性评分和第二相关性评分进行加权组合,以得到相关度得分;基于相关度得分从数据库中的文档中获得相应的检索结果。
20、进一步地,将检索结果中满足第一排序条件的内容确定为第一内容块,包括:确定目标输入信息与数据库中文档的相关度得分;基于相关度得分选取得分排名前n位的目标输入信息确定为第一内容块。
21、进一步地,从多个第一内容块中提取满足第二排序条件的目标内容块,包括:基于综合得分选取得分排名前m位的所述第一内容块确定为目标内容块。
22、第二方面,本申请还提供一种电子设备,电子设备包括:
23、存储器,用于存储计算机程序;处理器,用于执行计算机程序,计算机程序被处理器执行时实现如上述任意一项基于大语言模型的问答方法的步骤。
24、所述基于大语言模型的问答方法和电子设备,能够基于由用户输入的问题向量化得到的目标输入消息从数据库中检索,通过筛选检索结果以确定第一内容块,整合第一内容块形成第一答案。进一步地,基于大语言模型拆分第一答案为多个第二内容块并对每个第二内容块与对应的第一内容块进行相似度计算,按照计算结果对多个第一内容块排序并从中提取满足第二排序条件的目标内容块。再进一步地,确定目标内容块,经过完善后生成第二答案并将第二答案作为结果输出。在基于大语言模型的问答过程中能够不断优化、完善,以提高回答的准确性和可靠性。
1.一种基于大语言模型的问答方法,其特征在于,包括:
2.根据权利要求1所述的问答方法,其特征在于,
3.根据权利要求2所述的问答方法,其特征在于,
4.根据权利要求3所述的问答方法,其特征在于,
5.根据权利要求4所述的问答方法,其特征在于,
6.根据权利要求1所述的问答方法,其特征在于,
7.根据权利要求6所述的问答方法,其特征在于,
8.根据权利要求1所述的问答方法,其特征在于,
9.根据权利要求5所述的问答方法,其特征在于,
10.一种电子设备,其特征在于,包括: