本发明涉及人工智能,尤其涉及一种基于文档压缩的多场景自综合问答装置与方法。
背景技术:
1、目前,随着大模型与人工智能的逐步兴起,大语言模型在人们生活中扮演着越来越重要的角色,而如何更有效地使用大模型并且能够有效提升效率是目前的一个热点问题。
2、目前,大模型文档问答基本是给定问题做普通检索回答,但该部分会存在有时候检索不到的问题以及非专业人士提示词不专业的问题。因此,如何高效检索并利用大模型生成答案是一个重要的议题。
技术实现思路
1、本发明目的是针对背景技术中存在的大模型文档问答存在检索不到以及非专业人士提示词不专业的问题,提出一种基于文档压缩的多场景自综合问答装置与方法。
2、一方面,本发明提出一种基于文档压缩的多场景自综合问答装置,包括:
3、文档输入模块,用来输入问答文档;
4、文本处理模块,用来对文本进行处理以符合问答形式;
5、查询模块,用来根据处理后的文本进行查询并生成相近的文档,查询模块能配置多场景下的查询结果相关性和多样性;
6、答案生成模块,进一步根据查询模块生成的相近文档来生成查询答案;
7、结果输出模块,用来输出查询答案。
8、优选的,文本处理模块包括用来切分文档的文档切分单元和用来生成文本块的文本块生成单元。
9、优选的,查询模块包括:
10、相关性单元,用来根据处理后的文本进行相关性查询;
11、多样性单元,用来根据处理后的文本进行多样性查询;
12、压缩单元,需要同时兼顾查询结果的相关性和多样性,将上下文进行压缩,基于压缩后的上下文文档再结合mmr生成排序算法,保障答案多样性及答案精简性。
13、优选的,还包括场景增强模块,用来配置不同使用场景下的查询偏好。
14、另一方面,本发明提出一种基于文档压缩的多场景自综合问答装置的自综合问答方法,包括以下步骤:
15、s1、输入文档,并切分文档,生成文本块;
16、s2、通过文本块进行查询,根据相关性进行查询,生成相近文档,需要结合查询多样性时跳转至s3,不需要结合多样性时跳转至s4;
17、s3、将上下文进行压缩,基于压缩后的上下文文档再结合mmr生成排序算法,保障答案多样性及答案精简性;
18、s4、根据相近的文档生成最终答案并输出答案。
19、与现有技术相比,本发明具有如下有益的技术效果:能适配多场景需求,如基于文档的机器人回答,基于学术论文的机器人问答和搜索场景,构造出基于不同提示词及文档压缩的多场景综合问答的装置与方法,同时适用于海量样本与小样本场景,自动化、普适性地使用于业务场景,在保障业务效果的同时,发挥平台经济,将其自动化,一站式部署与生产。
1.一种基于文档压缩的多场景自综合问答装置,其特征在于,包括:
2.根据权利要求1所述的基于文档压缩的多场景自综合问答装置,其特征在于,文本处理模块包括用来切分文档的文档切分单元和用来生成文本块的文本块生成单元。
3.根据权利要求1所述的基于文档压缩的多场景自综合问答装置,其特征在于,查询模块包括:
4.根据权利要求1所述的基于文档压缩的多场景自综合问答装置,其特征在于,还包括场景增强模块,用来配置不同使用场景下的查询偏好。
5.一种根据权利要求3所述的基于文档压缩的多场景自综合问答装置的自综合问答方法,其特征在于,包括以下步骤: