基于大模型和知识图谱的企业知识库问答对生成方法与流程

文档序号:36004015发布日期:2023-11-16 18:34阅读:110来源:国知局
基于大模型和知识图谱的企业知识库问答对生成方法与流程

本发明属于企业知识库,涉及一种企业知识库问答对生成方法,尤其涉及一种基于大模型和知识图谱的企业知识库问答对生成方法。


背景技术:

1、在今天的企业中,知识库问答系统已经成为了重要的信息交互方式之一。企业知识库问答系统可以帮助员工在日常工作中快速获取所需信息,提高工作效率和质量。然而,由于企业知识库中的信息量庞大且多样化,传统的检索方式已经难以满足员工的需求。

2、近年来,基于大模型和知识图谱的问答系统已经成为研究热点。大模型可以通过深度学习技术对大规模语料库进行训练,从而获取丰富的语言知识。知识图谱则可以将语言知识和实体知识进行结合,形成一个丰富的知识网络。

3、但是,现有的企业知识库问答系统还存在一些问题。例如,知识图谱中的实体和关系数量庞大,如何高效地进行查询和匹配仍然是一个挑战。

4、因此,针对上述现有技术中存在的缺陷,需要研发一种新型的企业知识库问答对生成方法。


技术实现思路

1、为了克服现有技术的缺陷,本发明提出一种基于大模型和知识图谱的企业知识库问答对生成方法,其能够提高企业知识库问答的质量和效率。

2、为了实现上述目的,本发明提供如下技术方案:

3、一种基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,包括以下步骤:

4、1)、基于设备维修相关数据,采用大模型构建设备维修知识图谱;

5、2)、基于不同的故障类型,分别以所述设备维修相关数据和所述设备维修知识图谱为输入,采用大模型生成不同的故障问题及其对应的解决方案;

6、3)、采用大模型对所述不同的故障问题进行扩展,以获得与所述不同的故障问题相似的多个相似问题,并将所述多个相似问题与所述不同的故障问题及其对应的解决方案相关联,从而实现问题与解决方案的统一。

7、优选地,所述步骤1)具体包括:

8、知识建模,依据知识图谱中的知识结构对所述设备维修相关数据进行业务抽象和数据建模,从而建立知识图谱概念模型,所述知识图谱概念模型定义了实体、关系和属性;

9、实体识别,利用大模型对所述设备维修相关数据进行实体识别,识别出实体名称及其属性;

10、关系抽取,利用大模型对所述设备维修相关数据进行关系抽取,抽取出实体之间的关系;

11、知识图谱构建,基于所述实体识别和关系抽取的结果对所述知识图谱概念模型进行填充,以获得所述设备维修知识图谱。

12、优选地,所述知识图谱概念模型分为物理结构、故障和维修方案,所述物理结构定义了设备名称、设备类型、设备尺寸以及设备之间存在的包含关系;所述故障定义了故障名称、故障级别、故障原因以及所述设备与对应故障之间存在的引发关系;所述维修方案定义了方案名称、维修方法、维修工具、维修时长、所述维修方案与所述故障之间存在的解决关系以及所述设备与对应维修方案之间存在的适用关系。

13、优选地,所述步骤2)中,所述不同的故障类型包括事实类故障、原因类故障、统计类故障、解决方案类故障和预防措施类故障,并且,所述分别以所述设备维修相关数据和所述设备维修知识图谱为输入,采用大模型生成不同的故障问题及其对应的解决方案具体为:对于事实类故障和统计类故障,以所述设备维修知识图谱的三元组为输入,采用大模型生成不同的故障问题及其对应的解决方案;对于原因类故障、解决方案类故障和预防措施类故障,以所述设备维修相关数据为输入,采用大模型生成不同的故障问题及其对应的解决方案。

14、优选地,在所述步骤3)中,对所述不同的故障问题进行向量化,并将所述多个相似问题进行向量化,然后计算所述不同的故障问题的向量与所述多个相似问题的向量的相似度,在相似度满足一定阈值时,认为所述多个相似问题是与所述不同的故障问题相似的问题。

15、优选地,采用余弦相似度计算所述不同的故障问题的向量与所述多个相似问题的向量的相似度。

16、优选地,所述基于大模型和知识图谱的企业知识库问答对生成方法进一步包括:

17、4)、人工审核:将所述多个相似问题与所述不同的故障问题及其对应的解决方案相关联后,将其关联关系交给专家进行交互编辑。

18、优选地,所述设备维修相关数据包括维修手册、设备说明书、维修记录和维修分析报告。

19、优选地,所述大模型是指具有数十亿个参数的深度学习模型,包括gpt-3模型和glm-130b。

20、与现有技术相比,本发明的基于大模型和知识图谱的企业知识库问答对生成方法具有如下有益技术效果中的一者或多者:

21、1、本发明通过结合大模型和知识图谱,能够根据企业文本资料快速生成合适的问答对,提高企业知识的使用频率和效率。

22、2、本发明利用知识图谱中的结构化企业知识,提高了企业知识对话的准确性和质量。

23、3、本发明利用大模型的语言生成能力,生成的问答对具有较高的易读性和可理解性,便于人员执行。

24、4、本发明可广泛应用于各种企业知识库场景,具有较强的实用性和推广价值。



技术特征:

1.一种基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,所述步骤1)具体包括:

3.根据权利要求2所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,所述知识图谱概念模型分为物理结构、故障和维修方案,所述物理结构定义了设备名称、设备类型、设备尺寸以及设备之间存在的包含关系;所述故障定义了故障名称、故障级别、故障原因以及所述设备与对应故障之间存在的引发关系;所述维修方案定义了方案名称、维修方法、维修工具、维修时长、所述维修方案与所述故障之间存在的解决关系以及所述设备与对应维修方案之间存在的适用关系。

4.根据权利要求3所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,所述步骤2)中,所述不同的故障类型包括事实类故障、原因类故障、统计类故障、解决方案类故障和预防措施类故障,并且,所述分别以所述设备维修相关数据和所述设备维修知识图谱为输入,采用大模型生成不同的故障问题及其对应的解决方案具体为:对于事实类故障和统计类故障,以所述设备维修知识图谱为输入,采用大模型生成不同的故障问题及其对应的解决方案;对于原因类故障、解决方案类故障和预防措施类故障,以所述设备维修相关数据为输入,采用大模型生成不同的故障问题及其对应的解决方案。

5.根据权利要求4所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,在所述步骤3)中,对所述不同的故障问题进行向量化,并将所述多个相似问题进行向量化,然后计算所述不同的故障问题的向量与所述多个相似问题的向量的相似度,在相似度满足一定阈值时,认为所述多个相似问题是与所述不同的故障问题相似的问题。

6.根据权利要求5所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,采用余弦相似度计算所述不同的故障问题的向量与所述多个相似问题的向量的相似度。

7.根据权利要求1-6中任一项所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,进一步包括:

8.根据权利要求7所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,所述设备维修相关数据包括维修手册、设备说明书、维修记录和维修分析报告。

9.根据权利要求8所述的基于大模型和知识图谱的企业知识库问答对生成方法,其特征在于,所述大模型是指具有数十亿个参数的深度学习模型,包括gpt-3模型和glm-130b。


技术总结
本发明属于企业知识库技术领域,涉及一种基于大模型和知识图谱的企业知识库问答对生成方法,其包括以下步骤:1)、基于设备维修相关数据,采用大模型构建设备维修知识图谱;2)、基于不同的故障类型,分别以设备维修相关数据和设备维修知识图谱为输入,采用大模型生成不同的故障问题及其对应的解决方案;3)、采用大模型对所述不同的故障问题进行扩展,以获得与不同的故障问题相似的多个相似问题,并将多个相似问题与所述不同的故障问题及其对应的解决方案相关联,从而实现问题与解决方案的统一。本发明将大模型和知识图谱相结合,并利用知识图谱中的实体和关系对问题进行解析和匹配,从而提高了企业知识库问答系统的质量和效率。

技术研发人员:刘丁枭,马晋辰,王绍兰
受保护的技术使用者:北京智谱华章科技有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1