本发明属于大数据与人工智能,涉及一种基于大语言模型的航天领域信息可控答案生成方法,更为具体地讲,涉及一种通过大语言模型对航天领域的专业知识问题进行自动答案生成的方法,支持通过人工干预手段对大语言模型生成的答案中一些时变信息进行自动化的检索、替换与更新。
背景技术:
1、随着chatgpt、文心一言等智能生成式问答系统逐步出现,大语言模型已经广泛应用到了大众娱乐领域。大量民众可以向大语言模型进行提问,获得了相比之前的一些问答系统更为智能化的回答。然而目前大语言模型依旧存在内容捏造、知识遗忘等缺陷。这些缺陷在聊天娱乐、文档编辑等一些大众场景是可以被接受的,但是对于航天、军事等对生成答案的严谨性有较高要求的垂直专业领域是不可接受的。
2、同时,航天等专业领域的数据是存在实时变化的,例如卫星的实时位置、是否可通联、可拍摄覆盖的区域等。然而大语言模型是需要进行离线训练的,在大语言模型训练完毕进入使用阶段时,模型训练时所使用的数据与知识已经属于过期数据。基于过期数据所生成的答案在专业领域是完全不可控且不被接收的,基于该答案进行作业甚至会造成事故。
3、因此亟待研究一种适合航天专业领域的大语言模型答案可控生成的方法,使得大语言模型可以依据航天业务系统后台的实时数据来生成内容可控的答案,避免了答案内容随意捏造、与实时数据不符的问题。
技术实现思路
1、本发明的目的在于克服离线训练的大语言模型对实时数据兼容不足,且生成答案内容不可控的问题,提出了一种基于大语言模型的航天领域信息可控答案生成方法,通过槽位样本集训练使得大语言模型具备槽位答案的生成能力,随后根据槽位上下文匹配数据库近似字段和字段检索约束,根据字段检索约束生成数据库查询语句并进行槽位内容的查询与填充,得到最终的可控答案生成结果。
2、本发明采用的技术方案为:
3、一种基于大语言模型的航天领域信息可控答案生成方法,包括以下步骤:
4、(1)将航天领域的专业文档进行槽位化处理,将其中根据时间推移而改变的时变参数使用固定的槽位字符进行替换,得到槽位转换后的专业文档;其中时变参数包括时间、数量、位置和任务;
5、(2)将槽位转换后的专业文档作为训练样本集合,对大语言模型进行训练,得到槽位大语言模型,并对槽位大语言模型进行提问,得到包含槽位字符的答案,槽位字符位置处的内容为时变参数相关内容;
6、(3)将包含槽位字符的答案中的槽位字符转换为航天业务系统后台数据库中的具体内容,即得到最终的可控答案。
7、进一步的,步骤(3)具体包括如下步骤:
8、(301)依次将每一个槽位字符所在段落按照句号进行分句,并将包含对应槽位字符的句子进行分词并去掉停用词,得到对应槽位的上下文词汇集合;
9、(302)对上下文词汇集合进行词性分类,得到其中的时间约束词语、地点约束词语、对象约束词语以及内容属性词语;其中,时间约束词语用来对槽位中应该填写的内容所处的时间范围进行约束,地点约束词语用来对槽位中应该填写的内容所处的位置范围进行约束,对象约束词语用来对槽位中应该填写的内容所对应的对象范围进行约束,内容属性词语用来对槽位中应该填写的内容所对应的内容类型进行约束;
10、(303)将内容属性词语与航天业务系统后台数据库中所有字段进行近似度计算,得到最相关的字段,并将时间约束词语、地点约束词语和对象约束词语作为约束条件,对最相关的字段进行查询,将查询结果替换当前槽位字符。
11、本发明与背景技术相比具有如下优点:
12、本发明提出了一种全新的基于大语言模型的航天领域信息可控答案生成方法,通过对大语言模型进行槽位样本训练,并对生成答案中的槽位字符进行联合上下文约束的数据库检索,解决了现有大数据模型所生成的答案内容随意捏造、与实时数据不符的问题。
1.一种基于大语言模型的航天领域信息可控答案生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大语言模型的航天领域信息可控答案生成方法,其特征在于,步骤(3)具体包括如下步骤: