基于大语言模型的医学知识问答系统构建方法及系统

文档序号:39242560发布日期:2024-09-03 17:24阅读:26来源:国知局
基于大语言模型的医学知识问答系统构建方法及系统

本发明涉及计算机,特别是医学知识问答系统构建方法及系统。


背景技术:

1、近年来,大语言模型已经在很大程度上转变了人与机器之间的交互模式。特别是,基于transformer架构的chatgpt语言模型,通过对大规模文本数据集进行深入学习,已经展现出卓越的语言理解与生成能力。这类模型的显著优势在于其能够从特定领域的大量文本中提取知识,并通过预训练及微调技术,将知识有效地整合入模型之中,进一步增强其性能。

2、尽管大语言模型展现出显著的优势,其在实际应用场景中依旧面对一系列挑战,其中幻觉问题尤为显著,突显出当前大语言模型技术面临的重要难题。所谓的幻觉问题,是指在文本生成过程中,模型产生的信息存在不准确性、不相关性或完全是虚构的情况。这种问题往往源于模型对某一话题理解的不足、训练数据集存在偏差,或是模型的生成机制本身的局限性。幻觉问题的表现形式多样,包括但不限于事实错误、逻辑矛盾、内容不相关及虚构信息等,这直接影响了模型生成内容的真实性和可信度,成为衡量大语言模型性能的关键指标。

3、特别是在用户安全至关重要的领域,幻觉问题的挑战尤其明显,医疗领域便是一个显著的例子。在该领域,模型输出的准确性和可靠性不仅直接关系到医学建议和医疗决策的质量,更是医疗错误减少和患者安全保障的重要因素。因此,针对大语言模型的幻觉问题采取有效措施,提升其生成回复的准确性和可靠性,对于提高模型的实际应用价值具有至关重要的意义。


技术实现思路

1、本发明的目的是为了解决现有针对医学的大语言模型生成的医学回答准确性低、可靠性差的问题,而提出基于大语言模型的医学知识问答系统构建方法及系统。

2、一种基于大语言模型的医学知识问答系统构建方法具体过程为:

3、步骤一、构建医学实体抽取模型的训练集;

4、步骤二、构建医学实体抽取模型,医学实体抽取模型为大语言模型;

5、步骤三、将医学实体抽取模型的训练集中医学问答文本作为医学实体抽取模型的输入,将医学实体抽取模型的训练集中医学实体作为医学实体抽取模型的输出,对医学实体抽取模型进行训练直至收敛,获得训练好的医学实体抽取模型;

6、步骤四、构建医学实体属性抽取模型的训练集;

7、步骤五、构建医学实体属性抽取模型,医学实体属性抽取模型为大语言模型;

8、步骤六、将医学实体属性抽取模型的训练集中医学问答文本和医学实体作为医学实体属性抽取模型的输入,将医学实体属性抽取模型的训练集中属性作为医学实体属性抽取模型的输出,对医学实体属性抽取模型进行训练直至收敛,获得训练好的医学实体属性抽取模型;

9、步骤七、构建医学回答生成模型的训练集;

10、步骤八、构建医学回答生成模型,医学回答生成模型为大语言模型;

11、步骤九、将医学回答生成模型的训练集中问题、医学知识信息作为医学回答生成模型的输入,将医学回答生成模型的训练集中医学回答作为医学回答生成模型的输出,对医学回答生成模型进行训练直至收敛,获得训练好的医学回答生成模型;

12、步骤十、基于训练好的医学实体抽取模型、训练好的医学实体属性抽取模型、训练好的医学回答生成模型,对待测医学问题进行处理,输出医学回答。

13、基于大语言模型的医学知识问答系统构建系统包括:

14、医学实体抽取模块,用于根据用户输入的医学问题文本,基于通过大语言模型构建的医学实体抽取模型,抽取问题文本中的医学实体;

15、医学实体属性抽取模块,用于根据用户输入的医学问题文本和医学实体,基于通过大语言模型构建的医学实体属性抽取模型,抽取问题文本中的医学实体属性;

16、医学知识检索模块,用于根据用户输入的医学问题文本、医学实体和医学实体属性,在医学知识库中进行信息检索,得到相同的医学知识;

17、医学知识融合模块,用于根据用户输入的医学问题文本和医学知识,基于提示词融合医学知识,输出包含专业医学知识的融合后的医学问题文本;

18、医学回答生成模块,用于根据融合后的医学问题文本,基于通过大语言模型构建的医学回答生成模型,生成对应的回答。

19、本发明的有益效果为:

20、本发明利用医学知识库中的丰富信息资源,包括医学知识库中的医学实体名称、医学实体属性和专业医学知识,通过chatgpt的api生成大量包含上述医学信息的医学问题。这一过程借助多样化的提示词(prompt),进而构建出不同场景下的训练实例。利用chatgpt不仅显著降低了人工编写医学问题及其验证工作的时间成本,而且确保了生成内容的稳定性与可扩展性。本发明还采用了lora技术对基于transformer架构的大语言模型进行了高效的微调。lora技术的应用使得在有限的时间及计算资源条件下,也能够调整出具有可观效果的大语言模型。通过以上方法,本发明提供的医学知识问答系统构建方法及系统,旨在减少医学大模型在文本生成方面产生的幻觉问题,提高回复结果的准确性和可靠性。



技术特征:

1.基于大语言模型的医学知识问答系统构建方法,其特征在于:所述方法具体过程为:

2.根据权利要求1所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤一中构建医学实体抽取模型的训练集;具体过程为:

3.根据权利要求2所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤四中构建医学实体属性抽取模型的训练集;具体过程为:

4.根据权利要求3所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤七中构建医学回答生成模型的训练集;具体过程为:

5.根据权利要求4所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤七一中在医学知识库中检索与步骤一api接口的返回值中获取的医学实体和步骤四api接口的返回值中获取的属性相同的医学知识;

6.根据权利要求5所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤七一二中采用基于规则的模糊匹配方法在医学知识库中检索与步骤一api接口的返回值中获取的医学实体和步骤四api接口的返回值中获取的属性相同的医学知识;具体过程为:

7.根据权利要求6所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤七二中对医学知识进行长度截取;具体过程为:

8.根据权利要求7所述的基于大语言模型的医学知识问答系统构建方法,其特征在于:所述步骤十中基于训练好的医学实体抽取模型、训练好的医学实体属性抽取模型、训练好的医学回答生成模型,对待测医学问题进行处理,输出医学回答;具体过程为:

9.基于权利要求1大语言模型的医学知识问答系统构建方法的构建系统,其特征在于,基于大语言模型的医学知识问答系统构建系统包括:


技术总结
基于大语言模型的医学知识问答系统构建方法及系统,本发明涉及计算机技术领域,特别是医学知识问答系统构建方法及系统。本发明的目的是为了解决现有针对医学的大语言模型生成的医学回答准确性低、可靠性差的问题。过程为:构建医学实体抽取模型的训练集;构建医学实体抽取模型;获得训练好的医学实体抽取模型;构建医学实体属性抽取模型的训练集;构建医学实体属性抽取模型;获得训练好的医学实体属性抽取模型;构建医学回答生成模型的训练集;构建医学回答生成模型;获得训练好的医学回答生成模型;基于训练好的医学实体抽取模型、训练好的医学实体属性抽取模型、训练好的医学回答生成模型,对待测医学问题进行处理,输出医学回答。

技术研发人员:赵森栋,李子健,王昊淳,强泽文,秦兵,刘挺
受保护的技术使用者:哈尔滨工业大学
技术研发日:
技术公布日:2024/9/2
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1