一种增强大语言模型问答特定领域问题能力的方法及系统与流程

文档序号:36011607发布日期:2023-11-17 05:54阅读:来源:国知局

技术特征:

1.一种增强大语言模型问答特定领域问题能力的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的增强大语言模型问答特定领域问题能力的方法,其特征在于,采用大语言模型,从数据集中抽取关系三元组,包括:

3.根据权利要求1或2所述的增强大语言模型问答特定领域问题能力的方法,其特征在于,所述结构化数据包括:uniprot编码、chembl编码、受体名称、分类信息、下游信使、相关疾病、内源性配体以及上市药物;

4.根据权利要求1所述的增强大语言模型问答特定领域问题能力的方法,其特征在于,所述大语言模型、所述预训练大语言模型均为经过设计与训练、且与人类反馈充分对齐的语言模型;

5.根据权利要求1所述的增强大语言模型问答特定领域问题能力的方法,其特征在于,所述知识图谱通过neo4j软件以图数据库的形式存储。

6.根据权利要求1所述的增强大语言模型问答特定领域问题能力的方法,其特征在于,所述大语言模型、所述预训练大语言模型均采用生成式预训练变换器chatgpt。

7.根据权利要求1所述的增强大语言模型问答特定领域问题能力的方法,其特征在于,采用预训练大语言模型,通过cypher语言在所述图数据库中直接查询特定领域相关信息,得到提示信息;或通过python、java编程语言与所述图数据库进行交互;

8.一种增强大语言模型问答特定领域问题能力的系统,其特征在于,包括依次连接的数据获取模块、知识图谱构建模块以及交互模块;其中,

9.根据权利要求8所述的增强大语言模型问答特定领域问题能力的系统,其特征在于,所述数据获取模块包括关系三元组抽取单元以及关系三元组转换单元;其中,

10.根据权利要求9所述的增强大语言模型问答特定领域问题能力的系统,其特征在于,采用大语言模型,从结构化数据库中提取数据得到结构化数据;


技术总结
本申请涉及药物筛选技术领域,尤其涉及一种增强大语言模型问答特定领域问题能力的方法及系统,该方法包括以下步骤:采用大语言模型,从数据集中抽取关系三元组;数据集包括结构化数据和非结构化数据;基于关系三元组,构建G蛋白偶联受体的知识图谱,并将知识图谱以图数据库形式存储;知识图谱包括G蛋白偶联受体实体及其关系;采用预训练大语言模型,在图数据库中搜索特定领域相关信息,得到提示信息;特定领域为G蛋白偶联受体领域;基于提示信息和预训练大语言模型,得到回答结果;回答结果由预训练大语言模型返回至用户。本申请通过构建知识图谱,赋予大语言模型模型准确、实时的GPCRs领域知识,增强其回答GPCRs领域问题的能力。

技术研发人员:袁曙光,王世玉
受保护的技术使用者:深圳阿尔法分子科技有限责任公司
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1