基于大模型增强的垂直领域小样本知识抽取方法和系统

文档序号：36387071发布日期：2023-12-15 01:55阅读：来源：国知局

技术特征：

1.一种基于大模型增强的垂直领域小样本知识抽取方法，其特征在于，所述方法包括：

2.根据权利要求1所述的垂直领域小样本知识抽取方法，其特征在于，所述基于预先训练的大语言模型，对所述第一高质标注样本进行数据增强，得到所述目标领域的第二高质标注样本，包括：

3.根据权利要求2所述的垂直领域小样本知识抽取方法，其特征在于，所述通过将所述第一高质标注样本输入所述大语言模型，得到第一目标知识图谱，包括：

4.根据权利要求2所述的垂直领域小样本知识抽取方法，其特征在于，所述基于所述大语言模型，将所述第一目标知识图谱进行泛化处理，得到包含目标知识抽取信息的目标文本语料，包括：

5.根据权利要求1所述的垂直领域小样本知识抽取方法，其特征在于，所述以从所述第二高质标注样本中提取的多个实体，以及多个所述实体中每两个实体之间的关系为训练样本，训练得到知识抽取模型，包括：

6.根据权利要求5所述的垂直领域小样本知识抽取方法，其特征在于，所述基于所述知识抽取模型，对输入所述知识抽取模型的所述目标领域的非结构化文本进行知识抽取，得到所述目标领域的目标知识图谱，包括：

7.根据权利要求6所述的垂直领域小样本知识抽取方法，其特征在于，在将所有的所述目标知识三元组进行融合，得到所述目标知识图谱之后，所述方法还包括：

8.根据权利要求7所述的垂直领域小样本知识抽取方法，其特征在于，所述方法还包括：

9.根据权利要求7或8所述的垂直领域小样本知识抽取方法，其特征在于，所述方法还包括：

10.一种用于实现如权利要求1-9中任一项所述的基于大模型增强的垂直领域小样本知识抽取方法的系统，其特征在于，所述系统包括：

技术总结
本申请实施例提供了一种基于大模型增强的垂直领域小样本知识抽取方法和系统，涉及人工智能领域。所述方法包括：获取目标领域的第一高质标注样本，并基于预先训练的大语言模型，对第一高质标注样本进行数据增强，得到目标领域的第二高质标注样本；以从第二高质标注样本中提取的多个实体，以及多个实体中每两个实体之间的关系为训练样本，训练得到知识抽取模型；基于知识抽取模型，对输入知识抽取模型的目标领域的非结构化文本进行知识抽取，得到目标领域的目标知识图谱。本申请不仅降低了数据标注的人力成本需求，还使得知识抽取模型拥有更强的可持续化学习能力以及泛化能力，从而能够灵活应用于垂直领域的多种场景，具有较好的可扩展性。

技术研发人员：王平辉,梁润颖,李帅鹏,马杰,郭文华,何铁科
受保护的技术使用者：西安交通大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2