跨域小样本关系抽取方法、装置及电子设备

文档序号:35713240发布日期:2023-10-12 16:10阅读:36来源:国知局
跨域小样本关系抽取方法、装置及电子设备

本发明属于信息,具体是涉及到一种跨域小样本关系抽取方法、装置及电子设备。


背景技术:

1、关系抽取(relation extraction,re)的目标是预测给定上下文中两个实体之间的关系。例如,给定一个句子“london is the capital of the uk”,capital of代表关系标签,london代表头实体,the uk代表尾实体。关系抽取模型能够识别london和uk之间的关系是capital of。关系抽取是自然语言处理任务的基石,为智能检索、语义分析以及自动问答等下游任务提供了基础支持。

2、传统基于核函数、基于特征向量以及基于神经网络的关系抽取方法需要大量的标注数据进行训练,很难推广到现实应用场景。此外,不断增加的新关系和实体很容易也使关系抽取模型面临着数据稀缺的难题。基于以上问题,提出利用元学习(metadata learning,ml)来引导模型利用过去所学知识快速学习新概念。具体来说,ml模型首先构造了一系列具有丰富标注的元任务,然后通过学习相似性度量函数或较好的参数以泛化到数据稀缺的测试任务。

3、然而,传统的基于ml的关系抽取模型致力于解决同一领域的小样本问题,即训练和测试关系类别都来自同一领域。不幸的是,在一些专业领域,例如生物医学领域,数据注释需要极高的专业知识和时间,无法为元学习方法收集到足够的标注数据。因此,如何将元知识从数据丰富的原领域迁移到到数据极度稀缺的目标领域是关系抽取面临的一个实际挑战。跨域小样本(cross domain few-shot,crossfew)关系抽取(relation extraction,re)任务可以在领域泛化(domain generalization,dg)和领域适应(domain adaptation,da)两种情景下应用。在领域泛化情景下,关系抽取模型在训练阶段无法获得任何目标域的数据,在领域适应情境下,关系抽取模型在训练阶段可以获得来自目标域的无标签样本或者少量有标签样本。以往通过直接采用对抗训练的方法或者单纯的使用元学习方法解决跨域的问题。然而这些方法不能很好地解决跨域小样本关系抽取任务,将每个任务视为来自同一领域的相同数据分布,未能将其泛化到看不见的领域。现有的关系抽取模型粗暴地将源域和目标域的关系标签组成一个大的关系标签集,随后在标签级元任务的数据设置方式下训练,忽略了来自不同领域的数据之间的分布差异。另外,都是直接更新全部的大规模参数以达到全局最优。然而这种参数更新策略并不适用于跨域小样本关系抽取任务,因为该策略使关系模型收敛到数据量较多的源域最优点,导致与目标域的优化差距。


技术实现思路

1、本发明提供一种跨域小样本关系抽取方法、装置及电子设备,解决现有的跨域小样本关系抽取将每个任务视为来自同一领域的相同数据分布,未能将其泛化到看不见的领域的问题。

2、基于上述目的,本发明提出一种跨域小样本关系抽取方法,包括:对多个源域进行域采样,分别划分出一个伪可见域和一个伪不可见域;应用全局参数更新策略更新所述伪可见域的元知识;根据所述伪不可见域和更新后的所述元知识进行迁移学习操作,获取更新的可迁移知识;根据所述元知识和所述更新的可迁移知识预测目标域的关系标签。

3、可选的,所述对多个源域进行域采样,分别划分出一个伪可见域和一个伪不可见域,包括:对多个源域进行域采样,并从中随机选择两个候选域;对两个所述候选域进行域采样,分别划分出一个伪可见域和一个伪不可见域。

4、可选的,所述应用全局参数更新策略更新所述伪可见域的元知识,包括:对所述伪可见域和所述伪不可见域进行标签级元任务采样,构建标签级元任务,所述标签级元任务包括伪可见元任务和伪不可见元任务;根据所述伪可见元任务应用关系抽取模型对所述伪可见域的元知识进行更新。

5、可选的,所述伪可见元任务包括支持集和查询集,所述根据所述伪可见元任务应用关系抽取模型对所述伪不可见域的元知识进行更新,包括:应用所述关系抽取模型中的编码器将所述伪可见元任务中的支持集实例和查询集实例映射到低维向量空间;应用所述关系抽取模型中的度量函数获取所述伪可见元任务中的支持集实例和查询集实例在低维向量空间的表示,预测所述伪可见元任务中的查询集实例的关系标签;根据预测的所述查询集实例的关系标签计算所述关系抽取模型的交叉熵损失函数;根据所述交叉熵损失函数对所述元知识进行更新。

6、可选的,所述伪不可见元任务包括支持集和查询集,所述根据所述伪不可见域和更新后的所述元知识进行迁移学习操作,获取更新的可迁移知识,包括:根据更新后的所述元知识分为权重参数和偏差参数;基于前馈神经网络对所述权重参数和所述偏差参数进行迁移学习操作,获取伪不可见域的可迁移知识;根据更新后的所述元知识以及所述伪不可见域的可迁移知识计算关系抽取模型在伪不可见元任务上的泛化能力;根据所述泛化能力对所述可迁移知识进行更新。

7、可选的,所述基于前馈神经网络对所述权重参数和所述偏差参数进行迁移学习操作,获取伪不可见域的可迁移知识,包括:根据所述权重参数和所述偏差参数应用以下关系式计算伪不可见域的可迁移知识θpu;

8、

9、其中,ftrans(·)表示迁移元学习操作,⊙表示向量乘法,表示缩放参数,表示迁移参数。

10、可选的,所述根据所述元知识和所述更新的可迁移知识预测目标域的关系标签,包括:根据所述元知识和所述更新的可迁移知识预测目标域的查询集实例对应的关系标签,满足以下关系式:

11、

12、其中,ypred是预测的关系标签,和分别表示测试元任务的支持实例和查询实例,表示对应的关系标签。

13、基于同一发明构思,本发明还提出了一种跨域小样本关系抽取装置,包括:网络生成单元,用于获取药物-靶标符号异构图,并根据所述药物-靶标符号异构图获取符号二部网络、药物相互作用网络以及靶标相互作用网络;嵌入结果获取单元,用于根据所述符号二部网络应用训练后的基于符号图神经网络模型获取药物与靶标的结点嵌入结果;成分分析单元,用于对所述药物相互作用网络和所述靶标相互作用网络进行主成分分析,获取辅助信息;结果预测单元,用于对所述结点嵌入结果与所述辅助信息进行拼接,并应用判别器对药物与靶标之间的符号进行预测,获取跨域小样本关系抽取结果。

14、基于同一发明构思,本发明还提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的跨域小样本关系抽取方法。

15、基于同一发明构思,本发明还提出了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上所述的跨域小样本关系抽取方法。

16、从上面所述可以看出,本发明提供的技术方案的有益效果是:本发明提供的一种跨域小样本关系抽取方法、装置及电子设备,方法包括:对多个源域进行域采样,分别划分出一个伪可见域和一个伪不可见域;应用全局参数更新策略更新所述伪可见域的元知识;根据所述伪不可见域和更新后的所述元知识进行迁移学习操作,获取更新的可迁移知识;根据所述元知识和所述更新的可迁移知识预测目标域的关系标签,能够适应源域和目标域的分布差异,提高提高对未见目标域的泛化能力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1