一种联合学习框架下基于多视角图编码的选择式阅读理解方法

文档序号:33737647发布日期:2023-04-06 08:35阅读:32来源:国知局
一种联合学习框架下基于多视角图编码的选择式阅读理解方法

本发明涉及一种联合学习框架下基于多视角图编码的选择式阅读理解方法,属于自然语言处理。


背景技术:

1、机器阅读理解是一项通过对自然语言文档的理解实现对给定问题的正确回答的任务,常见的机器阅读理解任务根据问答形式的不同可以分为四类:完形填空、多项选择、答案片段抽取以及自由式回答。其中多项选择即选择式阅读理解要求机器根据对文档的分析,自动从多项候选答案中选择一项作为给定问题的正确答案,由于其答案不是直接从文档中抽取,而是从多个候选答案中选择最佳的答案,因此需要根据问题分析文档与候选答案之间关系来选择答案。该任务要求机器具备一定的分析推理能力,相关研究工作难度大,得到了学术界的广泛关注,是机器阅读理解任务的重要方向。

2、选择式阅读理解的核心是通过建模文档、问句及候选答案之间的关联性,选择和原文表达最一致的选项作为问题的答案。按照答案选择方式的不同又可分为排除法、相关度排序法以及匹配法等。parikh和sai等人提出了一种基于神经网络的答案排除模型,通过模仿人类的阅读理解方式,先计算问题感知的文档表征,然后通过构建消除门,计算感知文档表征与候选答案之间关联,通过关联判断来删除最不相关的选项,不断重复迭代排除不相关选项,得到最终答案。ran等人提出了一种基于选项比较网络的答案选择方法,该方法在答案选择过程加入了对候选答案之间关系的比较分析,将每个选项编码成向量,通过注意力机制实现逐个向量的比较,利用相关性关系辅助答案选择。段等人提出一种用于选择式阅读理解的多角度共同匹配模型,使用多角度匹配机制获得文档、问题和候选答案之间的相关性,利用相关性对文档表示进行加权,增强相关性强的文档候选片段,基于优化的文档表征进一步选出正确答案。


技术实现思路

1、本发明提供了一种联合学习框架下基于多视角图编码的选择式阅读理解方法,用于解决机器阅读理解任务中选择式阅读理解问题,本发明在选择式阅读理解任务上取得了较好的效果。

2、本发明的技术方案是:一种联合学习框架下基于多视角图编码的选择式阅读理解方法,所述方法的具体步骤如下:

3、step1、对句子si和问答对(q,aj)通过预训练语言模型bert获得文档和问答对的表示,分别为hi与h′j,前者为文档中第i个句子si的表示,后者为问题q分别与第j个候选答案aj拼接得到的表示;使用预训练语言模型对文档、问答对(问题和每个候选答案)进行编码得到bert的输入形式,该过程可以表示为:

4、h′1,h′2,...,h′m,h1,h2,...,hn=bert((q,a1),(q,a2),...,(q,am),...,s1,s2,...,sn)

5、其中h′j表示候选答案aj(i=1,2,...,m)经过bert语义编码后的表示,hi表示文档中句子si(i=1,2,...,n)经过bert语义编码后的表示,(q,aj)表示“[sep]”拼接得到的问答对;

6、step2、构建多视角图编码模块,从三个主要不同角度对文档中句子、问题和候选答案进行构图,三个角度为统计特性、相对距离和深度语义,构建得到的三个图为统计词共现图、句间距离关系图和语义相似关系图;

7、作为本发明的进一步方案,所述步骤step2中,基于统计特性的统计词共现图是基于tf-idf来构建的,具体来说,首先计算问题句子的tf-idf值,选择值高的词作为重要词,文档中所有句子和问答对作为结点,当两个结点之间出现重要词共现时,在两个结点之间连一条边。

8、作为本发明的进一步方案,所述步骤step2中,对于基于相对距离的句间距离关系图,使用高斯分布来衡量篇章内句子之间的空间距离对相关度的影响,计算文档中句子si与句子sj之间的距离使用公式σ表示超参数,并设置句间距离阈值,当两个句子之间的距离值超过阈值时连一条边。

9、作为本发明的进一步方案,所述步骤step2中,基于深度语义的语义相似关系图,采用余弦相似度计算两个句子之间的相似性,并设置相似度阈值,当两个结点之间的相似度超过阈值时,在两个结点间连一条边。

10、作为本发明的进一步方案,所述步骤step3中,采用一个两层感知机对三个不同视角图得到的表示进行信息融合,得到最终表示。

11、step3、使用图卷积神经网络对step2中构建的三个图分别进行卷积:

12、

13、其中au为邻接矩阵,取au=aword,adist,asimi;fu(·)为图卷积操作,l为图卷积层数;是所有句子的表示。

14、采用一个两层感知机对三个不同视角图得到的表示进行信息融合,表示为:

15、

16、其中wa,ba,w,b为模型的可训练参数,||为特征拼接操作;

17、step4、构建证据抽取模块,根据文档和问题所提供的信息,利用一个二分类器判断文档中每一个句子作为证据的可能性,其过程可描述为:

18、

19、其中pi为文档中句子si作为证据的概率;是图卷积后句子si的表示;||为特征拼接操作;wc,bc,wd,bd是模型的可训练参数,其中p既能够作为证据概率,又可以加权到句子的表示上以提高答案预测的效果;

20、step4中,所构建的证据抽取模块用于判断文档中每个句子作为回答问题的证据信息的可能性,通过一个基于softmax的分类器对每个句子进行二分类(是证据或非证据),其分类概率作为可能性,加权在图卷积与信息融合后得到的表示上,辅助后续的答案预测。

21、step5、构建答案预测模块,根据候选答案信息以及证据抽取模块得到的每个句子作为证据信息的概率作为权重辅助进行答案预测,其过程描述为:

22、

23、k,v=wf(pi·hi)+bf

24、

25、其中表示图卷积后候选答案aj的表示;c为交叉注意力后得到的表示;we,be,wf,bf为模型可训练参数。

26、最后得到答案预测模块输出:

27、p′1,p′2,...,p′m=softmax(wh·c+bh)

28、其中p′j为候选答案aj作为答案的概率;c为交叉注意力后得到的表示;wh,bh为模型可训练参数。

29、其中,所构建的答案预测模块将图卷积信息融合后得到的问答对表示以及通过证据预测概率加权后的表示来进行答案预测,该过程是通过交叉注意力实现的。

30、在联合学习的框架下,同步优化证据抽取与答案预测两个部分,在证据抽取的辅助下提升答案预测的准确率,同时根据答案预测结果的反馈来调整证据预测模块对句子作为证据概率的预测。

31、本发明的有益效果是:

32、1、本发明通过多视角图编码网络从多个不同视角对文档、问题和候选答案联合编码,从统计特性、相对距离和深度语义三个视角捕捉文档中句子之间以及文档句子和问句之间的关联关系,充分挖掘潜在证据信息,获得问答对感知的文档编码;

33、2、本发明还通过一个二分类器来判断文档中每一个句子是否为证据句以实现证据抽取模块的功能;最后构建答案预测模块,使用证据抽取模块得到的文档句子作为证据的概率对多视角图编码网络得到的文档编码进行加权以及选择性融合,在联合学习的框架下同时训练两个模块,从而实现答案预测的目标。本发明在选择式阅读理解任务上取得了较好的效果。

34、3、本发明从多视角建模文档、问题和候选答案的方法是有效的;在联合学习的框架下进行训练,联合优化证据抽取和答案预测,联合学习的框架可以减缓流水线框架中误差传播的问题;

35、4、本发明提出方法能够在没有证据标注的情况下可以有效建模文档间句子的关系,并提高答案预测的准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1