事件抽取模型训练方法及装置、事件抽取方法及装置与流程

文档序号:29622581发布日期:2022-04-13 13:39阅读:369来源:国知局
事件抽取模型训练方法及装置、事件抽取方法及装置与流程

1.本公开涉及知识图谱、深度学习等人工智能技术领域,尤其涉及一种事件抽取模型训练方法及装置、事件抽取方法及装置。


背景技术:

2.事件抽取,指的是将需要的事件的信息从非结构化的文本中提取出来,整合成结构化的形式。
3.目前,事件抽取通常是通过事件抽取模型实现的,而因为标注信息不充分,就会导致事件抽取模型的准确性较差。


技术实现要素:

4.本公开提供了一种事件抽取模型训练方法及装置、事件抽取方法及装置。
5.根据本公开的第一方面,提供了一种事件抽取模型训练方法,包括:
6.获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;
7.通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
8.获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;
9.通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;
10.基于所述第一子模型和所述第二子模型确定事件抽取模型。
11.根据本公开的第二方面,提供了一种事件抽取方法,包括:
12.获取待处理的第一文本;
13.通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
14.通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。
15.根据本公开的第三方面,提供了一种事件抽取模型训练装置,包括:
16.获取模块,用于获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;
17.第一处理模块,用于通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
18.第二获取模块,用于获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;
19.第二处理模块,用于通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;
20.确定模块,用于基于所述第一子模型和所述第二子模型确定事件抽取模型。
21.根据本公开的第四方面,提供了一种事件抽取装置,包括:
22.获取模块,用于获取待处理的第一文本;
23.第一处理模块,用于通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
24.第二处理模块,用于通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。
25.根据本公开的第五方面,提供了一种电子设备,包括:
26.至少一个处理器;以及
27.与所述至少一个处理器通信连接的存储器;其中,
28.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或者第二方面所述的方法。
29.根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面或者第二方面所述的方法。
30.根据本公开的第七方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面或者第二方面所述的方法。
31.根据本公开的技术解决了事件抽取模型的准确性较差的问题。
32.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
33.附图用于更好地理解本方案,不构成对本公开的限定。其中:
34.图1为本公开实施例提供事件抽取的实现示意图;
35.图2为本公开实施例提供的事件抽取模型训练方法的流程图;
36.图3为本公开实施例提供的标注数据的实现示意图;
37.图4为本公开实施例提供的事件抽取模型训练方法的流程图二;
38.图5为本公开实施例提供的第一子模型的处理示意图;
39.图6为本公开实施例提供的更新第一子模型的模型参数的实现示意图;
40.图7为本公开实施例提供的事件抽取模型训练方法的流程图三;
41.图8为本公开实施例提供的确定第一概率的实现示意图;
42.图9为本公开实施例提供的确定待选窗口的实现示意图;
43.图10为本公开实施例提供的确定目标窗口的实现示意图;
44.图11为本公开实施例提供的事件抽取方法的流程图;
45.图12为本公开实施例提供的事件抽取方法的处理示意图;
46.图13为本公开实施例的事件抽取模型训练装置的结构示意图;
47.图14为本公开实施例的事件抽取装置的结构示意图;
48.图15是用来实现本公开实施例的事件抽取模型训练方法以及事件抽取方法的电子设备的框图。
具体实施方式
49.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
50.为了更好的理解本公开的技术方案,下面对本公开所涉及的相关技术进行进一步的详细介绍。
51.事件作为信息的一种表现形式,其定义为特定的人、物在特定时间和特定地点相互作用的客观事实,一般来说是句子级的。在话题检测追踪(topic detection tracking,tdt)中,事件是指关于某一主题的一组相关描述,这个主题可以是由分类或聚类形成的。
52.其中,组成事件的各元素可以包括如下中的至少一种:触发词、事件类型、事件论元及论元角色。
53.其中,事件触发词:表示事件发生的核心词,多为动词或名词;
54.事件类型:可以为预设的多种事件类型,例如在ace2005语料库中定义了8种事件类型和33种子类型。目前大多数事件抽取均采用33种事件类型。可以理解,事件识别是基于词的34类(33类事件类型+none)多元分类任务。
55.事件论元:事件的参与者,主要由实体、值、时间组成。值是一种非实体的事件参与者,例如工作岗位;
56.论元角色:事件论元在事件中充当的角色。共有35类角色,例如,攻击者、受害者等,同样可以为预设的。可以理解,角色分类是基于词对的36类(35类角色类型+none)多元分类任务;
57.事件抽取技术是从非结构化信息中抽取出用户感兴趣的事件,并以结构化呈现给用户。事件抽取任务可分解为4个子任务:触发词识别、事件类型分类、论元识别和角色分类任务。其中,触发词识别和事件类型分类可合并成事件识别任务。
58.事件识别判断句子中的每个单词归属的事件类型,是一个基于单词的多分类任务。论元识别和角色分类可合并成论元角色分类任务。角色分类任务则是一个基于词对的多分类任务,判断句子中任意一对触发词和实体之间的角色关系。
59.例如可以结合图1对事件抽取进行理解,图1为本公开实施例提供事件抽取的实现示意图。
60.假设当前存在这样一个例句“在a城,当一个坦克对着p酒店开火时一个摄影师死去了”,针对当前的这个例句进行事件抽取,例如可以得到图1所示的两个事件。
61.其中,事件1的事件类型是死亡,其对应的触发词是上述例句中的“死去”,以及事件1中的事件论元包括摄影师、坦克、a城,这3个事件论元的论元角色依次是受害者、工具、地点。
62.以及,事件2的事件类型是攻击,其对应的触发词是上述例句中的“开火”,以及事件2中的事件论元包括摄影师、p酒店、坦克、a城,这4个事件论元的论元角色依次是目标、目标、工具、地点。
63.基于上述示例可以确定的是,事件抽取可以将需要的事件的信息,从非结构化的文本中提取出来,整合成结构化的形式。
64.在上述介绍的事件抽取的基础上,篇章级事件抽取是指从长文本的篇章中结构化所有预定义类型的事件,结构化的事件包含事件类型,以及此事件类型下的所有事件论元及其角色。也就是说,篇章级事件抽取是针对长文本的篇章进行事件抽取处理,其中篇章级事件抽取往往面临文本篇幅长,并且文本中包含多个同类型事件的复杂情况。
65.目前,事件抽取的实现通常都是通过事件抽取模型来实现的,现有的篇章级事件抽取模型中,在训练的时候通常需要给出篇章中每个字的监督信号,其中监督信号可以包括论元角色、事件类型、在文本中的位置等等。
66.可以理解的是,现有的篇章级的事件抽取模型依赖于每个字的监督信号,而篇章级的事件论元往往在篇章中会出现多次,但是有可能标注数据不够充分,从而导致模型训练学习是容易被错误的监督信号所误导。
67.此处可以结合一个具体的示例进行说明,假设当前存在一篇文本,在这篇文本中包括公式a,并且假设公式a在这篇文本中共出现了10次,也就是说在这篇文本中10个不同的地方都出现了公式a。目前的现有技术中就会对公式a对应的论元角色、事件类型以及在文本中出现的位置进行标注,然而因为标注工作的工作量巨大,很容易出现标注不充分的情况。
68.比如说当前示例中公式a在文本中共出现了10次,但是在标注的时候,仅仅对4个地方的公式进行了标注,也就是说只针对4个地方的公式标注了监督信号,而其余6个地方的公式没有标注到。因为模型的训练是依赖于监督信号的标注了,那么对于模型来说,因为当前只标注出来了4个地方的公式,那么模型就会认为在这篇文本中公式a只出现了4次,但是实际情况并不是这样的,那么上述标注的4个监督信号对于模型来说就属于误导的信息。
69.因此基于上述介绍可以确定的是,若文本中的监督信号标注不充分,那么标注的监督信号实际上就是错误的,则在模型训练学习的时候,很容易被错误的监督信号所误导。
70.此外,基于上述介绍可以确定的是,在篇章级事件抽取中,因为待抽取的文本篇幅较长,并且在文本中通常会包含多个同类型的复杂事件,那么很多时候,事件抽取就无法将同类型的事件区分开,从而导致最终的事件提取结果出现错误,比如说事件1和事件2是糅杂在一起的同类型事件,那么就有可能出现将事件1中的论元拆分到事件2的论元中,从而导致事件提取的结果错误。
71.针对上述介绍的现有技术中的问题,本公开提出了如下技术构思:通过多示例学习的方式,将文本中多次出现的事件论元作为一个包进行优化,以防止模型错误学习,从而
可以提供篇章中同一事件论元出现多次而标注不充分时的模型训练方法。以及,通过确定中心论元,以中心论元作为区分多个同类型事件的方法,同时以中心论元作为中心构建一个窗口匹配同事件的其他论元,从而可以有效提升事件提取结果的准确性。
72.在上述介绍内容的基础上,下面结合具体的实施例对本公开提供的事件抽取模型训练方法进行介绍,需要说明的是,本公开各实施例的执行主体可以为服务器、处理器、微处理器等具备数据处理功能的设备,此处对本公开中各实施例的执行主体不做限制,其可以根据实际需求进行选择和设置,凡是具备数据处理功能的设备均可以作为本公开中各实施例的执行主体。
73.下面首先结合图2和图3对本公开提供的事件抽取模型训练方法进行介绍,图2为本公开实施例提供的事件抽取模型训练方法的流程图,图3为本公开实施例提供的标注数据的实现示意图。
74.如图2所示,该方法包括:
75.s201、获取第一训练样本,第一训练样本包括第一样本文本和第一标注数据,第一标注数据包括:第一样本文本中的多个样本论元对应的多个数据包、各数据包对应的样本角色、各数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同。
76.在本实施例中,第一训练样本是用于对第一子模型进行训练的样本,其中第一训练样本可以包括第一样本文本以及第一标注数据。
77.可以理解的是,其中的第一样本文本就是文本篇章,比如说是论文、作文、文章等等,本实施例对第一样本文本的格式、字数等等均不做限定,第一样本文本的具体实现可以根据实际需求进行选择。
78.以及,本实施例中的第一标注数据就是针对第一样本文本的标注数据,在第一标注数据中可以包括:第一样本文本中的多个样本论元对应的多个数据包、各数据包各自对应的样本角色、各数据包各自对应的样本事件类型,其中,任一个数据包中的样本论元相同。也就是说本实施例中将第一样本文本中所包括的论元、论元对应的论元角色以及论元对应的事件类型均进行了标注,以得到第一标注数据。
79.同时,需要说明的是,本实施例中在针对第一样本对象中的论元进行标注的时候,是根据第一样本文本中的多个样本论元确定了多个数据包,其中的任一个数据包中可以包括一个或多个样本论元,在任一个数据包中所包括的样本论元是相同的。
80.例如可以参照图3进行理解,如图3所示,假设当前存在图3所示的样本文本,为了便于介绍,假设在样本文本中包括多个公式,比如说有图3所示的公式a、公式b、公式c,以及结合图3可以确定的是,在样本文本中,公式a和公式b均出现了多次。
81.则本实施例中将相同的样本文本确定为一个数据包,也就得到了图3的右侧所示的3个数据包。因为在样本文本中公式a出现了4次,因此在数据包1中就包括4个公式a;以及,在样本文本中公式b出现了2次,因此在数据包2中就包括2个公式b;以及,在样本文本中公式c仅出现了1次,因此在数据包3中就包括1个公式c。以及针对每一个数据包,均标注有各自对应的样本角色和样本事件类型。
82.基于图3的介绍可以理解的是,在任一个数据包中实际上包括的就是相同的论元角色,那么针对任一个数据包,数据包所对应的样本角色,实际上就是数据包中的论元的论元角色。以及数据包所对应的样本事件类型,实际上就是数据包中的论元的样本事件类型。
83.基于上述介绍可以确定的是,本实施例中针对在样本文本中多次出现的论元,可以将多个地方的相同论元作为一个数据包,以及针对仅出现一次的论元,同样可以确定仅包括该论元的数据包。之后针对数据包进行标注,从而可以正确的告知模型在样本文本中的各个论元出现的次数。
84.比如说针对图3中的数据包1,模型就可以确定在样本文本中公式a出现了4次,尽管我们没有告诉模型这4个样本文本的位置,但是我们起码正确的告诉了模型公式a的出现次数,以避免因为标注不充分而导致的对模型的误导。之后模型可以自主的学习各个论元的具体位置,因此本实施例可以通过将多次出现的相同论元作为一个数据包,并针对数据包进行标注,将标注数据提供给模型,从而可以将正确的标注信息提供给模型,以避免因为标注不充分所导致的对模型的误导。
85.上述介绍的进行数据包划分的实现,实际上就是多示例学习的应用,其中多示例学习的具体实现在上述实施例中已经进行了介绍,此处不再赘述。
86.在实际实现过程中,第一训练样本中所包括的第一样本文本可以是多个,针对每一个第一样本文本都有对应的第一标注数据,其中第一样本文本的具体数量可以根据实际需求进行选择和设置。
87.s202、通过第一训练样本进行模型训练得到第一子模型,第一子模型用于确定文本中存在的论元、论元对应的角色和论元对应的事件类型。
88.在获取第一训练数据之后,可以通过第一训练数据进行模型训练,比如说通过第一训练样本对初始的第一子模型进行训练,以得到训练后的第一子模型,本实施例中的第一子模型用于确定文本中存在的论元,以及论元对应的论元角色和论元对应的事件类型。
89.s203、获取第二训练样本,第二训练样本中包括第二样本文本、第二样本文本中存在的多个第二样本论元、多个第二样本论元中每两个第二样本论元对应同一事件的样本概率。
90.以及在本实施例中,还存在第二训练样本,第二训练样本是用于对第二子模型进行训练的样本,其中第二训练样本可以包括第二样本文本、第二样本文本中存在的多个第二样本论元、多个第二样本论元中每两个第二样本论元对应同一事件的样本概率。
91.基于上述的介绍可以确定的是,针对每一个事件论元,其都可以属于某一个事件,那么针对任一两个事件论元,其可以属于同一个事件,也可以属于不同的事件,则本实施例中的每两个第二样本论元对应同一个事件的样本概率可以为0(也就是说不属于同一个事件),或者每两个第二样本论元对应同一个事件的样本概率可以为1(也就是说属于同一个事件)、
92.以及,在一种可能的实现方式中,第一子模型和第二子模型的训练例如可以存在前后关系,也就是说先对第一子模型进行训练,之后根据第一子模型的输出数据再对第二子模型进行训练,则在第二训练样本中的第二样本文本例如可以和上述介绍的第一样本文本相同,以及在第二训练样本中第二样本文本中存在的多个第二样本论元,例如可以为上述的第一子模型输出的论元。也就是说基于相同的样本文本,首先对第一子模型进行训练,之后根据第一子模型提取的论元再对第二子模型进行训练。
93.或者,在另一种可能的实现方式中,第一子模型和第二子模型的训练还可以是相互独立的,也就是说训练第一子模型的过程、第一训练样本,以及训练第二子模型的过程、
第二训练样本之间并不存在关系,其是完全独立的训练过程,以及完全独立的样本数据。在实际实现过程中,第一训练样本和第二训练样本的具体实现可以根据实际需求进行选择和设置,本实施例对此不做特别限制。
94.s204、通过第二训练样本进行模型训练得到第二子模型,第二子模型用于确定文本中存在的事件、事件对应的论元和论元对应的角色。
95.在获取第二训练数据之后,可以通过第二训练数据进行模型训练,比如说通过第二训练样本对初始的第二子模型进行训练,以得到训练后的第二子模型,本实施例中的第二子模型用于确定文本中存在的事件、事件对应的论元和论元对应的角色。
96.s205、基于第一子模型和第二子模型确定事件抽取模型。
97.在对上述的第一子模型和第二子模型进行训练之后,可以基于第一子模型和第二子模型确定事件抽取模型,因此本实施例中的事件抽取模型就包括上述介绍的第一子模型和第二子模型。本实施例中的事件抽取模型用于对输入的文本进行处理,从而输出文本中存在的事件、事件对应的论元以及论元对应的角色。
98.本公开实施例提供的事件抽取模型训练方法,包括:获取第一训练样本,第一训练样本包括第一样本文本和第一标注数据,第一标注数据包括:第一样本文本中的多个样本论元对应的多个数据包、各数据包对应的样本角色、各数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同。通过第一训练样本进行模型训练得到第一子模型,第一子模型用于确定文本中存在的论元、论元对应的角色和论元对应的事件类型。获取第二训练样本,第二训练样本中包括第二样本文本、第二样本文本中存在的多个第二样本论元、多个第二样本论元中每两个第二样本论元对应同一事件的样本概率。通过第二训练样本进行模型训练得到第二子模型,第二子模型用于确定文本中存在的事件、事件对应的论元和论元对应的角色。基于第一子模型和第二子模型确定事件抽取模型。通过第一训练样本和第二训练样本,对事件抽取模型中的第一子模型和第二子模型分别进行处理,其中的第一训练数据是将在样本文本中出现的各种样本论元确定为数据包,在任一个数据包中所包括的样本论元是相同的,并且针对数据包进行角色和事件类型的标注,从而可以保证给模型提供正确的标注信息,进而可以避免因为标注不充分所导致的对模型的误导,进而可以有效的提升事件抽取模型的准确性。
99.在上述实施例的基础上,下面对第一子模型的训练和第二子模型的训练的实现分别进行介绍,下面首先结合图4至图6对本公开提供的事件抽取模型训练方法中,第一子模型的训练过程进行详细介绍。图4为本公开实施例提供的事件抽取模型训练方法的流程图二,图5为本公开实施例提供的第一子模型的处理示意图,图6为本公开实施例提供的更新第一子模型的模型参数的实现示意图。
100.如图4所示,该方法包括:
101.s401、获取第一训练样本,第一训练样本包括第一样本文本和第一标注数据,第一标注数据包括:第一样本文本中的多个样本论元对应的多个数据包、各数据包对应的样本角色、各数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同。
102.其中,s401的实现方式与上述s201的实现方式类似,此处不再赘述。
103.s402、通过待训练的第一子模型对第一样本文本进行处理得到第一预测数据,第一预测数据中包括多个预测论元、预测论元对应的预测角色和预测论元对应的预测事件类
型。
104.本实施例中将尚未训练的第一子模型称为待训练的第一子模型。在根据第一训练样本对第一子模型进行训练的时候,例如,可以通过待训练的第一子模型对第一样本文本进行处理,因为本实施例中的第一子模型是用于确定文本中存在的论元、论元的角色以及论元的事件类型的。
105.因此参照图5,第一子模型可以输出第一预测数据,在第一预测数据中包括多个预测论元,其中预测论元就是第一子模型针对第一样本文本进行论元提取得到的论元,比如说可以包括图5所示的论元a、论元b、论元c等等。以及在第一预测数据中包括各个预测论元各自对应的预测角色以和各个预测论元各自对应的预测事件类型。
106.在一种可能的实现方式中,本实施例中的第一预测数据中还包括多个预测论元在第一样本文本中的预测位置,以及第一预测数据中还包括多个预测论元在第一样本文本中的预测位置的概率。其中的概率可以理解为模型自身所输出的置信度,也就是说模型对当前输出的预测位置有多大的把握。
107.因此在本实施例中,尽管没有告诉第一子模型,相同的论元在文中的具体位置,仅仅是告诉了第一子模型在文中各个论元具体有几个,但是第一子模型也可以基于多示例学习的方式,输出提取的各个预测论元,同时可以输出提取的各个预测论元在文中的预测位置,以及针对当前的预测位置的概率。
108.s403、根据第一标注数据、预测论元对应的预测角色和预测论元对应的预测事件类型,确定第一损失。
109.在第一子模型输出第一预测数据之后,因为本实施例中针对第一样本文本标注有第一标注数据,因此可以根据第一标注数据以及上述的第一预测数据,确定模型的损失。
110.在一种可能的实现方式中,基于上述介绍可以确定的是,在第一标注数据中包括多个数据包,其中每个数据包的内部包括的都是相同的论元,以及针对每个数据包标注有论元角色和事件类型,因此在标注数据中实际上是标注了论元的论元角色和事件类型的。
111.以及上述的第一预测数据中包括多个预测论元,以及各个预测论元对应的预测角色和预测论元对应的预测事件类型。
112.因此参照图6,可以根据第一标注数据、预测论元对应的预测角色以及预测论元所对应的事件类型,来确定第一损失。在一种可能的实现方式中,例如可以预设有第一损失函数,之后通过第一损失函数对第一标注数据、预测论元对应的预测角色以及预测论元所对应的事件类型进行处理,从而确定第一损失。
113.s404、将多个预测论元进行分组,得到多组预测论元,每组预测论元中的论元相同。
114.以及本实施例中,在第一预测数据中可以包括多个预测论元,以及基于上述介绍可以确定的是,在文本中针对同一个论元可能出现多次,因为本实施例中会通过数据包告知模型各个样本论元的数量具体有多少个,因此模型是会输出多个相同的样本论元各自的预测位置。
115.因此当前可以对多个预测论元进行分组,从而得到多组预测论元,在每组预测预测论元中的论元相同。也就是说将预测论元中相同的论元作为一组,从而得到多组预测论元。
116.此处的一组预测论元与上述介绍的标注数据中的数据包实际上是类似的,不同之处在于,上述的数据包是提前标注所得到的数据,而当前的一组预测论元是在第一子模型进行处理之后,对得到的多个预测论元进行分组所得到的数据。
117.s405、根据多个预测论元在第一样本文本中的预测位置的概率,分别在多组预测论元中确定目标预测论元,其中,在一组预测论元中的目标预测论元在第一样本文本中的预测位置的概率最高。
118.基于上述介绍可以确定的是,本实施例中的第一预测数据中包括多个预测论元在第一样本文本中的预测位置的概率,本实施例中的概率可以理解为模型输出的置信度。
119.同时可以理解的是,因为本公开中并未告知各个论元在文本中的位置,因此模型在学习的过程中其实并没有参考信息,而是自主的进行学习,那么在开始训练的过程中,模型所输出的预测论元在第一样本文本中的预测位置的概率其实并不会很高,也就是说模型对于输出的预测论元的位置其实也不是非常确定。
120.那么为了提升模型训练的效率,本实施例中可以在多组预测论元中,确定目标预测论元,其中目标预测论元为在一组预测论元中对应的预测位置的概率最高的论元。也就是说根据预测位置的概率最高的论元,来计算损失,从而可以有效的提升模型训练的有效性。
121.s406、根据目标论元的预测位置和目标论元在第一样本文本中的实际位置,确定第二损失。
122.可以确定的是,目标论元也是从第一样本文本中提取出来的论元,因此基于第一样本文本,可以确定目标论元在第一样本文本中的实际位置。在一种可能的实现方式中,本实施例中无需预先标注好各个论元在第一样本文本中的实际位置,而是在模型输出预测论元的预测位置之后,再在第一样本文本中确定预测位置附近的目标论元,以确定目标论元在第一样本文本中的实际位置。
123.参照图6,之后可以根据目标论元的预测位置,以及目标论元在第一样本文本中的实际位置,来确定第二损失。在一种可能的实现方式中,例如可以通过预设的第二损失函数对目标论元的预测位置以及目标论元在第一样本文本中的实际位置进行处理,以得到第二损失函数。
124.s407、根据第一损失和第二损失,更新第一子模型的模型参数。
125.其中,第一损失可以对第一子模型提取论元,以及输出论元的论元角色和事件类型的准确性进行优化,而第二损失可以对第一子模型输出各个论元的位置的准确性进行优化,因此本实施例中可以基于上述确定的第一损失和第二损失,对第一子模型的模型参数进行更新,以实现对第一子模型的训练。
126.以及可以理解的是,在实际实现过程中,上述所介绍的确定损失,以及根据损失更新第一子模型的模型参数的操作,可以迭代进行多次,直至到达预设迭代次数,或者直至模型收敛,则可以得到训练完成的第一子模型。
127.本公开实施例提供的事件抽取模型训练方法,通过待训练的第一子模型对第一样本文本进行处理,从而输出第一预测数据,之后根据第一预测数据中包括的预测论元的论元角色和事件类型,以及第一标注数据中的论元的论元角色和事件类型,来确定用于优化确定论元角色和事件类型的准确性的第一损失。以及还可以根据第一预测数据中所包括的
预测论元在第一样本文本中的预测位置,以及预测位置的概率,选择概率最大的目标论元,之后基于目标论元来确定第二损失,从而可以有效提升模型训练的速度和效率。具体的,通过目标论元的预测位置和目标论元在第一样本文本中的实际位置,来确定用于优化输出的论元的位置的准确性的第二损失。之后根据第一损失和第二损失来更新第一子模型的模型参数,从而可以有效的实现针对第一子模型的训练,并且可以有效的保证第一子模型所输出的论元、论元的论元角色、论元的事件类型、论元的位置的准确性。
128.上述实施例介绍的是针对第一子模型进行训练的实现,下面再结合具体的实施例对针对第二子模型进行训练的实现方式进行详细介绍。例如可以结合图7至图10进行说明,图7为本公开实施例提供的事件抽取模型训练方法的流程图三,图8为本公开实施例提供的确定第一概率的实现示意图,图9为本公开实施例提供的确定待选窗口的实现示意图,图10为本公开实施例提供的确定目标窗口的实现示意图。
129.如图7所示,该方法包括:
130.s701、获取第二训练样本,第二训练样本中包括第二样本文本、第二样本文本中存在的多个第二样本论元、多个第二样本论元中每两个第二样本论元对应同一事件的样本概率。
131.其中,s701的实现方式与上述s203的实现方式类似,此处不再赘述。
132.s702、确定多个第二样本论元对应的多个第二样本角色。
133.在本实施例中,每个样本论元对应有各自的样本角色,在一种可能的实现方式中,当前的第二样本论元例如可以为上述的第一子模型输出的预测论元,基于上述介绍可以确定的是,第一子模型还会输出论元的论元角色和事件类型。因此当前的情况下,就可以基于第一子模型的输出,获取多个第二样本论元各自对应的第二样本角色。
134.s703、确定各第二样本角色下的第二样本论元对应同一个事件的第一概率。
135.在本实施例中,第二样本角色就是第二样本文本中的各个第二样本论元各自对应的样本角色,可以理解的是,每个样本论元均对应各自对应的事件,则本实施例中还可以确定各个第二样本角色下的第二样本论元对应同一个事件的第一概率。
136.此处需要区分事件类型和事件,可以理解的是,针对同一个事件类型,可以存在多个不同的事件,比如说当前存在事件a和事件b,这两个事件的事件类型均为事件类型1。
137.本实施例中在确定各个第二样本角色下的第二样本论元对应同一个事件的概率时,例如可以是基于第二样本文本进行分析,从而确定上述介绍的概率。
138.例如可以结合图8进行理解,如图8所示,假设当前针对第二样本文本进行分析,在第二样本文本中存在样本角色1下的多个论元,比如说可以包括图8所示的论元1、论元2和论元3,也就是说这3个论元的论元角色均为样本角色1,以及基于上述介绍可以确定的是,在文本中同一论元可以出现多次,则图8的示例就表示论元2在第二样本文本中出现了3次。
139.参照图8,其中的论元1是属于事件a的,以及第一个论元2和第二个论元2是属于事件a的,第三个论元2是属于事件b的,以及论元3是属于事件b的。则针对图8的示例,可以确定第二样本文本下的第二样本论元属于事件a的概率是60%(3/5),属于事件b的概率是40%(2/5)。
140.本实施例中的第二样本文本下的第二样本论元属于同一个事件的概率,例如可以为属于数量最多的同一个事件的概率,也就是说将概率最大的确定为当前需要的概率,因
此针对图8的示例,可以确定第二样本文本下的第二样本论元属于同一个事件的概率为60%。
141.图8介绍的是样本角色下的各个样本论元对应了两个不同的事件的实现方式,在实际实现过程中,样本角色下的各个论元还有可能对应大于两个的不同的事件,其实现方式与上述介绍的类似,可以将存在的数量最多事件所对应的概率确定为当前需要的概率。
142.s704、根据各第二样本角色的召回率和准确率,确定各第二样本角色的角色系数。
143.以及,本实施例中的第二样本论元是上述介绍的第一子模型所输出的论元,基于上述介绍可以确定的是,第一子模型可以输出预测论元、各个预测论元的预测角色以及各个预测论元各自对应的预测事件类型。
144.因为各个预测论元各自对应有各自的预测角色,因此第一子模型的输出中就存在诸多的预测角色,本实施例中的第二样本角色实际上也就是第一子模型输出的预测角色。
145.那么针对任一个第二样本角色,就可以统计第一子模型输出的第二样本角色对应的召回率和准确率,其中召回率(recall)和准确率(precision)的具体实现可以参照现有技术中的实现,此处对此不再赘述。
146.在确定各个第二样本角色的召回率和准确率之后,就可以根据各个第二样本角色的召回率和准确率,来确定各个第二样本角色的角色系数了。本实施例中的角色系数例如可以为综合评价指标(f-measure)。
147.在一种可能的实现方式中,例如可以根据预设函数处理第二样本角色的召回率和准确率,得到第二样本角色的角色系数。
148.其中,确定角色系数的预设函数例如可以满足如下的公式一:
[0149][0150]
其中,p为准确率,r为召回率,f为角色系数,本实施例中的角色系数具体可以为综合评价指标。
[0151]
针对每一个第二样本角色均可以执行上述操作,从而得到各个第二样本角色各自对应的角色系数f。
[0152]
s705、根据各第二样本角色各自对应的第一概率、以及各第二样本角色的角色系数,确定各第二样本角色的优先级。
[0153]
在确定各个第二样本角色各自对应的第一概率,以及各个第二样本角色各自的角色系数之后,例如可以根据第一概率和角色系数,确定各个第二样本角色的优先级。
[0154]
在一种可能的实现方式中,针对任一个第二样本角色,例如可以将第二样本角色对应的第一概率p以及第二样本角色的角色系数f的乘积,确定为第二样本角色的优先级。可以理解,p和f的乘积越大,就标识第二样本角色的优先级越大。
[0155]
s706、根据各第二样本角色的优先级,在多个第二样本角色中确定待选中心角色。
[0156]
在确定各个第二样本角色各自的优先级之后,可以根据各个第二样本角色的优先级,在多个第二样本角色中确定待选中心角色。
[0157]
在一种可能的实现方式中,例如可以将各个第二样本角色的优先级和预设阈值进行比较,若确定第二样本角色中存在第二样本角色的优先级大于或等于预设阈值,则可以将优先级大于或者等于预设阈值的第二样本角色确定为待选中心角色。这种情况下,本实
施例中的待选中心角色可以存在多个。
[0158]
在另一种可能的实现方式中,若确定多个第二样本角色的优先级均小于预设阈值,则可以将多个第二样本角色中优先级最大的第二样本角色确定为待选中心角色。
[0159]
此处需要说明的是,样本角色的优先级越大,则表示该样本角色下的论区分事件的能力越强,因此本实施例中基于优先级确定待选中心角色,实际上是确定了区分事件较强的论元角色。
[0160]
s707、将待选中心角色对应的论元确定为中心论元。
[0161]
在确定待选中心角色之后,可以将待选中心角色对应的论元确定为中心论元。其中,待选中心角色对应的论元,实际上就是论元角色为待选中心角色的论元。
[0162]
s708、在第二样本文本中确定中心论元对应的目标窗口,目标窗口中包括预设数量的字符。
[0163]
可以确定的是,本实施例中确定的中心论元可以存在多个,下面以任一个中心论元为例进行介绍。
[0164]
本实施例中,可以在第二样本文本中确定中心论元对应的目标窗口,其中目标窗口中可以包括预设数量的字符,其中,在目标窗口中所包括的字符的数量实际上就是窗口的长度。
[0165]
在一种可能的实现方式中,本实施例中的目标窗口满足如下条件:目标窗口中包括预设数量的字符、目标窗口中包括中心论元,在满足上述两个条件的基础上,目标窗口中包括最多的和中心论元的事件类型一致的其他论元。
[0166]
下面对确定目标窗口的可能的实现方式进行介绍:
[0167]
例如可以在第二样本文本中确定多个待选窗口,待选窗口中包括预设数量的字符,待选窗口中包括待选中心角色对应的论元。
[0168]
可以理解的是,本实施例中在确定目标窗口时,因为窗口的长度是预设的,并且在目标窗口中必须包括中心论元,那么为了保证目标窗口中包括最多的和中心论元的事件类型一致的其他论元,则可以通过滑动窗口的方式,首先确定多个待选窗口。
[0169]
本实施例中的待选窗口包括预设数量的字符,也就是说待选窗口的长度是预设长度,并且待选窗口中待选中心角色对应的论元,此处的待选中心角色对应的论元实际上就是上述介绍的中心论元。
[0170]
例如可以结合图9进行理解,参见图9,假设其中的901为第二样本文本,在图9中示意出了第二样本文本的部分内容。假设当前的中心论元为图9中的“数千万元”,则针对该中心论元,比如说可以至少确定图9中的902、903、904分别所示的待选窗口。
[0171]
基于待选窗口902、待选窗口903和待选窗口904可以确定的是,在各个待选窗口中均包括中心论元“数千万元”,以及各个待选窗口的长度均为预设长度,其中预设长度比如说可以为n个字,其中n的具体设置可以根据实际需求进行选择。
[0172]
以及基于上述图9可以确定的是,本实施例中可以在窗口中包括中心论元的基础上,基于预设的窗口长度来进行窗口的滑动,从而确定多个待选窗口。
[0173]
在确定待选窗口之后,可以确定待选窗口中包括的第一事件类型对应的论元的数量,第一事件类型为中心论元对应的事件类型。
[0174]
基于上述介绍可以确定的是,因为本实施例中的目标窗口是包括最多的和中心论
元的事件类型一致的其他论元的窗口。因此可以确定各个待选窗口中包括的第一事件类型对应的论元的数量,其中的第一事件类型为中心论元对应的事件类型。
[0175]
例如可以参照图10进行理解,如图10所示,假设当前存在图10所示的窗口1和窗口2。
[0176]
其中,在窗口1中,除了包括中心论元之外,还包括论元1、论元2、论元3和论元4,其中的中心论元的事件类型为事件类型a,论元1的事件类型为事件类型b,论元2的事件类型为事件类型a,论元3的事件类型为事件类型b,论元4的事件类型为事件类型c。那么可以确定的是,在待选窗口1中所包括的和中心论元的事件类型一致的其他论元的数量为1,也就是窗口1中的论元2。
[0177]
以及,在窗口2中,除了包括中心论元之外,还包括论元2、论元3、论元4、论元1和论元5,其中的中心论元的事件类型为事件类型a,论元2的事件类型为事件类型a,论元3的事件类型为事件类型b,论元4的事件类型为事件类型a,论元1的事件类型为事件类型a,论元5的事件类型为事件类型c。那么可以确定的是,在待选窗口1中所包括的和中心论元的事件类型一致的其他论元的数量为3,也就是窗口1中的论元2、论元4和论元1。
[0178]
之后,可以根据待选窗口中包括的第一事件类型对应的论元的数量,确定目标窗口。
[0179]
因为本实施例中是需要将包括最多的和中心论元的事件类型一致的其他论元的窗口确定为目标窗口,则在一种可能的实现方式中,就可以将包括的第一事件类型对应的论元的数量最多的待选窗口确定为目标窗口。
[0180]
比如说在上述图10的示例中,假设仅存在待选窗口1和待选窗口2,因为在图10的示例中,待选窗口中所包括的和中心论元的事件类型一致的其他论元的数量中,待选窗口2的数量是最多的,因此可以将待选窗口2确定为目标窗口。
[0181]
s709、确定目标窗口中存在的多个第一论元。
[0182]
基于上述介绍可以确定的是,在目标窗口中,除了中心论元之外,还可以包括很多的其他论元,因此本实施例中可以确定目标窗口中存在的多个第一论元,其中的第一论元例如可以为目标窗口中除中心论元之外的其余论元。
[0183]
s710、获取多个第一论元与中心论元对应于同一事件的预测概率。
[0184]
在确定多个第一论元之后,例如可以获取多个第一论元与中心论元对应于同一事件的预测概率,实际上也就是说确定第一论元和中心论元是属于同一个事件的预测概率。
[0185]
本实施例中的预测概率可以为第二子模型输出得到的,也就是说第二子模型可以对各个第一论元和中心论元进行处理,从而输出第一论元与中心论元对应于同一事件的概率。
[0186]
在一种可能的实现方式中,当前的第二子模型对第一论元与中心论元进行处理,以输出第一论元和中心论元对应于同一个事件的概率,可以是第二子模型中的部分处理过程,也就是说第二子模型除了输出第一论元和中心论元属于同一个事件的预测概率的处理之外,还包括其余的处理过程。比如说上述介绍的确定目标窗口和中心论元的过程也可以是第二子模型处理的,那么在这种情况下,直接将第二训练文本输入第二子模型即可。以及第二子模型后续还会输出文本中存在的事件、所述事件对应的论元和所述论元对应的角色。
[0187]
或者,上述介绍的确定目标窗口和中心论元的过程还可以不是第二子模型处理的,其可以是第二子模型进行处理之前的预处理阶段执行的。那么在这种情况下,在将第二训练文本输入第二子模型之前,首先需要对第二训练文本执行上述介绍的预处理过程,以在第二训练文本中确定目标窗口以及中心论元,之后除了将第二训练样本输入第二子模型之外,还需要将目标窗口中的第一文本和中心论元同样输入第二子模型,以使得第二子模型可以输出第一论元和中心论元属于同一个事件的预测概率。
[0188]
s711、根据各第一论元对应的预测概率,将对应的预测概率大于或等于概率阈值的第一论元确定为目标论元。
[0189]
在本实施例中,每一个第一论元都和中心论元对应有预测概率,在一种可能的实现方式中,若第一论元对应的预测概率大于或等于概率阈值,则表示当前的第一论元和中心论元同属于一个事件的可能性比较大,因此可以将对应的预测概率大于或等于概率阈值的第一论元确定为目标论元。当前的目标论元就是指和中心论元同属于一个事件的论元。
[0190]
以及在另一种可能的实现方式中,若第一论元对应的预测概率小于概率阈值,则表示当前的第一论元和中心论元同属于一个事件的可能性较小,因此这部分第一论元也就不是本实施例中所需要的目标论元。
[0191]
以及可以理解的是,实际上是会存在多个中心论元的,针对每一个中心论元都会执行上述操作,假设当前目标窗口中的某个第一论元和当前的中心论元不属于同一个事件,但是该第一论元可能和其余的中心论元属于同一个事件。
[0192]
因此可以理解的是,本实施例中通过确定中心论元,以及确定中心论元中的目标窗口中的各个第一论元和中心论元的预测概率,以确定第一论元和中心论元是否同属于一个事件,实际上是基于中心论元,实现了对掺杂在一起的事件的有效划分。
[0193]
以及在实际实现过程中,具体的概率阈值的设置可以根据实际需求进行选择和设置,本实施例对概率阈值的具体实现不做限制。
[0194]
s712、确定中心论元对应的预测事件,其中,预测事件中包括中心论元和目标论元。
[0195]
在针对当前的中心论元确定目标论元之后,就可以确定中心论元所对应的预测事件了,其中针对论元确定其对应的事件的具体实现,可以参照相关技术中的事件提取的实现,本实施例对此不做限制。
[0196]
在确定中心论元所对应的预测事件之后,因为确定了上述介绍的目标论元和中心论元是属于同一个事件的,因此可以确定预测事件中包括中心论元和各个目标论元。
[0197]
以及在实际实现过程中,因为中心论元存在多个,针对每一个中心论元均执行上述介绍的操作,从而可以针对各个中心论元确定各自对应的预测事件,以及在预测事件中还包括和中心论元同属于一个事件的各个目标论元,因此可以实现从样本文本中提取多个预测事件,在每个预测事件中都包括至少一个预测论元。
[0198]
s713、根据预测事件中的预测论元和样本事件中的第二样本论元,确定第三损失。
[0199]
在确定各个预测事件之后,因为在第二训练样本中还包样本事件,其中每个样本事件中都包括至少一个第二样本论元。那么其中的样本事件就相当于标注信息,预测事件相当于模型输出的信息,之后可以根据样本事件中的预测论元和样本事件中的第二样本论元,确定第三损失。
[0200]
在一种可能的实现方式中,比如说可以通过第三损失函数对样本事件和预测事件进行处理,从而确定第三损失。本实施例中的第三损失是用于优化第二子模型所输出的预测事件的准确性的,进一步的,是为了优化第二子模型所输出的预测事件的划分,以及预测事件中所包括的预测论元的准确性的。
[0201]
s714、根据第三损失更新第二子模型的模型参数。
[0202]
其中,第三损失可以对第二子模型所输出的预测事件的准确性进行优化,因此在确定第三损失之后,就可以根据第三损失对第二子模型的模型参数进行更新了,以实现对第二子模型的训练。
[0203]
以及可以理解的是,在实际实现过程中,上述所介绍的确定损失,以及根据损失更新第二子模型的模型参数的操作,可以迭代进行多次,直至到达预设迭代次数,或者直至模型收敛,则可以得到训练完成的第二子模型。
[0204]
本公开实施例提供的事件抽取模型训练方法,通过确定第二训练样本中的各个第二样本角色各自所对应的第一概率,以及各个第二样本角色各自的角色系数,之后根据角色系数以及第一概率确定各个第二样本角色的优先级,然后根据优先级确定至少一个中心样本角色,其中中心样本角色是对于事件的区分能力较强的样本角色,之后根据中心样本角色下的各个中心论元,确定各个中心论元各自对应的目标窗口,本实施例中的目标窗口是在包括中心论元的基础上,所包括的和中心论元同属于一个事件类型的其他论元最多的固定长度的窗口。然后确定中心论元的目标窗口中,各个其他论元和中心论元同属于一个事件的预测概率,并且根据预测概率来确定中心论元所对应的预测事件,从而可以有效的基于中心论元和预测概率,对复杂的句子中的多个事件进行划分,从而输出多个预测事件,其中的每个预测事件都包括至少一个预测论元。并且根据模型输出的预测事件以及标注的样本事件,对第二子模型的模型参数进行更新,从而可以准确有效的实现对第二子模型的训练,以使得第二子模型可以准确有效的输出包括对应论元的预测事件。
[0205]
上述介绍了针对第一子模型和第二子模型的训练过程,基于上述的介绍可以确定的是,本公开中的第一子模型可以实现论元的提取,以及输出各个论元各自对应的论元角色、事件类型,以及本公开中的第二子模型可以实现根据第一子模型提取的论元,确定各个论元各自对应的事件,也就是说实现事件的划分。那么第一子模型和第二子模型结合应用,就可以实现事件的提取。具体的,可以得到文本中提取出的事件,以及确定各个事件中所包括的论元、论元对应的论元角色、论元对应的事件类型。
[0206]
在上述实施例的基础上,下面结合图11和图12对本公开中提供的事件抽取方法进行进一步的详细介绍。
[0207]
图11为本公开实施例提供的事件抽取方法的流程图,图12为本公开实施例提供的事件抽取方法的处理示意图。
[0208]
如图11所示,该方法包括:
[0209]
s1101、获取待处理的第一文本。
[0210]
在本实施例中,待处理的第一文本就是需要进行事件提取的文本,本实施例对第一文本的具体内容、篇幅长度、格式等等,均不作限制,凡是需要进行事件提取的文本均可以作为本实施例中的第一文本。
[0211]
s1102、通过预训练的事件抽取模型中的第一子模型对第一文本进行处理,得到第
一输出结果,第一输出结果中包括:第一文本中存在的论元、论元对应的角色和论元对应的事件类型。
[0212]
本实施例中的预训练的事件抽取模型可以包括第一子模型和第二子模型,其中第一子模型可以对第一文本进行处理,从而输出第一文本中存在的论元、各个论元各自对应的论元角色以及各个论元各自对应的事件类型。
[0213]
参照图12,可以将第一文本输入事件抽取模型的第一子模型,以使得第一子模型输出第一输出结果,其中第一输出结果中包括第一文本中存在的论元、论元对应的论元角色以及论元对应的事件类型。
[0214]
s1103、通过预训练的事件抽取模型中的第二子模型对第一输出结果进行处理,得到第一文本中存在的事件、事件对应的论元。
[0215]
以及本实施例中的预训练的事件抽取模型还包括第二子模型,其中第二子模型可以第一子模型的第一输出结果进行处理,从而输出第一文本中存在的事件、事件对应的论元。
[0216]
基于上述实施例的介绍可以确定的是,实际上第二子模型的处理只需要提取的各个论元和待处理的第一文本即可,因此在一种可能的实现方式中,参照图12,可以获取第一输出结果中的各个论元。
[0217]
并且将各个论元以及第一文本输入值第二子模型,以使得第二子模型可以输出第一文本中存在的事件,以及各个事件各自包括的论元。
[0218]
那么参照图12可以确定的是,其中的第一子模型可以输出第一文本中的各个论元、各个论元各自对应的论元角色、各个论元各自对应的事件类型,以及第二子模型可以输出第一文本中存在的事件以及各个事件对应的论元。
[0219]
那么就可以得到图12所示的提取结果,也就是说在第一文本中存在的各个事件、各个事件的事件类型、各个事件所包括的论元、各个论元的论元角色。以及在可选的实现方式中,第二子模型还可以输出事件的触发词,那么在提取结果中就还可以包括各个事件的触发词,从而可以有效的实现从第一文本中提取事件。
[0220]
在本实施例中,基于上述介绍的模型训练过程可以理解的是,本实施例中的预训练的事件提取模型,针对文本中存在的多次出现的论元,同样可以实现准确有效的模型训练,以及针对多个事件糅杂的复杂情况,可以有效的实现事件的划分。因此基于上述训练得到的事件抽取模型对第一文本进行处理,以得到事件抽取结果,从而可以有效保证事件抽取结果的准确性。
[0221]
图13为本公开实施例的事件抽取模型训练装置的结构示意图。如图13所示,本实施例的事件抽取模型训练装置1300可以包括:获取模块1301、第一处理模块1302、第二获取模块1303、第二处理模块1304、确定模块1305。
[0222]
获取模块1301,用于获取第一训练样本,所述第一训练样本包括第一样本文本和第一标注数据,所述第一标注数据包括:所述第一样本文本中的多个样本论元对应的多个数据包、各所述数据包对应的样本角色、各所述数据包对应的样本事件类型,其中,任一个数据包中的样本论元相同;
[0223]
第一处理模块1302,用于通过所述第一训练样本进行模型训练得到第一子模型,所述第一子模型用于确定文本中存在的论元、所述论元对应的角色和所述论元对应的事件
类型;
[0224]
第二获取模块1303,用于获取第二训练样本,所述第二训练样本中包括第二样本文本、所述第二样本文本中存在的多个样本事件、各所述样本事件中所包括的第二样本论元;
[0225]
第二处理模块1304,用于通过所述第二训练样本进行模型训练得到第二子模型,所述第二子模型用于确定文本中存在的事件、所述事件对应的论元;
[0226]
确定模块1305,用于基于所述第一子模型和所述第二子模型确定事件抽取模型。
[0227]
一种可能的实现方式中,所述第一处理模块1302具体用于:
[0228]
通过待训练的所述第一子模型对所述第一样本文本进行处理得到第一预测数据,所述第一预测数据中包括多个预测论元、所述预测论元对应的预测角色和所述预测论元对应的预测事件类型;
[0229]
根据所述第一标注数据和所述第一预测数据,更新所述第一子模型的模型参数。
[0230]
一种可能的实现方式中,所述第一预测数据中还包括所述多个预测论元在所述第一样本文本中的预测位置;
[0231]
所述第一处理模块1302具体用于:
[0232]
根据所述第一标注数据、所述预测论元对应的预测角色和所述预测论元对应的预测事件类型,确定第一损失;
[0233]
根据所述多个预测论元的预测位置和所述多个预测论元在所述第一样本文本中的实际位置,确定第二损失;
[0234]
根据所述第一损失和所述第二损失,更新所述第一子模型的模型参数。
[0235]
一种可能的实现方式中,所述第一预测数据中还包括所述多个预测论元在所述第一样本文本中的预测位置的概率;
[0236]
所述第一处理模块1302具体用于:
[0237]
将所述多个预测论元进行分组,得到多组预测论元,每组预测论元中的论元相同;
[0238]
根据所述多个预测论元在所述第一样本文本中的预测位置的概率,分别在所述多组预测论元中确定目标预测论元,其中,在一组预测论元中的目标预测论元在所述第一样本文本中的预测位置的概率最高;
[0239]
根据所述目标论元的预测位置和所述目标论元在所述第一样本文本中的实际位置,确定所述第二损失。
[0240]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0241]
通过待训练的所述第二子模型对所述第二样本文本和所述多个第二样本论元进行处理,得到至少一个预测事件,所述预测事件中包括至少一个预测论元;
[0242]
根据所述预测事件中的预测论元和所述样本事件中的第二样本论元,确定第三损失;
[0243]
根据所述第三损失更新所述第二子模型的模型参数。
[0244]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0245]
根据所述第二样本文本,确定中心论元;
[0246]
在所述第二样本文本中确定所述中心论元对应的目标窗口,所述目标窗口中包括预设数量的字符;
[0247]
确定所述目标窗口中存在的多个第一论元,并获取所述多个第一论元与所述中心论元对应于同一事件的预测概率;
[0248]
根据所述中心论元、各所述第一论元以及各所述第一论元对应的预测概率,确定至少一个预测事件。
[0249]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0250]
在所述第二样本文本中确定多个待选窗口,所述待选窗口中包括所述预设数量的字符,所述待选窗口中包括所述待选中心角色对应的论元;
[0251]
确定所述待选窗口中包括的第一事件类型对应的论元的数量,所述第一事件类型为所述中心论元对应的事件类型;
[0252]
根据所述待选窗口中包括的第一事件类型对应的论元的数量,确定所述目标窗口。
[0253]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0254]
将包括的第一事件类型对应的论元的数量最多的待选窗口确定为所述目标窗口。
[0255]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0256]
确定所述多个第二样本论元对应的多个第二样本角色;
[0257]
确定各所述第二样本角色下的第二样本论元对应同一个事件的第一概率;
[0258]
根据各所述第二样本角色的召回率和准确率,确定各所述第二样本角色的角色系数;
[0259]
根据所述各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,在所述多个第二样本角色中确定所述待选中心角色;
[0260]
将所述待选中心角色对应的论元确定为所述中心论元。
[0261]
一种可能的实现方式中,针对任意一个第二样本角色;所述第二处理模块1304具体用于:
[0262]
根据预设函数处理所述第二样本角色的召回率和准确率,得到所述第二样本角色的角色系数。
[0263]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0264]
根据各所述第二样本角色各自对应的第一概率、以及各所述第二样本角色的角色系数,确定各所述第二样本角色的优先级;
[0265]
根据各所述第二样本角色的优先级,在所述多个第二样本角色中确定所述待选中心角色。
[0266]
一种可能的实现方式中,针对任意一个第二样本角色;所述第二处理模块1304具体用于:
[0267]
将所述第二样本角色对应一个事件的第一概率,与所述第二样本角色的角色系数的乘积,确定为各所述第二样本角色的优先级。
[0268]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0269]
若所述多个第二样本角色中存在第二样本角色的优先级大于或等于预设阈值,则将优先级大于或等于预设阈值的第二样本角色确定为所述待选中心角色;
[0270]
若所述多个第二样本角色的优先级均小于所述预设阈值,则将所述多个第二样本角色中优先级最大的第二样本角色确定为所述待选中心角色。
[0271]
一种可能的实现方式中,所述第二处理模块1304具体用于:
[0272]
根据各所述第一论元对应的预测概率,将对应的所述预测概率大于或等于概率阈值的第一论元确定为目标论元;
[0273]
确定所述中心论元对应的预测事件,其中,所述预测事件中包括所述中心论元和所述目标论元。
[0274]
图14为本公开实施例的事件抽取装置的结构示意图。如图14所示,本实施例的事件抽取装置1400可以包括:获取模块1401、第一处理模块1402、第二获取模块1403。
[0275]
获取模块1401,用于获取待处理的第一文本;
[0276]
第一处理模块1402,用于通过预训练的事件抽取模型中的第一子模型对所述第一文本进行处理,得到第一输出结果,所述第一输出结果中包括:所述第一文本中存在的论元、所述论元对应的角色和所述论元对应的事件类型;
[0277]
第二处理模块1403,用于通过预训练的事件抽取模型中的第二子模型对所述第一输出结果进行处理,得到所述第一文本中存在的事件、所述事件对应的论元。
[0278]
一种可能的实现方式中,所述第二处理模块1403具体用于:
[0279]
获取所述第一输出结果中的各个论元;
[0280]
将所述各个论元以及所述第一文本输入至所述第二子模型,以使得所述第二子模型输出所述第一文本中存在的事件、所述事件对应的论元。
[0281]
本公开提供一种事件抽取模型训练方法及装置、事件抽取方法及装置,应用于知识图谱、深度学习等人工智能技术领域,以达到提升事件抽取模型的抽取结果的准确性的效果。
[0282]
需要说明的是,本实施例中的人头模型并不是针对某一特定用户的人头模型,并不能反映出某一特定用户的个人信息。需要说明的是,本实施例中的二维人脸图像来自于公开数据集。
[0283]
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0284]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0285]
根据本公开的实施例,本公开还提供了一种计算机程序产品,计算机程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
[0286]
图15示出了可以用来实施本公开的实施例的示例电子设备1500的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0287]
如图15所示,设备1500包括计算单元1501,其可以根据存储在只读存储器(rom)1502中的计算机程序或者从存储单元1508加载到随机访问存储器(ram)1503中的计算机程
序,来执行各种适当的动作和处理。在ram 1503中,还可存储设备1500操作所需的各种程序和数据。计算单元1501、rom 1502以及ram 1503通过总线1504彼此相连。输入/输出(i/o)接口1505也连接至总线1504。
[0288]
设备1500中的多个部件连接至i/o接口1505,包括:输入单元1506,例如键盘、鼠标等;输出单元1507,例如各种类型的显示器、扬声器等;存储单元1508,例如磁盘、光盘等;以及通信单元1509,例如网卡、调制解调器、无线通信收发机等。通信单元1509允许设备1500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0289]
计算单元1501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1501执行上文所描述的各个方法和处理,例如事件抽取模型训练方法或者事件抽取方法。例如,在一些实施例中,事件抽取模型训练方法或者事件抽取方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1508。在一些实施例中,计算机程序的部分或者全部可以经由rom 1502和/或通信单元1509而被载入和/或安装到设备1500上。当计算机程序加载到ram 1503并由计算单元1501执行时,可以执行上文描述的事件抽取模型训练方法或者事件抽取方法的一个或多个步骤。备选地,在其他实施例中,计算单元1501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行事件抽取模型训练方法或者事件抽取方法。
[0290]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0291]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0292]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0293]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0294]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0295]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务("virtual private server",或简称"vps")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0296]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0297]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1