联合实体关系抽取的纠纷事件分类方法及其应用与流程

文档序号:31204197发布日期:2022-08-20 02:18阅读:113来源:国知局
联合实体关系抽取的纠纷事件分类方法及其应用与流程

1.本技术涉及数据处理技术领域,特别是涉及联合实体关系抽取的纠纷事件分类方法及其应用。


背景技术:

2.随着信息化技术的不断完善,对各类矛盾纠纷事件进行统计分析进而获取纠纷类型的分析系统应运而生,此类分析系统可对多来源渠道的矛调纠纷事件提供数据汇聚服务、数据治理服务、数据研判分析服务以及数据应用服务,基于分析得到的纠纷类型对人员进行画像、对矛调纠纷态势进行感知、对矛调纠纷态势进行预警等智能应用,加强源头治理防范机制落实,从而提升群众满意度,提升市域治理现代化水平。而现有的矛盾纠纷事件处理多采用人工的方法,增加了工作强度和难度,随着深度学习技术的不断发展,可采用深度学习技术对纠纷事件进行分类,方便基层工作人员做出相应的处理,提高办事效率。
3.现有的纠纷事件分类方法多采用文本分类的方法,但是由于纠纷事件较难区分,直接采用文本分类方法进行纠纷事件的分类,由于纠纷事件多和实体关系相关,例如夫妻关系的纠纷多为婚姻家庭纠纷,雇佣关系的纠纷多为劳动纠纷,因此存在纠纷事件分类精确率和召回率不高的问题。


技术实现要素:

4.本技术实施例提供了联合实体关系抽取的纠纷事件分类方法及其应用,采用联合实体关系抽取的方法进行纠纷事件的分类,从而提升纠纷事件分类的精确率和召回率。
5.第一方面,本技术提供了联合实体关系抽取的纠纷事件分类方法,所述方法包括以下步骤:
6.s00、根据纠纷事件字段从纠纷事件库中获取纠纷事件内容;
7.s10、根据纠纷事件内容分别获取纠纷事件内容涉及的人名、第一纠纷事件特征以及第一实体关系特征;
8.s20、根据第一纠纷事件特征和第一实体关系特征获取纠纷事件和实体关系的关联性;
9.s30、根据纠纷事件和实体关系的关联性获取包含纠纷事件类别和实体关系关联性的纠纷事件特征;
10.s40、将包含纠纷事件类别和实体关系关联性的纠纷事件特征后接纠纷事件分类层以获取纠纷事件的类别。
11.进一步地,步骤s10中,将纠纷事件内容输入到纠纷事件分类模型获取第一纠纷事件特征,该纠纷事件分类模型的训练步骤如下:
12.s11、采集第一纠纷事件数据,标注第一纠纷事件数据的纠纷事件的类别构成纠纷事件分类数据集,按照设定比例将纠纷事件分类数据集划分为纠纷事件分类训练数据集和纠纷事件分类验证数据集;
13.s12、将纠纷事件分类训练数据集输入至第一预训练模型迭代训练多次形成纠纷事件分类模型的初始版本;
14.s13、将纠纷事件分类验证数据集输入至纠纷事件分类模型的初始版本进行预测纠正,直至准确率不再上升得到已训练的纠纷事件分类模型。
15.进一步地,步骤s10中,纠纷事件内容和纠纷事件内容涉及的人名通过输入至实体关系抽取模型获取第一实体关系特征,该实体关系抽取模型的训练步骤如下:
16.s14、将第一纠纷事件数据输入至开源命名实体识别模型提取人名,对人名标注实体间的关系,构成纠纷事件实体关系抽取数据集,按照设定比例将纠纷事件实体关系抽取数据集划分为纠纷事件实体关系抽取训练数据集和纠纷事件实体关系抽取验证数据集;
17.s15、将纠纷事件实体关系抽取训练数据集输入至第二预训练模型迭代训练多次形成实体关系抽取模型的初始版本;
18.s16、将纠纷事件实体关系抽取验证数据集输入至实体关系抽取模型的初始版本进行预测纠正,直至准确率不再上升得到已训练的实体关系抽取模型。
19.进一步地,步骤s20中,将第一纠纷事件特征和第一实体关系特征通过输入到纠纷事件文本特征和实体关系特征注意力模块获取纠纷事件和实体关系的关联性,该纠纷事件文本特征和实体关系特征注意力模块使用步骤包括:
20.s21、将第一纠纷事件特征和第一实体关系特征输入至第一多层感知机映射至相同的语义空间,得到相同语义空间的第二纠纷事件文本特征和第二实体关系特征;
21.s22、将第二纠纷事件文本特征和第二实体关系特征拼接并输入至第二多层感知机获取纠纷事件和实体关系的关联性。
22.进一步地,步骤s30中,纠纷事件和实体关系的关联性通过输入至纠纷事件特征和实体关系特征混合模块获取包含纠纷事件类别和实体关系关联性的纠纷事件特征,该纠纷事件特征和实体关系特征混合模块使用步骤包括:
23.s31、将纠纷事件和实体关系的关联性乘以第一纠纷事件特征,得到包含纠纷事件类别和实体关系关联性的纠纷事件特征。
24.进一步地,纠纷事件分类训练数据集数据量大于纠纷事件分类验证数据集数据量;纠纷事件实体关系抽取训练数据集数据量大于纠纷事件实体关系抽取验证数据集数据量。
25.第二方面,联合实体关系抽取的纠纷事件分类模型训练方法,包括以下步骤:
26.采集第二纠纷事件数据,标注该第二纠纷事件数据的类别;
27.将该第二纠纷事件数据输入到已训练的命名实体识别模型提取人名并构成联合实体关系抽取的纠纷事件数据集;
28.将该联合实体关系抽取的纠纷事件数据集按照设定比例划分为联合实体关系抽取的纠纷事件训练数据集和联合实体关系抽取的纠纷事件验证数据集,其中联合实体关系抽取的纠纷事件训练数据集数据量大于联合实体关系抽取的纠纷事件验证数据集数据量;
29.将联合实体关系抽取的纠纷事件训练数据集分别输入到已训练的纠纷事件分类模型和已训练的实体关系抽取模型,提取第一纠纷事件特征和第一实体关系特征;
30.将第一纠纷事件特征和第一实体关系特征输入到纠纷事件文本特征和实体关系特征注意力模块获取纠纷事件的类别和实体关系的关联性;
31.将纠纷事件的类别和实体关系的关联性输入到纠纷事件特征和实体关系特征混合模块得到包含纠纷事件类别和实体关系关联性的纠纷事件特征;
32.将包含纠纷事件类别和实体关系关联性的纠纷事件特征与纠纷事件分类层进行连接;
33.将已训练的纠纷事件分类模型和已训练的实体关系抽取模型的参数进行固定并迭代训练多次得到联合实体关系抽取的纠纷事件分类模型的初始版本;
34.将联合实体关系抽取的纠纷事件验证数据集输入至联合实体关系抽取的纠纷事件分类模型的初始版本进行预测纠正,直至准确率不再上升得到已训练的联合实体关系抽取的纠纷事件分类模型。
35.第三方面,本技术提供了一种联合实体关系抽取的纠纷事件分类装置,包括:
36.采集模块,用于根据纠纷事件字段从纠纷事件库中获取纠纷事件内容;
37.命名实体识别模块,用于根据纠纷事件内容获取纠纷事件内容涉及的人名;
38.纠纷事件分类模型,用于根据纠纷事件内容获取第一纠纷事件特征;
39.实体关系抽取模型,用于根据纠纷事件内容和纠纷事件内容涉及的人名获取第一实体关系特征;
40.纠纷事件文本特征和实体关系特征注意力模块,用于根据第一纠纷事件特征和第一实体关系特征获取纠纷事件和实体关系的关联性;
41.纠纷事件特征和实体关系特征混合模块,用于根据纠纷事件和实体关系的关联性获取包含纠纷事件类别和实体关系关联性的纠纷事件特征;
42.处理模块,用于将包含纠纷事件类别和实体关系关联性的纠纷事件特征后接纠纷事件分类层以获取纠纷事件的类别。
43.第四方面,本技术提供了一种电子装置,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述的联合实体关系抽取的纠纷事件分类方法。
44.第五方面,本技术提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据上述的联合实体关系抽取的纠纷事件分类方法。
45.本发明的主要贡献和创新点如下:1、与现有技术相比,本技术考虑到实体关系对于纠纷事件类别的影响,提出一种联合实体关系抽取的纠纷事件分类方法,采用纠纷事件特征和实体关系特征注意力模块获取纠纷事件和实体关系的关联性,并采用纠纷事件特征和实体关系特征混合模块,获取包含纠纷事件类别和实体关系关联性的纠纷事件特征,从而提升纠纷事件的分类效果;
46.2、与现有技术相比,本技术能够很好地解决现有技术存在的直接采用文本分类方法存在的问题,针对于纠纷事件多和实体关系相关,例如夫妻关系的纠纷多为婚姻家庭纠纷,雇佣关系的纠纷多为劳动纠纷,从而通过联合实体关系抽取的方法进行纠纷事件的分类,显著提升纠纷事件分类的精确率和召回率。
47.本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。
附图说明
48.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
49.图1是根据本技术实施例的联合实体关系抽取的纠纷事件分类方法的流程;
50.图2是根据本技术实施例的联合实体关系抽取的纠纷事件分类模型训练方法的流程;
51.图3是本技术实施例的联合实体关系抽取的纠纷事件分类方法的流程框图;
52.图4是本技术实施例的纠纷事件特征和实体关系特征注意力模块的示意图;
53.图5是本技术实施例的多层感知机mlp1的示意图;
54.图6是本技术实施例的多层感知机mlp2的示意图;
55.图7是本技术实施例的一种电子装置的结构图。
具体实施方式
56.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
57.需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
58.基于目前纠纷事件分类方法多采用文本分类的方法,但是由于纠纷事件较难区分,直接采用文本分类方法进行纠纷事件的分类,存在纠纷事件分类精确率和召回率不高的问题。本技术提出了以下实施例:
59.实施例一
60.本技术旨在提出一种联合实体关系抽取的纠纷事件分类方法,采用纠纷事件特征和实体关系特征注意力模块获取纠纷事件和实体关系的关联性,并采用纠纷事件特征和实体关系特征混合模块,获取包含纠纷事件类别和实体关系关联性的纠纷事件特征,从而提升纠纷事件的分类效果。
61.本技术实施例提供了联合实体关系抽取的纠纷事件分类方法,可以,具体地,参考图1和图3,所述方法包括以下步骤:
62.s00、根据纠纷事件字段从纠纷事件库中获取纠纷事件内容;
63.在本实施例中,获取纠纷事件数据库,根据纠纷事件字段获取纠纷事件内容;
64.s10、根据纠纷事件内容分别获取纠纷事件内容涉及的人名、第一纠纷事件特征以及第一实体关系特征;
65.在本实施例中,将纠纷事件内容输入到纠纷事件分类模型获取第一纠纷事件特征,该纠纷事件分类模型的训练步骤如下:
66.s11、采集第一纠纷事件数据,标注第一纠纷事件数据的纠纷事件的类别构成纠纷事件分类数据集,按照设定比例将纠纷事件分类数据集划分为纠纷事件分类训练数据集和纠纷事件分类验证数据集;其中,纠纷事件分类训练数据集数据量大于纠纷事件分类验证数据集数据量;
67.在本实施例中,具体为采集第一纠纷事件数据,对第一纠纷事件数据进行人工标注纠纷事件的类别构成纠纷事件分类数据集,按照一定的比例r1将纠纷事件分类数据集划分为纠纷事件分类训练数据集和纠纷事件分类验证数据集,其中纠纷事件分类训练数据集数据的数目大于纠纷事件分类验证数据集数据的数目,一般取r1为0.8,纠纷事件的类别包括9个类别,分别为损害赔偿纠纷、经济纠纷、房地产纠纷、劳动纠纷、邻里纠纷、婚姻家庭纠纷、征地拆迁纠纷、其他纠纷及其他;其中,这里的其他是指纠纷以外的事件;
68.s12、将纠纷事件分类训练数据集输入至第一预训练模型迭代训练多次形成纠纷事件分类模型的初始版本;
69.在本实施例中,将纠纷事件分类训练数据集输入到开源的预训练模型bert 中进行训练,其中bert采用深层的双向transformer结构,最后一个双向 transformer结构的最后一层全连接层的数目为纠纷事件的类别数,即维度为9;
70.s13、将纠纷事件分类验证数据集输入至纠纷事件分类模型的初始版本进行预测纠正,直至准确率不再上升得到已训练的纠纷事件分类模型;
71.在本实施例中,将纠纷事件分类训练数据集迭代训练m次后,将纠纷事件分类验证数据输入到迭代训练m次的纠纷事件分类模型进行预测,获得预测结果,与标签进行比对,若一致则正确,否则错误,计算准确率;反复操作s12-s13 后,当损失函数不在下降,准确率不再上升,则停止训练,获取纠纷事件分类模型(已训练完成的纠纷事件分类模型);
72.本技术中的bert是预训练的语言表征模型,采用大量数据训练得到,在本实施例中只需要进行微调,进行各种下游任务,例如本技术就是采用纠纷事件分类数据集对bert进行微调获取纠纷事件分类模型,以及其他的模型;
73.在本实施例中,纠纷事件内容和纠纷事件内容涉及的人名通过输入至实体关系抽取模型获取第一实体关系特征,该实体关系抽取模型的训练步骤如下:
74.s14、将第一纠纷事件数据输入至开源命名实体识别模型提取人名,对人名标注实体间的关系,构成纠纷事件实体关系抽取数据集,按照设定比例将纠纷事件实体关系抽取数据集划分为纠纷事件实体关系抽取训练数据集和纠纷事件实体关系抽取验证数据集;其中,纠纷事件实体关系抽取训练数据集数据量大于纠纷事件实体关系抽取验证数据集数据量;
75.在本实施例中,获取采集的第一纠纷事件数据,将纠纷事件数据输入到训练好的命名实体识别模型提取人名,对提取的人名进行人工标注实体间的关系,构成纠纷事件实体关系抽取数据集,按照一定的比例r2将纠纷事件实体关系抽取数据集划分为纠纷事件实体关系抽取训练数据集和纠纷事件实体关系抽取验证数据集,其中纠纷事件实体关系抽取训练数据集数据的数目大于纠纷事件实体关系抽取验证数据集数据的数目,一般取r2为0.8,纠纷事件实体关系的类别包括15个类别,分别为夫妻关系、亲属关系、朋友关系、恋人关系、第三者关系、家校关系、师生关系、同学关系、医患关系、同事关系、雇佣关系、损害关系、邻里关系、买卖关系以及其他关系;
76.s15、将纠纷事件实体关系抽取训练数据集输入至第二预训练模型迭代训练多次形成实体关系抽取模型的初始版本;
77.在本实施例中,将纠纷事件实体关系抽取训练数据集输入到开源的预训练模型bert中进行训练,其中bert采用深层的双向transformer结构,其中,最后一个双向transformer结构的最后一层全连接层的数目为实体关系的类别数,即维度为15;
78.s16、将纠纷事件实体关系抽取验证数据集输入至实体关系抽取模型的初始版本进行预测纠正,直至准确率不再上升得到已训练的实体关系抽取模型;
79.在此步骤中,将纠纷事件实体关系抽取训练数据迭代训练m次后,将纠纷事件实体关系抽取验证数据输入到迭代训练m次的纠纷事件实体关系抽取模型进行预测,获得预测结果,与标签进行比对,若一致则正确,否则错误,计算准确率;反复操作s15-s16后,当损失函数不在下降,准确率不再上升,则停止训练,获取纠纷事件实体关系抽取模型(已训练完成的纠纷事件实体关系抽取模型);
80.s20、根据第一纠纷事件特征和第一实体关系特征获取纠纷事件和实体关系的关联性;
81.在本实施例中,将第一纠纷事件特征和第一实体关系特征通过输入到纠纷事件文本特征和实体关系特征注意力模块获取纠纷事件和实体关系的关联性,该纠纷事件文本特征和实体关系特征注意力模块使用步骤包括:
82.s21、如图4-6所示,将第一纠纷事件特征和第一实体关系特征输入至第一多层感知机mlp1映射至相同的语义空间,得到相同语义空间的第二纠纷事件文本特征和第二实体关系特征;
83.在本实施例中,由于第一纠纷事件文本特征和第一实体关系特征是从两个独立的网络获取,具有不同的语义空间,将第一纠纷事件特征和第一实体关系特征通过多层感知机mlp1映射到相同的语义空间,可更好地获取纠纷事件的类别和实体关系的关联性,因此映射公式如下:
84.e2=mlp1(e1);r2=mlp1(r1);
85.其中,mlp1表示第一多层感知机,由n1层全连接层组成;e1表示第一纠纷事件文本特征,e2表示第二纠纷事件文本特征;r1表示第一实体关系特征,r2表示第二实体关系特征;
86.s22、将第二纠纷事件文本特征和第二实体关系特征拼接并输入至第二多层感知机获取纠纷事件和实体关系的关联性;
87.在本实施例中,第二纠纷事件文本特征和第二实体关系特征先经过concat层进行拼接,再将拼接后的结果输入到第二多层感知机mlp2获取纠纷事件的类别和实体关系的关联性,如下公式所示:
88.γ=mlp2([e2,r2])=σ(mlp([e2,r2]));
[0089]
其中,mlp2表示第二多层感知机,由n2层全连接层和sigmod激活函数层组成;γ表示纠纷事件的类别和实体关系的关联性;e2表示第二纠纷事件文本特征;r2表示第二实体关系特征;[e2,r2]表示concat层对第二纠纷事件文本特征和第二实体关系特征进行拼接;mlp表示多层感知机,由n2层全连接层组成;σ表示sigmod激活函数;
[0090]
s30、根据纠纷事件和实体关系的关联性获取包含纠纷事件类别和实体关系关联性的纠纷事件特征;
[0091]
在本实施例中,纠纷事件和实体关系的关联性通过输入至纠纷事件特征和实体关系特征混合模块获取包含纠纷事件类别和实体关系关联性的纠纷事件特征,该纠纷事件特征和实体关系特征混合模块使用步骤包括:
[0092]
s31、将纠纷事件和实体关系的关联性乘以第一纠纷事件特征,得到包含纠纷事件类别和实体关系关联性的纠纷事件特征;
[0093]
在本实施例中,步骤s31中的公式如下:
[0094]
x=γe1;
[0095]
其中,γ表示纠纷事件的类别和实体关系的关联性;e1表示第一纠纷事件文本特征;x表示包含纠纷事件类别和实体关系关联性的纠纷事件特征;
[0096]
s40、将包含纠纷事件类别和实体关系关联性的纠纷事件特征后接纠纷事件分类层以获取纠纷事件的类别。
[0097]
在本实施例中以及下述实施例中,纠纷事件分类层包含全连接层和softmax层,全连接层的维度为类别数,将全连接层的输出经过softmax层,获取每个类别预测概率,选择概率值最大的类别,作为纠纷事件的类别,作用就是获取纠纷事件的类别。属于现有技术,具体原理不再进行赘述。
[0098]
在本实施例中以及下述实施例中,命名实体识别模型为开源模型bert,输入标注好的命名实体识别数据集进行微调训练得到命名实体识别模型,可以获取文本中的人名、地点、机构等,本技术仅需要提取文本中的人名。属于现有技术,具体原理不再进行赘述。
[0099]
实施例二
[0100]
基于相同的构思,本技术还提出了一种联合实体关系抽取的纠纷事件分类模型训练方法,如图2所示,包括以下步骤:
[0101]
s1、采集第二纠纷事件数据,标注该第二纠纷事件数据的类别;
[0102]
s2、将该第二纠纷事件数据输入到已训练的命名实体识别模型提取人名并构成联合实体关系抽取的纠纷事件数据集;
[0103]
s3、将该联合实体关系抽取的纠纷事件数据集按照设定比例划分为联合实体关系抽取的纠纷事件训练数据集和联合实体关系抽取的纠纷事件验证数据集,其中联合实体关系抽取的纠纷事件训练数据集数据量大于联合实体关系抽取的纠纷事件验证数据集数据量;
[0104]
在本实施例中,步骤s1-s3总结为采集第二纠纷事件数据,对第二纠纷事件数据进行人工标注纠纷事件的类别,其中,类别分别为损害赔偿纠纷、经济纠纷、房地产纠纷、劳动纠纷、邻里纠纷、婚姻家庭纠纷、征地拆迁纠纷、其他纠纷、其他,将采集的第二纠纷事件数据输入到训练好的命名实体识别模型提取人名,根据两两人名在纠纷事件句子中的前后位置分别标注为head和tail,构成联合实体关系抽取的纠纷事件数据集,将联合实体关系抽取的纠纷事件数据集按照一定的比例r3划分为联合实体关系抽取的纠纷事件训练数据集和联合实体关系抽取的纠纷事件验证数据集,其中联合实体关系抽取的纠纷事件训练数据集数据的数目大于联合实体关系抽取的纠纷事件验证数据集数据的数目,一般取r3为0.8;
[0105]
s4、将联合实体关系抽取的纠纷事件训练数据集分别输入到已训练的纠纷事件分类模型和已训练的实体关系抽取模型,提取第一纠纷事件特征和第一实体关系特征;
[0106]
s5、将第一纠纷事件特征和第一实体关系特征输入到纠纷事件文本特征和实体关
系特征注意力模块获取纠纷事件的类别和实体关系的关联性;
[0107]
s6、将纠纷事件的类别和实体关系的关联性输入到纠纷事件特征和实体关系特征混合模块得到包含纠纷事件类别和实体关系关联性的纠纷事件特征;
[0108]
s7、将包含纠纷事件类别和实体关系关联性的纠纷事件特征与纠纷事件分类层进行连接;
[0109]
在本实施例中,纠纷事件分类层为维度为9的全连接层,其中9为纠纷事件的类别数,纠纷事件分类层后面接softmax损失函数层;
[0110]
s8、将已训练的纠纷事件分类模型和已训练的实体关系抽取模型的参数进行固定并迭代训练多次得到联合实体关系抽取的纠纷事件分类模型的初始版本;
[0111]
s9、将联合实体关系抽取的纠纷事件验证数据集输入至联合实体关系抽取的纠纷事件分类模型的初始版本进行预测纠正,直至准确率不再上升得到已训练的联合实体关系抽取的纠纷事件分类模型。
[0112]
在本实施例中,训练过程中对训练好的纠纷事件分类模型和训练好的实体关系抽取模型的参数进行固定,迭代训练m次后,将联合实体关系抽取的纠纷事件验证数据集输入到迭代训练m次的联合实体关系抽取的纠纷事件分类模型进行预测,获取预测纠纷事件的类别,与类别标签进行比对,若一致则正确,否则错误,计算准确率;重复执行s5-s9,当损失函数不在下降,准确率不再上升,则停止训练,获取联合实体关系抽取的纠纷事件分类模型;
[0113]
在本实施例中以及下述实施例中,第一纠纷事件数据和第二纠纷事件数据可以是同一个数据也可以是不同数据,目的在于区分两个纠纷数据的名称。
[0114]
在本实施例中已训练的几个模型可以是实施例一中训练完成的模型。
[0115]
实施例三
[0116]
基于相同的构思,本技术还提出了一种联合实体关系抽取的纠纷事件分类装置,包括:
[0117]
采集模块,用于根据纠纷事件字段从纠纷事件库中获取纠纷事件内容;
[0118]
命名实体识别模块,用于根据纠纷事件内容获取纠纷事件内容涉及的人名;
[0119]
纠纷事件分类模型,用于根据纠纷事件内容获取第一纠纷事件特征;
[0120]
实体关系抽取模型,用于根据纠纷事件内容和纠纷事件内容涉及的人名获取第一实体关系特征;
[0121]
纠纷事件文本特征和实体关系特征注意力模块,用于根据第一纠纷事件特征和第一实体关系特征获取纠纷事件和实体关系的关联性;
[0122]
纠纷事件特征和实体关系特征混合模块,用于根据纠纷事件和实体关系的关联性获取包含纠纷事件类别和实体关系关联性的纠纷事件特征;
[0123]
处理模块,用于将包含纠纷事件类别和实体关系关联性的纠纷事件特征后接纠纷事件分类层以获取纠纷事件的类别。
[0124]
实施例四
[0125]
本实施例还提供了一种电子装置,参考图7,包括存储器404和处理器402,该存储器404中存储有计算机程序,该处理器402被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
[0126]
具体地,上述处理器402可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,简称为asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0127]
其中,存储器404可以包括用于数据或指令的大容量存储器404。举例来说而非限制,存储器404可包括硬盘驱动器(harddiskdrive,简称为hdd)、软盘驱动器、固态驱动器(solidstatedrive,简称为ssd)、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,简称为usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器404可包括可移除或不可移除 (或固定)的介质。在合适的情况下,存储器404可在数据处理装置的内部或外部。在特定实施例中,存储器404是非易失性(non-volatile)存储器。在特定实施例中,存储器404包括只读存储器(read-onlymemory,简称为rom) 和随机存取存储器(randomaccessmemory,简称为ram)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(programmableread-onlymemory,简称为prom)、可擦除prom(erasableprogrammableread-onlymemory,简称为eprom)、电可擦除prom(electricallyerasableprogrammableread-onlymemory,简称为eeprom)、电可改写rom(electricallyalterableread-only memory,简称为earom)或闪存(flash)或者两个或更多个以上这些的组合。在合适的情况下,该ram可以是静态随机存取存储器(staticrandom-acc essmemory,简称为sram)或动态随机存取存储器(dynamicrandomaccessmemory,简称为dram),其中,dram可以是快速页模式动态随机存取存储器404(fastpagemodedynamicrandomaccessmemory,简称为fpmdram)、扩展数据输出动态随机存取存储器(extendeddateoutdynamicrandomaccessmemory,简称为edodram)、同步动态随机存取内存(synchronousdynamicrandom-accessmemory,简称sdram)等。
[0128]
存储器404可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器402所执行的可能的计算机程序指令。
[0129]
处理器402通过读取并执行存储器404中存储的计算机程序指令,以实现上述实施例中的任意联合实体关系抽取的纠纷事件分类方法。
[0130]
可选地,上述电子装置还可以包括传输设备406以及输入输出设备408,其中,该传输设备406和上述处理器402连接,该输入输出设备408和上述处理器402连接。
[0131]
传输设备406可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备406可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
[0132]
输入输出设备408用于输入或输出信息。在本实施例中,输入的信息可以是纠纷事件等,输出的信息可以是纠纷事件的类别等。
[0133]
实施例五
[0134]
本实施例还提供了一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序包括用于控制过程以执行过程的程序代码,过程包括根据实施例一的联合实体关系抽取的纠纷事件分类方法。
[0135]
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所
描述的示例,本实施例在此不再赘述。
[0136]
通常,各种实施例可以以硬件或专用电路、软件、逻辑或其任何组合来实现。本发明的一些方面可以以硬件来实现,而其他方面可以以可以由控制器、微处理器或其他计算设备执行的固件或软件来实现,但是本发明不限于此。尽管本发明的各个方面可以被示出和描述为框图、流程图或使用一些其他图形表示,但是应当理解,作为非限制性示例,本文中描述的这些框、装置、系统、技术或方法可以以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或其某种组合来实现。
[0137]
本发明的实施例可以由计算机软件来实现,该计算机软件由移动设备的数据处理器诸如在处理器实体中可执行,或者由硬件来实现,或者由软件和硬件的组合来实现。包括软件例程、小程序和/或宏的计算机软件或程序(也称为程序产品)可以存储在任何装置可读数据存储介质中,并且它们包括用于执行特定任务的程序指令。计算机程序产品可以包括当程序运行时被配置为执行实施例的一个或多个计算机可执行组件。一个或多个计算机可执行组件可以是至少一个软件代码或其一部分。另外,在这一点上,应当注意,如图中的逻辑流程的任何框可以表示程序步骤、或者互连的逻辑电路、框和功能、或者程序步骤和逻辑电路、框和功能的组合。软件可以存储在诸如存储器芯片或在处理器内实现的存储块等物理介质、诸如硬盘或软盘等磁性介质、以及诸如例如dvd及其数据变体、cd等光学介质上。物理介质是非瞬态介质。
[0138]
本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0139]
以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以作出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1