本技术涉及人工智能,尤其是一种证据与事实关联图谱构建方法、装置、设备及介质。
背景技术:
1、对证据与事实进行关联是司法实践的核心环节,要求法官对案件相关材料进行深入分析,确定事实的真实性,并据此作出公正的裁决。这一过程涉及对大量文档、口供、物证等证据的收集、整理和评估,以确保法律判决的准确性和公正性。
2、目前,对证据与事实进行关联的方法依赖人工操作,人工分析过程耗时耗力,其次人工分析容易受到主观判断和认知偏见的影响,可能导致判决的不公正或不准确。此外,传统方法难以处理复杂的数据类型,如电子证据、大数据等,限制了法律实践的发展。
技术实现思路
1、本技术的目的是提供一种证据与事实关联图谱构建方法、装置、设备及介质,可以准确提取待关联证据和案件事实之间的复杂关系,降低人为错误和偏见的干扰。
2、本技术实施例提供一种证据与事实关联图谱构建方法,包括:
3、对法律文件和待关联证据进行向量化处理,得到文本向量和证据向量;
4、利用预训练的识别模型,对所述文本向量进行信息抽取和特征识别处理,以输出相应的主张向量;所述主张向量包含法律主张信息或事实主张信息;
5、利用预训练的分析模型,对诉讼关系图进行注意力权重更新处理,得到注意力权重,依据所述注意力权重对所述证据向量和所述主张向量进行相关性评分处理,得到相关性评分结果;所述诉讼关系图由所述证据向量和所述主张向量构成,所述预训练的识别模型和所述预训练的分析模型通过梯度下降法和相关性训练数据联合训练得到,所述相关性训练数据为具有表征所述证据向量和所述主张向量的相关性的标签信息的训练数据;
6、依据所述相关性评分结果,生成相应的关联图谱。
7、在一些实施例中,所述对法律文件和待关联证据进行向量化处理,得到文本向量和证据向量,包括:
8、对所述法律文件依次进行文本抽取处理,得到文件文本,对所述文件文本进行向量化处理,得到文本向量;
9、对所述待关联证据进行文本转换处理,得到证据文本,向所述证据文本配置标识符并进行向量化处理,得到证据向量。
10、在一些实施例中,所述预训练的识别模型包括bert模型和线性映射层;
11、所述利用预训练的识别模型,对所述文本向量进行信息抽取和特征识别处理,以输出相应的主张向量,包括:
12、利用所述bert模型,基于多头注意力机制和前馈神经网络,对所述文本向量进行文本特征抽取处理,输出文本特征向量;
13、利用所述线性映射层,对所述文本特征向量进行线性映射分类处理,得到所述文本特征向量的分类结果,依据所述分类结果对所述文本特征向量进行向量转换表示处理,输出所述主张向量。
14、在一些实施例中,所述利用预训练的分析模型,对诉讼关系图进行注意力权重更新处理,得到注意力权重,依据所述注意力权重对所述证据向量和所述主张向量进行相关性评分处理,得到相关性评分结果,包括:
15、以所述证据向量作为第一节点,以所述主张向量作为第二节点,以所述第一节点和所述第二节点组合构建边,生成所述诉讼关系图;
16、将所述诉讼关系图输入至所述预训练的分析模型,通过自注意力机制更新所述边的权重,得到更新后的边;所述更新后的边的权重被更新为所述注意力权重,所述预训练的分析模型由图注意力网络训练得到;
17、对所述更新后的边的权重进行归一化处理,得到归一化权重;
18、计算各所述归一化权重的平均值,得到相关性评分结果;所述相关性评分结果表征所述第一节点和所述第二节点的相关性。
19、在一些实施例中,所述分析模型的函数表达式为:
20、,
21、其中,eupdated为更新后的边,g为诉讼关系图,einit为更新前的边;
22、所述相关性评分结果的计算表达式为:
23、,
24、其中,r为相关性评分结果,we为更新后的边的权重。
25、在一些实施例中,所述依据所述相关性评分结果,生成相应的关联图谱,包括:
26、依据所述相关性评分结果,对所述待关联证据进行显著相关性筛选和排序处理,得到强相关证据文本;
27、对所述法律文件进行文本提取处理,得到案情文本;所述案情文本描述对应诉讼案件的案件背景和相关法律问题;
28、依据所述强相关证据文本所对应的相关性评分结果,生成评述文本;所述评述文本描述所述强相关证据文本对诉讼案件事实的影响;
29、将所述强相关证据文本、所述案情文本和所述评述文本分别导入至预设的图谱模板中相应的位置,以生成所述关联图谱。
30、在一些实施例中,在所述对法律文件和待关联证据进行向量化处理,得到文本向量和证据向量之前,还包括:
31、获取待训练的识别模型、待训练的分析模型和所述相关性训练数据;
32、对样本文件和样本证据进行向量化处理,得到样本文本向量和样本证据向量;
33、利用所述待训练的识别模型,对所述样本文本向量进行信息抽取和特征识别处理,以输出相应的样本主张向量;
34、利用所述待训练的分析模型,对所述样本证据向量和所述样本主张向量的关系进行注意力权重更新处理,得到样本注意力权重,依据所述样本注意力权重对所述样本证据向量和所述样本主张向量进行相关性评分处理,得到样本相关性评分结果;
35、依据模型损失信息,采用梯度下降法调整所述待训练的识别模型的权重参数和所述待训练的分析模型的权重参数,在所述模型损失信息符合结束条件时,得到所述预训练的识别模型和所述预训练的分析模型;所述模型损失信息表征所述相关性训练数据和所述样本相关性评分结果两者对于所述样本证据向量和所述样本主张向量的相关性描述的匹配程度。
36、本技术实施例还提供一种证据与事实关联图谱构建装置,包括:
37、第一模块,用于对法律文件和待关联证据进行向量化处理,得到文本向量和证据向量;
38、第二模块,用于利用预训练的识别模型,对所述文本向量进行信息抽取和特征识别处理,以输出相应的主张向量;所述主张向量包含法律主张信息或事实主张信息;
39、第三模块,用于利用预训练的分析模型,对诉讼关系图进行注意力权重更新处理,得到注意力权重,依据所述注意力权重对所述证据向量和所述主张向量进行相关性评分处理,得到相关性评分结果;所述诉讼关系图由所述证据向量和所述主张向量构成,所述预训练的识别模型和所述预训练的分析模型通过梯度下降法和相关性训练数据联合训练得到,所述相关性训练数据为具有表征所述证据向量和所述主张向量的相关性的标签信息的训练数据;
40、第四模块,用于依据所述相关性评分结果,生成相应的关联图谱。
41、本技术实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的证据与事实关联图谱构建方法。
42、本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的证据与事实关联图谱构建方法。
43、本技术的有益效果:利用深度语言模型,对由法律文件向量化得到的文本向量进行信息抽取和特征识别处理,以获取包含法律主张信息或事实主张信息的主张向量,利用图神经网络等技术,对由主张向量和由待关联证据向量化得到的证据向量构成的诉讼关系图进行注意力权重更新处理,得到注意力权重,再依据注意力权重对证据向量和主张向量进行相关性评分处理,得到相关性评分结果,从而可以确定各待关联证据与各事实主张两两之间是否存在显著性关系或者是确定各待关联证据与各法律主张两两之间是否存在显著性关系,从中选取与相关事实主张和/或法律主张具有显著性关系的待关联证据,生成相应的关联图谱,可以准确提取诉待关联证据和案件事实之间的复杂关系,降低人为错误和偏见的干扰。