用于争议焦点裁判文书的筛选的模型的训练方法与流程

文档序号:29914250发布日期:2022-05-06 03:13阅读:98来源:国知局
用于争议焦点裁判文书的筛选的模型的训练方法与流程

1.本技术涉及文本处理技术领域,更为具体地说,涉及一种用于争议焦点裁判文书的筛选的模型的训练方法、争议焦点裁判文书的筛选方法、装置和电子设备。


背景技术:

2.随着法律行业信息化建设的不断深入,不仅需要对海量数据的采集和治理,更需要计算机自动对法律文书进行处理。在法律文书的处理中,争议焦点是由法律专业工作者根据诉讼状和答辩状中诉辩双方各自的陈述所归纳总结的关键信息,争议焦点能够体现案件的分歧点和本身所聚焦的问题,关于争议焦点的归纳与总结通常需要较强的专业知识和领域经验,同时也耗费大量的精力。并且,由于并非所有裁判文书都包含争议焦点,所以在研究争议焦点问题时首先需要从大量文书中筛选包含争议焦点的文书。
3.在中国专利cn107291688a中提出了一种法律裁判文书的文书筛选方法,该发明公开了一种基于主题模型的裁判文书相似度分析方法。该方法采用机器学习中的lda(latent dirichlet allocation)主题模型,针对裁判文书,提出一种基于语义的、半自动化的、通用的相似度分析方法。该方法在一般相似度分析方法的基础上,充分考虑裁判文书内容上专业词汇丰富、语义复杂的特点,利用裁判文书半结构化的特性,从而提升了裁判文书相似度分析的准确性和适用性。
4.在中国专利cn113282726a中公开了一种数据处理方法及系统及装置及介质及数据分析方法,涉及自然语言处理领域,包括:从裁判文书库中筛选出包含预设类型犯罪的裁判文书数据;提取所述裁判文书数据信息中的案情事实数据;建立图神经网络,将所述案情事实数据输入所述图神经网络;在所述图神经网络的节点位置抽取实体信息数据、实体间的关系数据和事件序列信息数据,并转换为结果数据输出,所述结果数据包括(实体1,关系,实体2)三元组和裁判文书所属的犯罪类型;该发明得到的分析统计结果是基于裁判文书库中预设犯罪类型的全量裁判文书数据;通过深度学习的方法进行启发式的信息抽取,使得统计的维度更全面,不易受人为干扰。
5.争议焦点裁判文书的筛选本质上是一个文本分类问题,即通过模型判断一篇裁判文书是否具有争议焦点。当前裁判文书的文本分类主要通过自然语言处理技术中的神经网络模型进行识别,这种方法通常需要大量的标注数据,模型识别的效果依赖于标注数据的数量和质量。但在争议焦点裁判文书的筛选问题中,由于争议焦点的标注需要耗费大量精力,只有少量已进行标注的正样本和大量未标记的样本可用。
6.因此,期望提供改进的争议焦点裁判文书的筛选方案。


技术实现要素:

7.为了解决上述技术问题,提出了本技术。本技术的实施例提供了一种用于争议焦点裁判文书的筛选的模型的训练方法、争议焦点裁判文书的筛选方法、装置和电子设备,其基于正未标注策略,从已有的少量标注文书构建文书级别的争议焦点特征,并使用支持向
量机模型从大量无标签文书中识别具有争议焦点的裁判文书,从而改进争议焦点裁判文书的筛选方案。
8.根据本技术的一方面,提供了一种用于争议焦点裁判文书的筛选的模型的训练方法,包括:获取训练裁判文书,所述训练裁判文书包含小部分已标注样本和大部分未标注样本;对所述训练裁判文书进行文本预处理和段落抽取;从所述训练裁判文书构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量;以及,使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型,所述支持向量机模型用于将裁判文书分类为是否包含争议焦点。
9.在上述用于争议焦点裁判文书的筛选的模型的训练方法中,所述文本预处理包括数字统一转换和/或标点符号统一。
10.在上述用于争议焦点裁判文书的筛选的模型的训练方法中,所述段落抽取包括通过文书分段模型从所述训练裁判文书中抽取对应的裁判分析过程段和辩护段。
11.在上述用于争议焦点裁判文书的筛选的模型的训练方法中,从所述训练裁判文书构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量包括:基于裁判文书是否包含争议焦点的段落类型和段落长度,确定与争议焦点具有大于预定阈值的相关度的文书段落;以及,基于通过对争议焦点的句子进行分析和统计而获得的关键词和所述文书段落构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量。
12.在上述用于争议焦点裁判文书的筛选的模型的训练方法中,所述第一特征向量和所述第二特征向量包括如下特征及其权重:裁判文书的段落个数,裁判分析过程段的长度,辩护段落的长度,裁判分析过程段中说理特征词的个数,辩护段落中说理特征词的个数
13.在上述用于争议焦点裁判文书的筛选的模型的训练方法中,使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型包括:步骤1,将所述第一特征向量作为正特征向量并将所述第二特征向量作为负特征向量;步骤2,基于所述正特征向量和所述负特征向量确定所述支持向量机模型的几何间隔最大的分离超平面;步骤3,确定与所述正特征向量在所述分离超平面同一侧的候选负特征向量;步骤4,将所述候选负特征向量中距离所述分离超平面大于预定距离阈值的候选负特征向量转换为正特征向量;以及,步骤5,迭代所述步骤2到步骤4,直到不再转换正特征向量为止。
14.在上述用于争议焦点裁判文书的筛选的模型的训练方法中,在使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型之前进一步包括:基于所述已标注文本的第一特征向量,从未标注样本从选择具有与所述第一特征向量相似的特征分布的样本作为所述已标注样本。
15.根据本技术的另一方面,提供了一种争议焦点裁判文书的筛选方法,包括:获取待筛选的未标注的裁判文书;使用如上所述的用于争议焦点裁判文书的筛选的模型获得所述待筛选的未标注的裁判文书对应的特征向量与所述支持向量机的所述分离超平面的距离值;以及,基于所述距离值作为所述待筛选的未标注的裁判文书包含争议焦点的置信度,来对所述裁判文书进行是否包含争议焦点的筛选。
16.根据本技术的再一方面,提供了一种用于争议焦点裁判文书的筛选的模型的训练装置,包括:样本获取单元,用于获取训练裁判文书,所述训练裁判文书包含小部分已标注
样本和大部分未标注样本;预处理单元,用于对所述训练裁判文书进行文本预处理和段落抽取;特征提取单元,用于从所述训练裁判文书构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量;以及,模型训练单元,用于使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型,所述支持向量机模型用于将裁判文书分类为是否包含争议焦点。
17.根据本技术的又一方面,提供了一种争议焦点裁判文书的筛选装置,包括:文书获取单元,用于获取待筛选的未标注的裁判文书;距离确定单元,用于使用如上所述的用于争议焦点裁判文书的筛选的模型获得所述待筛选的未标注的裁判文书对应的特征向量与所述支持向量机的所述分离超平面的距离值;以及,文书筛选单元,用于基于所述距离值作为所述待筛选的未标注的裁判文书包含争议焦点的置信度,来对所述裁判文书进行是否包含争议焦点的筛选。
18.根据本技术的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在所述处理器运行时使得所述处理器执行如上所述的用于争议焦点裁判文书的筛选的模型的训练方法或者如上所述的争议焦点裁判文书的筛选方法。
19.根据本技术的又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,当所述计算机程序指令被计算装置执行时,可操作来执行如上所述的用于争议焦点裁判文书的筛选的模型的训练方法或者如上所述的争议焦点裁判文书的筛选方法。
20.本技术的实施例提供的用于争议焦点裁判文书的筛选的模型的训练方法、争议焦点裁判文书的筛选方法、装置和电子设备,能够基于正未标注策略,从已有的少量标注文书构建文书级别的争议焦点特征,并使用支持向量机模型从大量无标签文书中识别具有争议焦点的裁判文书,从而改进争议焦点裁判文书的筛选方案。
附图说明
21.通过阅读下文优选的具体实施方式中的详细描述,本技术各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。显而易见地,下面描述的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。而且在整个附图中,用相同的附图标记表示相同的部件。
22.图1图示了根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法的流程图;
23.图2图示了根据本技术实施例的争议焦点裁判文书的筛选方法的流程图;
24.图3图示了根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练装置的框图;
25.图4图示了根据本技术实施例的争议焦点裁判文书的筛选装置的框图;
26.图5图示了根据本技术实施例的电子设备的框图。
具体实施方式
27.下面,将参考附图详细地描述根据本技术的示例实施例。显然,所描述的实施例仅仅是本技术的一部分实施例,而不是本技术的全部实施例,应理解,本技术不受这里描述的示例实施例的限制。
28.示例性方法
29.图1图示了根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法的流程图。
30.如图1所示,根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法包括以下步骤。
31.s110,获取训练裁判文书,所述训练裁判文书包含小部分已标注样本和大部分未标注样本。也就是,如上所述,由于争议焦点的标注需要耗费大量精力,因此只有少量已进行标注的样本和大量未标记的样本可用,因此,在本技术实施例中,所述训练裁判文书包含小部分已标注样本和大部分未标注样本,例如,其中已标注的样本占总样本比例小于5%。并且,本领域技术人员可以理解,已标注样本是已经标注了争议焦点的裁判文书。
32.这里,基于法律裁判文书处理领域的专业知识,争议焦点是法官归纳的关于证据事实和法律适用争议的关键问题,既是庭审的主要内容也是制作裁判文书的主线。争议焦点关系到裁判文书说理的着力点,一篇文章争议焦点归纳的到位,裁判文书说理就有了明确的目标和方向;反之,争议焦点归纳不准确或者不到位,裁判文书就有可能说理偏颇、无的放矢。
33.争议焦点是当事人之间产生纠纷之后需要解决的主要问题,其首先是一个问题,具体而言,包括引起争议的事实、证据、法律规定、责任等方面的主要问题。既然是问题,即可以用“是否”、“如何”等语言进行描述,例如“合同是否生效”、“是否构成侵权”、“如何确定责任”等,这也是司法实践中的裁判文书中常见的表达方式,也是机器自动识别裁判文书中是否存在争议焦点的重要参考。
34.s120,对所述训练裁判文书进行文本预处理和段落抽取。这里,文本预处理主要是对文本进行异常处理,包括数字的统一转换,标点符号统一。而段落抽取则是通过文书分段模型,从裁判文书中抽取对应的裁判分析过程段和辩护段。
35.因此,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,所述文本预处理包括数字统一转换和/或标点符号统一。
36.以及,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,所述段落抽取包括通过文书分段模型从所述训练裁判文书中抽取对应的裁判分析过程段和辩护段。
37.s130,从所述训练裁判文书构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量。也就是,基于法律裁判文书处理领域的专业知识,并非所有的案件都必然要归纳争议焦点。一般而言,除了被告全部认可原告主张的事实和诉讼请求之外,原告、被告有诉有辩也就必然会有争议分歧,也就必然有争议焦点。但是,在裁判文书中,并非所有的争议都要归纳成争议焦点进行论述。因此,争议焦点的主要特征一般出现在对应的辩护段落和裁判分析段落,通过对已经标注的争议焦点裁判文书进行观察和分析,发现裁判文书中某些段落的段落类型和段落长度决定了裁判文书中是否存在争议焦点。具体来说,
如果一篇文书存在辩护段落,说明被告一方提出了辩护理由,这篇文书很可能存在争议焦点的表述。而针对裁判分析过程段,如果段落长度较长,表明案情较为复杂,文书对于案情分析过程的表述较长,所以存在争议焦点的可能性也较大。因此,存在辩护段落和段落长度大于预定阈值的段落可以认为是存在争议焦点的裁判文书的特征。
38.此外通过对争议焦点句子的分析和统计,总结了多个说理关键词,主要包括一些裁判文书中常出现的转折词和承接词例如“虽然、但是、即使、因此”等,也就是,特定段落中这些关键词的个数在一定程度上决定了裁判文书中是否存在争议焦点的相关表述。因此,可以将这些关键词作为存在争议焦点的裁判文书的特征。
39.这样,通过段落特征和关键词特征,在本技术实施例中,对不同案由的裁判文书,所构建的特征都是与案由无关的,因此可以在少量标注的基础上,通过半监督学习的方法,寻找未标注数据中得分较高的样例作为正例。
40.在一个示例中,文书级别的争议焦点特征主要包括:裁判文书的段落个数,裁判分析过程段的长度,辩护段落的长度,裁判分析过程段中说理特征词的个数,辩护段落中说理特征词的个数。
41.并且,针对这些特征,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,还可以通过模型来学习特征权重。也就是,在模型学习的过程中,首先将未标注文本当作负例,已标注的文本当作正例,提取特征,进行第一阶段的模型训练,待模型收敛之后,模型收敛之后会自动学习特征权重。这样,通过以上提取出的特征和特征相应的权重,就可以构建每个样本数据的用于分类的特征向量。
42.因此,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,从所述训练裁判文书构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量包括:基于裁判文书是否包含争议焦点的段落类型和段落长度,确定与争议焦点具有大于预定阈值的相关度的文书段落;以及,基于通过对争议焦点的句子进行分析和统计而获得的关键词和所述文书段落构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量。
43.并且,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,所述第一特征向量和所述第二特征向量包括如下特征及其权重:裁判文书的段落个数,裁判分析过程段的长度,辩护段落的长度,裁判分析过程段中说理特征词的个数,辩护段落中说理特征词的个数。
44.s140,使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型,所述支持向量机模型用于将裁判文书分类为是否包含争议焦点。
45.具体地,正未标记学习(positive-unlabeled learning:pu learning)是半监督学习的一个研究方向,指在只有正类和无标记数据的情况下,训练分类器,在数据检索、异常检测、序列数据监测等领域具有广泛应用。在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,基于pu-learning策略,将正样本和未标记样本分别看作是正样本和负样本,然后利用这些数据训练一个支持向量机。该支持向量机可以为每个裁判文书打一个分数,通常正样本分数高于负样本的分数,因此对于那些未标记的样本,分数较高的最有可能为正样本。
46.也就是,支持向量机(svm)本质上是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,它还包括核技巧,这使它成为实质上的非线性分类器。svm的学习策略是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。svm的学习算法就是求解凸二次规划的最优化算法。svm学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。对于线性可分的数据集来说,这样的超平面有无穷多个(即感知机),但是几何间隔最大的分离超平面却是唯一的。
47.因此,在本技术实施例中,在训练过程中,主要关注那些被分离超平面划分到已标注具有争议焦点的裁判文书的特征向量在同一侧的未标注的裁判文书的特征向量。将这些裁判文书中距离超平面较远文书加入到已标注的数据中,再以相同的方法继续训练下一轮,循环多次后,当没有新增加的争议焦点裁判文书时,则筛选模型趋于稳定,可以用于预测其他同类裁判文书是否包含争议焦点。
48.也就是,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型包括:步骤1,将所述第一特征向量作为正特征向量并将所述第二特征向量作为负特征向量;步骤2,基于所述正特征向量和所述负特征向量确定所述支持向量机模型的几何间隔最大的分离超平面;步骤3,确定与所述正特征向量在所述分离超平面同一侧的候选负特征向量;步骤4,将所述候选负特征向量中距离所述分离超平面大于预定距离阈值的候选负特征向量转换为正特征向量;以及,迭代所述步骤2到步骤4,直到不再转换正特征向量为止。
49.另外,在训练根据本技术实施例的用于争议焦点裁判文书的筛选的模型时,也可以仅使用未标注文本进行训练。也就是,由于未标注文本中实际上存在一些正例,在之前的模型训练过程中,模型会通过在正例中学到的正例独有的特征分布,在预测时,可以识别到未标注文本中存在的一些正例,然后这些正例加入到已标注文本中,再进行下一阶段的训练。这个过程循环多次,经过一定轮次的训练,达到一种稳定的状态,模型无法再从未标注的数据中找到与正例相似的数据,就得到用于识别争议焦点的模型。
50.因此,在根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练方法中,在使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型之前进一步包括:基于所述已标注文本的第一特征向量,从未标注样本从选择具有与所述第一特征向量相似的特征分布的样本作为所述已标注样本。
51.并且,基于以上所述的用于争议焦点裁判文书的筛选的模型的训练方法,本技术实施例提供一种争议焦点裁判文书的筛选方法。
52.图2图示了根据本技术实施例的争议焦点裁判文书的筛选方法的流程图。
53.如图2所示,根据本技术实施例的争议焦点裁判文书的筛选方法包括以下步骤。
54.s210,获取待筛选的未标注的裁判文书。
55.s220,使用如上所述的用于争议焦点裁判文书的筛选的模型获得所述待筛选的未标注的裁判文书对应的特征向量与所述支持向量机的所述分离超平面的距离值;以及
56.s230,基于所述距离值作为所述待筛选的未标注的裁判文书包含争议焦点的置信度,来对所述裁判文书进行是否包含争议焦点的筛选。
57.示例性装置
58.图3图示了根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练装置的框图。
59.如图3所示,根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练装置300包括:样本获取单元310,用于获取训练裁判文书,所述训练裁判文书包含小部分已标注样本和大部分未标注样本;预处理单元320,用于对所述训练裁判文书进行文本预处理和段落抽取;特征提取单元330,用于从所述训练裁判文书构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量;以及,模型训练单元340,用于使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型,所述支持向量机模型用于将裁判文书分类为是否包含争议焦点。
60.在一个示例中,在上述用于争议焦点裁判文书的筛选的模型的训练装置200中,所述预处理单元320用于进行数字统一转换和/或标点符号统一。
61.在一个示例中,在上述用于争议焦点裁判文书的筛选的模型的训练装置200中,所述预处理单元320用于通过文书分段模型从所述训练裁判文书中抽取对应的裁判分析过程段和辩护段。
62.在一个示例中,在上述用于争议焦点裁判文书的筛选的模型的训练装置200中,所述特征提取单元330用于:基于裁判文书是否包含争议焦点的段落类型和段落长度,确定与争议焦点具有大于预定阈值的相关度的文书段落;以及,基于通过对争议焦点的句子进行分析和统计而获得的关键词和所述文书段落构建所述已标注样本的第一特征向量和所述未标注样本的第二特征向量。
63.在一个示例中,在上述用于争议焦点裁判文书的筛选的模型的训练装置200中,所述第一特征向量和所述第二特征向量包括如下特征及其权重:裁判文书的段落个数,裁判分析过程段的长度,辩护段落的长度,裁判分析过程段中说理特征词的个数,辩护段落中说理特征词的个数
64.在一个示例中,在上述用于争议焦点裁判文书的筛选的模型的训练装置200中,所述模型训练单元340用于执行以下步骤:步骤1,将所述第一特征向量作为正特征向量并将所述第二特征向量作为负特征向量;步骤2,基于所述正特征向量和所述负特征向量确定所述支持向量机模型的几何间隔最大的分离超平面;步骤3,确定与所述正特征向量在所述分离超平面同一侧的候选负特征向量;步骤4,将所述候选负特征向量中距离所述分离超平面大于预定距离阈值的候选负特征向量转换为正特征向量;以及,步骤5,迭代所述步骤2到步骤4,直到不再转换正特征向量为止。
65.在一个示例中,在上述用于争议焦点裁判文书的筛选的模型的训练装置200中,所述模型训练单元340进一步用于:在使用正未标记学习策略,将所述已标注样本作为正样本并将所述未标注样本作为负样本训练支持向量机模型之前,基于所述已标注文本的第一特征向量,从未标注样本从选择具有与所述第一特征向量相似的特征分布的样本作为所述已标注样本。
66.图4图示了根据本技术实施例的争议焦点裁判文书的筛选装置的框图。
67.如图4所示,根据本技术实施例的争议焦点裁判文书的筛选装置400包括:文书获取单元410,用于获取待筛选的未标注的裁判文书;距离确定单元420,用于使用如上所述的
用于争议焦点裁判文书的筛选的模型获得所述待筛选的未标注的裁判文书对应的特征向量与所述支持向量机的所述分离超平面的距离值;以及,文书筛选单元430,用于基于所述距离值作为所述待筛选的未标注的裁判文书包含争议焦点的置信度,来对所述裁判文书进行是否包含争议焦点的筛选。
68.这里,本领域技术人员可以理解,上述用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400中的各个单元和模块的具体功能和操作已经在上面参考图1和图2描述的用于争议焦点裁判文书的筛选的模型的训练方法和争议焦点裁判文书的筛选方法中详细介绍,并因此,将省略其重复描述。
69.如上所述,根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400可以实现在各种终端设备中,例如用于处理法律裁判文书的服务器中。在一个示例中,根据本技术实施例的用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400可以作为一个软件模块和/或硬件模块而集成到所述终端设备中。例如,该用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400同样可以是该终端设备的众多硬件模块之一。
70.替换地,在另一示例中,该用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400与该终端设备也可以是分立的设备,并且该用于争议焦点裁判文书的筛选的模型的训练装置300和争议焦点裁判文书的筛选装置400可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
71.示例性电子设备
72.下面,参考图5来描述根据本技术实施例的电子设备。
73.图5图示了根据本技术实施例的电子设备的框图。
74.如图5所示,电子设备10包括一个或多个处理器11和存储器12。
75.处理器11可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
76.存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本技术的各个实施例的用于争议焦点裁判文书的筛选的模型的训练方法和争议焦点裁判文书的筛选方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如裁判文书,已提取的特征等各种内容。
77.在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
78.例如,该输入装置13可以是例如键盘、鼠标等等。
79.该输出装置14可以向外部输出各种信息,例如裁判文书的筛选结果等。该输出设
备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
80.当然,为了简化,图5中仅示出了该电子设备10中与本技术有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
81.示例性计算机程序产品和计算机可读存储介质
82.除了上述方法和设备以外,本技术的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的用于争议焦点裁判文书的筛选的模型的训练方法和争议焦点裁判文书的筛选方法中的步骤。
83.所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本技术实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
84.此外,本技术的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的用于争议焦点裁判文书的筛选的模型的训练方法和争议焦点裁判文书的筛选方法中的步骤。
85.所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
86.以上结合具体实施例描述了本技术的基本原理,但是,需要指出的是,在本技术中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本技术的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本技术为必须采用上述具体的细节来实现。
87.本技术中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
88.还需要指出的是,在本技术的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本技术的等效方案。
89.提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本
申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本技术的范围。因此,本技术不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
90.为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本技术的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1