一种基于对比学习的法律案例相似性匹配方法

文档序号:35058433发布日期:2023-08-06 18:45阅读:81来源:国知局
一种基于对比学习的法律案例相似性匹配方法

本发明属于深度学习,具体涉及一种基于对比学习的法律案例相似性匹配方法。


背景技术:

1、目前,法院需要处理的案件数量逐年增长,近些年以裁判文书为代表的大数据应用以及自然语言处理技术的持续突破,如何将人工智能技术应用在司法领域,提高司法人员在案件处理环节的效率逐渐成为法律科技研究的热点。在类案判决问题上,由于各个司法人员对案件的解读不一致,对法律裁判尺度的把握可能不同,“类案不同判”的问题得不到很好地解决。在这些相关应用的推动下,如何更好地提取法律文书语义特征对相似案例进行更加准确的匹配在法律领域中具有十分重要的研究意义。

2、相似案例匹配任务为了寻找相似的案件文本。对于此类法律文书匹配问题来说,传统处理方式需要经验丰富的法学领域专家进行解读,人工筛查耗时且昂贵,评判时易受人为因素影响,准确性不能得到保证。因此迫切希望通过近年来人工智能技术的发展来帮助解决这些难题。

3、从人工智能的技术角度看来,法律案例匹配任务属于自然语言处理中的文本相似性匹配问题。传统的文本相似度需要考虑词与词、句与句、段落与段落、篇章与篇章之间的相似度问题。相比于普通的文本匹配任务来说,法律案例匹配更加关注文本所表达的法律语义上相似。法律案件相似性比较需要对于整段的案件陈述综合理解的基础上来进行匹配,文本长度更长,法律背景知识要求更强,难度水平更加高。

4、早期的文本相似性比较中,通常采用词袋模型、n-grams模型、tf-idf等提取文本中的特征,然后结合支持向量机、朴素贝叶斯、k近邻等算法完成文本比较任务,传统的文本分类方法得到的文本表示往往是字词频率方面的规律,很难理解文本中的深层次语义信息。

5、近年来深度学习技术不断发展,尤其在自然语言处理中许多优秀的深度神经网络模型被提出,为文本相似性工作研究提供新的思路与方法。基于不同的处理方式,深度学习的文本匹配工作分为基于特征表示的文本匹配方法与基于特征交互的文本匹配方法。

6、基于特征表示的文本匹配方法一般采用双分支网络结构,对两段文本分别进行编码进而得到各自的向量表示,然后通过相似度计算函数来衡量得到最终的匹配关系。dssm通过搜索引擎里query和title的海量点击曝光日志,用深度神经网络把query和title表达为低维语义向量,并通过余弦距离来计算两个语义向量的距离,最终训练出语义相似度模型。lstm-dssm模型依然采用先前的架构,但将dssm中的mpl结构替换为lstm网络。siamese-lstm使用孪生神经网络用于文本相似性比较,将需要对比的两个文本分别通过不同的lstm进行编码,通过比较两个lstm的输出特征之间的曼哈顿距离来评估文本的相似性。siam-cnn网络中尝试了多种孪生架构,使用cnn作为基础编码器,将余弦距离来评估文本的相似性。arc网络能够很好地表示句子的层次结构,并且逐层合并,可以在不同层次捕捉到丰富的匹配模式。infersent网络也采用了双分支结构来提取文本特征,但在计算损失函数之前时对于生成的两个向量用了多种方式进行融合,再进入分类器评估相似性。

7、基于特征交互的文本匹配方法把待比较的两个文本一起输入进编码器,在编码的过程中让它们相互交换信息,再得到最终的相似结果。bimpm网络是经典的交互式模型,将两个文本用不同的bi-lstm模型分别编码,并通过注意力的方式让两个句子在编码过程中建立交互关系,从而学习到更深层次的匹配知识。matchpyramid网络通过两文本中tokenembedding间直接交互构造出匹配矩阵,然后将其视为图像进行2d卷积和2d池化,再通过mlp层计算得匹配分数。decatt网络将注意力机制引入到交互型文本匹配模型中,从而得到两个语句中token信息交互增强后的向量表征。

8、但是,目前用于文本的相似性比较方案所达到的判断效果不佳,进行相似性判断的准确度并不高。


技术实现思路

1、为了解决相关技术中存在的上述问题,本发明提供了一种基于对比学习的法律案例相似性匹配方法。本发明要解决的技术问题通过以下技术方案实现:

2、本发明提供一种基于对比学习的法律案例相似性匹配方法,包括:

3、获取基准案例和至少一个待匹配案例;

4、在所述基准案例和每个待匹配案例的预设位置进行文本内容采样,得到所述基准案例的基准采样文本、每个待匹配案例的待匹配采样文本;

5、将所述基准采样文本和所述待匹配采样文本输入预训练的特征提取网络中,得到所述基准采样文本的基准特征,以及每个待匹配采样文本的待匹配特征;所述预训练的特征提取网络是采用带有标签的多个不同的三元组和预设损失函数训练的;每个三元组包括基准案例样本、正案例样本和负案例样本,其中,所述基准案例样本与所述正案例样本为相似样本,所述基准案例样本与所述负案例样本为不相似样本;所述预设损失函数用于减小相似样本之间的特征距离,增大不相似样本之间的特征距离;

6、根据所述基准特征与各个待匹配特征之间的余弦相似度,从所述至少一个待匹配案例中选出与所述基准案例最相似的案例。

7、本发明具有如下有益技术效果:

8、通过多个三元组,以及用于减小相似样本之间的特征距离,增大不相似样本之间的特征距离的预设损失函数,进行特征提取网络的训练,并通过法律文本的特征之间的相关性来判断相似性,可以在对比学习中通过不同的多个样本之间作比对,从而可以让相似的法律文本相似度更加拉近,不相似的法律文本之间的距离更加远,最终提高了对法律文本的相似度的判断的准确性。

9、以下将结合附图及实施例对本发明做进一步详细说明。



技术特征:

1.一种基于对比学习的法律案例相似性匹配方法,其特征在于,包括:

2.根据权利要求1所述的基于对比学习的法律案例相似性匹配方法,其特征在于,在所述将所述基准采样文本和所述待匹配采样文本输入预训练的特征提取网络中,得到所述基准采样文本的基准特征,以及每个待匹配采样文本的待匹配特征之前,包括:

3.根据权利要求2所述的基于对比学习的法律案例相似性匹配方法,其特征在于,对每一个三元组样本中各个原始案例样本的所述采样文本进行组合的方式包括:

4.根据权利要求2所述的基于对比学习的法律案例相似性匹配方法,其特征在于,对每一个三元组样本中各个原始案例样本的所述采样文本进行组合的方式包括:

5.根据权利要求2所述的基于对比学习的法律案例相似性匹配方法,其特征在于,对每一个三元组样本中各个原始案例样本的所述采样文本进行组合的方式包括:

6.根据权利要求1所述的基于对比学习的法律案例相似性匹配方法,其特征在于,在所述将所述基准采样文本和所述待匹配采样文本输入预训练的特征提取网络中,得到所述基准采样文本的基准特征,以及每个待匹配采样文本的待匹配特征之前,所述方法还包括:

7.根据权利要求6所述的基于对比学习的法律案例相似性匹配方法,其特征在于,每个三元组的输出结果包括:该三元组中基准案例样本的基准样本特征、正案例样本的正样本特征和负案例样本的负样本特征;所述根据所述输出结果和所述预设损失函数,计算得到第t次训练的损失值,包括:

8.根据权利要求7所述的基于对比学习的法律案例相似性匹配方法,其特征在于,所述预设损失函数为:

9.根据权利要求1所述的基于对比学习的法律案例相似性匹配方法,其特征在于,所述根据所述基准特征与各个待匹配特征之间的余弦相似度,从所述至少一个待匹配案例中选出与所述基准案例最相似的案例,包括:

10.根据权利要求2所述的基于对比学习的法律案例相似性匹配方法,其特征在于,所述不同的预设采样方式对应不同的均值方差对,每个均值方差对包括一个均值和一个方差。


技术总结
本发明公开了一种基于对比学习的法律案例相似性匹配方法,包括:获取基准案例和至少一个待匹配案例;在基准案例和每个待匹配案例的预设位置进行文本内容采样,得到基准案例的基准采样文本、每个待匹配案例的待匹配采样文本;将基准采样文本和待匹配采样文本输入预训练的特征提取网络,得到基准采样文本的基准特征,以及每个待匹配采样文本的待匹配特征;预训练的特征提取网络是采用带有标签的多个不同的三元组和预设损失函数训练的;每个三元组包括基准案例样本、正案例样本和负案例样本,基准案例样本与正案例样本为相似样本,基准案例样本与负案例样本为不相似样本;根据基准特征与待匹配特征之间的余弦相似度,选出与基准案例最相似的案例。

技术研发人员:范阿曼,徐向宇,安晓玲,赵梅梅,张蘋
受保护的技术使用者:陕西国际商贸学院
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1