裁判文书的搜索方法及装置与流程

文档序号:12596324阅读:来源:国知局

技术特征:

1.一种裁判文书的搜索方法,其特征在于,包括:

获取搜索查询文本中的搜索关键词;

获取与所述搜索关键词含义相近和/或相同的法律词;

根据与所述搜索关键词含义相近和/或相同的法律词对所述搜索查询文本进行扩充,得到扩充后的搜索查询文本;以及

根据所述扩充后的搜索查询文本进行搜索,得到目标裁判文书。

2.根据权利要求1所述的方法,其特征在于,

在根据所述扩充后的搜索查询文本进行搜索,得到目标裁判文书之前,所述方法还包括:获取候选裁判文书和所述候选裁判文书中的法律关键词;对所述候选裁判文书和所述候选裁判文书中的法律关键词建立倒排索引,得到倒排表,

根据所述扩充后的搜索查询文本进行搜索,得到目标裁判文书包括:在所述倒排表中输入所述扩充后的搜索查询文本进行搜索,得到目标裁判文书。

3.根据权利要求2所述的方法,其特征在于,获取候选裁判文书和所述候选裁判文书中的法律关键词包括:

通过网络爬虫方式获取所述候选裁判文书;

对所述候选裁判文书进行分词处理,得到多个基本词;

获取第一预设数据库,其中,所述第一预设数据库存储有法律类的词;

获取所述多个基本词中包含的所述第一预设数据库中的法律类的词;以及

将所述多个基本词中包含的所述第一预设数据库中的法律类的词作为所述候选裁判文书中的法律关键词。

4.根据权利要求2所述的方法,其特征在于,获取候选裁判文书和所述候选裁判文书中的法律关键词包括:

通过网络爬虫方式获取所述候选裁判文书;

对所述候选裁判文书进行分词处理,得到多个基本词;

获取第一预设数据库,其中,所述第一预设数据库存储有法律类的词;

在分词系统中添加所述第一预设数据库;以及

通过所述分词系统对所述候选裁判文书进行分词处理,得到所述候选裁判文书中的法律关键词。

5.根据权利要求1所述的方法,其特征在于,在根据所述扩充后的搜索查询文本进行搜索之后,得到多个目标裁判文书,在得到所述多个目标裁判文书之后,所述方法还包括:

根据所述搜索关键词含义相近和/或相同的法律词的个数确定所述搜索关键词的权重值;

根据所述搜索关键词的权重值对根据所述扩充后的搜索查询文本中搜索关键词搜索出的所述多个目标裁判文书进行排序,得到排序后的所述多个目标裁判文书;以及

根据排序后的所述多个目标裁判文书,确定返回至目标地址的目标裁判文书。

6.根据权利要求1所述的方法,其特征在于,获取与所述搜索关键词含义相近和/或相同的法律词包括:

在第二预设数据库中查询与所述搜索关键词含义相近和/或相同的法律词,其中,所述第二预设数据库为预先存储有所述搜索关键词和与所述搜索关键词含义相近和/或相同的法律词的数据库。

7.一种裁判文书的搜索装置,其特征在于,包括:

第一获取单元,用于获取搜索查询文本中的搜索关键词;

第二获取单元,用于获取与所述搜索关键词含义相近和/或相同的法律词;

扩充单元,用于根据与所述搜索关键词含义相近和/或相同的法律词对所述搜索查询文本进行扩充,得到扩充后的搜索查询文本;以及

搜索单元,用于根据所述扩充后的搜索查询文本进行搜索,得到目标裁判文书。

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

第三获取单元,用于获取候选裁判文书和所述候选裁判文书中的法律关键词;

创建单元,用于对所述候选裁判文书和所述候选裁判文书中的法律关键词建立倒排索引,得到倒排表,

所述搜索单元还用于在所述倒排表中输入所述扩充后的搜索查询文本进行搜索,得到目标裁判文书。

9.根据权利要求8所述的装置,其特征在于,所述第三获取单元包括:

第一获取模块,用于通过网络爬虫方式获取所述候选裁判文书;

第一处理模块,用于对所述候选裁判文书进行分词处理,得到多个基本词;

第二获取模块,用于获取第一预设数据库,其中,所述第一预设数据库存储有法律类的词;

第三获取模块,用于获取所述多个基本词中包含的所述第一预设数据库中的法律类的词;以及

确定模块,用于将所述多个基本词中包含的所述第一预设数据库中的法律类的词作为所述候选裁判文书中的法律关键词。

10.根据权利要求8所述的装置,其特征在于,所述第三获取单元包括:

第四获取模块,用于通过网络爬虫方式获取所述候选裁判文书;

第二处理模块,用于对所述候选裁判文书进行分词处理,得到多个基本词;

第五获取模块,用于获取第一预设数据库,其中,所述第一预设数据库存储有法律类的词;

添加模块,用于在分词系统中添加所述第一预设数据库;以及

第三处理模块,用于通过所述分词系统对所述候选裁判文书进行分词处理,得到所述候选裁判文书中的法律关键词。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1