文本检索方法、装置、电子设备及存储介质与流程

文档序号:36506314发布日期:2023-12-28 16:22阅读:32来源:国知局
文本检索方法与流程

本技术涉及分布式领域,尤其涉及一种文本检索方法、装置、电子设备及存储介质。


背景技术:

1、银行业务术语由于具有一定的专业性和领域性,业务人员在需要获取相关业务属于的解释,需要在知识库中进行检索。

2、现有技术中,通常采用倒排索引的方式,将文本拆分为单词或词汇,在进行检索时,采用简单的文本查询语言,为用户提供检索结果,该查询方式相对较简单,重点在于检索功能的实现,即根据用户的检索关键词,为用户提供的文本按照文本与检索关键词的相似性进行排序。

3、在实际的检索过程中,由于银行业务术语的数量庞大,现有技术中按照文本与检索关键词的相似性进行排序得到银行业务术语的方式,导致了检索结果与用户检索目标的匹配度低的问题。


技术实现思路

1、本技术提供一种文本检索方法、装置、电子设备及存储介质,用以解决检索结果与用户检索目标的匹配度低的问题。

2、第一方面,本技术提供一种文本检索方法,包括:根据第一标识信息,得到第二标识信息,所述第一标识信息表征针对银行业务术语的检索语句的内容特征,所述第二标识信息表征与所述银行业务术语相关的目标文本的内容特征;根据所述第一标识信息和所述第二标识信息,得到文本匹配度,所述文本匹配度表征基于所述目标文本的时序特征确定的所述检索语句和所述目标文本的相关程度,所述时序特征包括目标文本的建立时间和/或更新时间;根据所述文本匹配度,得到目标文本位置。

3、在一种可能的实现方式中,所述第二标识信息中包括至少一个第一分词,所述根据第一标识信息,得到第二标识信息,包括:根据所述第一标识信息,得到所述目标文本;根据所述目标文本和第一分词模型,得到所述第一分词,所述第一分词模型用于解析所述目标文本的文本结构;根据至少一个所述第一分词,得到所述第二标识信息。

4、在一种可能的实现方式中,所述根据所述目标文本和第一分词模型,得到所述第一分词,包括:根据所述目标文本和第一分词模型,得到文本关键词,所述文本关键词为基于所述文本结构和所述目标文本的词语的出现次数确定的词语;根据所述文本关键词和文本核心词,得到所述第一分词,所述文本核心词为所述目标文本的预设的代表性词语。

5、在一种可能的实现方式中,所述根据所述第一标识信息和所述第二标识信息,得到文本匹配度,包括:根据所述第一标识信息和所述第二标识信息,得到词向量相似度,所述词向量相似度表征所述第一标识信息与所述第二标识信息的相似程度;根据所述词向量相似度和所述目标文本的时序特征,得到所述文本匹配度。

6、在一种可能的实现方式中,所述根据所述词向量相似度和所述目标文本的时序特征,得到所述文本匹配度,包括:获取第三标识信息,所述第三标识信息为与所述银行业务术语相关的目标文本的被浏览时长和被调用频数的加权值;根据所述词向量相似度、所述目标文本的时序特征和所述第三标识信息,得到所述文本匹配度。

7、在一种可能的实现方式中,还包括:所述第三标识信息为与所述银行业务术语相关的目标文本的被浏览时长、被调用频数和相关度评分的加权值。

8、在一种可能的实现方式中,所述目标文本位置包括第一文本位置,所述第一文本位置为基于分类检索确定的文本位置,所述根据所述文本匹配度,得到目标文本位置,包括:根据所述目标文本的内容特征,得到所述目标文本对应的业务类别;根据所述文本匹配度和所述业务类别,得到所述第一文本位置。

9、第二方面,本技术提供一种文本检索装置,包括:

10、处理模块,用于根据第一标识信息,得到第二标识信息,所述第一标识信息表征针对银行业务术语的检索语句的内容特征,所述第二标识信息表征与所述银行业务术语相关的目标文本的内容特征;

11、所述处理模块,还用于根据所述第一标识信息和所述第二标识信息,得到文本匹配度,所述文本匹配度表征基于所述目标文本的时序特征确定的所述检索语句和所述目标文本的相关程度;

12、确定模块,用于根据所述文本匹配度,得到目标文本位置。

13、在一种可能的实现方式中,所述第二标识信息中包括至少一个第一分词,所述处理模块在根据第一标识信息,得到第二标识信息时,具体用于:根据所述第一标识信息,得到所述目标文本;根据所述目标文本和第一分词模型,得到所述第一分词,所述第一分词模型用于解析所述目标文本的文本结构;根据至少一个所述第一分词,得到所述第二标识信息。

14、在一种可能的实现方式中,所述处理模块在根据所述目标文本和第一分词模型,得到所述第一分词时,具体用于:根据所述目标文本和第一分词模型,得到文本关键词,所述文本关键词为基于所述文本结构和所述目标文本的词语的出现次数确定的词语;根据所述文本关键词和文本核心词,得到所述第一分词,所述文本核心词为所述目标文本的预设的代表性词语。

15、在一种可能的实现方式中,所述处理模块在根据所述第一标识信息和所述第二标识信息,得到文本匹配度时,具体用于:根据所述第一标识信息和所述第二标识信息,得到词向量相似度,所述词向量相似度表征所述第一标识信息与所述第二标识信息的相似程度;根据所述词向量相似度和所述目标文本的时序特征,得到所述文本匹配度。

16、在一种可能的实现方式中,所述处理模块在根据所述词向量相似度和所述目标文本的时序特征,得到所述文本匹配度时,具体用于:获取第三标识信息,所述第三标识信息为与所述银行业务术语相关的目标文本的被浏览时长和被调用频数的加权值;根据所述词向量相似度、所述目标文本的时序特征和所述第三标识信息,得到所述文本匹配度。

17、在一种可能的实现方式中,还包括:所述第三标识信息为与所述银行业务术语相关的目标文本的被浏览时长、被调用频数和相关度评分的加权值。

18、在一种可能的实现方式中,所述目标文本位置包括第一文本位置,所述第一文本位置为基于分类检索确定的文本位置,所述确定模块在根据所述文本匹配度,得到目标文本位置时,具体用于:根据所述目标文本的内容特征,得到所述目标文本对应的业务类别;根据所述文本匹配度和所述业务类别,得到所述第一文本位置。

19、第三方面,本技术提供了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;

20、所述存储器存储计算机执行指令;

21、所述处理器执行所述存储器存储的计算机执行指令,以实现如本技术实施例第一方面任一项所述的文本检索方法。

22、第四方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本技术实施例第一方面任一项所述的文本检索方法。

23、根据本技术实施例的第五方面,本技术提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面任一项所述的文本检索方法。

24、本技术提供的文本检索方法、装置、电子设备及存储介质,通过根据第一标识信息,得到第二标识信息,所述第一标识信息表征针对银行业务术语的检索语句的内容特征,所述第二标识信息表征与所述银行业务术语相关的目标文本的内容特征;根据所述第一标识信息和所述第二标识信息,得到文本匹配度,所述文本匹配度表征基于所述目标文本的时序特征确定的所述检索语句和所述目标文本的相关程度,所述时序特征包括目标文本的建立时间和/或更新时间;根据所述文本匹配度,得到目标文本位置。由于通过检索内容对应的第一标识信息得到目标文本对应的第二标识信息,并基于第一标识信息和第二标识信息,得到了基于目标文本的时序特征的文本匹配度,使文本匹配度在通过目标文本与检索关键词的相似性确定的同时,进一步通过目标文本的时序特征确定,进而得到了目标文本位置,提高了检索结果与用户检索目标的匹配度,使用户准确获取目标文本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1