文本匹配方法、装置、设备、存储介质及程序产品与流程

文档序号:35871914发布日期:2023-10-28 06:30阅读:47来源:国知局
文本匹配方法、装置、设备、存储介质及程序产品与流程

本申请涉及ai(artificial intelligence,人工智能),特别涉及一种文本匹配方法、装置、设备、存储介质及程序产品。


背景技术:

1、临床上,关于同一种诊断、手术、药品、检查、化验、症状等往往会有成百上千种不同的写法。医学诊断标准化是医疗信息化过程中不可或缺的一项任务,其目标是将输入的表达不规范的原始文本映射到医学标准体系中规范的标准文本。

2、相关技术中,通过使用机器学习或者深度学习方法学习对文本语义的抽象理解能力,将序列化的文本压缩成语义特征向量,并基于语义匹配,使用度量距离(例如余弦距离)评估原始文本和标准文本的相似性。

3、然而,上述通过特征压缩得到文本信息的方法,容易忽略文本中的关键信息,导致输出的结果不够准确。


技术实现思路

1、本申请实施例提供了一种文本匹配方法、装置、设备、存储介质及程序产品。所述技术方案如下:

2、根据本申请实施例的一个方面,提供了一种文本匹配方法,所述方法包括:

3、构建原始文本对应的连通图,所述连通图中包括至少两个节点,每个节点对应于所述原始文本中的一个实体,两个节点之间的边代表所述两个节点对应的实体之间具备关联性;

4、确定所述原始文本对应的连通图与标准文本对应的连通图之间的匹配度,得到连通图匹配度;其中,所述连通图匹配度与两个所述连通图的节点之间匹配度和边之间匹配度有关;

5、根据所述连通图匹配度,确定所述原始文本与所述标准文本之间的匹配结果。

6、根据本申请实施例的一个方面,提供了一种文本匹配装置,所述装置包括:

7、连通图构建模块,用于构建原始文本对应的连通图,所述连通图中包括至少两个节点,每个节点对应于所述原始文本中的一个实体,两个节点之间的边代表所述两个节点对应的实体之间具备关联性;

8、匹配度确定模块,用于确定所述原始文本对应的连通图与标准文本对应的连通图之间的匹配度,得到连通图匹配度;其中,所述连通图匹配度与两个所述连通图的节点之间匹配度和边之间匹配度有关;

9、结果确定模块,用于根据所述连通图匹配度,确定所述原始文本与所述标准文本之间的匹配结果。

10、根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述文本匹配方法。

11、根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述文本匹配方法。

12、根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现上述文本匹配方法。

13、本申请实施例提供的技术方案可以带来如下有益效果:

14、通过将原始文本构建成包含节点和节点之间的边的连通图,清晰展示了原始本文的各个实体特征,以及各个实体之间的关系。并且在对原始文本的连通图和标准文本的连通图进行特征匹配时,考虑了节点匹配和边匹配两个方面,使得匹配节点的同时可以融合节点与周围其他节点的关系,从而保证原始文本中的实体之间的关系可以保留到匹配结果中,使得到的匹配结果更具准确性和合理性,便于文本数据的检索和分析。



技术特征:

1.一种文本匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述原始文本对应的连通图与标准文本对应的连通图之间的匹配度,得到连通图匹配度,包括:

3.根据权利要求2所述的方法,其特征在于,所述确定所述原始文本对应的连通图中的节点,与所述标准文本对应的连通图中的节点之间的匹配度,得到节点匹配度,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一节点对应的特征向量和所述第二节点对应的特征向量,确定所述第一节点与所述第二节点之间的节点匹配代价,包括:

5.根据权利要求3所述的方法,其特征在于,所述根据各个所述节点对分别对应的节点匹配代价,确定所述节点匹配度,包括:

6.根据权利要求2所述的方法,其特征在于,所述确定所述原始文本对应的连通图中的边,与所述标准文本对应的连通图中的边之间的匹配度,得到边匹配度,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述第一边连接的两个节点分别对应的特征向量,以及所述第二边连接的两个节点分别对应的特征向量,确定所述第一边与所述第二边之间的边匹配代价,包括:

8.根据权利要求1至7任一项所述的方法,其特征在于,所述构建原始文本对应的连通图,包括:

9.一种文本匹配装置,其特征在于,所述装置包括:

10.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至8任一项所述的文本匹配方法。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至8任一项所述的文本匹配方法。

12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至8任一项所述的文本匹配方法。


技术总结
本申请公开了一种文本匹配方法、装置、设备、存储介质及程序产品,涉及计算机技术领域。所述方法包括:构建原始文本对应的连通图,连通图中包括至少两个节点,每个节点对应于原始文本中的一个实体,两个节点之间的边代表两个节点对应的实体之间具备关联性;确定原始文本对应的连通图与标准文本对应的连通图之间的匹配度,得到连通图匹配度;其中,连通图匹配度与两个连通图的节点之间匹配度和边之间匹配度有关;根据连通图匹配度,确定原始文本与标准文本之间的匹配结果。本申请通过构建连通图,以及进行对应的节点匹配和边匹配,使得到的匹配结果更具准确性和合理性。

技术研发人员:林镇溪,张子恒
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1