文本匹配方法、装置、设备及存储介质与流程

文档序号:31840711发布日期:2022-10-18 22:29阅读:来源:国知局

技术特征:
1.一种文本匹配方法,其特征在于,所述方法包括:获取第一文本;对于所述第一文本中的每个词语,从所述第一文本中选取所述词语的每个关联词语,将所述词语以及选取的每个关联词语构成一个词语集合;基于构成的至少一个词语集合生成第一关系图,所述第一关系图包括至少一个关系子图,每个关系子图与一个词语集合对应,所述每个关系子图中的每个节点用于表示对应的词语集合中的一个词语,且所述每个关系子图用于表示对应的词语集合中的每个词语之间存在关联关系;基于所述第一关系图进行文本匹配。2.根据权利要求1所述的方法,其特征在于,所述对于所述第一文本中的每个词语,从所述第一文本中选取所述词语的每个关联词语,将所述词语以及选取的每个关联词语构成一个词语集合,包括:确定第一词语的第一词向量与每个第二词语的第二词向量之间的相似度,所述第一词语为所述第一文本中的任一词语,所述第二词语为所述第一文本中除所述第一词语之外的其他词语;选取与所述第一词向量之间的相似度小于参考阈值的每个第二词向量对应的第二词语;将所述第一词语以及选取的每个第二词语构成一个词语集合。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一关系图进行文本匹配,包括:调用关系识别模型,确定所述第一关系图与第二文本对应的第二关系图之间的关系标签,所述关系标签用于表示所述第一关系图与所述第二关系图之间的关系,所述关系为匹配或不匹配;响应于所述关系标签表示所述第一关系图与所述第二关系图匹配,将所述第二文本确定为与所述第一文本匹配的文本。4.根据权利要求3所述的方法,其特征在于,所述关系识别模型包括特征提取子模型和分类子模型;所述调用关系识别模型,确定所述第一关系图与第二文本对应的第二关系图之间的关系标签,包括:调用所述特征提取子模型,获取所述第一关系图中的每个节点的节点特征,以及所述第二关系图中的每个节点的节点特征,所述节点的节点特征为所述节点所表示的词语的特征;调用所述分类子模型,基于所述第一关系图中的每个节点的节点特征获取第一关系图特征,基于所述第二关系图中的每个节点的节点特征获取第二关系图特征;基于所述第一关系图特征与所述第二关系图特征,确定所述第一关系图与所述第二关系图之间的所述关系标签。5.根据权利要求4所述的方法,其特征在于,所述调用所述分类子模型,基于所述第一关系图中的每个节点的节点特征获取第一关系图特征,基于所述第二关系图中的每个节点的节点特征获取第二关系图特征,包括:调用所述分类子模型,获取所述第一关系图中的多个节点的节点特征的平均值,将所
述平均值确定为所述第一关系图特征,获取所述第二关系图中的多个节点的节点特征的平均值,将所述平均值确定为所述第二关系图特征。6.根据权利要求4所述的方法,其特征在于,所述特征提取子模型包括多个特征提取层;所述调用所述特征提取子模型,获取所述第一关系图中的每个节点的节点特征,包括:调用第一个特征提取层,获取所述第一关系图中的每个节点的第一节点特征;调用所述第一个特征提取层,分别融合所述第一关系图中的每个关系子图中的节点的第一节点特征,得到所述每个关系子图的第一子图特征,分别融合所述第一关系图中的每个节点所属的关系子图的第一子图特征,得到所述每个节点的第二节点特征;调用下一个特征提取层,分别融合所述第一关系图中的每个关系子图中的节点的第二节点特征,得到所述每个关系子图的第二子图特征,分别融合所述第一关系图中的每个节点所属的关系子图的第二子图特征,得到所述每个节点的第三节点特征,直至得到最后一个特征提取层输出的所述每个节点的节点特征,将所述最后一个特征提取层输出的所述每个节点的节点特征确定为所述第一关系图中的每个节点的节点特征。7.根据权利要求6所述的方法,其特征在于,所述调用所述第一个特征提取层,分别融合所述第一关系图中的每个关系子图中的节点的第一节点特征,得到所述每个关系子图的第一子图特征,分别融合所述第一关系图中的每个节点所属的关系子图的第一子图特征,得到所述每个节点的第二节点特征,包括:获取所述第一关系图的第一关系参数,所述第一关系参数表示所述第一关系图中的每个节点与每个关系子图的关系,所述关系为节点属于关系子图或节点不属于关系子图;对于所述第一关系图中的每个关系子图,调用所述第一个特征提取层,基于所述第一关系参数,确定所述关系子图中的节点,融合所述关系子图中的节点的第一节点特征,得到所述关系子图的第一子图特征;对于所述第一关系图中的每个节点,调用所述第一个特征提取层,基于所述第一关系参数,确定所述节点所属的关系子图,融合所述节点所属的关系子图的第一子图特征,得到所述节点的第二节点特征。8.根据权利要求7所述的方法,其特征在于,所述融合所述节点所属的关系子图的第一子图特征,得到所述节点的第二节点特征之后,所述方法包括:调用所述第一个特征提取层,基于所述第一子图特征和所述第二节点特征,确定第二关系参数,所述第二关系参数表示所述第一关系图中的每个节点的第二节点特征与每个关系子图的第一子图特征之间的相似度;所述调用下一个特征提取层,分别融合所述第一关系图中的每个关系子图中的节点的第二节点特征,得到所述每个关系子图的第二子图特征,分别融合所述第一关系图中的每个节点所属的关系子图的第二子图特征,得到所述每个节点的第三节点特征,包括:对于所述第一关系图中的每个关系子图,调用所述下一个特征提取层,基于所述第二关系参数,确定所述关系子图中的节点的第二节点特征与所述关系子图的第一子图特征之间的相似度,将所述关系子图中的节点对应的相似度作为权重,融合所述关系子图中的节点的第二节点特征,得到所述关系子图的第二子图特征;对于所述第一关系图中的每个节点,调用所述下一个特征提取层,基于所述第二关系参数,确定所述节点所属的关系子图的第一子图特征与所述节点的第二节点特征之间的相
似度,将所述节点所属的关系子图对应的相似度作为权重,融合所述节点所属的关系子图的第二子图特征,得到所述节点的第三节点特征。9.根据权利要求8所述的方法,其特征在于,所述调用所述第一个特征提取层,基于所述第一子图特征和所述第二节点特征,确定第二关系参数,包括:获取所述第一关系图中的每个节点的第二节点特征与每个关系子图的第一子图特征之间的余弦相似度,得到多个余弦相似度;将所述多个余弦相似度中小于第一参考相似度的余弦相似度调整为第二参考相似度,所述第二参考相似度表示不相似的第二节点特征与第一子图特征之间的相似度;基于调整后的所述多个余弦相似度生成所述第二关系参数。10.根据权利要求8所述的方法,其特征在于,所述将所述节点所属的关系子图对应的相似度作为权重,融合所述节点所属的关系子图的第二子图特征,得到所述节点的第三节点特征之后,所述方法还包括:调用所述下一个特征提取层,基于所述第二子图特征和所述第三节点特征,确定第三关系参数,所述第三关系参数表示所述第一关系图中的每个节点的第三节点特征与每个关系子图的第二子图特征之间的相似度。11.根据权利要求6所述的方法,其特征在于,所述调用所述第一个特征提取层,分别融合所述第一关系图中的每个关系子图中的节点的第一节点特征,得到所述每个关系子图的第一子图特征之后,所述方法还包括:对于所述第一关系图中的每个关系子图的第一子图特征,调用所述第一个特征提取层,确定与所述第一子图特征相似的至少一个目标子图特征;基于所述至少一个目标子图特征对所述第一子图特征进行更新,得到更新后的所述第一子图特征;其中,所述目标子图特征为所述第二关系图中的关系子图的第一子图特征。12.根据权利要求11所述的方法,其特征在于,所述基于所述至少一个目标子图特征对所述第一子图特征进行更新,得到更新后的所述第一子图特征,包括:调用所述第一个特征提取层,基于所述第一子图特征与所述至少一个目标子图特征中的每个目标子图特征之间的相似度,从所述至少一个目标子图特征中选取参考数量的目标子图特征,选取的目标子图特征与所述第一子图特征之间的相似度大于所述至少一个目标子图特征中剩余的目标子图特征与所述第一子图特征之间的相似度;将选取的目标子图特征与所述第一子图特征之间的相似度作为权重,对所述选取的目标子图特征进行融合,得到融合特征,将所述第一子图特征与所述融合特征的差异特征确定为更新后的所述第一子图特征。13.一种文本匹配装置,其特征在于,所述装置包括:文本获取模块,用于获取第一文本,所述第一文本包括至少三个词语;集合构成模块,用于对于所述第一文本中的每个词语,从所述第一文本中选取所述词语的每个关联词语,将所述词语以及选取的每个关联词语构成一个词语集合;关系图生成模块,用于基于构成的至少一个词语集合生成第一关系图,所述第一关系图包括至少一个关系子图,每个关系子图与一个词语集合对应,所述每个关系子图中的每个节点用于表示对应的词语集合中的一个词语,且所述每个关系子图用于表示对应的词语
集合中的每个词语之间存在关联关系;文本匹配模块,用于基于所述第一关系图进行文本匹配。14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至权利要求12任一项所述的文本匹配方法所执行的操作。15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至权利要求12任一项所述的文本匹配方法所执行的操作。

技术总结
本申请提供了一种文本匹配方法、装置、设备及存储介质,属于计算机技术领域。方法包括:获取第一文本;对于第一文本中的每个词语,从第一文本中选取所述词语的每个关联词语,将所述词语以及选取的每个关联词语构成一个词语集合;基于构成的至少一个词语集合生成第一关系图,第一关系图包括至少一个关系子图,每个关系子图与一个词语集合对应,每个关系子图中的每个节点用于表示对应的词语集合中的一个词语,且每个关系子图用于表示对应的词语集合中的每个词语之间存在关联关系;基于第一关系图进行文本匹配。上述方法中的关系图能够完整地表示文本的语义信息,通过该关系图进行文本匹配能够提高文本匹配的准确率。匹配能够提高文本匹配的准确率。匹配能够提高文本匹配的准确率。


技术研发人员:朱怀生 赵瑞辉
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.04.13
技术公布日:2022/10/17
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1