基于知识库内头尾实体分布的关系相似度度量方法及系统与流程

文档序号:19189170发布日期:2019-11-20 01:52阅读:来源:国知局

技术特征:

1.一种关系相似度度量方法,其特征在于,包括:

获取待比较的两个关系;

获取所述两个关系各自对应的头尾实体分布;

计算两个关系各自对应的头尾实体分布之间的kl散度,基于计算得到的kl散度确定所述两个关系间的相似度。

2.根据权利要求1所述的关系相似度度量方法,其特征在于,所述计算两个关系各自对应的头尾实体分布之间的kl散度的步骤,进一步包括:

基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的kl散度。

3.根据权利要求1所述的关系相似度度量方法,其特征在于,所述获取待比较的两个关系的步骤,之前还包括:

定义三元关系组的分布,定义三元关系组分布的计算方式。

4.根据权利要求3所述的关系相似度度量方法,其特征在于,所述定义三元关系组的分布,定义三元关系组分布的计算方式的步骤,之后还包括:

计算优化模型参数,基于所述优化模型参数对三元关系组的分布进行优化。

5.根据权利要求2所述的关系相似度度量方法,其特征在于,所述基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的kl散度的步骤,进一步包括:

基于下式计算两个头尾实体分布之间的kl散度:

其中dkl(·||·)代表kl散度;代表关系r1对应的头尾实体分布,代表关系r2对应的头尾实体分布;h和t分别为关系对应三元关系组内的头实体和尾实体;θ*为模型参数;是从中采样出来的头尾实体对集合。

6.根据权利要求5所述的关系相似度度量方法,其特征在于,所述θ*满足如下条件:

其中是一个关系三元组的集合,ε为实体的集合,为关系的集合;θ为优化前的参数模型。

7.一种关系相似度度量系统,其特征在于,包括:

获取模块,用于获取待比较的两个关系;

获取模块,还用于获取所述两个关系各自对应的头尾实体分布;

计算模块,用于计算两个关系各自对应的头尾实体分布之间的kl散度,基于计算得到的kl散度确定两个关系间的相似度。

8.根据权利要求7所述的关系相似度度量系统,其特征在于,所述计算模块,进一步用于:

基于蒙特卡罗模拟,计算两个关系各自对应的头尾实体分布之间的kl散度。

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述关系相似度度量方法的步骤。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述关系相似度度量方法的步骤。


技术总结
本发明实施例提供一种基于知识库内头尾实体分布的关系相似度度量方法及系统,所述方法包括:获取待比较的两个关系;获取所述两个关系各自对应的头尾实体分布;计算两个关系各自对应的头尾实体分布之间的KL散度,基于计算得到的KL散度确定所述两个关系间的相似度。基于知识库内头尾实体分布的关系相似度度量方式,能够利用知识库中头尾实体的信息来确定两个关系之间的相似度。同时由于本发明实施例关注于两个关系头尾实体的分布,增强了对于两个关系相似度的可解释性。

技术研发人员:刘知远;陈暐泽;朱昊;韩旭;孙茂松
受保护的技术使用者:清华大学
技术研发日:2019.07.16
技术公布日:2019.11.19
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1