一种实体抽取方法、装置、设备及存储介质与流程

文档序号:33947181发布日期:2023-04-26 08:47阅读:46来源:国知局
一种实体抽取方法、装置、设备及存储介质与流程

本发明涉及人工智能,尤其涉及一种实体抽取方法、装置、设备及存储介质。


背景技术:

1、在现有语音交互场景招牌菜的知识图谱问答中,现有知识图谱意图与实体匹配的算法逻辑是,先将问句与图谱里的实体进行硬匹配,得到匹配的实体以后根据实体的所属类型进行实体替换,将问句模板化后进行模板匹配,最后可得意图。

2、目前这种先进行实体的硬匹配后进行问句模板匹配的方式,在图谱构造越来越庞大、实体越来越丰富的情况下,对实体的硬匹配会极大的消耗运算时间,实体与实体之间也会有分词上的冲突(例如,辣子鸡丁、辣子鸡、辣子,这实际上是三种不同的食物,那实际分词的时候是以最细粒度“辣子”来分,还是以最粗粒度“辣子鸡丁”来分,在不同的场景下,一旦分错则可能造成意图失配)。另外,基于分词的问句模板在意图识别上十分受限,只具备微小的泛化能力,此时,换一种问法可能识别不到意图,用户体验很差。因此,亟需一种更有效且准确的实体抽取方法来更精准地匹配用户意图。


技术实现思路

1、本发明提供了一种实体抽取方法、装置、设备及存储介质,以提高餐饮场景下实体抽取的准确性,从而精准识别用户意图。

2、根据本发明的一方面,提供了一种实体抽取方法,该方法包括:

3、获取餐饮场景下用户与机器人交互过程中的目标问句;

4、基于语言模型引擎,对所述目标问句进行向量化处理,得到目标问句向量;

5、根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体。

6、根据本发明的另一方面,提供了一种实体抽取装置,该装置包括:

7、目标问句获取模块,用于获取餐饮场景下用户与机器人交互过程中的目标问句;

8、目标问句向量确定模块,用于基于语言模型引擎,对所述目标问句进行向量化处理,得到目标问句向量;

9、目标实体确定模块,用于根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体。

10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

11、至少一个处理器;以及

12、与所述至少一个处理器通信连接的存储器;其中,

13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的实体抽取方法。

14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的实体抽取方法。

15、本发明实施例的技术方案,通过获取餐饮场景下用户与机器人交互过程中的目标问句,之后基于语言模型引擎,对所述目标问句进行向量化处理,得到目标问句向量,进而根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体。上述技术方案,相比于现有技术基于分词倒排索引等确定实体的方式会导致在知识图谱中数据量大的情况下实体抽取效率慢且准确率低的问题,本发明中引入目标问句向量,基于向量索引来确定目标问句中的目标实体,尤其在知识图谱中数据量庞大的情况下,能够快速且准确地抽取到目标实体。

16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种实体抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述向量索引通过如下方式确定:

3.根据权利要求1所述的方法,其特征在于,所述向量索引还包括物体属性和/或不同物体实体之间的关系。

4.根据权利要求1所述的方法,其特征在于,所述根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定候选实体,包括:

6.根据权利要求4所述的方法,其特征在于,所述根据所述候选实体,确定所述目标问句的目标实体,包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体之后,还包括:

8.根据权利要求1所述的方法,其特征在于,所述根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体之后,还包括:

9.一种实体抽取装置,其特征在于,包括:

10.一种电子设备,其特征在于,所述电子设备包括:

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-8中任一项所述的实体抽取方法。


技术总结
本发明公开了实体抽取方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取餐饮场景下用户与机器人交互过程中的目标问句;基于语言模型引擎,对所述目标问句进行向量化处理,得到目标问句向量;根据所述目标问句向量、以及目标知识图谱对应的向量索引,确定目标实体。通过上述技术方案,提高餐饮场景下实体抽取的准确性,从而精准识别用户意图。

技术研发人员:张辉,李翔远,栾小飞,苏晴
受保护的技术使用者:上海擎朗智能科技有限公司
技术研发日:
技术公布日:2024/1/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1