索引生成方法、电子设备和存储介质与流程

文档序号:36631914发布日期:2024-01-06 23:20阅读:27来源:国知局
索引生成方法、电子设备和存储介质与流程

本申请涉及计算机和人工智能,具体而言,涉及一种索引生成方法、电子设备和存储介质。


背景技术:

1、随着计算机技术和人工智能技术的发展,内容识别成为待研究的重要问题之一,尤其是对更复杂场景下的多知识点内容进行识别。根据相关技术,通常对多知识点内容整体进行识别建立对应的索引,然而,由于多知识点内容本身段落较长,文档编码效果差,难以对多知识点内容进行细粒度识别,利用所建立的索引进行检索时召回覆盖率较低。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种索引生成方法、电子设备和存储介质,以至少解决相关技术直接基于整段多知识点内容进行索引创建的方法其内容识别准确度差、检索召回覆盖率低的技术问题。

2、根据本申请实施例的一个方面,提供了一种索引生成方法,包括:获取原始数据,其中,原始数据包括:多个知识点,多个知识点用于确定多个不同语义的索引信息;对原始数据进行挖掘,得到控制标识,其中,控制标识用于指定原始数据的索引生成方向;采用可控生成方式,对原始数据与控制标识进行索引构建,生成目标索引,其中,目标索引包括:多个不同语义的索引信息中的至少部分索引信息,目标索引用于确定原始数据对应的检索召回覆盖范围。

3、根据本申请实施例的另一方面,还提供了另一种索引生成方法,包括:获取原始数据,其中,原始数据包括:多个知识点,多个知识点用于确定多个不同语义的索引信息;对原始数据进行挖掘,得到控制标识,其中,控制标识用于指定原始数据的索引生成方向;采用可控生成大模型对原始数据与控制标识进行索引构建,输出目标索引,其中,目标索引包括:多个不同语义的索引信息中的至少部分索引信息,目标索引用于确定原始数据对应的检索召回覆盖范围;利用待解答问题检索目标索引,以通过目标索引生成待解答问题对应的目标答案。

4、根据本申请实施例的另一方面,还提供了又一种索引生成方法,包括:获取电商服务原始数据,其中,电商服务原始数据包括:多个电商服务知识点,多个电商服务知识点用于确定多个不同语义的索引信息;对电商服务原始数据进行挖掘,得到电商服务控制标识,其中,电商服务控制标识用于指定电商服务原始数据的电商服务索引生成方向;采用可控生成方式,对电商服务原始数据与电商服务控制标识进行索引构建,生成目标电商服务索引,其中,目标电商服务索引包括:多个不同语义的索引信息中的至少部分索引信息,目标电商服务索引用于确定电商服务原始数据对应的电商服务检索召回覆盖范围。

5、根据本申请实施例的另一方面,还提供了一种问题处理方法,包括:获取待解答电商服务问题;利用待解答电商服务问题检索目标电商服务索引,其中,目标电商服务索引采用可控生成方式对待解答电商服务问题关联的电商服务原始数据与电商服务控制标识进行索引构建后生成,目标电商服务索引用于确定电商服务原始数据对应的电商服务检索召回覆盖范围,电商服务原始数据包括:多个电商服务知识点,多个电商服务知识点用于确定多个不同语义的索引信息,电商服务控制标识通过对电商服务原始数据进行挖掘后得到,电商服务控制标识用于指定电商服务原始数据的电商服务索引生成方向;基于目标电商服务索引召回待解答问题对应的目标答案;显示目标答案。

6、根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器,存储有可执行程序;处理器,用于运行程序,其中,程序运行时执行任意一项上述的索引生成方法。

7、根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的可执行程序,其中,在可执行程序运行时控制计算机可读存储介质所在设备执行任意一项上述的索引生成方法。

8、在本申请实施例中,首先获取原始数据,其中,原始数据包括:多个知识点,多个知识点用于确定多个不同语义的索引信息,通过对原始数据进行挖掘,得到控制标识,其中,控制标识用于指定原始数据的索引生成方向,采用可控生成方式,对原始数据与控制标识进行索引构建,生成目标索引,其中,目标索引包括:多个不同语义的索引信息中的至少部分索引信息,目标索引用于确定原始数据对应的检索召回覆盖范围。由此,本申请达到了采用可控生成方式对多知识点内容进行索引创建的目的,从而实现了提升索引创建准确度、提高检索召回覆盖准确率的技术效果,进而解决了相关技术直接基于整段多知识点内容进行索引创建的方法其内容识别准确度差、检索召回覆盖率低的技术问题。

9、容易注意到的是,上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释,并不构成对本申请的限定。



技术特征:

1.一种索引生成方法,其特征在于,包括:

2.根据权利要求1所述的索引生成方法,其特征在于,对所述原始数据进行挖掘,得到所述控制标识包括:

3.根据权利要求2所述的索引生成方法,其特征在于,对所述多个知识点的内容进行多个维度信息识别,得到所述控制标识包括:

4.根据权利要求3所述的索引生成方法,其特征在于,对所述多个知识点的内容进行对象特征识别,得到所述特征识别结果包括:

5.根据权利要求3所述的索引生成方法,其特征在于,对所述多个知识点的内容进行对象属性识别,得到所述属性识别结果包括:

6.根据权利要求3所述的索引生成方法,其特征在于,对所述多个知识点的内容进行对象观点识别,得到所述观点识别结果包括:

7.根据权利要求1所述的索引生成方法,其特征在于,采用所述可控生成方式,对所述原始数据与所述控制标识进行索引构建,生成所述目标索引包括:

8.根据权利要求7所述的索引生成方法,其特征在于,所述可控生成模型包括:编码器和解码器,采用可控生成模型对所述拼接结果进行索引构建,生成所述目标索引包括:

9.根据权利要求1所述的索引生成方法,其特征在于,通过终端设备提供一图形用户界面,所述图形用户界面所显示的内容至少部分地包含一智能机器人自动化问答模式下的问答对话框,所述索引生成方法还包括:

10.一种索引生成方法,其特征在于,包括:

11.一种索引生成方法,其特征在于,包括:

12.一种问题处理方法,其特征在于,包括:

13.一种电子设备,其特征在于,包括:

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的可执行程序,其中,在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至11中任意一项所述的索引生成方法或权利要求12所述的问题处理方法。


技术总结
本申请公开了一种索引生成方法、电子设备和存储介质。其中,该方法包括:获取原始数据,其中,原始数据包括:多个知识点,多个知识点用于确定多个不同语义的索引片段;对原始数据进行挖掘,得到控制标识,其中,控制标识用于指定原始数据的索引生成方向;采用可控生成方式,对原始数据与控制标识进行索引构建,生成目标索引,其中,目标索引包括:多个不同语义的索引信息中的至少部分索引信息,目标索引用于确定原始数据对应的检索召回覆盖范围。本申请解决了相关技术直接基于整段多知识点内容进行索引创建的方法其内容识别准确度差、检索召回覆盖率低的技术问题。

技术研发人员:李鹤,余海洋,李永彬,黄非
受保护的技术使用者:杭州阿里云飞天信息技术有限公司
技术研发日:
技术公布日:2024/1/5
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1