单词标准化、查询方法、装置、电子设备以及存储介质与流程

文档序号:36735463发布日期:2024-01-16 12:49阅读:19来源:国知局
单词标准化、查询方法、装置、电子设备以及存储介质与流程

本公开涉及人工智能,尤其涉及语音技术、智能搜索、大语言模型等领域,具体地,涉及一种单词标准化、查询方法、装置、电子设备以及存储介质。


背景技术:

1、大规模分布式系统可以包含多个服务,每个服务可以包含多个指标,高可用系统是多地多活架构,包含很多机房。人机交互过程中,涉及到大量的名字。大语言模型给生产力带来了显著提升,基于大语言模型使得人机交互变得更便利,人可以以口语化的方式完成交互过程。例如,口语化查询系统中各服务的指标,口语化询问系统中各服务的部署状态,口语化获取各服务的知识,口语化完成对服务的操作等等。


技术实现思路

1、本公开提供了一种单词标准化、查询方法、装置、电子设备以及存储介质。

2、根据本公开的一方面,提供了一种单词标准化方法,包括:将待处理单词的待处理单词向量与存储于向量数据库中的口语化单词向量进行匹配,得到与待处理单词向量相匹配的目标口语化单词向量的目标向量标识,口语化单词向量为对口语化单词进行转换得到的,口语化单词向量具有向量标识;根据映射信息,确定与目标向量标识相关的目标标准化单词,映射信息包括向量标识与标准化单词之间的关联关系,标准化单词表征口语化单词的标准化形式;以及根据目标标准化单词,确定待处理单词的标准化形式。

3、根据本公开的另一方面,提供了一种查询方法,包括:获取口语化查询语句,口语化查询语句中包括口语化单词;基于本公开的单词标准化方法,将口语化单词转换为标准化单词,得到标准化查询语句;以及基于标准化查询语句进行查询。

4、根据本公开的另一方面,提供了一种单词标准化装置,包括:匹配模块,用于将待处理单词的待处理单词向量与存储于向量数据库中的口语化单词向量进行匹配,得到与待处理单词向量相匹配的目标口语化单词向量的目标向量标识,口语化单词向量为对口语化单词进行转换得到的,口语化单词向量具有向量标识;标准化单词确定模块,用于根据映射信息,确定与目标向量标识相关的目标标准化单词,映射信息包括向量标识与标准化单词之间的关联关系,标准化单词表征口语化单词的标准化形式;以及标准化模块,用于根据目标标准化单词,确定待处理单词的标准化形式。

5、根据本公开的另一方面,提供了一种查询装置,包括:口语化查询语句获取模块,用于获取口语化查询语句,口语化查询语句中包括口语化单词;单词转换模块,用于基于本公开的单词标准化装置,将口语化单词转换为标准化单词,得到标准化查询语句;以及查询模块,用于基于标准化查询语句进行查询。

6、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开的单词标准化方法和查询方法其中至少一种方法。

7、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开的单词标准化方法和查询方法其中至少一种方法。

8、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序存储于可读存储介质和电子设备其中至少之一上,所述计算机程序在被处理器执行时实现本公开的单词标准化方法和查询方法其中至少一种方法。

9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种单词标准化方法,包括:

2.根据权利要求1所述的方法,还包括:在所述根据映射信息,确定与所述目标向量标识相关的目标标准化单词之前,

3.根据权利要求1所述的方法,其中,所述根据所述目标标准化单词,确定所述待处理单词的标准化形式包括:

4.一种查询方法,包括:

5.根据权利要求4所述的方法,还包括:在所述将所述口语化单词转换为标准化单词,得到标准化查询语句之前,

6.根据权利要求5所述的方法,其中,所述将所述口语化查询语句转换为口语化多元组序列包括:

7.根据权利要求5所述的方法,其中,所述将所述口语化查询语句转换为口语化多元组序列包括:

8.根据权利要求5-7中任一项所述的方法,其中,所述将所述口语化查询语句转换为口语化多元组序列包括:

9.根据权利要求5-8中任一项所述的方法,其中,所述特定语义信息包括如下至少一种语义信息:表征服务名的语义信息、表征机器名的语义信息,表征要查询字段的字段名的语义信息。

10.根据权利要求5-9中任一项所述的方法,其中,所述将所述口语化查询语句转换为口语化多元组序列包括:

11.根据权利要求5-10中任一项所述的方法,还包括:

12.根据权利要求11所述的方法,还包括:在所述根据所述标准化多元组序列中的标准化单词序列,获取与所述标准化单词序列相关的目标字段值之前,

13.根据权利要求12所述的方法,其中,所述标准化单词序列包括至少一个服务名;所述根据所述标准化多元组序列中的标准化单词序列,获取与所述标准化单词序列相关的目标字段值包括:

14.根据权利要求13所述的方法,其中,所述标准化单词序列还包括指标字段名;所述根据所述目标服务资源信息,确定所述目标字段值包括:

15.一种单词标准化装置,包括:

16.根据权利要求15所述的装置,还包括:

17.根据权利要求15所述的装置,其中,所述标准化模块包括:

18.一种查询装置,包括:

19.根据权利要求18所述的装置,还包括:

20.根据权利要求19所述的装置,其中,所述序列转换模块包括:

21.根据权利要求19所述的装置,其中,所述序列转换模块包括:

22.根据权利要求19-21中任一项所述的装置,其中,所述序列转换模块包括:

23.根据权利要求19-22中任一项所述的装置,其中,所述特定语义信息包括如下至少一种语义信息:表征服务名的语义信息、表征机器名的语义信息,表征要查询字段的字段名的语义信息。

24.根据权利要求19-23中任一项所述的装置,其中,所述序列转换模块包括:

25.根据权利要求19-24中任一项所述的装置,还包括:

26.根据权利要求25所述的装置,还包括:

27.根据权利要求26所述的装置,其中,所述标准化单词序列包括至少一个服务名;所述字段值获取模块包括:

28.根据权利要求27所述的装置,其中,所述标准化单词序列还包括指标字段名;所述字段值确定子模块包括:

29.一种电子设备,包括:

30.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-14中任一项所述的方法。

31.一种计算机程序产品,包括计算机程序,所述计算机程序存储于可读存储介质和电子设备其中至少之一上,所述计算机程序在被处理器执行时实现根据权利要求1-14中任一项所述的方法。


技术总结
本公开提供了单词标准化、查询方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及语音技术、智能搜索、大语言模型等领域。具体实现方案为:将待处理单词的待处理单词向量与存储于向量数据库中的口语化单词向量进行匹配,得到与待处理单词向量相匹配的目标口语化单词向量的目标向量标识,口语化单词向量为对口语化单词进行转换得到的,口语化单词向量具有向量标识;根据映射信息,确定与目标向量标识相关的目标标准化单词,映射信息包括向量标识与标准化单词之间的关联关系,标准化单词表征口语化单词的标准化形式;以及根据目标标准化单词,确定待处理单词的标准化形式。

技术研发人员:甄真,徐志明,惠向波,杨冰霜
受保护的技术使用者:百度国际科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1