语音控制方法、装置、设备和存储介质与流程

文档序号:35694986发布日期:2023-10-11 17:50阅读:45来源:国知局
语音控制方法、装置、设备和存储介质与流程

本公开涉及人工智能,具体涉及智能座舱、语音对话系统、自动驾驶等,尤其涉及一种语音控制方法、装置、设备和存储介质。


背景技术:

1、在车载系统中,语音控制成为了越来越受欢迎的方式。由于驾驶员在驾驶时需要集中注意力,因此,通过语音指令与车载系统进行交互已成为驾驶员和乘客的首选方式。

2、现有的车载语音控制系统通常只支持单用户输入,难以支持多人同时交互。特别是在多人乘坐的情况下,驾驶员和乘客之间的语音输入可能会相互干扰,导致交互效率降低,用户体验不佳。


技术实现思路

1、本公开提供了一种语音控制方法、装置、设备和存储介质。

2、根据本公开的一方面,提供了一种语音控制方法,包括:针对多轮语音数据中的当前语音数据,确定所述当前语音数据的当前意图;若所述当前意图是跟随意图,确定所述当前意图所跟随的目标意图,所述目标意图用于控制目标对象执行目标操作;基于所述目标对象确定当前对象,以及,基于所述目标操作或所述当前语音数据确定当前操作;控制所述当前对象执行所述当前操作。

3、根据本公开的另一方面,提供了一种语音控制装置,包括:第一确定模块,用于针对多轮语音数据中的当前语音数据,确定所述当前语音数据的当前意图;第二确定模块,用于若所述当前意图是跟随意图,确定所述当前意图所跟随的目标意图,所述目标意图用于控制目标对象执行目标操作;第三确定模块,用于基于所述目标对象确定当前对象,以及,基于所述目标操作或所述当前语音数据确定当前操作;控制模块,用于控制所述当前对象执行所述当前操作。

4、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。

5、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。

6、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。

7、根据本公开的技术方案,可以提升语音控制效率。

8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种语音控制方法,包括:

2.根据权利要求1所述的方法,其中,所述若所述当前意图是跟随意图,确定所述当前意图所跟随的目标意图,包括:

3.根据权利要求2所述的方法,其中,

4.根据权利要求3所述的方法,其中,

5.根据权利要求3所述的方法,其中,所述确定当前操作,包括:

6.根据权利要求2所述的方法,其中,

7.根据权利要求6所述的方法,其中,所述基于所述目标对象确定当前对象,包括:

8.根据权利要求6所述的方法,其中,所述确定当前操作,包括:

9.根据权利要求2所述的方法,其中,所述若所述当前意图是跟随意图,在历史语音数据中,基于所述当前语音数据的当前时间和所述历史语音数据的历史时间,确定候选语音数据,包括:

10.根据权利要求9所述的方法,其中,

11.根据权利要求1-10任一项所述的方法,其中,所述针对所述多轮语音数据中的当前语音数据,确定所述当前语音数据的当前意图,包括:

12.根据权利要求11所述的方法,其中,所述确定所述当前语音数据的离线意图,包括:

13.根据权利要求11所述的方法,其中,所述确定所述当前语音数据的在线意图,包括:

14.根据权利要求11所述的方法,其中,所述对所述离线意图和所述在线意图进行仲裁,以确定所述当前意图,包括:

15.一种语音控制装置,包括:

16.根据权利要求15所述的装置,其中,所述第二确定模块进一步用于:

17.根据权利要求16所述的装置,其中,

18.根据权利要求17所述的装置,其中,

19.根据权利要求17所述的装置,其中,所述第三确定模块进一步用于:

20.根据权利要求16所述的装置,其中,

21.根据权利要求20所述的装置,其中,所述第三确定模块进一步用于:

22.根据权利要求20所述的装置,其中,所述第三确定模块进一步用于:

23.根据权利要求16所述的装置,其中,所述第二确定模块进一步用于:

24.根据权利要求23所述的装置,其中,

25.根据权利要求15-24任一项所述的装置,其中,所述第一确定模块进一步用于:

26.根据权利要求25所述的装置,其中,所述第一确定模块进一步用于:

27.根据权利要求25所述的装置,其中,所述第一确定模块进一步用于:

28.根据权利要求25所述的装置,其中,所述第一确定模块进一步用于:

29.一种电子设备,包括:

30.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-14中任一项所述的方法。

31.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-14中任一项所述的方法。


技术总结
本公开提供了一种语音控制方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及智能座舱、语音对话系统、自动驾驶等技术领域。语音控制方法包括:针对多轮语音数据中的当前语音数据,确定所述当前语音数据的当前意图;若所述当前意图是跟随意图,确定所述当前意图所跟随的目标意图,所述目标意图用于控制目标对象执行目标操作;基于所述目标对象确定当前对象,以及,基于所述目标操作或所述当前语音数据确定当前操作;控制所述当前对象执行所述当前操作。本公开可以提升语音控制效率。

技术研发人员:周文欢,欧阳能钧
受保护的技术使用者:阿波罗智联(北京)科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1