信息处理方法和电子设备与流程

文档序号:13389210阅读:157来源:国知局
信息处理方法和电子设备与流程

本公开涉及一种信息处理方法和电子设备。



背景技术:

语音识别正逐步成为信息技术中人机交互的关键技术,使人们能够甩掉键盘,通过语音命令进行操作从而极大地减轻了劳动强度、提高了工作效率,并日益改变着人们的日常生活。在实现本发明构思的过程中,发明人发现现有技术中至少存在如下问题,在语音指令不准确的情况下,机器无法识别用户命令。例如带有方言或者特殊口音的人,说“打开散(闪)光灯”,语音识别出“打开”,“散光灯”,却无法执行用户的真正意图打开闪光灯的功能。另一方面,通常一个操作指令对应一个语音,这就需要用户像记住编程指令集似的记住各个对应的语音指令名称,由于指令繁多,难于记忆。否则,对于用户想用自己的话描述一个功能,系统是无法识别该语音指令的。还存在一个问题,目前,什么语音指令对应什么操作,都是系统预置提供的,不能更改,不能用户自创或者组合,不具有灵活度。还有,目前,一个语音指令,仅对应一个操作,不能对应多个有关联的一系列操作,要想实施多个操作,用户得一个一个说出语音指令,分别实施,这个过程过于繁琐。以上这些弊端都限制了语音操控的普及。



技术实现要素:

本公开的一个方面提供了一种用于信息处理的方法,包括,接收语音信息,检测在接收语音信息之前、之后或之时获取的操作,以及建立所述语音信息与所述操作之间的对应关系。

可选地,所述建立所述语音信息与所述操作之间的对应关系包括若所述操作对应于可执行指令,则建立所述语音信息与所述可执行指令之间的对应关系,以使得当再次接收到所述语音信息时,所述电子设备能够基于所述对应关系,执行所述可执行指令。

可选地,所述建立所述语音信息与所述操作之间的对应关系包括,若所述语音信息被识别后得到的一部分内容与所述可执行指令相匹配,则建立所述语音信息与所述可执行指令之间的对应关系。

可选地,所述检测在接收语音信息之前、之后或之时获取的操作包括,若不能正确识别所述语音信息,或者不存在所述语音信息所对应的可执行指令,则检测在接收语音信息之后获取的操作。

可选地,所述检测在接收语音信息之前、之后或之时获取的操作包括,检测在接收语音信息之前、之后或之时获取的多个操作,以及所述建立所述语音信息与所述操作之间的对应关系包括,建立所述语音信息与所述多个操作之间的对应关系。

本公开的另一个方面提供了一种电子设备,包括,处理器,以及存储器,用于存储程序,其中,当所述程序被所述处理器执行时,使得所述处理器,接收语音信息,检测在接收语音信息之前、之后或之时获取的操作,以及建立所述语音信息与所述操作之间的对应关系。

可选地,所述处理器建立所述语音信息与所述操作之间的对应关系包括,若所述操作对应于可执行指令,则建立所述语音信息与所述可执行指令之间的对应关系,以使得当再次接收到语音信息时,所述电子设备基于所述对应关系,执行所述可执行指令。

可选地,所述处理器建立所述语音信息与所述操作之间的对应关系包括,若所述语音信息被识别后得到的一部分内容与所述可执行指令相匹配,则建立所述语音信息与所述可执行指令之间的对应关系。

可选地,所述处理器检测在接收语音信息之前、之后或之时获取的操作包括,若不能正确识别所述语音信息,或者不存在所述语音信息所对应的可执行指令,则检测在接收语音信息之后获取的操作。

可选地,所述处理器检测在接收语音信息之前、之后或之时获取的操作包括,检测在接收语音信息之前、之后或之时获取的多个操作,以及所述处理器建立所述语音信息与所述操作之间的对应关系包括,建立所述语音信息与所述多个操作之间的对应关系。

本公开的另一方面提供了一种信息处理系统,包括接收模块、检测模块和处理模块。接收模块,用于接收语音信息。检测模块,用于检测在接收语音信息之前、之后或之时获取的操作。处理模块,用于建立所述语音信息与所述操作之间的对应关系。

可选地,所述处理模块包括第一处理子模块,用于在所述操作对应于可执行指令的情况下,建立所述语音信息与所述可执行指令之间的对应关系,以使得当再次接收到所述语音信息时,所述电子设备能够基于所述对应关系,执行所述可执行指令。

可选地,所述处理模块包括第二处理子模块,用于在所述语音信息被识别后得到的一部分内容与所述可执行指令相匹配的情况下,建立所述语音信息与所述可执行指令之间的对应关系。

可选地,所述检测模块包括第一检测子模块,用于在不能正确识别所述语音信息,或者不存在所述语音信息所对应的可执行指令的情况下,检测在接收语音信息之后获取的操作。

可选地,所述检测模块包括第二检测子模块,用于检测在接收语音信息之前、之后或之时获取的多个操作,以及所述处理模块包括第三处理子模块,用于建立所述语音信息与所述多个操作之间的对应关系。

本公开的另一方面提供了一种非易失性存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。

附图说明

为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:

图1示意性示出了根据本公开实施例的信息处理方法和电子设备的应用场景;

图2示意性示出了根据本公开实施例的信息处理方法的流程图;

图3示意性示出了根据本公开另一实施例的信息处理方法的流程图;

图4示意性示出了根据本公开另一实施例的信息处理方法的流程图;

图5示意性示出了根据本公开另一实施例的信息处理方法的流程图;

图6示意性示出了根据本公开实施例的信息处理系统的框图;

图7a示意性示出了根据本公开另一实施例的处理模块的框图;

图7b示意性示出了根据本公开另一实施例的处理模块的框图;

图7c示意性示出了根据本公开另一实施例的检测模块的框图;

图7d示意性示出了根据本公开另一实施例的信息处理系统的框图;以及

图8示意性示出了根据本公开实施例的电子设备的框图。

具体实施方式

以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“a或b”应当被理解为包括“a”或“b”、或“a和b”的可能性。

附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。

因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(hdd);光存储装置,如光盘(cd-rom);存储器,如随机存取存储器(ram)或闪存;和/或有线/无线通信链路。

本公开的实施例提供了一种信息处理方法和电子设备。该方法通过将用户语音和用户操作建立联系,帮助机器理解用户的语音指令,提高用户体验。

图1示意性示出了根据本公开实施例的信息处理方法和电子设备的应用场景。

如图1所示,电子设备100既能够接收用户的语音信息,也能够接收用户的操作。在接收到用户的语音信息或操作对应于可执行指令的情况下,电子设备100可以基于该语音信息或者操作,执行对应的可执行指令。

然而,在一些情况下,例如语音指令不准确时,机器无法识别用户命令。例如带有方言或者特殊口音的人,说“打开散(闪)光灯”,语音识别出“打开”以及“散光灯”,却无法执行用户的真正意图打开闪光灯的功能。

根据本公开实施例提供的信息处理方法,可以在不能识别“打开散光灯”的情况下,继续检测用户在之后的一段时间内的操作。若用户在之后的一段时间内打开了闪光灯,则电子设备100可以将“打开散光灯”对应于打开闪光灯的操作。

根据本公开实施例,电子设备10例如可以是台式电脑,打印机、智能手环、手机或者平板电脑等电子设备,本公开在此不对电子设备的类型进行限制。

下面结合图1的应用场景,参考图2来描述根据本公开示例性实施方式的信息处理方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何应用场景。

图2示意性示出了根据本公开实施例的信息处理方法的流程图。

如图2所示,该方法包括操作s210~s230。

在操作s210,接收语音信息。

在操作s220,检测在接收语音信息之前、之后或之时获取的操作。

在操作s230,建立所述语音信息与所述操作之间的对应关系。

该方法通过将语音信息和获取的操作建立对应关系,帮助机器理解用户的语音指令,提高用户体验。具体地,该方法可以解决发音不准确导致语音指令无法识别的问题,有利于语音控制的普及,另一方面,用户可以自定义语音指令,更加符合用户习惯,减少了用户记忆指令的成本。

在操作s210,接收语音信息,例如可以是通过电子设备上的声音采集装置采集用户发出的语音信息。

在操作s220,检测在接收语音信息之前、之后或之时获取的操作,以及在操作s230,建立所述语音信息与所述操作之间的对应关系。下面以如下两种情况为例对本公开实施例的操作s220和s230进行说明。

根据本公开一些实施例,电子设备提供语音信息的定义功能。当使用该功能时,提示用户执行需要定义语音信息对应的操作,以及提示用户发出语音信息。此处,接收语音信息和接收操作之间的时间顺序可以由本领域技术人员任意设定,例如可以设定接收操作在接收语音信息之前、之后或之时,本公开对此不做限定。

电子设备接收用户的语音信息和操作后,可以建立所述语音信息与所述操作之间的对应关系,即定义了该语音信息的含义。

根据本公开另一些实施例,电子设备的语音信息定义功能可以是对用户透明的。例如,当用户说出一段语音信息时,电子设备在一定条件下会检测在接收该语音信息之后获取的操作,并自动地将其建立对应关系。

根据本公开实施例,所述建立所述语音信息与所述操作之间的对应关系包括,若所述操作对应于可执行指令,则建立所述语音信息与所述可执行指令之间的对应关系,以使得当再次接收到所述语音信息时,所述电子设备能够基于所述对应关系,执行所述可执行指令。

在上述情况下,将语音信息和操作建立对应关系后,若所述操作对应于可执行指令,则建立所述语音信息与所述可执行指令之间的对应关系,当用户在之后使用电子设备的过程中,如果说出了该语音信息,电子设备可以将其转化为可执行指令,用于完成与上述操作对应的同样的指令。通过操作将所述语音信息和可执行指令建立对应关系,使得电子设备能够学习语音信息对应的指令。

需要注意的是,上述两种情况仅是为了便于理解本公开的精神和原理,本公开的实施方式在此方面不受任何限制。

图3示意性示出了根据本公开另一实施例的信息处理方法的流程图。

如图3所示,该方法包括操作s210、s220和s310。其中,操作s210和s220与图2所示意的实施例基本相同,此处不再赘述。

在操作s310,若所述语音信息被识别后得到的一部分内容与所述可执行指令相匹配,则建立所述语音信息与所述可执行指令之间的对应关系。

例如,如上文所述的示例,用户发出“打开散光灯”的语音信息时,电子设备在识别时,语音识别出“打开”、“散光灯”,无法执行用户的真正意图打开闪光灯的功能。之后用户通过操作打开了电子设备上的闪光灯。电子设备根据该操作指令,判断“打开”以及“灯”能够与前述语音信息匹配,则可以建立语音指令“打开散光灯”与打开闪光灯的指令之间的对应关系。而在另一些情况下,例如,用户向其他人说“再见”,之后很快在电子设备上打开视频应用程序,想要通过该视频应用程序看一段视频。此时,电子设备虽然接收到了语音信息和操作,但是由于该语音信息和操作无法部分匹配,因此不会建立该语音信息与操作之间的联系。

当然,上述匹配的规则可以根据需要设定,例如可以是一个或多个关键词一致、一定比例的关键词一致或者部分关键词含义相关联等。

该方法在语音信息被识别后得到的一部分内容与所述可执行指令相匹配时,才建立对应关系,减少了将不相关的操作和语音信息的情况。

图4示意性示出了根据本公开另一实施例的信息处理方法的流程图。

如图4所示,该方法包括操作s210、s410和s230。其中,操作s210和s230与图2所示意的实施例基本相同,此处不再赘述。

在操作s410,若不能正确识别所述语音信息,或者不存在所述语音信息所对应的可执行指令,则检测在接收语音信息之后获取的操作。

例如,用户发出“打开闪光灯”的语音信息,由于电子设备能够正确识别出该指令,因此,在之后获取用户操作时,不再将语音信息和操作之间建立对应关系。

又如,用户发出“打开摄像头”的语音信息,由于电子设备能够正确识别出该指令,执行了对应的指令,打开了电子设备上的默认摄像头,例如手机的后置摄像头。然后,用户通过操作关闭了后置摄像头,并打开了前置摄像头。电子设备可以根据该操作,认为识别了错误的指令,可以将“打开摄像头”的语音信息与打开前置摄像头建立对应关系,即重新定义了已有的语音指令。

再如,用户发出“帮我导航”的指令,由于不存在对应的可执行指令,因此,在之后获取到用户打开地图应用软件时,将“帮我导航”语音信息与打开地图应用软件的操作建立对应关系。

该方法在不能识别语音对应的指令时,才检测之后获取的操作,使正确识别的指令不受干扰,并且节省了系统资源。

图5示意性示出了根据本公开另一实施例的信息处理方法的流程图。

如图5所示,该方法包括操作s210、s510和s520。其中,操作s210与图2所示意的实施例基本相同,此处不再赘述。

在操作s510,检测在接收语音信息之前、之后或之时获取的多个操作。

在操作s520,建立所述语音信息与所述多个操作之间的对应关系。

例如,用户发出“播放xx音乐”的语音信息,电子设备在识别后,由于不存在对应的可执行指令,而不能执行任何指令,即不能对用户的语音信息作出响应。根据本公开实施例,在之后的一段时间内,检测到用户打开某音乐播放应用程序,在该程序中选中xx音乐并进行播放,因此,电子设备可以将该一系列操作与语音消息“播放xx音乐”建立对应关系,当用户再次说出“播放xx音乐”的语音信息时,可以通过执行对应的一系列操作,播放该音乐。

该方法可以将语音信息与多个操作建立对应关系,从而可以使电子设备学习复杂的指令,在获得一个语音信息后,可以识别并执行更加复杂的一系列指令。

通过本公开实施例的方法,一方面能够方便发音不标准的用户使用语音控制,另一方面,用户可以根据自己的习惯定义语音指令,减少用户的记忆成本,并且自定义的语音指令可能更加符合用户需求,而且,对于一个复杂操作,用户不必要记忆复杂的指令组合,而是可以通过自定义语音指令,一次性地执行多个指令以满足用户需要,提高用户体验,利于语音技术的普及。

图6示意性示出了根据本公开实施例的信息处理系统600的框图。

如图6所示,信息处理系统600包括接收模块610、检测模块620和处理模块630。该信息处理系统600可以执行上面参考图2~图5描述的方法,以实现语音指令的学习。

具体地,接收模块610,例如执行上文参考图2描述的操作s210,用于接收语音信息。

检测模块620,例如执行上文参考图2描述的操作s220,用于检测在接收语音信息之前、之后或之时获取的操作。

处理模块630,例如执行上文参考图2描述的操作s230,用于建立所述语音信息与所述操作之间的对应关系。

图7a示意性示出了根据本公开另一实施例的处理模块630的框图。

如图7a所示,处理模块630包括第一处理子模块631。

第一处理子模块631,用于在所述操作对应于可执行指令的情况下,建立所述语音信息与所述可执行指令之间的对应关系,以使得当再次接收到所述语音信息时,所述电子设备能够基于所述对应关系,执行所述可执行指令。

图7b示意性示出了根据本公开另一实施例的处理模块630的框图。

如图7b所示,处理模块630包括第二处理子模块632。

第二处理子模块632,例如执行上文参考图3描述的操作s310,用于在所述语音信息被识别后得到的一部分内容与所述可执行指令相匹配的情况下,建立所述语音信息与所述可执行指令之间的对应关系。

图7c示意性示出了根据本公开另一实施例的检测模块620的框图。

如图7c所示,检测模块620包括第一检测子模块621。

第一检测子模块621,例如执行上文参考图4描述的操作s410,用于在不能正确识别所述语音信息,或者不存在所述语音信息所对应的可执行指令的情况下,检测在接收语音信息之后获取的操作。

图7d示意性示出了根据本公开另一实施例的信息处理系统700的框图。

如图7d所示,信息处理系统700包括接收模块610、第二检测子模块622和第三处理子模块633。

第二检测子模块,例如执行上文参考图5描述的操作s510,用于检测在接收语音信息之前、之后或之时获取的多个操作。

第三处理子模块,例如执行上文参考图5描述的操作s520,用于建立所述语音信息与所述多个操作之间的对应关系。

可以理解的是,上述模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,上述模块中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,上述模块中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。

图8示意性示出了根据本公开实施例的电子设备的框图800。

如图8所示,电子设备800包括处理器810、存储器820以及信号接收器830。该电子设备800可以执行上面参考图2~图5描述的方法,以实现语音信息和在语音信息之后获取的操作建立对应关系。

具体地,处理器810例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器810还可以包括用于缓存用途的板载存储器。处理器810可以是用于执行参考图2~图5描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

存储器820,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(hdd);光存储装置,如光盘(cd-rom);半导体存储器,如随机存取存储器(ram)或闪存;和/或有线/无线通信链路。

存储器820可以包括计算机程序821,该计算机程序821可以包括代码/计算机可执行指令,其在由处理器810执行时使得处理器810执行例如上面结合图2~图5所描述的方法流程及其任何变形。

计算机程序821可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序821中的代码可以包括一个或多个程序模块,例如包括821a、模块821b、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器810执行时,使得处理器810可以执行例如上面结合图2~图5所描述的方法流程及其任何变形。

根据本发明的实施例,接收模块610、检测模块620以及处理模块630中的至少一个可以实现为参考图8描述的计算机程序模块,其在被处理器810执行时,可以实现上面描述的相应操作。

本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1