本发明涉及一种智能对话领域,特别是涉及一种智能对话装置、反馈式智能语音控制系统及方法。
背景技术:
随着语音分析技术的发展,现有很多智能人机对话装置中都带有语音控制,在现有的语音控制方案中,主要是单向无反馈的语音操控,即通过用户输入正确的语音指令,智能人机对话装置对正确的语音指令进行响应,从而执行响应的操作;但是,当用户输入的语音指令有误时,装置无法分析用户真实意图,进而不能快速、准确地响应用户,无法执行用户想要其执行的正确操作,例如,对于某个带有开关灯功能的智能人机对话装置,如果该装置内置的正确语音指令为“开灯”,即如果用户对该装置说“开灯”,则该装置能快速准确地响应用户的意图,自动开灯,但是,如果用户对该装置说“请开下灯吧”,虽然此时用户也是想让该装置自动开灯,但是由于用户说的并不是正确语音指令“开灯”,从而导致该装置无法识别用户的语音指令,此时该装置就无法快速、准确地响应用户的真实意图,无法执行用户想要的开灯操作;
由此可知,现有的智能人机对话装置在语音分析和处理这一块有很大的技术缺陷,导致无法智能分析用户语音指令,造成无法快速、准确地预测和响应用户的真实意图,并且,也不能在用户发出错误语音指令的情况下对用户进行指导与提示,告知其正确的语音指令,从而导致现有的智能人机对话装置语音识别的范围较窄、识别率较低,用户使用体验很差。
技术实现要素:
本发明要解决的技术问题是为了克服现有技术中智能人机对话装置语音识别的范围较窄、识别率较低,用户使用体验很差的缺陷,提供一种智能对话装置、反馈式智能语音控制系统及方法。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供了一种反馈式智能语音控制系统,包括语音输入模块、语音识别模块、数据处理模块、本地指令库以及mcu(微控制单元);
所述语音输入模块与所述语音识别模块电连接,所述语音识别模块与所述数据处理模块电连接,所述数据处理模块分别与所述本地指令库及所述mcu电连接;
所述本地指令库用于存储文本指令及对应的控制指令;
所述语音输入模块用于采集用户输入的语音信息,并传输至所述语音识别模块;
所述语音识别模块用于将所述语音信息转换为文本信息,并传输至所述数据处理模块;
所述数据处理模块用于判断所述本地指令库中是否包含与所述文本信息完全相同的文本指令,若否,则对所述文本信息与所述本地指令库中的文本指令进行模糊匹配,若与一目标文本指令匹配成功,则将与所述目标文本指令对应的目标控制指令传输至所述mcu;
所述mcu用于根据所述目标控制指令执行操作。
较佳地,所述文本信息与所述目标文本指令匹配成功包括:
所述目标文本指令的关键字均包括在所述文本信息中,或,所述文本信息与所述目标文本指令的相同关键字的字数超过第一阈值,或,所述文本信息与所述目标文本指令的相同关键字的字数与所述目标文本指令的比值超过第二阈值。
较佳地,所述反馈式语音控制系统还包括语音输出模块;
所述数据处理模块还用于在所述文本信息与所述目标文本指令匹配成功时,将所述目标文本指令传输至所述语音输出模块,所述语音输出模块用于输出包括所述目标文本指令的提示语音。
较佳地,所述语音识别模块还包括声纹识别单元,用于在所述语音识别模块接收到所述语音信息后,识别用户的声纹特征,并判断识别出的声纹特征是否与预设声纹特征匹配,若是,则调用所述语音识别模块将所述语音信息转换为文本信息。
较佳地,所述反馈式智能语音控制系统还包括指纹识别模块,用于对用户指纹进行识别,并在识别成功之后启用所述语音输入模块采集用户输入的语音信息。
较佳地,所述反馈式智能语音控制系统还包括指令增加模块,用于将所述文本信息及所述文本信息与所述目标文本指令的对应关系增加至所述本地指令库中进行存储。
较佳地,所述反馈式智能语音控制系统还包括存储模块及统计模块,所述存储模块用于在所述文本信息与所述目标文本指令匹配成功时存储所述文本信息;
所述统计模块用于统计所述文本信息的存储次数,并在判断所述存储次数超过第三阈值时,启用所述指令增加模块。
较佳地,所述语音识别模块包括:
第一预存单元,用于预存多个目标词组及与每个目标词组对应的同类词组和近义词组;
字符串转换单元,用于将所述语音信息转换为字符串;
拆分单元,用于将所述字符串拆分为若干词组;
判断单元,用于判断拆分出的词组是否包括存储在所述第一预存单元中的目标词组,并在判断为是时,获取与所述拆分出的词组中的目标词组对应的同类词组和近义词组;
文本信息生成单元,用于对所述拆分出的词组中的非目标词组与目标词组或目标词组对应的同类词组和近义词组进行任意组合,生成多个文本信息,并传输至所述数据处理模块。
较佳地,所述语音识别模块包括:
第二预存单元,用于预存不同种类的特殊语言的语音信息与一标准语言的语音信息的对应关系;
语言转换单元,用于在识别出用户输入的语音信息为特殊语言的语音信息时,将特殊语言的语音信息转换为对应的标准语言的语音信息;
文本转换单元,用于将所述对应的标准语言的语音信息转换为文本信息,并传输至所述数据处理模块。
较佳地,在所述本地指令库中,同一个控制指令对应多个文本指令,不同的文本指令用于表征不同的用户表达习惯。
本发明还提供了一种智能对话装置,其包括如上所述的反馈式智能语音控制系统。
较佳地,所述智能对话装置为故事机或点读机。
本发明还提供了一种反馈式智能语音控制方法,包括以下步骤:
s1、存储文本指令及对应的控制指令;
s2、采集用户输入的语音信息;
s3、将所述语音信息转换为文本信息;
s4、判断是否有与所述文本信息完全相同的文本指令,若否,则对所述文本信息与所述文本指令进行模糊匹配,若与一目标文本指令匹配成功,则输出与所述目标文本指令对应的目标控制指令;
s5、根据所述目标控制指令执行操作。
较佳地,步骤s4中所述文本信息与所述目标文本指令匹配成功包括:
所述目标文本指令的关键字均包括在所述文本信息中,或,所述文本信息与所述目标文本指令的相同关键字的字数超过第一阈值,或,所述文本信息与所述目标文本指令的相同关键字的字数与所述目标文本指令的比值超过第二阈值。
较佳地,步骤s4中在所述文本信息与所述目标文本指令匹配成功时,还输出包括所述目标文本指令的提示语音。
较佳地,步骤s3包括:
根据所述语音信息识别用户的声纹特征,并判断识别出的声纹特征是否与预设声纹特征匹配,若是,则将所述语音信息转换为文本信息。
较佳地,步骤s2之前还包括:
对用户指纹进行识别,若识别成功,则执行步骤s2。
较佳地,步骤s5之后还包括:
s6、存储所述文本信息及所述文本信息与所述目标文本指令的对应关系。
较佳地,步骤s6中包括:
存储所述文本信息,统计所述文本信息的存储次数,并在判断所述存储次数超过第三阈值时,存储所述文本信息与所述目标文本指令的对应关系。
较佳地,步骤s3包括:
s311、预存多个目标词组及与每个目标词组对应的同类词组和近义词组;
s312、将所述语音信息转换为字符串;
s313、将所述字符串拆分为若干词组;
s314、判断拆分出的词组是否包括存储在所述预存单元中的目标词组,并在判断为是时,获取与所述拆分出的词组中的目标词组对应的同类词组和近义词组;
s315、对所述拆分出的词组中的非目标词组与目标词组或目标词组对应的同类词组和近义词组进行任意组合,生成多个文本信息。
较佳地,步骤s3包括:
s321、预存不同种类的特殊语言的语音信息与一标准语言的语音信息的对应关系;
s322、在识别出用户输入的语音信息为特殊语言的语音信息时,将特殊语言的语音信息转换为对应的标准语言的语音信息;
s323、将所述对应的标准语言的语音信息转换为文本信息,并传输至所述数据处理模块。
较佳地,步骤s1中同一个控制指令对应多个文本指令,不同的文本指令用于表征不同的用户表达习惯。
本发明的积极进步效果在于:本发明实现了在智能人机对话过程中,当用户输入的语音指令有误时,能够对语音指令进行进一步分析,从而自动分析和预测用户的真实意图,进而能快速、准确地响应用户的真实意图,自动执行用户想要执行的操作,从而提高了语音识别率和识别范围,同时还可以将正确语音指令反馈提示给用户,达到了对用户进行指导的效果,改善了用户的使用体验。
附图说明
图1为本发明的实施例1的反馈式智能语音控制系统的模块示意图。
图2为本发明的实施例1的反馈式智能语音控制方法的流程图。
图3为本发明的实施例2的反馈式智能语音控制系统的模块示意图。
图4为本发明的实施例2的反馈式智能语音控制方法的流程图。
图5为本发明的实施例3的反馈式智能语音控制系统的模块示意图。
图6为本发明的实施例3的反馈式智能语音控制方法的流程图。
图7为本发明的实施例4的反馈式智能语音控制系统的语音识别模块的模块示意图。
图8为本发明的实施例4的反馈式智能语音控制方法中步骤103的具体操作流程图。
图9为本发明的实施例5的反馈式智能语音控制系统的语音识别模块的模块示意图。
图10为本发明的实施例5的反馈式智能语音控制方法中步骤103的具体操作流程图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
如图1所示,本实施例的反馈式智能语音控制系统包括语音输入模块1、语音识别模块2、数据处理模块3、本地指令库4以及mcu5;
其中,所述语音输入模块1与所述语音识别模块2电连接,所述语音识别模块2与所述数据处理模块3电连接,所述数据处理模块3分别与所述本地指令库4及所述mcu5电连接;
在所述本地指令库4中,会预先存储文本指令及对应的控制指令,所述控制指令用于控制所述mcu5执行相应的操作;
在本实施例中,所述语音输入模块1具体可包括麦克风,用于采集用户输入的语音信息,并传输至所述语音识别模块2;
所述语音识别模块2用于将所述语音信息转换为文本信息,并传输至所述数据处理模块;语音识别及语音转换为文本已经属于本领域比较成熟的技术,在此就不再赘述;
所述数据处理模块3则用于判断所述本地指令库4中是否包含与所述文本信息完全相同的文本指令,若是,则说明用户输入的是正确语音指令,此时就可以和现有技术中一样响应用户的正确语音指令,即通过所述mcu5响应与所述文本指令相对应的控制指令,执行相应的操作;
若否,则对所述文本信息与所述本地指令库4中的文本指令进行模糊匹配,若与一目标文本指令匹配成功,则将与所述目标文本指令对应的目标控制指令传输至所述mcu5;
所述mcu5用于根据所述目标控制指令执行操作。
在本实施例中,所述数据处理模块3可以采用现有的模糊匹配算法来对所述文本信息与所述本地指令库4中的文本指令进行模糊匹配,在此就不再赘述。
下面举一个本实施例的反馈式智能语音控制系统的具体应用实例:
例如,在本实施例的反馈式智能语音控制系统中,所述本地指令库中预先存储了文本指令“开灯”以及对应的开灯指令,通过所述开灯指令可以控制所述mcu执行开灯操作;
当用户输入语音信息“开灯”时,所述语音识别模块能够将语音信息“开灯”转换为文本信息“开灯”,所述数据处理模块就会判断出转换后的文本信息“开灯”与所述本地指令库中的文本指令“开灯”完全相同,此时,即可判断出用户发出的是正确语音指令,从而就可以控制所述mcu执行相应的开灯动作;
当用户输入语音信息“请开灯吧”时,所述语音识别模块能够将语音信息“请开灯吧”转换为文本信息“请开灯吧”,所述数据处理模块就会判断出转换后的文本信息“请开灯吧”与所述本地指令库中的文本指令“开灯”并不相同,此时就会对所述文本信息“请开灯吧”与所述本地指令库中预先存储的各个文本指令分别进行模糊匹配,然后确定其与目标文本指令“开灯”匹配成功,并将与所述目标文本指令“开灯”相对应的开灯指令(即目标控制指令)传输至所述mcu,所述mcu就会根据开灯指令执行开灯操作;
可见,在本实施例中,当用户输入错误的语音指令时,本实施例的反馈式智能语音控制系统能够在将用户的语音指令转换为文本信息后,对文本信息作进一步的分析处理,从而能够准确分析预测用户的真实意图,并能够响应用户的真实意图,自动执行用户想要的操作。
本实施例还提供了一种反馈式智能语音控制方法,其利用本实施例的反馈式智能语音控制系统实现,如图2所示,包括以下步骤:
步骤101、存储文本指令及对应的控制指令;
步骤102、采集用户输入的语音信息;
步骤103、将所述语音信息转换为文本信息;
步骤104、判断是否有与所述文本信息完全相同的文本指令,若否,则对所述文本信息与所述文本指令进行模糊匹配,若与一目标文本指令匹配成功,则输出与所述目标文本指令对应的目标控制指令;
步骤105、根据所述目标控制指令执行操作。
实施例2
本实施例的反馈式智能语音控制系统与实施例1基本相同,主要区别在于:如图4所示,本实施例的反馈式智能语音控制系统还包括语音输出模块6以及指纹识别模块7,并且所述语音识别模块2还包括声纹识别单元21;
在本实施例的反馈式智能语音控制系统中,在利用所述语音输入模块1采集用户输入的语音信息之前,可以先通过所述指纹识别模块7对用户进行指纹识别,并只有在对用户进行指纹识别成功之后,才启用所述语音输入模块1,若识别失败,则不启用所述语音输入模块,这样指纹识别失败的用户就无法输入语音指令来控制所述反馈式智能语音控制系统,从而本实施例的反馈式智能语音控制系统大大提升了保密性和安全性。
在指纹识别的实施方案中,具体可预先存储正确的用户指纹,这样,在采集到指纹之后,进行指纹比对和匹配即可。
另外,在本实施例中,为了进一步提升保密性和安全性,本实施例中,在所述语音识别模块2接收到所述语音信息后,会先由所述声纹识别单元21识别用户的声纹特征,并判断识别出的声纹特征是否与预设声纹特征匹配,若是,则调用所述语音识别模块1将所述语音信息转换为文本信息并执行后续操作,若否,则不调用所述语音识别模块1。
由于每个人发出的语音信息都包含有其独特的声纹特征,这样,本实施例中利用所述声纹识别单元21可以保证,只有声纹特征匹配的特定用户发出的语音指令才会被进一步分析,从而提升了保密性和安全性。
另外,在本实施例中,所述数据处理模块3还用于在所述文本信息与所述目标文本指令匹配成功时,将所述目标文本指令传输至所述语音输出模块6,所述语音输出模块6用于输出包括所述目标文本指令的提示语音,从而可以将正确语音指令反馈给用户,以实施例1中的应用实例为例,如果正确语音指令为“开灯”,当用户输入语音信息“请开灯吧”,经过上述各个模块的操作之后,最终所述语音输出模块6会将包含正确语音指令的提示信息反馈给用户,例如具体可以为向用户语音提示:您是要开灯吗?如果是的话可以对我说开灯。
在本实施例中,所述数据处理模块3对所述文本信息与所述本地指令库4中的文本指令进行的模糊匹配具体可以为:
判断所述目标文本指令的关键字是否均包括在所述文本信息中,或,判断所述文本信息与所述目标文本指令的相同关键字的字数是否超过第一阈值,或,判断所述文本信息与所述目标文本指令的相同关键字的字数与所述目标文本指令的比值是否超过第二阈值;
而所述文本信息与所述目标文本指令匹配成功的情况则具体包括:
所述目标文本指令的关键字均包括在所述文本信息中,或,所述文本信息与所述目标文本指令的相同关键字的字数超过第一阈值,或,所述文本信息与所述目标文本指令的相同关键字的字数与所述目标文本指令的比值超过第二阈值。
本实施例同样提供了一种反馈式智能语音控制方法,如图4所示,本实施例的反馈式智能语音控制方法包括以下步骤:
步骤201、存储文本指令及对应的控制指令;
步骤2011、对用户指纹进行识别,若识别成功,则执行步骤202;
步骤202、采集用户输入的语音信息;
步骤203、根据所述语音信息识别用户的声纹特征,并判断识别出的声纹特征是否与预设声纹特征匹配,若是,则将所述语音信息转换为文本信息;
步骤204、判断是否有与所述文本信息完全相同的文本指令,若否,则对所述文本信息与所述文本指令进行模糊匹配,若与一目标文本指令匹配成功,则输出与所述目标文本指令对应的目标控制指令,并输出包括所述目标文本指令的提示语音;
步骤205、根据所述目标控制指令执行操作。
实施例3
本实施例的反馈式智能语音控制系统与实施例1基本相同,主要区别在于:如图5所示,本实施例的反馈式智能语音控制系统还包括指令增加模块8、存储模块9以及统计模块10;
在本实施例中,当所述文本信息与所述目标文本指令匹配成功时,所述存储模块9还存储所述文本信息,并且每当成功匹配一次,所述存储模块9就存储一次所述文本信息;
所述统计模块10则会统计所述文本信息的存储次数,并在判断所述存储次数超过第三阈值时,启用所述指令增加模块8;
所述指令增加模块8则用于将所述文本信息及所述文本信息与所述目标文本指令的对应关系增加至所述本地指令库中进行存储。
本实施例的反馈式智能语音控制系统可以对用户的发音习惯、说话习惯等进行归纳总结,从而生成全新的、符合用户习惯的文本指令。同样以实施例1中的应用实例为例,如果所述本地指令库中存储的正确文本指令为“开灯”,但由于用户说话喜欢用敬词,因此,每次用户想要开灯时输入的语音信息都是“请开灯吧”,这样,每次所述数据处理模块3都会对文本信息“请开灯吧”进行模糊匹配并且匹配成功,这样,在本实施例中,每次匹配成功之后所述存储模块9就会存储一次所述文本信息“请开灯吧”,所述统计模块10则会统计存储次数,当存储次数超过第三阈值时,所述指令增加模块就会将所述文本信息“请开灯吧”及所述文本信息与所述目标文本指令(即开灯指令)的对应关系增加至所述本地指令库中进行存储,由此,原先错误的语音指令“请开灯吧”也就变为正确语音指令,当用户再次输入语音指令“请开灯吧”以后,就不需要进行模糊匹配,就可以直接控制mcu执行开灯操作。
本实施例还提供了一种智能对话装置,其包括本实施例所述的反馈式智能语音控制系统,其中,优选地,所述智能对话装置可以为故事机或点读机,在本实施例中,通过用户语音控制故事机或点读机播放相应的音视频数据的实现原理与本实施例的反馈式智能语音控制系统完全相同,在此就不再赘述。
本实施例同样提供了一种反馈式智能语音控制方法,如图6所示,本实施例的反馈式智能语音控制方法包括以下步骤:
步骤301、存储文本指令及对应的控制指令;
步骤302、采集用户输入的语音信息;
步骤303、将所述语音信息转换为文本信息;
步骤304、判断是否有与所述文本信息完全相同的文本指令,若否,则对所述文本信息与所述文本指令进行模糊匹配,若与一目标文本指令匹配成功,则输出与所述目标文本指令对应的目标控制指令;
步骤305、根据所述目标控制指令执行操作;
步骤306、存储所述文本信息,统计所述文本信息的存储次数,并在判断所述存储次数超过第三阈值时,存储所述文本信息与所述目标文本指令的对应关系。
实施例4
本实施例的反馈式智能语音控制系统与实施例1基本相同,主要区别在于:如图7所示,本实施例的反馈式智能语音控制系统的语音识别模块2具体包括:第一预存单元21、字符串转换单元22、拆分单元23、判断单元24、文本信息生成单元25;
其中,所述第一预存单元21用于预存多个目标词组及与每个目标词组对应的同类词组和近义词组;
所述字符串转换单元22用于将所述语音信息转换为字符串;
所述拆分单元23用于将所述字符串拆分为若干词组;
所述判断单元24用于判断拆分出的词组是否包括存储在所述第一预存单元中的目标词组,并在判断为是时,获取与所述拆分出的词组中的目标词组对应的同类词组和近义词组;
所述文本信息生成单元25用于对所述拆分出的词组中的非目标词组与目标词组或目标词组对应的同类词组和近义词组进行任意组合,生成多个文本信息,并传输至所述数据处理模块。
本实施例中,所述语音识别模块可以利用上述各个单元对用户输入的语音信息进行更进一步地分析,可以根据用户输入的语音信息转换后的字符串中所包括的目标词组查询出相对应的同类词组和近义词组,并将其与字符串中的非目标词组进行任意组合,从而实现了用户说的一句话,最终可以转换成多个文本信息,然后对每个文本信息进行匹配,只要其中有一个匹配成功,那么用户发出的语音信息就可以得到响应,从而提高了语音信息匹配成功的可能性,提升了对用户输入语音信息的响应成功率。
下面举一个本实施例的反馈式智能语音控制系统的语音识别模块的具体应用实例:
例如,所述第一预存单元中预存有目标词组“谦让”,以及与其对应的同类词组“孔融让梨”和近义词组“谦虚”;当用户输入语音信息“我想听一个关于谦让的故事”时,所述字符串转换单元会将其转换为字符串“我想听一个关于谦让的故事”,然后所述拆分单元会将其依次拆分为若干词组,例如拆分为“我”、“想听”、“一个”、“关于”、“谦让”、“的”、“故事”,其中将字符串拆分为词组已经属于本领域比较成熟的现有技术,在此就不再赘述;这样,所述判断单元会判断拆分出的词组是否包括存储在预存单元中的目标词组,经判断,发现词组“谦让”属于目标词组,然后就获取与“谦让”相对应的同类词组“孔融让梨”和近义词组“谦虚”;接着所述文本信息生成单元就可以对所述拆分出的词组中的非目标词组(即包括:“我”、“想听”、“一个”、“关于”、“的”、“故事”)与目标词组或目标词组对应的同类词组和近义词组(即包括“谦让”、“孔融让梨”、“谦虚”)进行任意组合,生成多个文本信息,当然,优选地,在组合时,各个词组的初始顺序保持不变,这样,最终会生成三个文本信息:
文本信息一:我想听一个关于谦让的故事;
文本信息二:我想听一个关于孔融让梨的故事;
文本信息三:我想听一个关于谦虚的故事;
然后将这三个文本信息传输至所述数据处理模块,所述数据处理模块会对上述三个文本信息分别进行匹配,而假设本实施例的反馈式智能语音控制系统运行在故事机中,其中故事机中存储有文本指令“孔融让梨”和对应的控制指令“语音播放孔融让梨的故事”,这样,文本信息二会最终与文本指令“孔融让梨”匹配成功,从而触发故事机播放孔融让梨的故事。
本实施例还提供了一种反馈式智能语音控制方法,其基本步骤与实施例1的反馈式智能语音控制方法基本相同,主要区别在于,如图8所示,本实施例的反馈式智能语音控制方法的步骤103具体包括:
步骤10311、预存多个目标词组及与每个目标词组对应的同类词组和近义词组;
步骤10312、将所述语音信息转换为字符串;
步骤10313、将所述字符串拆分为若干词组;
步骤10314、判断拆分出的词组是否包括存储在所述预存单元中的目标词组,并在判断为是时,获取与所述拆分出的词组中的目标词组对应的同类词组和近义词组;
步骤10315、对所述拆分出的词组中的非目标词组与目标词组或目标词组对应的同类词组和近义词组进行任意组合,生成多个文本信息。
实施例5
本实施例的反馈式智能语音控制系统与实施例1基本相同,主要区别在于:如图9所示,本实施例的反馈式智能语音控制系统的语音识别模块2具体包括:第二预存单元26、语言转换单元27以及文本转换单元28;
其中,所述第二预存单元26用于预存不同种类的特殊语言的语音信息与一标准语言的语音信息的对应关系;
所述语言转换单元27用于在识别出用户输入的语音信息为特殊语言的语音信息时,将特殊语言的语音信息转换为对应的标准语言的语音信息;
所述文本转换单元28用于将所述对应的标准语言的语音信息转换为文本信息,并传输至所述数据处理模块。
在本实施例中,所谓的特殊语言具体可指方言,不同种类的特殊语言即表示不同地区的方言,而所述的标准语言即是指普通话,即本实施例的所述第二预存单元预存有不同的方言的语音信息与普通话的语音信息的对应关系,例如对于同一个语音信息“吃饭”,不同地方的方言所对应的的语音是不同的,而不同的表示“吃饭”的方言均预存在所述第二预存单元中,与标准的普通话语音“吃饭”相对应;
所述语言转换单元则是在识别出用户输入的语音信息是方言时,将其转换为普通话的语音信息;然后所述文本转换单元将普通话的语音信息转换为文本信息,并传输至所述数据处理模块进行匹配;
本实施例的语音识别模块实现了识别不同地区的用户输入语音信息时的方言,并将方言表达的语音信息转换为普通话对应的标准语音信息进行处理,从而本实施例拓展了能够处理的语音的种类,提升了用户的使用体验。
下面举一个本实施例的反馈式智能语音控制系统的语音识别模块的具体应用实例:
例如,所述第一预存单元中预存有不同种类的方言表达“我想听关于吃饭的相声”的语音信息,以及普通话表达“我想听关于吃饭的相声”的语音信息;当一个上海人用上海话输入“我想听关于吃饭的相声”时,所述语言转换模块能够识别出表达“我想听关于吃饭的相声”的语音信息为上海话,并将其转换为普通话表达的“我想听关于吃饭的相声”的语音信息,然后所述文本转换单元就可以将普通话表达的“我想听关于吃饭的相声”的语音信息转换为文本信息“我想听关于吃饭的相声”,并传输至所述数据处理模块进行匹配,而假设本实施例的反馈式智能语音控制系统运行在故事机中,其中故事机中存储有文本指令“我想听关于吃饭的相声”和控制指令“播放一段关于吃饭的相声”,从而用户用上海话说出的语音信息“我想听关于吃饭的相声”就能够被成功识别和响应,最终控制故事机播放一段关于吃饭的相声,从而能够对用方言发出指令的用户进行正确的响应。
本实施例还提供了一种反馈式智能语音控制方法,其基本步骤与实施例1的反馈式智能语音控制方法基本相同,主要区别在于,如图10所示,本实施例的反馈式智能语音控制方法的步骤103具体包括:
步骤10321、预存不同种类的特殊语言的语音信息与一标准语言的语音信息的对应关系;
步骤10322、在识别出用户输入的语音信息为特殊语言的语音信息时,将特殊语言的语音信息转换为对应的标准语言的语音信息;
步骤10323、将所述对应的标准语言的语音信息转换为文本信息,并传输至所述数据处理模块。
实施例6
本实施例的反馈式智能语音控制系统与实施例1基本相同,主要区别在于:在所述本地指令库中,同一个控制指令对应多个文本指令,不同的文本指令用于表征不同的用户表达习惯;本实施例实现了将不同用户关于同一个控制指令的多个不同的文本指令统一存储起来,并均与同一个控制指令相对应,这样,对于具有不同表达习惯的用户,本实施例的反馈式智能语音控制系统均能够对其进行正确响应和反馈。
例如,对于同一个控制指令“开灯”,不同用户可能会有不同的表达习惯,例如包括“开灯”、“光亮一点”、“提高照明度”等等,本实施例的本地指令库中会将这些不同的表达习惯的文本指令均与同一个控制指令“开灯”进行对应;这样,无论是哪个表达习惯的用户,只要其输入的语音信息转换为文本信息之后,能够与本地指令库中的某一个表征用户特俗表达习惯的文本指令成功匹配,都能够实现最终执行用户想要的控制指令。
本实施例还提供了一种反馈式智能语音控制方法,其基本步骤与实施例1的反馈式智能语音控制方法基本相同,主要区别在于,在本实施例的步骤101中,同一个控制指令对应多个文本指令,不同的文本指令用于表征不同的用户表达习惯。虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。