一种语音处理的方法、装置及电子设备与流程

文档序号:14122203阅读:230来源:国知局
一种语音处理的方法、装置及电子设备与流程

本发明涉及通信技术领域,具体涉及一种语音处理的方法、装置及电子设备。



背景技术:

随着智能终端和各种社交软件的发展,人们之间的交流越来越多,其中,文字和语音交流最为普遍。语音交流的方式有很多,例如电话通话、语音聊天、发送语音等等。在语音交流的过程中,声音一定程度代表着个人的形象。好听悦耳的声音让人感到愉悦开心,会乐于与说话者进一步交谈。因此,好听的声音可以为人加分,提升人受欢迎的程度。

人人都希望拥有着跟播音员一样温润饱满的声音,但现实情况下,除了正常说话的腔调,每个人在刚起床时、感冒时声音会沙哑,在特殊场合低声说话时声音会不够明亮等等,在这种情况下,会造成用户对语音交流产生排斥感。

发明人在实现本发明实施例的过程中发现,相关技术的语音处理不能有效地满足用户根据自己的喜好来修正润色自己的嗓音,再传输给对端用户的需求。



技术实现要素:

本发明实施例提供一种语音处理的方法、装置及电子设备,以对用户的语音进行修饰,生成美化的语音,有效地满足了用户对美化语音的需求,极大地提高了语音播放的听觉感受。

为了实现上述目的,本发明实施例公开了如下技术方案:

第一方面,本发明实施例提供了一种语音处理的方法,包括:获取待处理语音;接收对所述待处理语音的语音修正指令;根据所述语音修正指令,获取预设语音参数值;若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;将所述处理后的语音发送至通信方的电子设备。

其中,所述方法还包括:接收样本语音;从所述样本语音提取语音参数,并且将提取到的语音参数存储为所述预设语音参数值。

其中,在所述获取待处理语音之后,所述方法还包括:对所述待处理语音进行预处理,所述预处理包括降噪。

其中,在所述若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音之后,所述方法还包括:接收对所述处理后的语音的调整指令,并根据所述调整指令,对所述处理后的语音进行调整。

其中,在所述将所述处理后的语音发送至通信方的电子设备之前,所述方法还包括:接收对所述处理后的语音的试听指令,并根据所述试听指令,播放所述处理后的语音。

其中,所述待处理语音的语音参数包括分贝、频率和/或波形。

第二方面,本发明实施例提供了一种语音处理的装置,包括:语音获取单元,用于获取待处理语音;修正指令接收单元,用于接收对所述待处理语音的语音修正指令;预设参数获取单元,用于根据所述语音修正指令,获取预设语音参数值;修正单元,用于若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;发送单元,用于将所述处理后的语音发送至通信方的电子设备。

其中,所述装置还包括:样本接收单元,用于接收样本语音;参数提取单元,用于从所述样本语音提取语音参数,并且将提取到的语音参数存储为所述预设语音参数值。

其中,在所述语音获取单元之后,所述装置还包括:预处理单元,用于对所述待处理语音进行预处理,所述预处理包括降噪。

其中,在所述修正单元之后,所述装置还包括:调整单元,用于接收对所述处理后的语音的调整指令,并根据所述调整指令,对所述处理后的语音进行调整。

其中,在所述发送单元之前,所述装置还包括:试听单元,用于接收对所述处理后的语音的试听指令,并根据所述试听指令,播放所述处理后的语音。

其中,所述待处理语音的语音参数包括分贝、频率和/或波形。

第三方面,本发明实施例提供了一种语音处理的电子设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的语音处理的方法。

第四方面,本发明实施例还提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使电子设备能够执行如上所述的语音处理的方法。

第五方面,本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如上所述的语音处理的方法。

本发明实施例的有益效果是:区别于现有技术的情况下,本发明实施例提供的一种语音处理的方法通过获取待处理语音;接收对所述待处理语音的语音修正指令;根据所述语音修正指令,获取预设语音参数值;若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;将所述处理后的语音发送至通信方的电子设备。通过以上方式,对用户的语音进行修饰,生成美化的语音,有效地满足了用户对美化语音的需求,极大地提高了语音播放的听觉感受。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

图1是本发明实施例提供的一种语音处理的方法的流程示意图;

图2是本发明另一实施例提供的一种语音处理的方法的流程示意图;

图3是本发明实施例提供的一种语音处理的方法的应用实例流程示意图;

图4是本发明实施例提供的一种智能手机语音处理的操作界面示意图;

图5是本发明实施例提供一种语音处理的装置的结构示意图;

图6是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明实施例提供一种语音处理的方法、装置及电子设备,所述方法和装置可以满足对用户的语音进行修饰,生成美化的语音的需求,极大地提高了语音播放的听觉感受。

本发明实施例的语音处理的方法,可以在任何合适类型,具有用户交互装置和运算能力的处理器的用户终端中执行,例如台式计算机、智能手机、平板电脑以及其他用户终端中。

本发明实施例的语音处理的装置可以作为其中一个软件或者硬件功能单元,独立设置在上述用户终端中,也可以作为整合在处理器中的其中一个功能模块,执行本发明实施例的语音处理的方法。

在本发明的实施例中,电子设备可以是智能手机、计算机、智能手表、智能手环、平板电脑、掌上电脑等等具有语音功能的电子设备。上述电子设备支持各种桌面应用程序的安装,诸如以下桌面应用程序中的一个或者多个桌面应用程序:即时消息应用程序、电话应用程序、视频应用程序、电子邮件应用程序、数码录像机应用程序以及等等。

具体地,下面结合附图,对本发明实施例作进一步阐述。

实施例一

图1是本发明实施例提供的一种语音处理的方法的流程示意图。请参阅图1,语音处理的方法应用于电子设备,其中,该语音处理的方法包括:

110、获取待处理语音;

在本实施例中,上述“待处理语音”可以为该电子设备的用户在发送即时消息时输入的语音,例如微信的语音输入、语音聊天等;也可以为该电子设备的本地音频文件,例如录音文件、音乐等;还可以为电话通信时的语音等等。获取待处理语音的具体实施方式可以为:从寄存器中读取即时消息输入的语音;或者,通过读取存储器或内存中的音频信息获取本地音频文件;或者,从寄存器中读取电话通信的语音等等。

120、接收对所述待处理语音的语音修正指令;

在本实施例中,语音修正指令包括由电子设备根据相关操作而分发出用于执行如下一步骤所示的“获取预设语音参数值”的指令,电子设备根据该语音修正指令执行对应的事件。其中,相关操作可以是软操作或硬操作,软操作可以是电子设备根据预先逻辑输出触发信号,以使电子设备进一步分发出语音修正指令。硬操作可以是外部对电子设备的相关硬件进行操作而使电子设备分发出语音修正指令,例如,可以是用户在电子设备的触摸屏进行的触摸操作,可以是对电子设备的按键进行的操作,以及等等。

电子设备接收到语音修正指令时,再次根据预设逻辑完成下一步骤的执行。

130、根据所述语音修正指令,获取预设语音参数值;

在本实施例中,预设语音参数值用于作为待处理语音的修正的参考范围,可以为用户预先录制的一段自己较佳声音的参数值,或者为用户自定义设置的声音的参数值,或者为系统默认声音的参数值,等等。其中,参数值包括但不限于预设语音的分贝、频率和/或波形。

语音修正指令触发电子设备,使电子设备获取预设语音参数值。在获取过程中,电子设备可以根据待处理语音的语音参数的类型获取对应的预设语音参数值,例如,若待处理语音的语音参数包括分贝和频率,则获取预设语音的分贝和频率作为预设语音参数值。其中,设计者可以根据业务需求自行对电子设备配置对应的组件及方法以获取预设语音参数值。

140、若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;

在本实施例中,待处理语音的语音参数包括但不限于分贝、频率和/或波形,其中,分贝反映声音的音量,频率反映声音的音调,波形反映声音的音色。根据待处理语音的语音参数,分别与对应的预设语音参数值进行匹配,即将待处理语音的分贝、频率、波形,与预设语音的分贝、频率、波形一一进行匹配。其中,“匹配”可以为判断待处理语音的语音参数是否在预设语音参数值的范围内,若在范围内,则为匹配;若不在范围内,则为不匹配。例如,待处理语音的分贝为20db,预设语音参数值的分贝范围为50-60db,则待处理语音的语音参数与预设语音参数值不匹配。

在本实施例中,对待处理语音的语音参数进行修正可以为将待处理语音的语音参数调整为预设语音参数值的范围内,例如,待处理语音的分贝为20db,预设语音参数值的分贝范围为50-60db,将待处理语音的分贝调整为55db。因此,当预设语音参数值与待处理语音的语音参数不匹配时,根据预设语音参数值,对待处理语音的语音参数进行修正,得到处理后的语音,具体实施方式可以为:分别比较待处理语音的语音参数与预设语音参数值,判断待处理语音的语音参数是否在预设语音参数值范围内,若不是,则将待处理语音的语音参数分别修正为预设语音参数值范围内的数值,得到处理后的语音。例如:待处理语音的分贝为20db,频率为100hz,波形为x(t),预设语音参数值的分贝为50-60db,频率为500-700hz,波形为y(t),将待处理语音的分贝修正为55db,频率修正为500hz,并且计算x(t)和y(t)的相关数pxy,调整波形x(t),直至相关数pxy在0.6-1的范围内,则完成待处理语音的语音参数的修正,得到处理后的语音。

其中,待处理语音的语音参数还可以包括语速、音位等等。例如,对待处理语音的语速进行修正,使处理后的语音速度更适当、平稳,以使其更加悦耳。例如,预先设置预设语音参数值的标准音位,可以为普通话音位、粤语音位、英语音位等等,根据标准音位,对待处理语音的音位进行修正,以使语音的普通话、粤语或者英语更加标准。

150、将所述处理后的语音发送至通信方的电子设备。

在本实施例中,上述通信方可以为用户的即时消息的发送对象、通话的对象、会议的对象、听演讲的对象等等。通信方的电子设备可以为智能手机、计算机、智能手表、智能手环、平板电脑、掌上电脑或音响等等。在用户对处理后的语音感到满意后,接收用户的发送指令,该发送指令用户可以通过单击或长按发送按钮的方式输入,然后将处理后的语音发送至通信方的电子设备,从而给通信方带来良好的听觉感受。

本实施例提供的一种语音处理的方法,通过获取待处理语音;接收对所述待处理语音的语音修正指令;根据所述语音修正指令,获取预设语音参数值;若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;将所述处理后的语音发送至通信方的电子设备。通过以上方式,对用户的语音进行修饰,生成美化的语音,有效地满足了用户对美化语音的需求,极大地提高了语音播放的听觉感受。

实施例二

图2是本发明另一实施例提供的一种语音处理的方法的流程示意图,如图2所示,语音处理的方法应用于电子设备,其中,该语音处理的方法包括:

210、接收样本语音;

在本实施例中,用户可以通过录制样本语音,预先设置预设语音参数值。样本语音可以为用户在自我感觉声音状态良好时录制的一段语音;或者可以为用户录制的希望模仿的他人的一段语音,例如明星的语音、主持人的语音等等;或者还可以为动漫人物的一段语音,例如初音未来的语音、蜡笔小新的语音等等。

其中,用户可以录制多个样本语音,预先设置不同的预设语音参数值,作为不同的语音包保存下来。

220、从所述样本语音提取语音参数,并且将提取到的语音参数存储为所述预设语音参数值;

在本实施例中,从所述样本语音提取语音参数的具体实施方式可以是:在接收到样本语音后,该电子设备将该样本语音储存,然后对该样本语音进行信号处理,提取该样本语音的语音参数。其中,语音参数可以包括分贝、频率、波形等。

230、获取待处理语音;

240、对所述待处理语音进行预处理,所述预处理包括降噪;

在本实施例中,电子设备在获取待处理语音后,由于电子设备的用户在输入语音时,周围的环境可能比较嘈杂,或者用户输入的语音音量可能过小,或者由于设备原因使输入的语音存在噪声等,因此需要对待处理语音进行预处理。预处理可以为降噪,降噪是指减少噪声,例如环境噪声等。降噪可以通过数字信号处理实现,例如频域变换、小波变换等等。预处理还可以为放大,当待处理语音的音量太小时,通过信号处理对待处理语音进行人声识别,并将人声部分放大。

250、接收对所述待处理语音的语音修正指令;

260、根据所述语音修正指令,获取预设语音参数值;

270、若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;

280、接收对所述处理后的语音的调整指令,并根据所述调整指令,对所述处理后的语音进行调整;

在本实施例中,当用户对处理后的语音仍不满意,希望进行略微调整时,自由选择输入调整指令对处理后的语音进行调整。调整指令可以由用户输入设定值,包括分贝调整指令、频率调整指令等等。

281、接收对所述处理后的语音的试听指令,并根据所述试听指令,播放所述处理后的语音;

在本实施例中,当用户希望试听处理后的语音,通过触发试听指令,可对处理后的语音进行播放。

其中,步骤280和步骤281可以循环进行,例如:接收调整指令,接收试听指令,继续接收调整指令,继续接收试听指令……

290、将所述处理后的语音发送至通信方的电子设备。

本实施例提供的一种语音处理的方法,通过预先设置预设语音参数值,获取待处理语音并进行预处理,接收对待处理语音的语音修正指令并获取预设语音参数值;若预设语音参数值与待处理语音的语音参数不匹配,对待处理语音的语音参数进行修正,得到处理后的语音,对处理后的语音进行试听、调整,将处理后的语音发送至通信方的电子设备。通过以上方式,对用户的语音进行修饰、调整,生成用户满意的的语音,有效地满足了用户对美化语音或者变换语音的需求,极大地提高了语音播放的听觉感受,增加了趣味性。

实施例三

图3是本发明实施例提供的一种语音处理的方法的应用实例流程示意图,该应用实例为智能手机的语音处理的方法举例,如图3所示,该方法包括:

310、接收样本语音并提取语音参数,将提取到的语音参数存储为预设语音参数值;

请一并参阅图4,该智能手机通过用户点击屏幕上的按键,接收样本语音输入指令,用户开始输入一段声音状态良好的语音,同时根据该样本语音输入指令,该智能手机接收样本语音。在接收到样本语音之后,该智能手机将该样本语音储存,然后对该样本语音进行信号处理,提取该样本语音的语音参数(包括分贝、频率、波形),并将提取到的语音参数存储为预设语音参数值。在本实施例中,该智能手机的用户预设了三个预设语音参数值,分别将这三个预设语音参数值存为不同的语音包:美化、低沉、欢快。

320、在该智能手机的即时消息应用程序的语音输入界面,接收输入语音的用户操作,根据所示用户操作获取待处理语音,并对该待处理语音进行预处理;

当用户打开即时消息应用程序,并且打开与联系人甲的聊天对话框,希望发送一段语音给联系人甲,用户点击屏幕上的按键“按住说话”,开始输入一段时长为10秒的语音,同时该智能手机获取该语音作为待处理语音,然后对该待处理语音进行降噪处理,以减小环境噪声。

330、接收对所述待处理语音的语音修正指令,并根据所述语音修正指令,获取预设语音参数值;

当用户对输入的语音的声音状态不满意时,希望对输入的语音进行美化时,在该智能手机上触发“美化声”的语音修正指令,该智能手机则获取“美化”的预设语音参数。

340、若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;

该智能手机通过比较待处理语音和“美化”的预设语音参数是否匹配,对不匹配的待处理语音段进行修正,使待处理语音的语音参数在“美化”的预设语音参数范围内,得到处理后的语音。

350、接收对所述处理后的语音的试听指令,并根据所述试听指令,播放所述处理后的语音;

用户希望预先知道经过“美化”处理后的语音,于是在该智能手机上触发试听指令,该智能手机根据该试听指令,播放处理后的语音。

360、接收对所述处理后的语音的调整指令,并根据所述调整指令,对所述处理后的语音进行调整;

当用户对处理后的语音进行试听后,认为处理后的语音音量太小,对处理结果仍然不满意,于是在该智能手机触发“音量+”调整指令,该智能手机根据“音量+”调整指令,对处理后的语音进行放大处理,以提高音量。

370、将所述处理后的语音发送至通信方的电子设备。

在用户对处理后的语音感到满意后,接收用户触发的发送指令,将处理后的语音发送给联系人甲,从而给联系人甲带来感官上不一样的听觉感受。

本实施例通过获取待处理语音;接收对所述待处理语音的语音修正指令;根据所述语音修正指令,获取预设语音参数值;若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;将所述处理后的语音发送至通信方的电子设备。通过以上方式,对用户的语音进行修饰,生成美化的语音,有效地满足了用户对美化语音的需求,极大地提高了语音播放的听觉感受。

实施例四

图5是本发明实施例提供一种语音处理的装置的结构示意图。如图5所示,该语音处理装置500应用于电子设备,其中,该语音处理装置50包括语音获取单元510、修正指令接收单元520、预设参数获取单元530、修正单元540和发送单元550。语音获取单元510用于获取待处理语音;修正指令接收单元520用于接收对所述待处理语音的语音修正指令;预设参数获取单元530用于根据所述语音修正指令,获取预设语音参数值;修正单元540用于若所述预设语音参数值与所述待处理语音的语音参数不匹配,根据所述预设语音参数值,对所述待处理语音的语音参数进行修正,得到处理后的语音;发送单元550用于将所述处理后的语音发送至通信方的电子设备。

可选地,装置500还包括:样本接收单元560用于接收样本语音;参数提取单元561用于从所述样本语音提取语音参数,并且将提取到的语音参数存储为所述预设语音参数值。

可选地,在所述语音获取单元510之后,装置500还包括:预处理单元570用于对所述待处理语音进行预处理,所述预处理包括降噪。

可选地,在修正单元540之后,装置500还包括:调整单元570用于接收对所述处理后的语音的调整指令,并根据所述调整指令,对所述处理后的语音进行调整。

可选地,在所述发送单元550之前,装置500还包括:试听单元580用于接收对所述处理后的语音的试听指令,并根据所述试听指令,播放所述处理后的语音。

可选地,所述待处理语音的语音参数包括分贝、频率和/或波形。

由于装置实施例和方法实施例是基于同一构思,在内容不互相冲突的前提下,装置实施例的内容可以引用方法实施例的,在此不赘述。

本实施例提供的语音处理装置500能够对用户的语音进行修饰,生成美化的语音,有效地满足了用户对美化语音的需求,极大地提高了语音播放的听觉感受。

实施例五

图6是本发明实施例提供的一种电子设备的结构示意图,如图6所示,该电子设备600包括:

一个或多个处理器610以及存储器620,图6中以一个处理器610为例。

处理器610和存储器620可以通过总线或者其他方式连接,图6中以通过总线连接为例。

存储器620作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的即时消息提醒方法对应的程序指令/模块(例如,附图5所示的语音获取单元510、修正指令接收单元520、预设参数获取单元530、修正单元540和发送单元550)。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行该用户终端的各种功能应用以及数据处理,即实现上述方法实施例的语音处理的方法。

存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据即时消息提醒装置的使用所创建的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至即时消息提醒装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器620中,当被所述一个或者多个处理器610执行时,执行上述任意方法实施例中的语音处理的方法,例如,执行以上描述的图1中的方法步骤110至步骤150,实现图4中的单元510-550所述的各个模块或单元的功能。

本发明实施例还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图6中的一个处理器610,可使得上述一个或多个处理器可执行上述任意方法实施例中的语音处理的方法,例如,执行上述任意方法实施例中的语音处理的方法,例如,执行以上描述的图1至图3所示的各个步骤;也可实现附图4所述的各个模块或单元的功能。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1