一种主动降噪方法、装置、智能音箱及存储介质与流程

文档序号：19934236发布日期：2020-02-14 22:22阅读：311来源：国知局

本发明涉及语音处理技术领域，特别是涉及一种主动降噪方法、装置、智能音箱及存储介质。

背景技术：

随着科技的发展，出现了很多具有语音识别功能的语音交互设备，如智能音箱、机器人等，语音识别技术也得到了较好的发展。在安静环境中，当用户与语音交互设备进行语音交互时，语音交互设备能够较准确地识别出用户输入的语音并能输出准确的语音回复，然而在嘈杂环境中，嘈杂的噪声对用户输入的语音造成干扰，从而对有效识别用户语音产生较大影响，甚至导致语音交互设备无法识别出用户输入的语音。

现有语音交互设备通常通过识别拾取的声音信号中的噪声信号，并对噪声信号进行衰减处理，从而获得声音信号中用户的语音信号，以消除环境噪声对语音识别的影响。但该衰减处理算法通常为固定算法，对于不同的噪声环境，不能完全消除噪声信号，只能消除部分噪声信号。且当衰减强度较强时，会对用户的语音信号也造成衰减，影响对用户语音进行识别。

技术实现要素：

本发明主要提供一种主动降噪方法，能够克服现有的语音交互设备对拾取的声音信号中的噪声信号进行衰减处理的算法为固定算法而导致无法完全消除不同噪声环境中的噪声信号，且衰减强度较强时，会对用户语音信号造成衰减，影响语音识别的问题。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种主动降噪方法，所述主动降噪方法应用于语音交互设备，所述主动降噪方法包括：

拾取当前噪声环境的环境噪声信号；

根据所述环境噪声信号生成中和所述环境噪声信号的第一抗噪信号，并播放所述第一抗噪信号；

拾取包含所述第一抗噪信号和所述环境噪声信号的第一综合声音信号，判断所述第一综合声音信号的音量有效值是否小于预设阈值，若是，则将所述第一抗噪信号作为当前抗噪信号；

若否，则基于所述第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据所述第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号。

优选地，所述根据所述环境噪声信号生成中和所述环境噪声信号的第一抗噪信号的步骤具体包括：

预先确定抗噪信号与噪声信号之间的相位关系和幅值关系；

获取所述环境噪声信号的相位和幅值；

根据所述相位关系、幅值关系以及所述环境噪声信号的相位和幅值确定所述第一抗噪信号的相位和幅值，从而生成中和所述环境噪声信号的第一抗噪信号。

优选地，所述预先确定抗噪信号与噪声信号之间的幅值关系的步骤具体包括：

拾取预设距离处所播放的预设音量的第一测试声音信号，并获取所述第一测试声音信号的第一幅值；

播放第二测试声音信号以使传输到所述语音交互设备的麦克风处的第二测试声音信号的声压级为预设声压级，并获取所述第二测试声音信号的第二幅值；

计算所述第二幅值与所述第一幅值的第一比值，所述第一比值为所述抗噪信号幅值与所述噪声信号幅值的比值。

优选地，所述预先确定抗噪信号与噪声信号之间的相位关系的步骤具体包括：

获取所述第一测试声音信号的第一相位；

调整所述第二测试声音信号的第二相位并生成第三测试声音信号，播放所述第三测试声音信号，以使所述麦克风所拾取的第四测试声音信号的第四相位与所述第一相位相反；

获取所述第三测试声音信号的第三相位；

计算所述第三相位与所述第一相位的第二比值，所述第二比值为所述抗噪信号相位与所述噪声信号相位的比值。

优选地，所述预设阈值的确定步骤具体包括：

拾取安静环境中的安静环境声音信号；环境声音信号的声压级小于45db为所述安静环境；

获取所述安静环境声音信号的音量有效值，将所述安静环境声音信号的音量有效值设定为所述预设阈值。

优选地，所述基于所述第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据所述第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号的步骤具体包括：

基于所述第一抗噪信号进行多次调整以生成多个修正抗噪信号，依次播放多个所述修正抗噪信号；

依次拾取多个包含所述环境噪声信号和所述修正抗噪信号的综合修正声音信号；

获取所述第一综合声音信号的音量有效值、多个所述综合修正声音信号的音量有效值及所述环境噪声信号的音量有效值中的最小值，将所述最小值所对应的第一抗噪信号/修正抗噪信号/环境噪声信号作为当前抗噪信号。

优选地，基于所述第一抗噪信号进行多次调整以生成多个修正抗噪信号的步骤具体包括：

调整所述第一抗噪信号的幅值增加10％以生成第一修正抗噪信号；

调整所述第一抗噪信号的幅值减小10％以生成第二修正抗噪信号；

调整所述第一抗噪信号的相位增加10％以生成第三修正抗噪信号；

调整所述第一抗噪信号的相位减小10％以生成第四修正抗噪信号。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种主动降噪装置，所述主动降噪装置包括：

环境噪声拾取模块，用于拾取当前噪声环境的环境噪声信号；

第一抗噪信号生成模块，用于根据所述环境噪声信号生成中和所述环境噪声信号的第一抗噪信号，并播放所述第一抗噪信号；

当前抗噪信号确定模块，用于拾取包含所述第一抗噪信号和所述环境噪声信号的第一综合声音信号，判断所述第一综合声音信号的音量有效值是否小于预设阈值，若是，则将所述第一抗噪信号作为当前抗噪信号；若否，则基于所述第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据所述第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种智能音箱，所述智能音箱包括处理器以及存储器，所述处理器耦合所述存储器，所述处理器在工作时执行指令以实现上述的主动降噪方法。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行以实现上述的主动降噪方法。

本发明的有益效果是：区别于现有技术的情况，本发明中拾取当前噪声环境的环境噪声信号；根据环境噪声信号生成中和环境噪声信号的第一抗噪信号，并播放第一抗噪信号；拾取包含第一抗噪信号和环境噪声信号的第一综合声音信号，判断第一综合声音信号的音量有效值是否小于预设阈值，若是，则将第一抗噪信号作为当前抗噪信号；若否，则基于第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号。本发明中播放抗噪信号以中和当前环境噪声信号，其中抗噪信号根据当前噪声环境生成，因此在不同噪声环境下均可较好地消除噪声信号，且播放抗噪信号消除噪声信号的方式不会对用户语音信号造成衰减，本发明中的主动降噪方法能较好地消除环境噪声信号对语音识别的影响。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，其中：

图1是本发明一实施例提供的主动降噪方法的流程图；

图2是图1中步骤s200的具体实现流程图；

图3是本发明另一实施例提供的主动降噪装置的结构示意图；

图4是本发明另一实施例提供的智能音箱的结构示意图；

图5是本发明另一实施例提供的存储介质的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

图1为本发明一实施例提供的主动降噪方法的流程图，主动降噪方法应用于语音交互设备，语音交互设备可为智能音响或带有语音交互功能的终端设备，语音交互设备具有麦克风和扬声器，主动降噪方法包括步骤s100、步骤s200、步骤s300及步骤s400。

步骤s100：拾取当前噪声环境的环境噪声信号。

具体地，语音交互设备通过麦克风拾取当前噪声环境中的环境噪声信号。

步骤s200：根据环境噪声信号生成中和环境噪声信号的第一抗噪信号，并播放第一抗噪信号。

具体地，根据麦克风拾取的环境噪声信号生成第一抗噪信号，并通过扬声器播放第一抗噪信号，进而中和环境噪声信号，从而使得麦克风在拾取用户输入的语音信号时，不会拾取到环境噪声信号，消除环境噪声信号对语音识别的影响。

具体地，如图2所示，根据环境噪声信号生成中和环境噪声信号的第一抗噪信号的步骤具体包括步骤s201、步骤s202、步骤s203。

步骤s201：预先确定抗噪信号与噪声信号之间的相位关系和幅值关系。

具体地，在拾取环境噪声信号前，预先确定好抗噪信号与噪声信号之间的相位关系和幅值关系。

具体地，预先确定抗噪信号与噪声信号之间的幅值关系的步骤具体包括：拾取预设距离处所播放的预设音量的第一测试声音信号，并获取第一测试声音信号的第一幅值；播放第二测试声音信号以使传输到所述语音交互设备的麦克风处的第二测试声音信号的声压级为预设声压级，并获取所述第二测试声音信号的第二幅值；计算第二幅值与第一幅值的第一比值，第一比值为抗噪信号幅值与噪声信号幅值的比值。

进一步具体地，麦克风拾取距离该语音交互设备预设距离处的扬声器所播放的预设音量的第一测试声音信号，其中，预设距离可为0.5m，0.5m处的扬声器播放预设音量的第一测试声音信号使得在麦克风处测得的第一测试声音信号的声压级为80db，预设距离每增加一倍，麦克风处测得的第一测试声音信号的声压级减小6db。语音交互设备的扬声器播放第二测试声音信号，以使传输至语音交互设备的麦克风处的第二测试声音信号的声压级为80db。第二测试声音信号的第二幅值与第一测试声音信号的第一幅值的比值即为抗噪信号幅值与噪声信号幅值的比值。

具体地，预先确定抗噪信号与噪声信号之间的相位关系的步骤具体包括：获取第一测试声音信号的第一相位；调整第二测试声音信号的第二相位并生成第三测试声音信号，播放第三测试声音信号，以使麦克风所拾取的第四测试声音信号的第四相位与第一相位相反；获取第三测试声音信号的第三相位；计算第三相位与第一相位的第二比值，第二比值为抗噪信号相位与噪声信号相位的比值。其中，第四测试声音信号为扬声器播放的第三测试声音信号传输到麦克风处后，被麦克风所拾取的声音信号。

本实施例中，考虑到声音信号经过一段距离传输后相位和幅值发生变化，因此语音交互设备的扬声器播放声音信号后，麦克风处所接收到的声音信号与扬声器所播放的声音信号不同(相位和幅值不同)，也因此，当扬声器播放与环境噪声信号相位相反、幅值相等的抗噪信号时，麦克风处的抗噪信号与麦克风处的环境噪声信号并不是相位相反、幅值相等的关系，为了使麦克风处的抗噪信号与麦克风处的环境噪声信号进行有效中和，以尽量避免麦克风拾取环境噪声信号，因此通过上述的步骤确定抗噪信号与噪声信号之间的相位和幅值关系，而不是仅简单地将抗噪信号设置为与拾取的环境噪声信号相位相反、幅值相等。

步骤s202：获取环境噪声信号的相位和幅值。

具体地，根据环境噪声信号获取其相位和幅值。

步骤s203：根据相位关系、幅值关系以及环境噪声信号的相位和幅值确定第一抗噪信号的相位和幅值，从而生成中和环境噪声信号的第一抗噪信号。

具体地，根据预先确定的抗噪信号与噪声信号之间的相位关系和幅值关系，以及环境噪声信号的相位和幅值，可确定第一抗噪信号的相位和幅值，从而生成第一抗噪信号以中和环境噪声信号。

步骤s300：拾取包含第一抗噪信号和环境噪声信号的第一综合声音信号，判断第一综合声音信号的音量有效值是否小于预设阈值，若是，则将第一抗噪信号作为当前抗噪信号；

具体地，预设阈值的确定步骤具体包括：拾取安静环境中的安静环境声音信号；环境声音信号的声压级小于45db为安静环境；获取安静环境声音信号的音量有效值，将安静环境声音信号的音量有效值设定为预设阈值。

具体地，扬声器播放第一抗噪信号后，麦克风拾取包含第一抗噪信号和环境噪声信号的第一综合声音信号，判断第一综合声音信号的音量有效值是否小于预设阈值，若小于预设阈值，则表明第一抗噪信号的中和效果达到预期，并继续播放第一抗噪信号进行抗噪。

步骤s400：若否，则基于第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号。

具体地，若第一综合声音信号的音量有效值大于或等于预设阈值，则表明第一抗噪信号的中和效果未达预期，需要对第一抗噪信号进行修正，以获取中和效果更优的抗噪信号。

具体地，基于第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号的步骤具体包括：基于第一抗噪信号进行多次调整以生成多个修正抗噪信号，依次播放多个修正抗噪信号；依次拾取多个包含环境噪声信号和修正抗噪信号的综合修正声音信号；获取第一综合声音信号的音量有效值、多个综合修正声音信号的音量有效值及环境噪声信号的音量有效值中的最小值，将最小值所对应的第一抗噪信号/修正抗噪信号/环境噪声信号作为当前抗噪信号。

优选地，基于第一抗噪信号进行多次调整以生成多个修正抗噪信号的步骤具体包括：调整第一抗噪信号的幅值增加10％以生成第一修正抗噪信号；调整第一抗噪信号的幅值减小10％以生成第二修正抗噪信号；调整第一抗噪信号的相位增加10％以生成第三修正抗噪信号；调整第一抗噪信号的相位减小10％以生成第四修正抗噪信号。

优选地，基于第一抗噪信号进行四次调整以生成四个修正抗噪信号，依次播放四个修正抗噪信号，并依次拾取包含第一修正抗噪信号和环境噪声信号的第一综合修正声音信号、包含第二修正抗噪信号和环境噪声信号的第二综合修正声音信号、包含第三修正抗噪信号和环境噪声信号的第三综合修正声音信号、包含第四修正抗噪信号和环境噪声信号的第四综合修正声音信号，获取第一综合声音信号、第一综合修正声音信号、第二综合修正声音信号、第三综合修正声音信号、第四综合修正声音信号以及环境噪声信号的音量有效值，并获取音量有效值中的最小值，将最小值所对应的第一抗噪信号/修正抗噪信号/环境噪声信号作为当前抗噪信号。若第一综合声音信号的音量有效值最小，则将第一综合声音信号所对应的第一抗噪信号作为当前抗噪信号；若第一综合修正声音信号的音量有效值最小，则将第一综合修正声音信号所对应的第一修正抗噪信号作为当前抗噪信号；若环境噪声信号的音量有效值最小，则将环境噪声信号作为当前抗噪信号。

在本发明实施例中，播放抗噪信号以中和当前环境噪声信号，其中抗噪信号根据当前噪声环境生成，因此在不同噪声环境下均可较好地消除噪声信号，且播放抗噪信号消除噪声信号的方式不会对用户语音信号造成衰减，本发明中的主动降噪方法能较好地消除环境噪声信号对语音识别的影响。此外，在播放抗噪信号后，通过麦克风拾取包括抗噪信号和环境噪声信号的综合声音信号，并判断综合声音信号的音量有效值是否小于预设阈值，若是，则表明抗噪效果较好，若否，则调整当前播放的抗噪信号以寻找抗噪效果更优的抗噪信号，即本发明实施例中还对抗噪信号的抗噪效果进行检测和调整，以获得最优的抗噪效果。

实施例二

图3为本发明另一实施例提供的主动降噪装置的结构示意图，主动降噪装置包括环境噪声拾取模块100、第一抗噪信号生成模块200及当前抗噪信号确定模块300。

环境噪声拾取模块100用于拾取当前噪声环境的环境噪声信号。

第一抗噪信号生成模块200用于根据环境噪声信号生成中和环境噪声信号的第一抗噪信号，并播放第一抗噪信号。

当前抗噪信号确定模块300用于拾取包含第一抗噪信号和环境噪声信号的第一综合声音信号，判断第一综合声音信号的音量有效值是否小于预设阈值，若是，则将第一抗噪信号作为当前抗噪信号；若否，则基于第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号。

本发明实施例提供的主动降噪装置的具体实现与主动降噪方法的具体实现相同，主动降噪装置的具体实现可参阅上述实施例一的描述，在此不再赘述。

实施例三

图4为本发明另一实施例提供的智能音箱的结构示意图，智能音箱包括处理器400以及存储器500，处理器400耦合存储器500，处理器400在工作时执行指令以实现上述任一实施例中的主动降噪方法。

其中，处理器400还可以称为cpu(centralprocessingunit，中央处理单元)。处理器400可能是一种集成电路芯片，具有信号的处理能力。处理器400还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器，但不仅限于此。

实施例四

参阅图5，图5是本发明另一实施例提供的存储介质的示意图，本实施例中的计算机可读存储介质存储有计算机程序600，该计算机程序600能够被处理器400执行以实现上述任一实施例中的主动降噪方法。

可选的，该可读存储介质可以是u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。

本发明中，拾取当前噪声环境的环境噪声信号；根据环境噪声信号生成中和环境噪声信号的第一抗噪信号，并播放第一抗噪信号；拾取包含第一抗噪信号和环境噪声信号的第一综合声音信号，判断第一综合声音信号的音量有效值是否小于预设阈值，若是，则将第一抗噪信号作为当前抗噪信号；若否，则基于第一抗噪信号进行多次调整以生成多个修正抗噪信号，根据第一抗噪信号以及多个修正抗噪信号分别降噪的降噪结果确定当前抗噪信号。播放抗噪信号以中和当前环境噪声信号，抗噪信号根据当前噪声环境生成，且不会对用户语音信号造成衰减，因此在不同噪声环境下均可较好地消除噪声信号。此外，在播放抗噪信号后，通过麦克风拾取包括抗噪信号和环境噪声信号的综合声音信号，并对抗噪信号的抗噪效果进行检测和调整，以获得最优的抗噪效果。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：凌华东
技术所有人：星络智能科技有限公司
我是此专利的发明人

上一篇：一种带彩色艺术图案的井盖及其制作方法与流程
上一篇：一种水箱或水池进水消音装置的制作方法