用于话音激活的系统的模数转换器（ADC）动态范围增强的制作方法

文档序号：13392351阅读：346来源：国知局

相关申请的交叉引用

本申请主张要求以yousofmortazavi等人的名义的题为“analog-to-digitalconverterdynamicrangeenhancementforvoice-activatedsystems”的美国实用新型专利申请no.14/696172的优先权。其全部内容以其整体通过引用被并入本文。

本公开涉及模数转换器(adc)。更具体地，本公开的各部分涉及话音激活的系统中的adc的动态范围(dr)增强。

背景技术：

在常规的话音激活的系统中，监测并处理音频样本以检测人类话音活动的存在。在检测到人类话音活动之后，经由语音处理技术来进一步处理人类话音的音频样本。通常，特定词语或短语的表达触发所述系统从监测人类话音活动到执行语音处理的转换。例如，人类可以表达以下内容：“bluegenie，温度是多少？”在该范例中，“bluegenie”是“触发器”，并且剩余部分是“命令”。因此，常规的话音激活的系统将监测音频样本以检测触发器短语“bluegenie”。在检测到触发器短语之后由人类话音表达的任何词语随后由话音激活的系统进行语音处理。

一种常规的实施方案使用单个高性能adc来处理所有语音，包括触发器和命令。然而，该实施方案具有许多缺点。例如，设计和操作adc以始终满足高信噪比(snr)要求导致高功耗并且因此缩短电池寿命。在诸如移动电话的设备中，话音激活的控制常常不是控制电子系统的主要手段。因此，监测表达的词语而消耗的功率为移动设备的用户提供了有限的益处。

此处所提到的缺点仅仅是代表性的并且被简单地包括以突出显示存在对于经改进的电气部件、特别是对于adc以及在诸如移动电话的消费级设备中采用的话音激活的系统中的语音检测的需求。在本文中所描述的实施例解决了某些缺点但是不必在此描述本领域中已知的每个或每一个。

技术实现要素：

用于接收诸如话音命令的音频信号的可重新配置的输入路径可以提供在处理所述音频信号过程中的更低的功耗以及相似的性能。例如，可以通过基于对所接收的音频样本的分析来动态地调节话音激活的系统的部件的操作性能以实现在话音激活的系统中的adc的低功率dr增强。例如，尽管所述话音激活的系统针对人类话音活动而监测音频样本，但是可以在低功率状态中操作所述话音激活的系统内的adc。在已经检测到所述触发器之后，如果所述音频信号质量不足以对所述音频样本执行语音处理，那么adc可以被调节以在更高性能状态中进行操作。例如，如果所述音频样本的snr太低而不能满足用于语音处理所要求的snr，则在检测到语音之后可以对所述adc进行重新配置。仅当音频样本要求语音处理时，而不是在仅针对人类话音活动而监测音频样本时，当adc在高性能状态中操作时可以增加功率效率并且可以改善dr。

可以改善功率效率，因为对于大量的时间而言，所述输入路径可以在操作的低功率(例如，低dr)模式中操作。提供话音激活的电子设备比对表达的词语执行语音处理更频繁地监测音频样本以检测人类话音活动。在没有可重新配置的输入路径的情况下，所述adc将在该全部时间期间以高snr来操作，使得所述话音激活的系统消耗比监测命令所需的更多的功率。当在移动设备中实施所述话音激活的系统时该结果是尤其不期望的，因为不必要的功耗降低了所述移动设备的电池寿命并且要求对电池的更频繁的充电，其两者降低了用户对所述移动设备的满意度。提供更低功耗的一种方案是降低snr或者否则减少在监测触发器时在adc处的音频处理功率。

在没有高性能语音处理软件例程的情况下，能够对在对触发器的检测之前所监测的音频样本进行处理。因此，针对话音激活的系统内的部件的性能要求在所述音频样本将被处理以检测人类话音活动时与在所述音频样本将经由语音处理技术进行处理时是不同的。例如，对于话音激活的系统内的adc的最小信噪比(snr)要求在所述音频样本将被处理以检测人类话音活动时与在所述音频样本将经由语音处理技术进行处理时相比可以是更低的。然而，因为常规的话音激活的系统利用单个adc来处理所有音频样本，所述adc被设计并且被操作以始终满足最高snr要求。

根据一个实施例，一种用于话音激活的系统中的adc的低功率dr增强的方法可以包括：通过具有第一配置的输入路径来接收音频的第一部分；确定音频的所述第一部分的特性；至少部分地基于所确定的特性来将所述输入路径调节到第二配置；通过具有所述第二配置的输入路径来接收音频的第二部分；和/或对音频的所述第二部分执行语音分析。在一些实施例中，执行语音分析的步骤包括利用数字信号处理器(dsp)执行语音分析。

在某些实施例中，音频的所述第一部分包括触发器命令，并且音频的所述第二部分包括指令命令。另外，在一些实施例中，确定所述特性的步骤包括确定以下中的至少一项：snr、信号电平和频率内容。

在一些实施例中，调节所述输入路径包括调节以下中的至少一项：所述输入路径的增益、snr和动态范围。具体地，根据一个实施例，调节所述输入路径包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一些实施例中，调节所述增益包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益，以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的snr，音频的所述第二部分在一些实施例中可以包括指令命令。

在其他实施例中，调节所述输入路径可以包括将针对所述输入路径的adc的噪声基底从所述第一配置的第一值部分调节到所述第二配置的较低的第二值部分。例如，根据一个实施例，调节所述噪声基底可以包括以下中的至少一项：调节所述adc中的电阻器的值、调节所述adc中的电容器的值、以及调节所述adc中的电流的值。

根据另一实施例，调节所述输入路径还可以包括去激活所述输入路径的第一adc并且激活所述输入路径的第二adc。在一些实施例中，所述第一adc可以是具有在其增益级中的最小信号放大的低功率、低动态范围(dr)adc，并且所述第二adc可以是比所述第一adc具有在其增益级中的更多信号放大的高功率、高dradc。尽管针对所述第一adc和所述第二adc参考了功率，所述第一adc和所述第二adc可以具有相似的放大能力。与高功率第二adc相比较，可以通过减小动态范围来获得低功率第一adc。

在某些实施例中，所述方法也可以包括：至少部分地基于所接收的音频的第二部分的特性来将所述输入路径的增益调节到第三配置；通过具有所述第三配置的输入路径来接收音频的第三部分；对音频的所述第三部分执行语音分析；和/或针对音频的额外部分继续调节所述输入路径的增益。

根据另一实施例，一种装置可以包括：麦克风；输入路径，其被耦合以从所述麦克风接收音频信号，其中，所述输入路径包括adc；和/或dsp，所述dsp被耦合到所述输入路径以接收所述音频信号的数字表示，其中，所述dsp被配置为：通过具有第一配置的所述输入路径来接收音频的第一部分；确定音频的所述第一部分的特性；至少部分地基于所确定的特性来将所述输入路径调节到第二配置；和/或通过具有所述第二配置的输入路径来接收音频的第二部分。在一些实施例中，所述dsp还被配置为对音频的所述第二部分执行语音分析的步骤。

在一些实施例中，所述输入路径还包括被耦合在所述麦克风与所述adc之间的放大器，并且其中，调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一个实施例中，调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的snr。

根据实施例，调节所述输入路径的步骤包括将所述输入路径的所述adc的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。在一个实施例中，调节所述噪声基底的步骤包括以下中的至少一项：调节所述adc中的电阻器的值；调节所述adc中的电容器的值；以及调节所述adc中的电流的值。

根据实施例，所述输入路径还包括第二adc，并且其中，所述dsp被配置为执行通过以下操作来调节所述输入路径的步骤：去激活所述输入路径的第一adc；并且激活所述输入路径的第二adc。在一个实施例中，所述第一adc包括低功率、低动态范围adc，并且其中，所述第二adc包括高功率、高动态范围adc。

在某些实施例中，所述dsp还被配置为：至少部分地基于所接收的音频的第二部分来将所述输入路径的增益调节至第三配置；通过具有所述第三配置的输入路径来接收音频的第三部分；对音频的所述第三部分执行语音分析；和/或针对音频的额外部分继续调节所述输入路径的增益。

根据另一实施例，一种移动设备可以包括：麦克风；以及音频处理电路，所述音频处理电路被耦合到所述麦克风并且被配置为从所述麦克风接收音频信号。在一些实施例中，所述音频处理电路包括：模数转换器(adc)；和/或数字信号处理器(dsp)，所述数字信号处理器被耦合到所述adc以接收所述音频信号的数字表示，其中，所述音频处理电路被配置为：在所述音频处理电路被配置在第一配置中时，从所述麦克风接收音频的第一部分；确定音频的所述第一部分的特性；至少部分地基于所确定的特性来将所述音频处理电路调节到第二配置；和/或在所述音频处理电路被配置在所述第二配置中时，通过所述麦克风接收音频的第二部分。

在一些实施例中，所述音频处理电路还包括被耦合在所述麦克风与所述adc之间的放大器，并且其中，调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一个实施例中，调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益，以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的snr。

在另一实施例中，调节所述输入路径的步骤包括将针对所述输入路径的所述adc的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。例如，在一个实施例中，所述音频处理电路可以包括可变电阻器和可变电容器中的至少一个，其中，所述音频处理电路被配置为通过执行以下步骤中的至少一个步骤来调节所述噪声基底：调节所述adc中的电阻器的值；调节所述adc中的电容器的值；以及调节所述adc中的电流的值。

在一些实施例中，所述输入路径还包括第二adc，并且所述dsp被配置为执行通过以下操作来调节所述输入路径的步骤：去激活所述输入路径的所述模数转换器(adc)；并且激活所述输入路径的第二模数转换器(adc)。在一个实施例中，所述adc包括低功率、低动态范围adc，并且所述第二adc包括高功率、高动态范围adc。

在某些实施例中，所述音频处理电路还被配置为执行以下步骤：至少部分地基于所接收的音频的第二部分来将所述放大器的增益调节到第三配置；在所述增益被设定到所述第三配置时接收音频的第三部分；对音频的所述第三部分执行语音分析；并且针对音频的额外部分继续调节所述放大器的增益。

在一些实施例中，所述音频处理电路还被配置为对音频的所述第二部分执行语音分析的步骤。另外，在一个实施例中，所述dsp包括所述移动设备的通用中央处理单元(cpu)的一部分。

前述内容已经概括了本发明的实施例的相当宽泛地某些特征和技术优点以便可以更好地理解下文的详细描述。在下文中将描述形成本发明的权利要求的主题的额外特征和优点。本领域普通技术人员应当理解，所公开的概念和特定实施例可以被容易地用作用于修改或设计用于执行相同或相似目的的其他结构的基础。本领域普通技术人员还应当认识到，这样的等效构造不脱离如在权利要求书中所阐述的本发明的精神和范围。将从结合附图考虑时的以下描述更好地理解额外特征。然而，应当明确理解，附图中的每个仅仅出于图示和描述的目的被提供的而并非旨在限制本发明。

附图说明

为了对所公开的系统和方法的更完整的理解，现在结合附图参考以下描述。

图1是图示了根据本公开的一个实施例的具有dr增强型adc的话音激活的系统的范例示意性框图；

图2是根据本公开的一个实施例的用于检测触发器和用于执行语音处理的音频信号质量要求之间的区别的范例幅度对频率绘图图示；

图3是图示了根据本公开的一个实施例的可调节的连续时间δ-σ调制adc的范例示意性框图；

图4是图示了根据本公开的一个实施例的可调节的双路径输入的范例示意性框图；

图5是图示了根据本公开的一个实施例的由可调节的输入路径实现的性能改进的范例幅度对频率绘图图示；

图6是图示了根据本公开的一个实施例的用于降低正由话音激活的系统处理的音频信号的幅度的另一话音激活的系统的范例示意性框图；并且

图7是图示了根据本公开的一个实施例的用于话音激活的系统的低功率dr增强的方法的范例流程图。

具体实施方式

在图1的示意性框图中图示了具有动态范围(dr)增强型低功率模数转换器(adc)的话音激活的系统的一个实施例。电子系统100可以包括麦克风102、可编程增益放大器(pga)104、adc106、缓存器108、数字信号处理器(dsp)110和计算网络112。模拟部件104和106以及数字部件108和110可以被集成在诸如话音激活的系统的混合信号系统114中。在一些实施例中，麦克风102可以是话音激活的系统114的一部分，而在其他实施例中，麦克风102可以在话音激活的系统114的外部。计算网络112可以是联网计算机和数据中心的“云”。在一些实施例中，可以由用于数据存储(诸如用于存储从话音转换的文本)的混合信号系统114来访问计算网络112。在其他实施例中，可以由用于处理语音的各部分的电子系统100来访问计算网络112，使得电子系统100将记录的音频发送到计算网络112并且接收回转录的文本。尽管图1将pga104和adc106图示为两个分离的部件，但是在一些实施例中，pga104和adc106可以被设计并且被操作为单个部件116。当被集成时，包括pga104和adc106的单个部件可以仍然被称为adc。

当话音激活的系统114是空闲时，诸如当话音激活的系统114未正在执行语音处理时，话音激活的系统114可以在话音活动检测模式中操作，其中，其连续地处理音频样本以检测人类话音活动。例如，由麦克风102所检测的音频信号可以被传送到pga104和低功率adc106以将模拟音频信号转换为数字音频信号。麦克风102、pga104和adc106可以在几乎所有时间处是on(开启)以降低在用户发出话音命令时的时刻与在命令的动作被执行时的时刻之间的响应时间。话音活动检测模式可以是话音激活的系统114的低功率模式。在话音激活的系统114处在话音活动检测模式中时，可以通过由dsp110运行的软件例程的低最小信号质量实现低功耗。例如，dsp110可能已经降低了对话音活动检测模式中的音频样本的snr要求。

由adc106输出的数字音频样本可以被存储在缓存器108中，缓存器108可以是先进先出(fifo)缓存器。dsp110可以针对新样本而轮询所述缓存器108并且处理所述样本以确定人类话音活动是否存在。当检测到话音活动时，话音激活的系统114可以转换到话音唤醒模式(也被称为“触发器检测模式”)，其中，dsp110处理音频样本以检测触发器声音、词语、短语和/或句子。更复杂的dsp例程可以被用于在话音唤醒模式期间而不是在话音活动检测模式中处理音频样本。这些更复杂的例程可以是对于检测表达的触发器所必需的。更高级的例程可以要求更好的信号质量，诸如更高的snr，其导致adc106的更大的功耗。

在检测到触发器之后，话音激活的系统114可以在语音处理模式(也被称为“命令处理模式”)中操作，其中，dsp110利用语音处理软件算法处理所述音频样本以解释由人类话音说出的信息。该经解释的信息可以被用于发起通过电子系统100的进一步处理，诸如使得动作由电子系统100来执行。例如，在一些实施例中，dsp110可以将所检测到的话音转换为文本并且将所述文本传送到计算网络112。该文本可以被显示在屏幕上或者被插入到文档中。备选地，所述文本可以使电子系统100执行动作。

由dsp110检测触发器所要求的音频样本的信号质量可以与由dsp110执行语音处理例程所要求的音频样本的信号质量不同。例如，图2是根据本公开的一个实施例的用于检测触发器和用于执行语音处理的音频信号质量要求之间的区别的范例幅度对频率绘图图示。到达水平202的音频信号产生20db的snr并且可以足以满足由dsp检测触发器所施加的snr要求。然而，利用更高的snr到达水平204的更强的音频信号可以对于满足由dsp对音频样本执行语音处理例程的所施加的snr要求是必要的。在一些实施例中，尽管实际要求可以针对不同的实施例在该范围外部变化，但是用于执行语音处理的snr要求可以与30db一样低并且与40db一样高。

为了解释宽的snr要求范围，话音激活的系统100可以包括从dsp110到pga104的反馈路径118，从而调节pga104的增益以使用单个adc106来满足不同的snr要求。例如，在一些实施例中，dsp110可以从具有第一配置的pga104和adc106的输入路径接收音频的第一部分，诸如触发器命令。例如，pga104可以被设定到第一增益值。在另一范例中，具有第一配置的输入路径可以包括输入路径的adc106被配置有第一噪声基底值。为了辅助向反馈路径118提供信号，dsp110可以被配置为确定音频的第一部分的特性。例如，dsp110可以被配置为确定以下中的至少一项：音频的第一部分中的音频样本的snr、信号电平和频率内容。

dsp110可以被配置为至少部分地基于所确定的特性来将输入路径调节到第二配置。例如，dsp110可以将pga104的增益从第一增益值部分调节到较高的第二增益值。换言之，dsp110可以至少部分地基于音频的第一部分的信号电平来调节pga104或其他放大部件的增益，以获得用于对音频的第二部分执行语音分析的输入路径中的期望的snr。在其他实施例中，dsp110可以通过将adc106的噪声基底从第一噪声基底值调节到较低的第二噪声基底值来将输入路径调节到第二配置以实现相似的结果。

为了图示根据本公开的一个实施例来调节输入路径的范例，图3提供了图示连续时间δ-σ调制adc(δσadc)的范例示意性框图。δσadc300可以包括积分器302、量化器304和数模转换器(dac)306。在一些实施例中，δσadc300也可以包括额外的回路滤波部件(或者回路滤波器的剩余部分)308。

在一些实施例中，δσadc300可以对应于包括pga104和adc106的电路实施方案。换言之，δσadc300可以对应于包括放大部分和adc部分的输入路径的单部件adc实施例。在该实施例中调节输入路径可以包括调节adc中的一个或多个电阻器的值，诸如积分器302中的电阻器310和312的值。例如，为了降低δσadc300的噪声基底值，可以降低电阻器310和312的电阻值。备选地，电阻器310和312的电阻值可以被增加以增加δσadc300的噪声基底值。因为在一些实施例中电阻器310和312可能需要是可调节的，所以电阻器310和312可以是可变电阻器(可变电阻)。备选地，电阻器310和312可以是开关电阻器元件，其组成被电阻器310和/或312代替的更大的可编程(可变)电阻设备。在另一实施例中，将所述输入路径从第一配置调节到第二配置可以包括调节adc中的一个或多个电容器的值，诸如调节积分器302中的电容器314和316的值。例如，为了降低δσadc300的噪声基底值，可以增加电容器314和316的电容值。备选地，电容器314和316的电容值可以被降低以增加δσadc300的噪声基底值。因为在一些实施例中电容器314和316可能需要是可调节的，所以电容器314和316可以是可变电容器。备选地，电容器314和316可以是开关电容器元件，其组成被电容器314和/或316代替的更大的可编程(可变)电容设备。

将所述输入路径从第一配置调节到第二配置还可以包括调节adc中的电流的值。例如，被供应到adc中的一些设备的电流可以被增加以降低adc的噪声基底值并且增加snr。备选地，被供应到adc中的一些设备的电流可以被减小以增加adc的噪声基底值。在一些实施例中，电阻器、电容器和电流的组合可以被调节以将所述输入路径从第一配置调节到第二配置的。

如上文所描述的，可以通过允许对输入路径的动态重新配置来提供两个或更多输入路径配置。也可以通过使用多个输入路径来提供两个或更多输入路径配置。图4提供了图示根据本公开的一个实施例的可以被调节的双路径输入路径的范例示意性框图。与在图1中所图示的电子系统100相似，电子系统400可以包括麦克风402、可编程增益放大器(pga)404、adc406、缓存器408、数字信号处理器(dsp)410和计算网络412。pga404可以是明确的增益级或虚拟/功能pga，诸如在pga404由在adc406处所获得的固有增益替换时。具有双路径输入的电子系统400也包括额外的pga414、额外的adc416、第一多路复用器418和第二多路复用器420。在一些实施例中，每个pga-adc对可以被设计并且被操作以满足由dsp410所施加的不同的snr要求。例如，包括pga404和adc406的pga-adc对可以对应于低功率、低动态范围adc，其中，pga404可以被设定为具有低增益。所述低增益可以被选择以对于adc406足以输出具有用于dsp410检测音频样本中的触发器的足够的snr的音频样本。包括pga414和adc416的pga-adc对可以对应于高功率、高动态范围adc，其中，pga414可以被设定为具有较高的增益。所述较高的增益可以被选择以对于adc416足以对音频样本执行语音处理例程。换言之，pga414可以具有比pga404较高的增益和/或adc416可以具有比adc406更低的噪声基底。在一些实施例中，在任何给定时间处，仅pga-adc对之一可以正在处理音频样本并且输出音频样本以用于由dsp410进一步处理。在其中输入路径是双路径输入路径(诸如在图4中所图示的双路径输入路径)的实施例中，dsp可以被配置为执行通过去激活输入路径的第一adc(诸如adc406)并且激活输入路径的第二adc(诸如adc416)来将输入路径从第一配置调节到第二配置的步骤。在一些实施例中，诸如在其中pga-adc对包括分离的pga和adc部件的实施例中，pga404也可以在adc406被去激活时被去激活并且pga414也可以在adc416被激活时被激活。尽管自始至终描述了两个pga404和414，但是可以在没有明确pga404和414的情况下实现图4的一个实施例。例如，adc406和416可以被配置有不同的全标度，其将导致在不存在pga404和414的情况下两个路径中的不同的增益。

在一些实施例中，可以经由反馈路径422实现对在图4中所图示的双路径输入路径中的部件的去激活和激活。另外，在一些实施例中，反馈路径422也可以由dsp410用于控制多路复用器418和420中的哪些路径被闭合以允许经由所述路径的信号传输以及哪些路径被打开以限制经由所述路径的信号传输。此外，尽管在图4中图示了多路复用器418，但是可以通过允许输入以驱动这两个输入而在没有多路复用器418的情况下实施反馈路径422。在该配置中，所述反馈将被提供到这两个路径(穿过adc406的第一路径以及穿过adc416的第二路径)，并且多路复用器420将仅选择所述路径中的一个路径以通过系统400继续。尽管在图4中图示了仅两个pga-adc对，但是可以通过反馈路径422来实施和控制额外的对。

对所述输入路径的从第一配置到第二配置的调节可以增加输入路径中的部件的性能，使得从所述输入路径输出的音频样本具有足够的snr以满足由dsp110对音频样本执行语音处理所施加的snr要求。例如，图5是图示了根据本公开的一个实施例的通过将输入路径调节到第二配置而实现的性能改进的范例幅度对频率绘图。当所述输入路径处在第一配置中时，所述输入路径可以产生具有足够的snr到达水平502的音频样本，以满足用于触发器检测的要求。例如，在其中由dsp110所施加的最小snr要求是20db的实施例中，所述第一配置中的输入路径可以输出具有至少20db的snr的音频样本。当输入路径处在第二配置中时，所述输入路径可以产生具有足够的snr的音频样本以满足用于到达水平504的语音处理的要求。例如，当调节所述输入路径包括调节增益时，增益中的增加对于由第二配置中的输入路径输出的音频样本满足由用于对音频样本执行语音处理的dsp110所施加的snr要求的增加可以是足够的。

返回到图1，dsp110还可以被配置为：在所述输入路径已经被调节以被配置在第二配置中之后，通过所述输入路径来接收音频的第二部分。由第二配置中的输入路径处理的音频样本可以具有足够的snr以满足由dsp对音频样本执行语音处理所施加的snr要求。dsp还可以被配置为对音频的第二部分执行语音分析。

在一些实施例中，所述输入路径的第二配置可以与所述输入路径的第一配置相同。例如，在一些实施例中，音频的第一部分的音频样本部分的snr可以足够高以满足由dsp执行语音处理所施加的snr要求。如果是的话，则adc能够被维持在第一配置中以处理音频的第二部分和音频的后续部分，因为可以不需要snr要求。

在一些实施例中，由dsp所接收的音频的第二部分可以具有产生太高以至于信号裁剪可能变为问题或者对于dsp110太低以至于不能执行可靠的语音处理的snr的幅度。例如，在一些实施例中，音频样本的信号特性可以基于音频的第一部分来确定，并且所述输入路径可以基于从音频的第一部分所确定的信号特性来调节。音频的第二部分可以不具有与音频的第一部分相同的信号特性。因此，在一些实施例中，dsp110也可以检测音频的第二部分的特性并且基于从音频的第二部分所确定的信号特性来调节所述输入路径。

具体地，在一些实施例中，dsp110还可以被配置为至少部分地基于所接收的音频的第二部分来将所述输入路径的增益调节到第三配置。例如，dsp110还可以调节所述输入路径以：要么(1)当音频的第二部分中的音频样本不具有对于dsp执行语音处理足够的snr时进一步增加由麦克风102所接收的音频样本的信号幅度；要么(2)当音频的第二部分中的音频样本具有太高的幅度以至于裁剪可能发生时，降低由麦克风102所接收的音频样本的信号幅度。在一些实施例中，信号电平可以被认为是太高以至于裁剪可能在信号电平超过阈值时发生。在另一实施例中，信号电平可以被认为是太高以至于当信号电平比能够由adc处理的最大信号电平的90％更高时裁剪可能发生。

在所述输入路径已经被调节到第三配置之后，dsp110可以通过具有第三配置的输入路径来接收音频的第三部分并且对音频的所述第三部分执行语音分析。在一些实施例中，dsp110也可以被配置为音频的额外部分继续调节输入路径的增益。因此，在一些实施例中，对在所述输入路径中应用的增益的调节可以是动态调节，所述动态调节动态地增加或减小输入路径中应用的增益，使得由dsp处理的音频样本具有足够的snr以执行可靠的语音处理而不是snr太高以至于裁剪发生。

对所述输入路径的重新配置可以是足够快的，使得信号不被裁剪。例如，一旦检测到音频样本的信号电平太高，则dsp110可以经由反馈路径118降低在pga104处的增益。图6图示了快速地降低正在由话音激活的系统处理的音频信号的幅度的范例示意性框图，其中，信号电平检测电路602被耦合到adc604和pga606。信号电平检测电路602可以检测正在由adc604处理的音频样本的信号电平，并且如果信号电平到达预定阈值，则信号电平检测电路602可以降低由pga606应用的增益。如果由dsp610所接收的音频样本的幅度太低，那么dsp610可以增加pga606处的增益。增益减小的速率以及增益增加的速率可以是非对称的。亦即，增益可以快速地减小以避免裁剪但是以较慢的速率增加以避免使话音激活的系统中的控制回路不稳定。

所述输入路径可以被调节以返回到第一配置以监测和处理用于人类话音活动和用于触发器的检测的音频样本。例如，在对音频样本的语音处理已经完成之后和/或如果人类话音活动不再存在于音频样本中，则所述输入路径能够被调节到第一配置以消耗更少的功率。在一些实施例中，所述话音激活的系统可以被配置为在自从对音频样本执行语音处理或者自从人类话音活动最后存在于音频样本中已经经过了预定时间量之后，将所述输入路径返回到第一配置。例如，在没有人类话音活动被检测到的期间的时间的五秒或更多秒之后，所述输入路径可以被返回到第一配置。

鉴于在本文中所示出和所描述的示范性系统，将参考各种功能框图更好地领会根据所公开的主题可以实施的方法。尽管出于解释的简单性的目的而将方法示出并且描述为一系列的动作/框，但是将理解并且将领会到，所主张的主题并不由框的数目或顺序限制，因为一些框可以以不同的顺序和/或与从在本文中描绘并且描述什么的其他框基本上相同的时间发生。此外，并非所有图示的框可以被要求实施在本文中所描述的方法。将领会到，可以由软件、硬件或者其组合或任何其他适合的装置(例如，设备、系统、过程或部件)来实施与各框相关联的功能。另外，还应当领会到，贯穿本说明书所公开的方法能够被存储在制造品上以促进将这样的方法传输并且传送到各种设备。本领域技术人员将理解并且将领会到，所述方法可以备选地被表示为一系列相关的状态或事件，诸如在状态图中。

图7是图示了根据本公开的一个实施例的用于话音激活的系统的低功率dr增强的方法的范例流程图。可以利用关于图1-6所描述的系统来实施方法700。方法700在框702处以通过具有第一配置的输入路径接收音频的第一部分开始。在一些实施例中，音频的所述第一部分可以包括触发器命令。在框704处，方法700包括确定音频的所述第一部分的特性，所述特性在一些实施例中可以包括以下中的至少一项：snr、信号电平和频率内容。

方法700包括在框706处至少部分地基于所确定的特性将输入路径调节到第二配置。在一些实施例中，调节所述输入路径可以包括调节以下中的至少一项：所述输入路径的增益、snr和动态范围。例如，根据一个实施例，调节所述输入路径可以包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一些实施例中，调节所述增益可以包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益，以获得用于对可以包括指令命令的音频的第二部分执行语音分析的输入路径中的期望的snr。在其他实施例中，诸如在框706处调节所述输入路径可以包括将针对所述输入路径的adc的噪声基底从第一配置的第一值部分调节到第二配置的较低的第二值部分。例如，根据一个实施例，调节所述噪声基底可以包括以下中的至少一项：调节adc中的电阻器的值、调节adc中的电容器的值、以及调节adc中的电流的值。

根据另一实施例，所述输入路径可以是包括两个路径中的每个路径中的不同的adc的双路径输入路径，其中，每个adc能够根据不同的性能约束和规格来设计。在这样的实施例中，诸如在框706处调节所述输入路径也可以包括去激活所述输入路径的第一adc并且激活所述输入路径的第二adc。在一些实施例中，第一adc可以是具有其增益级中的最小信号放大的低功率、低dradc，并且第二adc可以是比第一adc具有其增益级中的更多信号放大的高功率、高dradc。尽管针对第一和第二adc参考功率，第一和第二adc可以具有相似的放大能力。与较高功率的第二adc相比较，可以通过减小动态范围来获得低功率的第一adc。

接下来，方法700包括在框708处通过具有第二配置的输入路径来接收音频的第二部分。例如，音频的第二部分可以是包括由人类话音说出的指令命令的音频的部分。在框710处，方法700包括对音频的第二部分执行语音分析。例如，可以利用dsp(诸如在图1中所图示的dsp110)来执行语音分析。

在一些实施例中，音频的第二部分中的音频样本的信号电平可以与音频的第一部分中的音频样本的信号电平是不同的。至少部分地基于所接收的音频的第二部分的特性，可以将所述输入路径的增益调节到第三配置。随后，可以通过具有第三配置的输入路径来接收音频的第三部分，并且可以对音频的第三部分执行语音分析。根据实施例，采用方法700的系统可以针对音频的额外部分继续调节所述输入路径的增益。

图7的示意性流程图通常被阐述为逻辑流程图。这样，所描绘的顺序和所标记的步骤指示所公开的方法的各方面。可以设想在功能、逻辑或效果方面等效于所图示的方法的一个或多个步骤或者其部分的其他步骤和方法。另外，所采用的格式和符号被提供以解释方法的逻辑步骤并且被理解为不限制所述方法的范围。尽管各种箭头类型和线类型可以被采用在流程图中，但是其被理解为不限制对应的方法的范围。实际上，一些箭头或其他连接器可以被用于仅指示方法的逻辑流。例如，箭头可以指示所描绘的方法的枚举步骤之间的未指定的持续时间的等待或监测时段。另外，特定方法发生的顺序可以严格地遵守所示的对应的步骤的顺序或者可以不严格地遵守所示的对应的步骤的顺序。

如果以固件和/或软件来实施，则上文所描述的功能可以作为一个或多个指令或代码被存储在计算机可读介质上。范例包括编码有数据结构的计算机可读介质以及编码有计算机程序的计算机可读介质。计算机可读介质包括物理计算机存储介质。存储介质可以是能够由计算机访问的任何可用介质。以范例而非限制的方式，这样的计算机可读介质能够包括随机存取存储器(ram)、只读存储器(rom)、电可擦可编程只读存储器(eeprom)、压缩盘只读存储器(cd-rom)或者其他光盘存储装置、磁盘存储装置或者其他磁性存储设备或者可以被用于存储以指令或数据结构的形式并且能够由计算机访问的期望的程序代码的任何其他介质。磁盘和光盘包括压缩盘(cd)、激光盘、光学盘、数字通用盘(dvd)、软盘和蓝光盘。一般地，磁盘磁性地再现数据，并且光盘光学地再现数据。上文的组合还应当被包括在计算机可读介质的范围内。

除了计算机可读介质上的存储装置之外，指令和/或数据可以被提供为被包括在通信装置中的传输介质上的信号。例如，通信装置可以包括具有指示指令和数据的信号的收发器。指令和数据被配置为使得一个或多个处理器来实施权利要求中概括的功能。

尽管已经详细描述本公开和某些代表性优点，但是应当理解，在不脱离如由权利要求书所限定的本公开的精神和范围的情况下，可以在本文中做出各种改变、替代和变更。此外，本申请的范围不旨在限于说明书中所描述的过程、机器、制造、物质组成、装置、方法和步骤的特定实施例。如本领域普通技术人员从本公开将容易领会到的，可以利用与本文所描述的对应的实施例执行基本上相同功能或者实现基本上相同结果的目前存在或稍后将被研发的过程、机器、制造、物质组成、装置、方法或步骤。因此，权利要求书旨在在其范围内包括这样的过程、机器、制造、物质组成、装置、方法或步骤。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Y·莫尔塔扎维;J·L·梅兰桑;R·赞巴吉;A·布伦南
技术所有人：思睿逻辑国际半导体有限公司
我是此专利的发明人