助听器算法的改进的制作方法

文档序号:7721587阅读:184来源:国知局

专利名称::助听器算法的改进的制作方法
技术领域
:本发明涉及听音设备尤其是助听器的声音处理的改进。本发明涉及改进用户周围的声环境突然变化的处理或涉及使容易分离给用户的声音。本发明具体涉及用于处理表示音频信号的电输入信号并提供处理后电输出信号的音频处理装置的运行方法。本发明还涉及音频处理装置。本发明还涉及在助听器系统的信号处理器上运行的软件程序及涉及其上保存指令的介质。例如,本发明可用在如助听器、头戴式受话器、头戴式耳机或有源耳塞的应用中。
背景技术
:下述现有技术涉及本发明的应用领域之一,即助听器。相当多的文献涉及盲源分离(BSS)、半盲源分离、空间滤波、降噪、具有传声器阵列的波束形成、或更全面的专题一计算听觉场景分析(CASA)。总的来说,这些方法或多或少能够分离并存的声源,其通过使用不同类型的提示如Bregman的书[Bregman,1990]中描述的或机器学习方法[如Roweis,2001]中使用的提示。最近,对二进制掩模和波束形成进行结合以提取比传声器数量多的并存声源(参见Pedersen,M.S.,Wang,D.,Larsen,J.,Kjems,U.,OvercompleteBlindSourceSeparationbyCombiningICAandBinaryTime—FrequencyMasking,IEEEInternationalworkshoponMachineLearningforSignalProcessing,pp.15-20,2005)。该工作的目标在于能够从两个传声器分离两个以上声源。这些算法的一般输出为源位置或传声器位置处的分离声源,没有或很少信息来自其它声源。如果空间提示不可用,已提出单耳方法并对其进行了测试(参见[Jourjine,Richard,andYilmas,2000];[Roweis,2001];[PontoppidanandDyrholm,2003];[BachandJordan,2005])。助听器中的可调时延已在EP1801786A1中描述,其中吞吐量时延可进行调节以在处理时延和时延赝象之间平衡。US7,231,055B2教示了一种消除助听器中的掩蔽效应的方法。该方法可包括延迟一声音,否则对于听力受损人员该声音将被另一声音掩蔽。
发明内容本发明的核心概念为音频处理装置如听音设备例如助听器的输入变换器拾取(或接收)的音频信号如输入声音可被延迟(贮存),可能进行处理以提取输入信号的某些特征,及之后不久进行重放,可能稍加快以赶上输入声音。算法通常由声环境的变化触发。延迟和追赶在听音设备中提供多种新的可能性。由延迟和追赶处理提供的一种可能性为在时域中人工使音频处理装置能够分离但用户不能的声源彼此离开。这要求声源已经分离,例如使用[Pedersenetal.,2005]中描述的算法。人工时域分离通过在其它声音占优时延迟声音启动直到先前(占优)的声音已结束为止而实现。除了听觉阈值增大以外,听力受损还包括频率选择性降低(例如参见[Moore,1989])及来自前掩蔽的释放减少(例如参见)。后一观测表明,除了"正常"前掩蔽时延tmd。(理想地,意味着一声音结束和下一声音开始之间的有益最小时延tmd。(以增加可懂度))之外,听力受损人员可能经历额外的前掩蔽时延Atmd(tmd—hi=tmd。+Atmd,tmd—hi为听力受损人员的(最小)前掩蔽时延)。Moore[Moore,2007]报告,不管掩蔽水平如何,掩蔽在100-200ms之后衰减为零,暗示存在最大前掩蔽释放(暗含在上面的记法中tmd—hi《200ms)。附加时延增加了对加快重放的需要,使得延迟的声音可赶上输入声音(或者更准确地说,具有最低程度延迟的输出)。该修改后的两个声源的呈现的好处在于减少了先前声音对新声音的掩蔽。不管分离方法是ICA(独立部件分析)、二进制掩模、传声器阵列等中的哪一种,算法指定分离声源的呈现。同样的基础算法(延迟,(加快)重放)也可用于克服在发生器之后参数估计滞后的问题。如果生成的参数改变(例如,由于语音特性的一个或多个变化、出现新声源、声源移动、声反馈情形变化等),在估计器(例如,一些种类的"在助听器中实施的涉及前述生成参数变化的算法或模型")即估计参数收敛为新值之前需要一些时间。该延迟或滞后的适当处理是本发明的重要方面。通常,例如对于具有固定或自适应步长的算法,延迟也是参数变化比例的函数。在延迟提取的参数用于修改信号的情况下,时滞意味着在生成参数变化和估计参数收敛之间的时间中输出信号未用正确参数进行处理。通过保存(贮存)信号并用收敛参数重放该信号,(所保存)的信号可用正确的参数进行处理。因此,本方法产生的延迟不仅适于补偿特定算法的处理时间而且适于补偿输入信号的变化。由本方法产生的延迟由输入信号(如某些特性,如参数)的变化引起,当输入信号稳定时可再次消除。此外,通过使用快速重放,总的处理时延可保持低水平。在抗反馈设置中,同样的基础算法(延迟,加快重放)可用于以这样的方式调度输出的声音,即不允许建立啸声。当音频处理装置检测到正建立啸声时,其使输出短时间停止从而在重放时间压縮的延迟声音并追赶之前使已经输出的声音能传播通过传声器。此外,音频处理装置将知道,对于下一第一时间段,由传声器拾取的声音将受输出影响,及对于其后的第二时间段,其将不受输出声音的影响。在此,第一和第二时间段的持续时间取决于实际装置及传声器、扬声器、所涉及的距离和装置类型等的应用。第一和第二时间段可以是任何时间长度,但在实践情形中通常为ms级(例如0.5-10ms)。本发明的目标在于对听音设备中的声音处理进行改进。^£本发明的目标通过用于处理表示音频信号的电输入信号和提供处理后电输出信号的音频处理装置的运行方法实现。本发明方法包括a)接收表示音频信号的电输入信号;b)提供指示与电输入信号有关的变化并用于控制电输入信号的处理的事件控制参数;c)保存电输入信号或其部分的表示;d)基于所保存的电输入信号或其部分的表示及通过事件控制参数控制,提供具有可配置时延的处理后电输出信号。这具有提供用于改善用户对处理后信号的感知的方案的优点。术语"事件控制参数"在本说明书中意为指示声信号中通过监视与输入信号有关的变化检测到的具体事件的控制参数(例如,物化在控制信号中)。事件控制参数可用于控制处理后电输出信号的延迟。在实施例中,音频处理装置(如处理单元)适于使用事件控制参数决定对处理算法的哪一参数或哪一处理算法或程序进行修改或交换并对所保存的电输入信号的表示实施。在实施例中,〈事件>_〈延迟>表保存在音频处理装置的内存中,音频处理装置适于用延迟表中对应于检测到的事件控制参数的〈事件>的〈延迟>对处理后输出信号进行延迟。在另一实施例中,〈事件>_〈延迟>及〈算法>表保存在音频处理装置的内存中,音频处理装置适于用延迟表中对应于检测到的事件控制参数的〈事件>的〈延迟>对处理后输出信号进行延迟并根据对应于所涉及〈事件>和〈延迟>的〈算法>处理所保存的电输入信号表示。保存在音频处理装置的内存中的前述表也可或另外包括对应的参数如重放率增量〈Arate〉(表明相比于"自然"(输入)率,重放率适当增加)、给定类型〈事件>的典型〈TYPstor〉和/或最大保存时间〈MAXstor〉(控制分配给特定事件的内存量)。优选地,自动提取事件控制参数(即无需用户干预)。在实施例中,事件控制参数从电输入信号和/或从本地和/或远处检测器(如监视声环境的检测器)自动提取。助听器的从输入到输出变换器的信号通路具有某一最小时延。总的来说,信号通路的时延适合尽可能小。在本说明书中,术语"可配置时延"意为可适当适合声情形的另外(即超出信号通路的最小时延)的时延。在实施例中,超出信号通路的最小时延的可配置时延在从0到10s之间的范围中,例如从0ms到100ms,如从0ms至lj30ms,例如从0ms到15ms。在给定时间点的实际时延由事件控制参数控制,其取决于当前声环境的事件(变化)。术语"电输入信号(的)表示"在本说明书中意为电输入信号的(可能修改的)版本,电信号已经历一些种类的处理,如下述的一个或多个处理模数转换、放大、定向性处理、声反馈抵消、时频转换、压縮、随频率变化的增益改变、降噪、源/信号分离等。在特定实施例中,本发明方法还包括e)提取所保存的电输入信号表示的特征;及f)使用所述特征影响处理后电输出信号。术语"所保存的电输入信号表示的特征"在本说明书中意为方向、信号强度、信噪比、频谱、开始或结束(如声源的开始和结束时间)、调制频谱等。在实施例中,本发明方法包括监视与输入音频信号有关的变化并在配置事件控制参数时使用检测到的变化。在实施例中,这些变化从电输入信号提取(可能从所保存的电输入信号)。在实施例中,这些变化基于来自其它源的输入,例如来自其它算法或检测器(例如来自定向性、降噪、带宽控制等)。在实施例中,监视与输入音频信号有关的变化包括估计来自本地和/或远处算法或检测器的输入,远处意为位于物理上分隔开的物体中,分隔开的物理距离大于lcm,或大于5cm,或大于15cm,或40cm以上。术语"监视与输入音频信号有关的变化"在本说明书中意为确定与信号处理相关的变化,即这些变化可引起处理参数如与声信号的方向和/或强度有关的参数、与声反馈有关的参数等的变化,尤其是要求相当长时间恒定不变以从信号提取的参数(例如,相当长时间恒定不变为ms级,如在从5ms到1000ms之间的范围中,例如从5ms到100ms,例如从10ms至lj40ms)。在实施例中,本发明方法包括将输入声音转换为电输入信号。在实施例中,本发明方法包括将处理后输出信号呈现给用户,前述信号至少部分基于具有可配置时延的处理后电输出信号。在实施例中,本发明方法包括在并行信号通路中处理源自电输入信号的没有附加6时延的信号。术语"并行"在本说明书中应当理解为,在某些时间场合,处理后输出信号可能唯一基于输入信号的延迟部分,及在其它时间场合,处理后输出信号可能唯一基于尚未被贮存(因而相比于正常处理时延尚未经受附加时延)的信号部分,又及在其它时间场合,处理后输出信号可基于延迟和未延迟信号的组合。因此,延迟和未延迟部分在并行信号通路中进行处理,这可至少部分由事件控制参数进行组合或独立选择、控制(参见图la)。在实施例中,延迟和未延迟信号经受同一处理算法。在实施例中,本发明方法包括定向系统,例如包括处理来自多个不同输入变换器的输入信号,这些输入变换器的电输入信号被组合(处理)以提供关于存在的声源的空间分布的信息。在实施例中,定向系统适于分离存在的声源以能够将特定(或者,一个或多个)声源的电表示(暂时)贮存在(如助听器的)内存中。在实施例中,定向系统(例如参见EP0869697),如基于波束形成(例如参见EP1005783),如使用时间频率掩蔽,用于确定声源的方向和/或分离源自不同方向的几个声源信号(例如参见[Pedersenetal.,2005])。术语"使用所述特征影响处理后电输出信号"在本说明书中意为使用算法用基于从所保存的输入信号表示提取的特征的参数修改处理后电输出信号。在实施例中,可贮存(及随后重放)100ms以上长度的电输入信号表示的时序,如500ms以上,如ls以上,如5s以上。在实施例中,内存具有循环缓冲器(或先进先出缓冲器)功能,使得进行连续的信号记录,及当缓冲器满时删除先保存的信号部分。在实施例中,贮存电输入信号的表示包括贮存输入信号的多个时间帧,每一时间帧包括预定数量N的数字时间样本xn(n=1,2,...,N),对应于时间帧长度L=N/^,其中fs为模数转换单元的采样频率。在实施例中,对保存的时间帧逐帧进行时间_频率变换以提供相应频谱的频率样本。在实施例中,时间帧具有至少8ms的时间长度,如至少24ms,如至少50ms,如至少80ms。在实施例中,模数转换单元的采样频率大于4kHz,如大于8kHz,如大于16kHz。在实施例中,可配置时延随时间变化。在实施例中,可配置时延的时间相关性遵循特殊功能模式,如线性相关,如递减。在优选实施例中,处理后电输出信号被加快重放(比贮存或记录其的速率快)以赶上输入声音(从而反映时延随时间减少)。例如,这可通过改变在重放时间每一帧之间的样本数量实现。Sanjune将此称为选粒叠加[Sanjune,2001]。此外,Sanjune[Sanjune,2001]描述了对可用在本文中的基本技术的几个改进,例如同步叠加(SOLA)、基音同步叠加(PSOLA)等。另外,话之间的几乎与元音部分的固定部分一样的中断可简单地通过使用跨帧冗余进行时间压縮。在实施例中,电输入信号已经历一个或多个(在前的)信号修改过程。在实施例中,电输入信号已经历一个或多个下述过程降噪、语音增强、源分离、空间滤波、波束形成。在实施例中,电输入信号是来自传声器系统的信号,如来自包括多个传声器和用于分离不同音频源的定向系统的传声器系统。在特定实施例中,电输入信号是来自包括单一提取音频源的定向系统的信号。在实施例中,电输入信号是AUX输入,如娱乐系统(如TV或HiFi或PC系统)或通信设备的音频输出。在实施例中,电输入信号为成流音频信号。在实施例中,算法用作ASR(自动语音识别)系统的预处理。重新i周度声音在实施例中,时延用于重新调度声音(的部分)以使佩戴者能够分离声音。该算法实施例想要解决的问题在于听力受损佩戴者在时间-频率-方向域中不能象正常听力听者那样好地分离。算法夸大了并存声源中的时间-频率-方向提示以实现佩戴者能够利用的时间_频率_方向分离。在此,通过引入或夸大时域提示,防止缺乏频率和/或空间分辨率。该概念还用于单传声器信号,其中有限的频谱分辨率的影响通过增加或夸大时域提示进行补偿。在实施例中,"监视与输入声音信号有关的变化"包括检测电输入信号表示来自两个空间上相对于用户处于不同方向的声音信号,及本发明方法还包括分离表示从第一开始时间到第一结束时间的第一持续时间的第一声音并源自第一方向的第一电输入信号及表示从第二开始时间到第二结束时间的第二持续时间的第二声音并源自第二方向的第二电输入信号中的电输入信号,及其中第一电输入信号被贮存,及从其产生第一处理后电输出信号并按相对于从第二电输入信号产生的第二处理后电输出信号具有时延地呈现给用户。在实施例中,可配置时延包括额外的前掩蔽时延以确保第一声音结束和第二声音开始之间具有适当时延。这样的时延有利地适应特定用户的需要。在实施例中,额外的前掩蔽时延大于10ms,如在从10ms到200ms之间的范围中。在实施例中,本发明方法与"遗漏数据算法"(如在统计分析中用于找到参数的估计值的期望值-最大化(EM)算法)结合,以替代在呈现时可用的频率窗口中由其它声源遮蔽的部分。在视听整合的限制内,不同的时延可应用于不同的空间上分开的声音。例如,时延适于随时间变化,如衰变,初始相当短的时延快速减小到零,即助听器追赶。使用波束形成可分离不同空间起源的声音。使用二进制掩模可评估竞争声音的干扰/掩蔽。使用根据本发明实施例的算法,在开始延迟来自没有视听整合的方向(即来自用户看不见的源,如来自后面,因而音频和视觉印象之间可能的失配不太重要)的声音,以在竞争源之间获得较少的干扰。本发明的该实施例目的不是用于噪声环境语音,而是用于解决语音掩蔽语音环境如鸡尾酒会的问题。算法也可用于讲和听设置,这使助听器能从讲和听增益规则之间的振荡型转移适度地恢复。例如,这可通过相对于自己话音的结束延迟讲话者话音的开始从而补偿前掩蔽而实现。算法也可用于反馈通路估计设置,其中两个并存源之间的"静默"间隙用于通过HA接收器继而通过反馈通路放出听不见(即由先前输出掩蔽)的探针噪声。如果反馈抵消系统决定输出不得不在现在停止(及具有时延地重放)以防止由于声耦合引起的啸声(或类似人工产物),算法也可用于保存输入声音。本发明该实施例的目标在于提供在听音设备如助听器的佩戴者处于多讲话者环境中时改善空间上分开的声音的可懂度的方案。在特定实施例中,表示从第一开始时间到第一结束时间的第一持续时间的第一声音并源自第一方向的第一电输入信号在呈现给用户之前相对于表示从第二开始时间到第二结束时间的第二持续时间的第二声音并源自第二方向的第二电输入信号延迟。当源信号源自不同方向时,这具有提供下述方案的优点对多个声源信号进行组合并呈现给听音设备的佩戴者。在特定实施例中,第一方向对应于没有视听整合的方向,如来自用户后面的方向。在特定实施例中,第二方向对应于有视听整合的方向,如来自用户前方的方向。在特定实施例中,在存在第二声音的同时第一声音开始,其中第一声音被延迟直到第二声音在第二结束时间结束为止,助听器处于从第一开始时间到第二结束时间的延迟模式。在特定实施例中,第一声音被暂时贮存,至少在其与第二声音并存期间如此。在特定实施例中,当第二声音结束时对用户播放第一贮存的声音。在特定实施例中,当对用户播放时,第一声音被时间压縮。在特定实施例中,第一声音被贮存,直到第一声音的时间压縮重放已赶上实时第一声音为止,在此场合第一声音信号被正常处理。在实施例中,第一声音被延迟直到第二声音在第二结束时间结束且额外的前掩蔽延迟时间tmd已消逝为止(例如适应特定用户的需要)。在特定实施例中,第一声音信号的时延通过与信号的频移结合而最小化。算法的该实施例概括了一系列算法,其中应用小的非线性变换以在时间和/或频率方面人工分离源自不同源的声音。两种普遍遇到的掩蔽类型为1)前掩蔽,其中声音在(同一频区中的)另一声音之后立即掩蔽另一声音;及2)掩蔽向上扩展,其中声音掩蔽频率接近并高于该声音的另一声音。延迟和快速重放可有助于解决前掩蔽问题,移频可用于帮助解决掩蔽向上扩展问题。在实施例中,第一声音或声音分量被移频以利用来自掩蔽的加快释放。在实施例中,移频基于人类听觉系统的模型。在实施例中,人类听觉系统的模型(具体地,掩蔽阈值对频率)针对特定用户的听力受损进行定制。本质上,其为确定使第一声音或声音分量听得见所必须的频移量的掩蔽模板频谱。最小化时延的积极作用在于由于第一和第一声音分量引起的掩蔽组合扩展也被最小化。在特定实施例中,第一和第二声音的分离基于用于将声信号转换为电信号的至少两个输入变换器的电输出信号的处理或基于源自那里的信号,使用时频掩蔽技术(参见Wang[Wang,2005])或自适应波束形成器系统。在特定实施例中,来自至少两个输入变换器的每一电输出信号被数字化并安排在预定时间长度的时间帧中,每一帧从时域转换到频域以提供包括连续时间帧的时频图,每一时间帧包括所涉及帧中数字化时间信号的频谱的数字表示(每一帧由多个TF单元组成)。在特定实施例中,时频图用于为源自第一和第二方向的每一信号产生(例如二进制)增益掩模,从而使能估计两个信号之间的时频重叠。本发明实施例包括下述要素-使用波束形成,可分离不同空间起源的声音。-使用二进制掩模,可评估竞争声音的干扰/掩蔽。-两个不同空间方向的比较使能估计两个信号之间的时频重叠。不同i舌音、i井i舌及听音情形的不同放大在实施例中,算法适于使用原始传声器输入,空间滤波、估计的源,或语音增强的信号,所谓的"讲和听"情形。在此,该算法实施例解决的问题在于解决不同声音对不同放大率的需要。所谓的"讲和听"情形众所周知对听力受损人员而言存在问题,因为相较其它人的话音,对自身话音放大的需要非常不同。基本上,所解决的问题相当于上述的重新调度声音,"自身话音"当作"方向"。在特定实施例中,用户(自己)的话音与其它声源分离。在实施例中,第一电输入信号表示不同于用户自己话音的声源,及第二电输入信号表示用户自己的话音。在实施例中,在呈现给用户之前,适当修改所保存的第一电信号的放大率。当两个其它人的转换之后,其中必须对两个讲话人应用不同的放大量,将提供同样的好处。例如,自己话音的检测在US2007/009122和W02004/077090中涉及。棘鹏粉古i十,白條翻fei十除了与生成参数和估计参数的比较相关联的正常偏离和偏差之外,估计此外还遭受估计滞后,即参数变化在可观察到的数据中的表现不是即时的。通常,估计器的偏离和偏差可通过使估计时间较长而得以最小化。在助听器中,吞吐量时延必须小(参见[Laugesen,Hansen,andHellgren,1999;Prytz,2004]),因此,通过使估计时间较长而提高估计准确度通常不可取。这简化成估计器需要"看见"多少样本以提供具有必要准确度和鲁棒性的估计量。此外,仅在为追踪相对较大的参数变化时较长的估计时间才必要。本算法提供在大多数时间使用相当短估计时间的机会(当生成参数几乎恒定不变时),及当生成参数变化时使用相对较长的估计时间,同时不危及总吞吐量时延。当出现大规模参数变化时,例如远大于估计算法的步长,如果前述参数被确定,则算法保存声音直到参数估计已收敛为止,之后用收敛参数对记录的声音进行处理并用收敛参数重放,可能加快重放(即以比对其保存或记录的速率更快的速率)以赶上输入声音。在实施例中,本发明方法包括,当参数已收敛及输出信号已赶上输入信号时,消除因电输入声信号的贮存引起的时延(输入和输出之间的正常处理时延除外)。在实施例中,算法适于提供调制滤波。在调制滤波中(参见[Schimme1,2007;Atlas,Li,andThompson,2004]),频带调制从频带绝对值的频谱进行估计。调制频谱通常使用双重滤波(首先滤波全频带信号以获得信道信号,然后通过滤波信道信号的绝对值获得频谱)获得。为获得必要的调制频率分辨率,在计算调制频谱时必须使用合理数量的帧,每一帧由合理数量的样本组成。Athineos调制频谱代码的默认值提供"合理数量"在调制频谱滤波时意味着什么的见识(参见[Athineos])。Athineos提出500ms的信号用于计算每一调制频谱,更新率为250ms,及此外每一帧为20ms长。然而,250ms甚或125ms的时延严重超过Laugesen或Prytz提出的助听器时延[Laugesenetal.1999;Prytz2004]。给定目标调制频率,Schimmel和Atlas已提出使用一组时变二阶IIR谐振滤波器以縮减调制滤波的时延[SchimmelandAtlas,2008]。延迟和快速重放算法使能使用比Laugesen或Prytz[Laugesenetal.1999;Prytz2004]所提出的长的时延以更大的准确度对调制滤波参数进行估计,同时受益于用Shimmel和Atlas[ShimmelandAtlas2008]提出的时变二阶IIR谐振滤波器加快调制滤波。在实施例中,算法适于提供空间滤波。在自适应波束形成中,空间参数从输入信号进行估计,因此,当检测到新方向(以前不活动的方向)的声音时,波束形成器在该方向不被调谐。通过持续保存输入信号,来自该方向的声音的开始可用收敛空间参数进行空间滤波,及当空间参数保持稳定时,由于该算法引起的附加时延减少直到赶上输入声音为止。音频处理单元另一方面,本发明提供音频处理装置。音频处理装置包括用于接收表示音频信号的电输入信号的接收单元、用于产生事件控制信号的控制单元、用于保存电输入信号或其部分的表示的内存;音频处理装置包括信号处理单元,用于基于所保存的电输入信号或其部分的表示以事件控制信号控制的可配置时延提供处理后电输出信号。可以预计,上面描述的、"具体实施方式"中详细描述的、及权利要求限定的方法的过程特征当由相应的结构特征适当代替时可与音频处理装置结合。音频处理装置的实施例具有与相应方法一样的优点。总的来说,信号处理单元可适于执行音频处理装置的任何(数字)处理任务。在实施例中,信号处理单元包括实现对输入信号进行随频率而变的处理(例如使输入信号适应用户需要)。另外或者作为备选,信号处理单元可适于执行一个或多个其它处理任务,如在多个信号之中选择信号、组合多个信号,分析数据,变换数据,产生控制信号,向内存写数据和/或从其读数据等。例如,信号处理单元可以是通用数字信号处理单元(DSP)或特别适于音频处理(如来自AMI、Gen皿m或Xemics)的单元或为与本发明有关的特定任务定制的信号处理单元。在实施例中,信号处理单元适于提取所保存的电输入信号的表示的特征。在实施例中,信号处理单元适于使用所提取的特征产生或影响事件控制信号和/或影响处理后电输出信号(例如,修改其增益、压縮、降噪、导致延迟、使用处理算法等)。在实施例中,音频处理装置适于以比记录其的速度快的速度重放处理后电输出信号以赶上输入声音。在实施例中,音频处理装置包括用于在用户环境中定位声音的定向系统,至少能够对源自第一方向的第一声音与源自第二方向的第二声音进行区分,信号处理单元适于在来自第一方向的声音出现时对其进行延迟,同时来自第二方向的声音被呈现给用户。在特定实施例中,用于在用户环境中定位声音的定向系统适于基于表示来自两个不同空间方向的声音信号并评估两个信号之间的时频重叠的两个二进制掩模的比较。在特定实施例中,音频处理装置包括移频单元,用于通过将第一声音分量的频率移到具有掩蔽加快释放的频率范围而使电输入信号的第一声音分量的时延相对于电输入信号的第二在前声音分量最小化。在特定实施例中,音频处理装置适于实现,第一声音信号的时延可通过与信号频移结合而最小化。在实施例中,音频处理装置适于实现,第一声音或声音分量被移频以利用掩蔽加快释放。在实施例中,音频处理装置适于实现,移频基于人类听觉系统的模型。在实施例中,音频处理装置适于实现,人类听觉系统的模型(具体地,掩蔽阈值对频率)针对特定用户的听力受损进行定制。在特定实施例中,音频处理装置包括监视单元,用于监视与输入声音有关的变化及用于向控制单元提供输入。用于监视与输入声音有关的变化例如用于识别不同的声环境的监视单元在W02008/028484和W002/32208中描述。在特定实施例中,音频处理装置包括用于在并行信号通路中处理源自电输入信号的没有附加时延的信号的信号处理单元,使得提供具有可配置时延的处理后电输出信号及可能不同的没有附加时延的处理后电输出信号。在实施例中,并行信号通路(延迟和未延迟)的处理算法相同。在特定实施例中,音频处理装置包括两个以上并行信号通路,例如,其中一个信号通路提供未延迟的处理,及其中两个或两个以上提供不同电输入信号的延迟处理(或用不11同时延处理同一电输入信号)。在特定实施例中,音频处理装置包括选择器/组合器单元,用于选择延迟和未延迟的处理后电输出信号的加权组合之一,至少部分受事件控制信号控制。听音系统另一方面,提供适于用户佩戴的听音系统,如助听器系统,该听音系统包括如上所述的、"具体实施方式"中详细描述的及权利要求中限定音频处理装置及包括用于将输入声音转换为电输入信号的输入变换器。或者,听音系统可体现在主动耳保护系统、头戴式耳机或一对耳机中。或者,听音系统可形成通信设备的一部分。在实施例中,输入变换器为传声器。在实施例中,输入变换器位于物理上与音频处理装置位于其中的部件分开的部件中。在实施例中,听音系统包括使处理后电输出信号适应适合呈现给用户并感知为音频信号的输出剌激的输出单元,如输出变换器,如接收器。在实施例中,输出变换器位于物理上与音频处理装置位于其中的部件分开的部件中。在实施例中,输出变换器形成包括音频的PC系统或娱乐系统的一部分。在实施例中,听音系统包括助听器、有源耳塞或头戴式耳机。数据处理系统另一方面,提供数据处理系统,该数据处理系统包括信号处理器和在信号处理器上运行的软件程序代码,其中软件程序代码当在数据处理系统上运行时使信号处理器执行如上所述的、"具体实施方式"中详细描述的及权利要求书限定的方法的至少部分(如大部分,如全部)步骤。在实施例中,信号处理器包括如上所述的、"具体实施方式"中详细描述的及权利要求书限定的音频处理装置。在实施例中,数据处理系统形成包括音频的PC系统或娱乐系统的一部分。在实施例中,数据处理系统形成ASR系统的一部分。在实施例中,本发明的软件程序代码形成处理话音通信的计算机程序如SkypeTM和GmailVoice的一部分或嵌入在其中。i十算机可i卖介质另一方面,提供具有软件程序代码的介质,其包括保存于其上的指令,当在数据处理系统上运行时,使数据处理系统的信号处理器执行如上所述的、"具体实施方式"中详细描述的及权利要求书限定的方法的至少部分(如大部分,如全部)步骤。在实施例中,信号处理器包括如上所述的、"具体实施方式"中详细描述的及权利要求书限定的音频处理装置。本发明的进一步的目标通过从属权利要求和本发明的详细描述中限定的实施方式实现。除非明确指出,在此所用的单数形式的含义均包括复数形式(即具有"至少一"的意思)。应当进一步理解,在说明书中使用的术语"包括"和/或"包含"表明存在所述的特征、整数、步骤、操作、元件和/或部件,但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解,除非明确指出,当元件被称为"连接到"另一元件时,可以是直接连接或耦合到其他元件,也可以存在介于中间的元件。此外,如在此使用的"连接"或"耦合"可包括无线连接或耦合。如在此所用的术语"和/或"包括一个或多个列举的相关项目的任何及所有组合。除非明确指出,在此公开的任何方法的步骤不必须精确按所公开的顺序执行。下面将结合优选实施例和参考附图对本发明进行更充分地说明,其中图1示出了根据本发明的方法的一般概念,图la示出了一般算法的两种情形的并行实施例,及图lb示出了算法具有不同输入的实施例。图2示出了一般算法的更详细描述。图3示出了根据本发明实施例的方法,当与第二(正面)信号源同时出现时将第一(背面)信号源延迟呈现给用户的概念。图4示出了根据本发明的贮存、延迟和追赶概念算法的各个方面,图4a示出了时间上部分重叠的两个声音,图4b示出了在第一声音已被延迟之后的输出,图4c示出了在第一声音已被延迟及加快重放之后的输出,图4d示出了第一声音输入和第一声音输出之间的差,图4e示出了"分离的"两个输入声音,及图4f示出了声音的贮存和快速重放,其中处理等待参数收敛。图5示出了可怎样通过比较定向传声器的输出获得二进制掩模。图6示出了通过比较两个信号获得的二进制掩模可怎样与调度器一起使用以建立能够使用延迟和快速重放减少时间重叠的系统。图7示出了具有70dB级的2kHz猝发音的同时发生的时域掩蔽。图8示出了向传统先行装置添加输入驱动的延迟单元的例子。为清晰起见,这些附图均为示意性及简化的图,它们只给出了对于理解本发明所必要的细节,而省略其他细节。通过下面给出的详细描述,本发明进一步的适用范围将显而易见。然而,应当理解,在详细描述和具体例子表明本发明优选实施例的同时,它们仅为说明目的给出,因为,对于本领域的技术人员来说,通过这些详细说明在本发明精神和范围内做出各种变化和修改是显而易见的。具体实施例方式目前在每一耳朵上具有两个或两个以上传声器的助听器配置及无线通信使能使用非常先进的双耳信号处理技术。Pedersen及其同事[Pedersenetal.,2005;Pedersenetal.,2006]已展示了独立部件分析(ICA)或时频掩蔽可怎样与众所周知的自适应波束形成结合以接近时间-频率-方向域中的多个源。这延伸了工作,其中已表明独立信号在时间-频率域中不相交。下面的记法用于将时域中的信号表示(s(t))变换为(时间_)频率域中的信号表示(s(t,f))(包括连续时间帧中的信号的频谱)其中s为源信号,t为时间,f为频率,STFT为短时傅立叶变换,dir为也可以是数量的可选方向。噪声信号记为n。在此,短时傅立叶变换已用于将信号分拆为多个随频率而变的信道,然而,也可使用任何其它类型的滤波器组,如伽玛通(gammatone)、小波甚或只有一对单滤波器。改变滤波器组仅改变时间_频率或有关性质,而不改变掩模的直接功能。理想的二进制掩模在理想的二进制掩模的定义中,时间-频率(TF)窗口的绝对值与噪声的相应(时间和频率)TF窗口比较。如果源信号的TF窗口中的绝对值高于相应TF噪声窗口,该窗口被判定为属于源信号[Wang,2005]。最后,源信号(以及噪声信号)可通过合成属于源信号的TF窗口子集进行重构。基本上,如果TF窗口属于该信号,则TF窗口中的实值或复值乘以1;及如果不属于,则乘以0。在下面,对于局部准则的性质的进一步描述,为简单起见,LC(所谓的局部准则)设为O,参见[Wangetal.,2008]。然而,理想的二进制掩模不能在现实设置时使用,因为我们不可以使用清洁源信号或噪声信号。除理想的二进制掩模之外在其NIPS2000论文[Roweis,2001]中已表明,因子隐Markov链可怎样用于在TF域中从单传声器记录分离两个讲话人。每一因子隐Markov链使用选择处于安静的具体讲话人进行训练。必须需要两个讲话人的个别训练的因子隐Markov链形式的特殊知识以能够分离两个讲话人。主要由于内存限制,讲话人特殊模型的需求对当前HA没有吸引力。特殊的讲话人知识可由空间信息代替,空间信息提供可用于在多个讲话人/声音之间进行区分的度量[Pedersenetal.,2006;Pedersenetal.,2005]。给定任何空间滤波算法,例如延迟及求和波束形成器或更先进的装置,在不同空间方向滤波的输出可在TF域中进行比较,与理想的二进制掩模的信号和噪声类似,以提供当前信号的空间及频谱分布图。如果左和右与前和后互换,上面的等式描述单耳时频掩蔽的基础。来自两个不同空间方向的两个二进制掩模的比较使我们能评估两个信号之间的时频重叠。如果这些信号之一源自后方(背面声音),其中视听失调不是问题,则两个信号之间的时频重叠可通过贮存背面信号直到重叠结束为止而进行优化,之后背面信号按时间压縮方式进行重放直到延迟的声音已赶上输入为止。必要的时延可通过使其与轻微频移结合而最小化。之后,算法概括了一系列算法,外,/)=外,/)64,/)其中应用小的非线性变换以人工分离源自不同源的时频窗口。评估听力受损人员的必要闪现量(频率范围和持续时间方面)的测试(参见[Cooke,2006])将告诉算法知道所保存的声音在频率和/或时间方面应被平移多远以帮助个别用户。闪现是属于同一源的一组相连(时间或频率相邻)的时频窗口的一部分。术语听觉闪现是一瞥视觉现象的类比,其中物体可从部分信息进行识别,例如由于物体在目标前方。Bregman[Bregman,1990]提供了大量该类型的例子。对于听觉,使时频窗口互连的基础结构如共同开始、连续性、谐音关系、或啁啾声可被识别和使用,尽管许多时频窗口不受控于其它源。由于频率选择性降低及掩蔽释放减少,对于听力受损人员,闪现似乎需要更大。与闪现有关的另一概念是急降听音。相比于具有静态掩蔽(背景或噪声信号)的设置,听力受损人员不能与正常听力人员同等程度地从调制掩蔽受益。可以看作好象听力受损人员由于其频率选择性和掩蔽释放降低而不能接近调制掩蔽提供的急降目标的闪现。因此,相较正常听力情形,听力受损情形要求那些闪现必须更大或与噪声更加分离(参见或[Moore,1989])。在本发明的实施例中,方法或音频处理装置适于识别电输入信号中的闪现及适于增强这些闪现或将这些闪现与信号中的噪声分离。对于讲和听应用,衰变时延使助听器能赶上偏移,用适当的增益规则(通常自己的话音相较其它话音或声音增益较低)放大"整个发言",及由于会话来回进行的频率不是那样快,我们不认为用户会因变化的时延而变得"晕船"。该处理与重新调度来自不同方向的声音非常类似,其仅用自己话音的非定向内部位置扩展方向特征。图1示出了具有贮存和(快速)重放算法的部分处理通路的两个例子。图la示出了具有两个贮存、快速重放通路及未延迟通路的并行处理通路的例子。总事件控制的输出(如事件控制参数)指明选择器/组合器应怎样组合并行处理通路中的信号以获得优化输出。选择器/组合器可选择输入信号之一或提供两个或两个以上输入信号的组合,两个或两个以上输入信号可能适当相互加权。图lb示出了作为贮存和(快速)重放算法之前的预处理步骤的普通音频装置处理。图lb的一个或多个示例性可能预处理步骤可在电输入信号输入到本算法(或音频处理装置)之前应用于该电输入信号,包括降噪、语音增强、声源分离(如基于BSS或ICA)、空间滤波、波束形成。另外或者作为备选,电输入信号可包括来自娱乐设备或任何其它通信设备的AUX输入。作为备选或者另外,电输入信号可包括未处理的(电,可能模拟,或数字)传声器信号。显然,贮存、快速重放也可组合在图中提及的算法中。此外,图例示了贮存、快速重放用于重新调度来自多个或许多所提及的输入或信号提取算法的信号的实施例。图2示出了所提出算法的内部结构。事件控制参数(步骤提供事件控制参数)从将由该算法处理的具体电信号(输入表示音频的电信号)提取,或从其它电输入(输入其它电输入)提取,或从所保存的将由该算法处理的具体电信号的表示(可从保存电输入信号的表示步骤获得)提取。前述事件控制参数的例子可在图4a-4f看到,例如确定声音对象的开始和结束、或出现新声源的时间、以及描述声源的参数已收敛的时间的参数。此外,事件控制参数也可与确定声音中发生某事的时间的事件相关联,例如贮存和(快速)重放算法的使用有利于音频装置的用户的时间。当算法准备好重放所保存的信号时,其开始从内存读数据(步骤从事件控制参数控制的内存读数据),从而产生所保存(可能已处理)的电输入信号的延迟版本(输出延迟的处理后电输出信号),其可被处理(可选步骤处理),及延迟可在可选的快速重放步骤(步骤快速重放)中恢复。最后,可选地,信号可在选择器/组合器步骤与已通过并行贮存和(快速)重放通路(步骤并行处理通路)或未延迟处理通路的其它信号组合。在选择器/组合器步骤中,至少部分基于事件控制参数输入,输入信号之一可被选择并呈现为输出。或者,可提供两个或两个以上(可能适当相互加权)的输入信号的组合并呈现为输出。在实施例中,选择器/组合器步骤包括在至少一延迟的处理后输出信号和未延迟的处理后输出信号之间选择。虚线指示可选输入、连接或步骤/过程(功能块)。例如,这些可选项目可包括另外的并行通路(步骤并行处理通路),包括与所提及类似或备选的电输入信号(或其部分)处理步骤。作为备选或者另外,这些可选项目可包括处理通路,该处理通路包括电输入信号(或其部分)的未延迟("正常")处理通路(步骤未延迟的处理通路)。图3示出了根据本发明实施例的方法,当与第二(正面)信号源同时出现时将第一(背面)信号源延迟呈现给用户的概念。图3示出了由多个事件说明的助听器(HI)追赶过程。水平轴表示时间,如由助听器拾取或重放的声事件(声音,"声音1"和"声音2")的"输入时间"和"输出时间"。上图的纵轴表示所涉及声事件的振幅(或声压水平)。下图的纵轴表示在不同时间点与特定声音("声音1")相关联的呈现(输出)时延。这两个图表明由助听器的正面传声器(在此为"声音2")拾取的声事件的输入时间和输出时间实质上相等(即没有有意延迟),而由助听器的背面传声器(在此为"声音1")拾取的(同时发生的)声事件的输入时间和输出时间不同,说明由背面传声器拾取的声事件的输出相较于由正面传声器拾取的"相应"(同时发生的)事件延迟,及时延随时衰变(表明由背面传声器拾取的声事件被延迟但以增加的速率重放以使背面声音能"赶上"正面声音)。在事件l("声音l"开始),在正面信号("声音2")活动的同时检测背面信号("声音l")中的能量。HI保存背面信号供随后使用。应注意,"声音1"的时延不在该点决定,因为声音1必须等待声音2结束。此外,声音1的先拾取部分被延迟最多。在事件2("声音2"结束),正面信号已"结束"(不再活动)。HI在下一可用的时间瞬间开始播放所记录的背面信号,同时HI继续保存背面信号(现在,已知道声音1的第一部分的时延;这是最大时延,参见下图)。在后面的帧中对背面信号时间压縮,及时延据此逐步减少。在事件3,背面信道已赶上正面信道("声音1"的时延为0,参见下图)。因此,不再需要记录和时间压縮背面信道。"声音l"相对于其初始出现的中间时延在图3的下图中表示在事件2和事件3之间。图4示出了根据本发明实施例的贮存、延迟和追赶概念算法的各个方面。为图示目的,阴影用于区分不同的信号(即部分性质不同的信号,性质如声起源(如正面和背面)或处理(例如,在信号的生成参数明显变化之后用未收敛参数处理的一信号及用收敛参数处理的另一信号))。许多不同的参数或性质可用于表征且可能分离声音。这些参数和性质的例子可以是方向、频率范围、调制频谱、共同开始、共同结束、共调制等。图4中信号的每一矩形可当作包括预定数量的表示信号的数字样本的时间帧。相邻矩形的时间重叠指示信号的连续时间帧的预计重叠。图4a示出了时间上部分重叠的两个声音。标记重叠开始和结束的两个事件被标识。在下面的图中,示出了与两个声音之间的时间重叠可怎样消除有关的一些细节。16图4b示出了重叠可怎样通过延迟第一声音直到第二声音结束为止进行消除(不引入"快速重放")。然而,该过程引起这样一种时延,为保持该时延免于持续增大必须对其进行解决。如果适当的连续时延在第二声音中可用到(或者如果存在可片段使用的安静、吵杂或元音类型的时期),该解决方案可以接受,使得第一声音可在第二声音的前述可用(安静或吵杂)时刻重放。图4c示出了声音重叠可怎样通过延迟第一声音直到第二声音结束为止进行消除("延迟模式"),此外,加快重放(在此用S0LA实施)怎样导致赶上输入声音(追赶模式);在运行的"正常模式"占优之后在"第一声音已赶上"处标记事件。在"追赶模式"下,连续时间帧的重叠大于"正常模式"下的重叠,表明在"追赶模式"下给定数量的时间帧以比"正常模式"更短的时间输出。图4d示出了第一声音输入和第一声音输出,没有第二声音。该图示出了每一帧时间上怎样延迟,及在追赶模式下每一帧的时延递减,直到声音已赶上为止,之后,第一声音输出按"正常模式"输出(具有相同输入和输出速率的"实时"输出)。图4e示出了分离的第一和第二声音。两个信号中的每一个均由阴影的方向表征。图4a示出了两个信号的视觉混合,而图4e示出了使用每一信号的特殊特征的分离过程的结果。图4f与图4d类似,其中单一声音被延迟直到参数已收敛为止,之后,用收敛参数处理声音并加快重放以赶上输入。应用的例子已经给出调制滤波、定向性参数等。图5示出了具有指向相反方向的心形方向性图的两个传声器(图5中的前和后)可怎样用于使来自前面的声音与来自背后的声音分离。比较为二元比较,并在短时傅立叶变换(STFT)已用于获得振幅谱IXf(t,f)|禾PIXjt,f)|之后在时间-频率域中发生。为获得前面信号,二进制掩模逻辑对Xf(t,f)>Xjt,f)的时频窗口输出前面掩模BMf(t,f)=l,及对Xf(t,f)<Xr(t,f)的时频窗口输出BMf(t,f)=0。掩模模型BMf(t,f)指明在给定时间(t),频谱(f)的部分受前向控制。在图5中,二进制掩模逻辑单元基于前面和背后振幅谱Xf(t,f)和Xr(t,f)确定前面和背后二进制掩模模型函数BMf(t,f)和BMr(t,f),例如,(BMr(t,f)确定为l-BMf(t,f))。图6示出了两个信号Xl(t)和x2(t)分别在提供相应频谱&(t,f)和X2(t,f)的STFT单元中变换到时间-频率域之后可怎样在比较单元中以与图5中针对定向传声器输入所示等价的方式进行比较。比较单元产生二进制掩模逻辑输出BMjt,f)、BM2(t,f)(如上所述),这些输出还被转发给调度器单元。在掩模应用单元中,二进制掩模BMjt,f)和BM2(t,f)分别用于选择和输出声音的部分xjt,f)和x2(t,f),二者受信号xjt)或X2(t)控制。比较调度器单元(用于产生事件控制信号的控制单元)中的模式产生用于控制相应选择单元的相应输出。每一选择单元(用于处理A(t,f)和&(t,f)的每一处理通路分别对应一个选择单元)将未延迟输入信号及延迟且可能快速重放的输入信号中的任一个选择为输出(两个输入均基于对应掩模应用单元的输出),或者作为备选,零输出。选择单元的输出在求和单元(图6中的+)中相加。例如,求和单元的输出x1&2(t)可提供声音的和,例如,未延迟("实时",只有正常处理的最小时延)版本的一声音如Xl(t)和延迟(且可能快速重放,参见图4d)版本的另一声音如xjt),从而x皿(t)构成改进的输出信号,两个信号xjt)和x2(t)之间的时间重叠被消除或减少。时域掩蔽及频移图7示出了在2kHz、70dB音下的动态掩蔽阈值。猝发音被绘制在左上侧(具有按比例绘制的振幅),及掩蔽频谱由于计算时延而相对于声音延迟。倾斜的实线强调22dB边界的部分(见图7中的箭头)。为简单起见,掩蔽阈值的衰变模型化为阈值按dB随时线性降低。对于预定算法,必需的时延可通过对掩蔽信号进行移频而减小。例如,对于该具体配置,2kHz的新的22dB分量必须延迟直到0.ls为止,以能够听得见;然而,在3500Hz附近0.05s即可使能听得见。本质上为掩蔽模板频谱的形状,其确定使新分量听得见所需要的频移量。最小化时延的积极作用在于掩蔽的组合扩展,新的分量也被最小化。先行时延本发明利用时变时延以在助听器中获得随信号而变的先行时延。先行常规用于使应用计算水平调整同步到输入信号,其通过将输入信号延迟计算时延和指定先行时延的和实现。例如,水平计算可基于7个输入样本,及取2个样本进行计算,因此,如果对7个输入样本求和的权重对称(7个样本长的FIR滤波器具有4个样本的时延加计算时延,在该例子中计算时延为2个样本),则输入信号应被延迟6个样本以实现对准。对于并行滤波器的处理,每一处理信道的时延可通过零点平凡修正进行同步。本发明不同于此的地方在于时延可从输入信号动态确定,例如通过看某些计算检测器随时怎样发展。这由图8中的框图说明。图8示出了输入驱动的延迟单元添加到常规先行装置的例子或电路。模块延迟1补偿获得除法的分母所需要的计算时延,以使信号与增益系数匹配。省略该比率的传统非线性处理(如压縮表查询等);然而,延迟l也应对此进行补偿。可变时延即时延A和时延B均受变化检测算法(事件控制单元)控制。关于定向系统的具体问题前述动态先行时延的具体例子可用在定向系统中。当新的声源出现在听觉场景中时,根据本发明的系统使系统能等待直到定义新的源的空间参数已收敛为止,总的来说,相较于这些参数的实际计算,这花费更长的时间。之后,收敛参数可应用于由整个新的源组成的输入信号。本发明由独立权利要求的特征限定。从属权利要求限定优选实施例。权利要求中的任何附图标记并非意于限定其范围。—些优选实施例已经在上述内容中进行了说明,但是应当强调的是,本发明不受这些实施例的限制,而是可以权利要求限定的主题内的其它方式体现。参考文献EP0869697(LUCENTTECHNOLOGIES)07-10-1998EP1005783(PHONAK)25-02-1999US2007/009122(SIEMENSAUDIOLOGISCHETECHNIK)11-01-2007US7,231,055B2(PHONAK)02-05-2002WO2004/077090(OTICON)10-09-2004*W02008/028484(GNRESOUND)13-03-2008WO02/32208(PHONAK)25-04-2002[Athineos]hadMatlabcodeformodulationspectrummodificationathttp://www,ee.Columbia,edu/marios/modspec/modcodec.html.ThepageandcodeisnotarailableontheInternet肌ylonger.[Atlasetal.,2004]Atlas,L.,Li,Q.,andThompson,J.Homomorphicmodulationspectra.ICASSP2004,pp.761—764.2004.[Cooke,2006]M.Cooke,Aglimpsingmodelofspeechperceptioninnoise,JournaloftheAcousticalSocietyofAmerica,Vol.119,No.3,pages1562—1573,2006.[Laugesenetal.,1999]Laugesen,S.,Hansen,K.V.,andHellgren,J.AcceptableDelaysinHearingAidsandImplicationsforFeedbackCancellation.EEA-ASA.1999.[Jourjineetal.,2000]Jourjine,A.,Rickard,S.,andYilmaz,0.Blindseparationofdisjointorthogonalsignals:demixingNsourcesfrom2mixtures.IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing,2000.[Moore,1989]Moore,B.C.J.Anintroductiontothepsychologyofhearing.Thirded.,AcademicPressSanDiego,Calif,1989.[Moore,2007]Moore,B.C.J.CochlearHearingLoss,Physiological,PsychologicalandTechnicalIssues.Seconded.,Wiley,2007.*[Oxenhametal.,2003]Oxenham,A.J.andBacon,S.P.CochlearCompression:PerceptualMeasuresandImplicationsforNormalandImpairedHearing.EarandHearing24(5),pp.352—366.2003.[Pedersenetal.,2005]Pedersen,M.S.,Wang,D.,Larsen,J.,Kjems,U.,OvercompleteBlindSourceSeparationbyCombiningICAandBinaryTime—FrequencyMasking,IEEEInternationalworkshoponMachineLearningforSignalProcessing,2005,pp.15-20,2005.[Pedersenetal.,2006]Pedersen,M.S.,Wang,D.,Larsen,J.,andKjems,U.SeparatingUnderdeterminedConvolutiveSpeechMixtures.ICA2006.2006.[Prytz,2004]Prytz,LTheimpactoftimedelayinhearingaidsonthebenefitfromspeechreading.Magisterdissertation,L皿dsUniveristy,Sweden.2004.[Roweis,2001]Roweis,S.T.OneMicrophoneSourceSeparation.NeuralInformationProcessingSystems(NIPS)2000,pp.793-799EditedbyLeen,T.K.,Dietterich,T.G.,andTresp,V.De読r,C0,US,MITPress.2001.[Sanjuame,2001]Sanjuame,J.B.AudioTime-ScaleModificationintheContextofProfessionalAudioPost—roduction.ResearchworkforPhDProgramInformc5ticaiCom皿icaci6digita1.2002.[Schimmel,2007]Schimmel,S.M.TheoryofModulationFrequencyAnalysisandModulationFilteringwithApplicationstoHearingDevices.PhDdissertation,UniversityofWashington.2007.[Schimmeletal.,2008]Schimmel,S.M.andAtlas,L.E.TargetTalkerEnhancementinHearingDevices.ICASSP2008,pp.4201-4204.2008.[Wang,2005]Wang,D.Onidealbinarymaskasthecomputationalgoalofauditorysceneanalysis,DivenyiP(ed):SpeechSeparationbyHumansandMachines,pp.181-197(Kl騰r,No潔ll,MA,2005).[Wangetal.,2008]Wang,D.,Kjems,U.,Pedersen,M.S.,Boldt,J.B.,andLunner,T.Speechperceptioninnoisewithbinarygains.Acoustics'08.2008。权利要求用于处理表示音频信号的电输入信号并提供处理后电输出信号的音频处理装置的运行方法,包括a)接收表示音频信号的电输入信号;b)提供指示与电输入信号有关的变化并用于控制电输入信号的处理的事件控制参数;c)保存电输入信号或其部分的表示;d)基于所保存的电输入信号或其部分的表示及通过事件控制参数控制,提供具有可配置时延的处理后电输出信号。2.根据权利要求1的方法,还包括e)提取所保存的电输入信号表示的特征;及f)使用所述特征影响处理后电输出信号。3.根据权利要求1或2的方法,包括处理后电输出信号以比记录其的速率快的速率加快重放以赶上输入声音信号。4.根据权利要求3的方法,其中监视与输入声音有关的变化包括检测电输入信号表示来自两个空间上相对于用户处于不同方向的声音信号,及所述方法还包括分离表示从第一开始时间到第一结束时间的第一持续时间的第一声音并源自第一方向的第一电输入信号及表示从第二开始时间到第二结束时间的第二持续时间的第二声音并源自第二方向的第二电输入信号中的电输入信号,及其中第一电输入信号被贮存,及从其产生第一处理后电输出信号并按相对于从第二电输入信号产生的第二处理后电输出信号具有时延地呈现给用户。5.根据权利要求4的方法,包括自动产生指示与电输入信号有关的变化及用于控制电输入信号的处理的事件控制参数。6.根据权利要求5的方法,其中与电输入信号有关的变化从电输入信号提取或基于来自其它源的输入。7.根据权利要求6的方法,其中第一声音信号的时延通过与信号的频移结合而最小化。8.根据权利要求7的方法,其中用户自己的话音与其它声源分离,其中第一电输入信号表示不同于用户自己话音的声源,及第二电输入信号表示用户自己的话音。9.根据权利要求8的方法,包括在并行信号通路中处理源自电输入信号的没有附加时延的信号,使得提供具有可配置的附加时延的处理后电输出信号和没有附加时延的处理后电输出信号。10.根据权利要求9的方法,其中监视与输入声音有关的变化包括检测大规模参数变化出现,及实现贮存电输入信号直到参数已收敛为止,之后重放用收敛参数处理的处理后输出信号。11.根据权利要求10的方法,其中当参数已收敛及输出信号已赶上输入信号时,因贮存电输入信号引起的时延被消除。12.根据权利要求ll的方法,提供调制滤波,其中所保存的电输入信号用于计算电输入信号的调制频谱。13.根据权利要求12的方法,提供空间滤波,其中监视与输入声音有关的变化包括检测来自新方向的声音存在及来自新方向的电输入信号被隔离并贮存使得收敛的空间参数可从所保存的信号确定及来自该方向的声音的开始可用收敛的空间参数进行空间滤波。14.音频处理装置,包括用于接收表示音频信号的电输入信号的接收单元;用于产生事件控制信号的控制单元;用于保存电输入信号或其部分的表示的内存;所述音频处理装置包括信号处理单元,用于基于所保存的电输入信号或其部分的表示以事件控制信号控制的可配置时延提供处理后电输出信号。15.根据权利要求14的音频处理装置,其中信号处理单元适于提取所保存的电输入信号的表示的特征,信号处理单元适于使用所提取的特征产生或影响事件控制信号和/或影响处理后电输出信号。16.根据权利要求14或15的音频处理装置,适于以比记录其的速度快的速度重放处理后电输出信号以赶上输入声音。17.根据权利要求16的音频处理装置,包括用于在用户环境中定位声音的定向系统,至少能够对源自第一方向的第一声音与源自第二方向的第二声音进行区分,信号处理单元适于在来自第一方向的声音出现时对其进行延迟,同时来自第二方向的声音被呈现给用户。18.根据权利要求17的音频处理装置,包括移频单元,用于通过将第一声音分量的频率移到具有更小掩蔽时延的频率范围而使电输入信号的第一声音分量的时延相对于电输入信号的第二在前声音分量最小化。全文摘要本发明公开了音频处理装置及其运行方法。本发明方法包括a)接收表示音频信号的电输入信号;b)提供指示与电输入信号有关的变化并用于控制电输入信号的处理的事件控制参数;c)保存电输入信号或其部分的表示;d)基于所保存的电输入信号或其部分的表示及通过事件控制参数控制,提供具有可配置时延的处理后电输出信号。本发明的目标是改进听音设备中的声音处理。本发明可在助听器、头戴式受话器、头戴式耳机或有源耳塞中使用。文档编号H04R25/00GK101754081SQ20091024621公开日2010年6月23日申请日期2009年11月26日优先权日2008年11月26日发明者N·H·蓬托皮丹申请人:奥迪康有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1