专利名称:用于精确波形测量的域识别和分离的制作方法
技术领域:
本发明涉及波形和复合波形的时间频率幅度分析、测量和分解(parse apart)。注意,词语“信号”是更通用的“波形”的流行同义词并且在此二者可以互换使用。尽管本文 档的绝大部分指代音频频率范围,但用于本发明目的的波形不限于任何特定频率范围或复杂性(complexity)。任何将测量波形/信号作为其处理的一部分的技术都可以从所描述的这种机器和发现处理中得到辅助。
背景技术:
给定ー个复合波形,期望准确测量该波形及其成分,这些成分可能由几个源生成。这在波形包括以下内容时难以进行由不同源产生的在时间和频率中叠加的信号,被较高能量/幅度信号遮盖的低能量/幅度信号,频率的快速变化,和/或幅度的快速变化。如果能够更准确地测量、分析这些波形和在不同域中将信息分解,将极大地提升我们理解这些波形所包含的内容和如何分离和/或修改这些内容的能力。传统地,在时域和频域中分析波形。通常,这些波形首先被数字地捕获作为时间上的幅度样本,随后使用一系列变换来測量信号,其结果被显示在时间、频率和幅度矩阵中。已经开发了多种技术以从时间序列数据提取时间/频率/幅度信息。然而,表示频率和幅度如何相对于时间变化可能是有挑战的,特别是当存在陡峭的频率和/或幅度变化或来自多个源的信号占据相同的时间和频率区域吋。获取时间、频率和幅度信息的ー种常用变换是离散傅立叶变换(DFT)。不幸的是,在由DFT的大小(尺寸)导致的频率分辨率和时间分辨率之间存在折衷。由DFT检查的时间窗与其尺寸成比例。因此,与小尺寸DFT相比,大尺寸DFT检测更大的时间窗。该更大的时间窗使得大尺寸DFT对动态变化反应很慢。相反地,大尺寸DFT将频率范围划分为更精细片段。通过DFT测量的最大频率为数字化的信号的采样率的一半。尺寸X的DFT将从0至最大值的频率范围划分为X/2个相等尺寸的“点(bin)”。因此,在DFT中每ー个频率点的大小等于采样率除以DFT的尺寸的结果的两倍。因此,较大尺寸的DFT具有较高的频率分辨率但时间分辨率较低。较小尺寸的DFT具有较高的时间分辨率但频率分辨率较低。由于这ー折衷,专业人员寻找改变的DFT或其它替代方法以在时间和频率上均具有良好分辨率的情况下准确地表示动态时变波形。本发明人已经获得了多项专利授权,在此通过引用而合并于此。这些专利是快速查找基频方法(Fast Find Fundamental Method),美国专利第6,766,288B1号;改进复杂波形的谐波内容的方法(Methodof Modifying Harmonic Content of a Complex Waveform),美国专利第7,003,120B1号;以及信号分片方法(Method of Signal Shredding),美国专利第6,798,886B1号。提交于2009年11月12日的专利申请第PCT/US2009/064120号的精确测量矩阵PMM也通过引用而合并于此。
发明内容
本发明提供了一种用于数字信号处理的机器实现方法,包括从模拟信号的转换或者从数据存储器获取数字信号;根据专利申请第PCT/US2009/064120号构建精确测量矩阵(PMM),PMM包括包含针对特定时间和频率的幅度的具有标记的相互关联最大值的单元;以及使用PMM中的最大值的域关系和最大值的局部链(partial chain)来识别相关联单元以便识别和分离复杂的复合波形内的声源。此处要求保护的扩展包括识别PMM中的相关联单元的新方式。在PMM中关联单元的新方式中,可以通过以下的“域”关系关联单元频率、时间、幅度、谐波、开始时间、停止时间、峰值时间、长度、攻角和衰变角、频率重复、模式重复、存储器中发现的模式和未在存储器中发现的模式、以及非随机数学关系。具体来说,以这些方式中的ー种或者这些方式的多种组合而相关的最大值单元和/或者最大值单元链被识别和标记出来。被如此相关的単元是用于源识别的候选。
图I是示出各公开的实施例的功能的框图。图2是针对第二音频采样信号、示出全部PMM事件的河流三维屏幕截图。图3是示出针对第二采样发生在限定幅度水平之上的解析幅度域事件的三维屏.截图。图4A和4B分别是对于第二采样示出为谐波相关的谐波域事件的三維和ニ维屏幕截图。根据用于找到谐波相关事件的美国专利第6,766,288B1号,“快速查找基频方法”。图5A和5B分别是重复域事件的三維和ニ维屏幕截图。对于第二采样示出按照频率点每10秒15个事件的重复事件。图6是谐波域和幅度域的组合域的ニ维屏幕截图。图7是示出全部PMM事件的对于第三音频采样信号的河流三维屏幕截图。图8是对于第三采样示出为发生在限定的幅度范围内的幅值域事件的三维屏幕截图。图9A和9B分别是根据第三采样的开始时间分选的局部链域的三維和ニ维屏幕截图。图10是对于第三采样的长链(在0. 375秒期间)的局部链域屏幕截图。图11是示出用于第四音频采样的角度參数的局部链域屏幕截图。图12是对于第五采样示出为谐波相关的谐波域事件的三维屏幕截图。图13是用于解释所公开的实施例的效用的替代示意图。
具体实施方式
如上面阐释的,所公开的实施例提供识别基于获得的数字信号而构建的精确测量矩阵PMM中的相关单元的新方式。如申请NO.PCT/US2009/064120中阐释的,PMM包括含有针对特定时间和频率的幅度的、具有标记的相互关联最大值的单元。使用PMM中的最大值的域关系和最大值的局部链来识别相关单元使得可在复杂的复合波形中识别并分离声源。因此,识别PMM中的相关单元的新方式具有显著效用和实际应用。在对所公开的实施例的深入论述之前,应理解,一般来说,通过执行多次FFT (或它们的等价形式)以生成测量矩阵(MM)来构建是表示要被分析的数字信号的频谱幅度的单元的矩阵。因此,对于特定的时间片,每个FFT生成一行或一列单元(一个单元用于一个频率点)。如专利申请No. PCT/US2009/064120中描述的那样,PMM是从MM生成的、具有标记的相互关联最大值的时间、频率、幅度事件矩阵。应该理解,在必要时,如该专利申请阐释的 那样,所生成的MM可被拉伸以提供重叠从而确保在整个PMM上存在适当的覆盖。根据本公开,提供了在PMM中使单元关联的新方式;更具体地,可通过以下的“域”关系来关联单元频率、时间、幅度、谐波、开始时间、停止时间、峰值时间、长度、攻角和衰变角、频率重复、模式重复、存储器中发现的模式、存储器中未发现的模式以及非随机数学关系。因此,可以识别和标记以这些方式之一或者这些方式的多种组合来进行关联的最大值单元和/或最大值单元链。结果,如此关联的单元可以被识别为用于源识别的候选。在了解所公开的实施例的初步和概括解释的情况下,接下来提供在后面详细说明中使用的各种术语的更具体定义。定义在此使用以下定义。FT :傅立叶变换一计算波形的频谱幅度的算法。DFT :离散傅立叶变换一计算离散(数字化的)波形的频谱的幅度的算法。DFT输出可以是复数或者仅实数幅度。本发明的许多优选实施例仅需要实数幅度。除非特别地描述为复数,此处对DFT的所有引用均针对具有实数输出的DFT。FFT :快速傅立叶变换-一种快速运行的DFT方法,其如此流行以至于其名称通常与DFT同义地使用。此处DFT和FFT互换地使用。窗由傅立叶变换(或等价技术)使用的时间部分。在DFT中,(采样中)的窗大小已知为DFT的尺寸。例如,如果信号以每秒8000个采样进行数字化,则尺寸为4000的DFT将在4000个数据采样(半秒)上操作。窗技术一种流行的DFT方法,根据该方法,窗中的采样不全被等同地处理。例如,尺寸为4000的简单DFT将简单地对4000个采样进行变换。使用窗技术,4000个采样将被调整成在中间的采样被赋予较大的权重而在起点和终点的采样被赋予较小的权重。窗技术被设计成减小DFT的频率响应中的旁瓣/人为现象。dB:分贝一用于例如声学和电子学测量和计算中的具体用于幅度或能量单元的测量的对数比率。dBFS:全量程分贝一数字表示的相对于最大峰值水平的DB。时间片一部分时间。时间片可例如由运行在特定的数据时间窗上的FFT表示。然而,该窗通常比其表示的时间片大得多并以时间片为中心。时间片的大小是由相继的FFT运行之间的间隔决定而不是由窗的大小决定。对于每秒具有8000个采样的数字化信号,如果每8个采样运行一个新的FFT,则时间片为8个采样(I毫秒)宽。FFT窗可为4000个采样(半秒或500个时间片)宽。频率点小频率范围(例如,1702-1704HZ)。单元矩阵中的单元。通常,单元表示时间片中的频率点并且包含用dBFS表示的幅度。注意具有单元并不限制频率或者时间分辨率。在频点中涵盖的频率范围可以是例如
O.OOlHz0类似地,时间片可以小于O. 001秒。MM :测量矩阵一一种表示波形随时间的频谱幅度的单元矩阵。测 量矩阵通过重复的FFT (或等价方式)生成。每一个FFT对于其时间片生成一行(或列)单元一一个单元用于一个频率点。每一个单元中的幅度是用于在该时间片中的该频率点的幅度。这些单元随后被适当地检查并标记为最大值。在接近实时地处理连续信号时,测量矩阵可为无限的长度。对于限时的波形,测量矩阵可为有限的长度。最大单元被标记为具有一个或多个类型的最大值的单元。简单最大值单元幅度大于直接相邻单元的单元。如果一个单元的幅度大于同一时间片上在频率方面恰好大于和恰好小于该单元的单元的幅度,则该单元是频率峰值简单最大值。如果一个单元的幅度大于在同一频率点上在时间方面恰好在该单元之前和之后的单元的幅度,则该单元是时间峰值简单最大值。单个单元可既是时间简单最大值又是频率简单最大值。时间峰值简单最大值单元和频率峰值简单最大值单元可被区别地标记或可作为同义词看待并为了简洁就称作“简单最大值单元”或“简单最大值。相关最大值(“小兄弟”)单元与简单最大值相邻的单元,该单元的幅度位于简单最大值的指定门限中且还大于另一侧上的单元的幅度。如果一个单元为频率峰值简单最大值,则在频率方面恰好大于和小于简单最大值的在相同时间片中的单元是用于相关最大值的候选。如果一个单元为时间峰值简单最大值,则相同频率点中恰好在该单元之前和之后的单元是用于相关最大值的候选。在所公开的实施例中,如果在简单最大值之前的候选单元中的幅度位于简单最大值幅度的2dB之内且还大于在其之前的单元的幅度,则其将被标记为小兄弟。在所公开的实施例中,如果在频率方面恰好大于简单最大值的候选单元的幅度位于简单最大值幅度的3dB之内且还大于在频率方面恰好大于该候选的单元的幅度,则其应标记为小兄弟。用于在时间方面相邻的小兄弟的dB门限不必与在频率方面相邻的小兄弟相同。时间和频率小兄弟可区别地标记或作为同义词看待并简单地标记为小兄弟。一个单元可同时为二者。角度最大值单元是这样的单元,该单元与在其相反两侧的相邻单元之间的幅度差变化超过给定阈值。在公开的实施例中,如果一个单元比相同频率点中在时间方面恰好在该单元之前的单元大4dB,但仅仅比在该单元之后的单元小ldB,3dB的差使它可以作为角度最大值(具体地,时间角度最大值)。类似地通过比较一个单元的幅度和在同一时间片中在频率方面恰好大于和小于超该单元的单元的幅度来找到频率角度最大值。角度最大值可以被区别地标记为频率角度最大值和/或者时间角度最大值或者可以同义对待并简单地标记为角度最大值。一个单元可以是两者。强迫(Burglar)最大值单元是这样的最大值单元,其中最大值是通过在信号峰值进入和退出DFT窗时测量幅度变化而检测到的。频率点中的能量峰值将会影响其中峰值位于单元的变换窗中的那个频点中的全部单元的幅度。如果变换窗是例如500时间片宽,则峰值在退出之前将进入窗500时间片(单元)。通过比较幅度增加和后面的500时间片的减少,还通过比较两者和指定阈值,可以声明一个强迫最大值。然后标记中间的单元。如果峰值在持续时间上长于一个时间片,则能量将在多个单元(时间片或者行)上升高并类似地在后面500个单元上下降,中间的多个单元将被标记为强迫最大值。因此,不像其它类型的最大值,不能通过将单元和其紧邻的邻居比较而检测强迫最大值。由于窗口可能比单个时间片宽得多,所以可能在与要标记的单元远离的多个单元中看到幅度变化。此外,不像简单最大值、关联最大值以及角度最大值,强迫最大值仅能作为时间最大值存在;不存在类似的频率最大值。局部(partial):标记的最大值单元(例如,简单最大值小兄弟)。局部链(按照邻近(proximity))链接在一起的局部链或者集合。局部链可以包括按照时间片的一个或多个局部。局部链可以如直线、曲线和/或角度线(angled line)— 样穿过时间片。局部链被认为是链接的单元。局部链也称作“链”或者“事件”。注意局部链是局部的链-不是完整的链。链与局部链同义。事件链接在一起的局部的集合一与局部链同义。PMM :精确测量矩阵一如专利申请第PCT/US2009/064120号描述的那样,来自丽的时间、频率和幅度事件的、具有标记的相互关联最大值的矩阵。河流可视化模块以三维可视化模块示出的PMM。域用于解析事件的类别。频率域(众所周知的)“事件”发生的频率。基于频率识别或分离事件。时间域(众所周知的)“事件”发生的时间。基于时间识别或分离事件。幅度域“事件”发生的幅度层级。基于幅度识别或者分离事件。(链的幅度水平。)谐波域谐波相关的事件。基于通用的谐波相关的局部链频率来识别和/或分离事件。合理地同时发生的事件可能具有谐波相关的单独的频率事件。重复域随时间重复的事件。按照频率基于重复链事件来识别或分离事件。不同时间的事件可以通过他们和他们的时间上的重复出现之间的间隔而关联。局部链域以简单方式相似的事件。基于一致开始时间、一致停止时间、时间上的一致峰值、链攻角/衰变角、和/或链长度。存储域由于事件的形状和这些形状如何与存储在存储器中的形状比较而受关注的事件。事件可能由于其形状匹配已经存储在存储器中的预构形状而受关注。此外,事件可能由于其形状不匹配存储器中的已知形状而受关注。注意与预构形状匹配可以是近似的或者可以仅涉及与形状标准匹配(例如,具有螺旋形状的任何事件可能是受到关注的一或者仅仅任何右手螺旋)。非随机域可以被识别为非随机的事件。具有未限定于其它域中的数学关系的局部链。组合域操作员可以组合和调整与每个域相关的参数以分离信号事件。信号发现可以不限于以上所列的域。在更详细地描述本公开的实施例之前,提供对在之前提交的申请No.PCT/US2009/064120(通过引用而结合)中给出的支持技术的总结概述以完全公开实施例的内容。根据之前提交的公开内容的实施例,提供了用于数字信号处理的机器执行方法。该方法包括从模拟信号的转换或从数据存储器获得数字信号,构建一个或多个MM,这些MM包括含有针对特定时间和频率的幅度的单元,基于单元幅度的比较在这些矩阵中标记最大值,以及使这些最大值相关以找到相互关联最大值,其中多个最大值在时间和频率上均位置一致。因此,生成具有被标记的相互关联最大值的称作PMM的新矩阵。(注意所有这些最大值为局部最大值,但为了简便,我们将它们简单地称作“最大值。”)每一个MM可通过使用例如FFT进行输入信号的重复变换而生成。每一个变换表不输入信号中的称作时间片的一部分时间并具有一行单兀,每一个单兀对应于称作频率点的频率范围。每一个单元中填充有幅度,该幅度表示其对应的频率点/时间片的信号强度。每一个MM中的优选地沿着每一个时间片(和/或频率点)具有最大幅度的单兀被识别并标记。可以使用识别最大值的各种方法,产生许多类型的最大值。时间和频率上位置一致的各种矩阵的最大值和/或各种类型的最大值可以在PMM中被标记。然后,PMM中相邻 的相互关联最大值可以经由邻近链接在一起作为局部链。最大值单元可通过比较其幅度与相邻单元的幅度或通过比较其它特定相关单元的幅度而被识别。如果一个单元的幅度大于其相邻单元的幅度,则该单元为简单最大值单元。其它类型的最大值可包括相关“小兄弟”最大值、角度最大值以及强迫最大值(burglarmaxima)ο如果对于相同的时间片和频率点(例如,在不同的丽中)发现多个最大值,贝1J最大值可以位置一致;结果,PMM中相应单元可被标记为相互关联最大值。PMM中每一个单元中的幅度被填充有初始MM中的对应单元中的值的函数(例如,加权平均值)。根据申请第PCT/US2009/064120号,可以对于时间序列信号的瞬时频率和幅度进行高分辨率和准确性测量。这可通过构建可变化大小的多个MM、在MM中标记最大值并随后对最大值进行相互关联而完成。较小尺寸的变换提供较好的时间分辨率,而较大尺寸的变换提供较好的频率分辨率。由于这一原因,两个或更多的测量矩阵(例如时间和频率分辨率不同)可用于建立一个PMM。PMM中相邻的最大值可链接成称作局部链的链。这样的链接是通过连接相同或相近的频率点中的相邻时间片中的任意两个最大值单元而完成的。在申请第PCT/US2009/064120号的一个公开的实施例中,使用不同尺寸的FFT可生成两个MM,以及可使用用于小兄弟的2dB门限来(同时在时间和频率上)标记简单最大值和小兄弟。在这样的实施例中,所有的4种最大值(即时间或频率、以及简单或小兄弟)可被简单地标记为“最大值”。通过将两个MM中的具有匹配时间和频率的单元进行比较并在两者都具有最大值的情况下在PMM中标注最大值来创建PMM。PMM中的单元填充有原始MM中的对应单元的平均幅度。申请第PCT/US2009/064120号的创造性概念的其它实施例可以通过对本实施例的变化而产生。因此,时间最大值可能被丢弃而仅使用频率最大值。小兄弟阈值可以从2dB到任何其它值改变或者可以消除小兄弟。可以创建和相互关联超过两个MM,不必在所有MM之间存在普遍的一致性。例如,如果使用五个不同的测量矩阵,可能需要在相同时间和频率处的五个最大值中的三个来识别相互关联的最大值。此外,不是简单地均等或用相等权重对待全部最大值,可以与简单最大值不同地对待小兄弟。相互关联最大值的标准可以比简单计数或者加法更加复杂一任何数学公式都是可能的。此外,相互关联最大值对于不同的频率范围可以被不同地确定。对于低频率,为提高的频率分辨率可能需要较大尺寸的测量矩阵。相反地,对于高频率,较小尺寸的测量矩阵可能工作良好。
可以使用这些变化的任何组合。此外,可以使用任何窗技术。可以用相同尺寸的FFT但不同的窗技术来生成多个丽。然后在这些丽中标记最大值(可能用不同的标记标准),然后可以比较这些MM以找到相互关联最大值并建立PMM。或者,可以用不同尺寸和不同窗技术二者来产生多个MM。因此,可能组合是无穷尽的。在理解申请第PCT/US2009/064120号中提供的这些技术创造的情况下,现在将描述要本公开的实施例。具体来说,本公开的实施例提供识别PMM(例如,PMM根据申请第PCT/US2009/064120中公开的方法创建)中的相关单元的新方式。可以识别PMM中的这样的相关单元以便识别和分离在复杂的复合波形中的声源。每个PMM包括单元,每个单元表示在特定时间片内的频率点。每个单元可以包含可以表示在该时间(该时间片包含的时间范围)处在该频率(该频率点包含的频率范围)处的信号强度的幅度值。因此,一些单元可以被标记为峰值,意味着它们比相邻的单元包含更大的幅度。标记为峰值的单元通常可以被认为表示重要信号而其它单元通常可以不被标记并且可以是背景噪声。然后可以将频率和时间方面相邻(或者接近相邻,例如,在定位方面以预定或者可接受数量的位置区分)的被标记的单兀链接到一起成为局部链。这样,根据本公开的实施例,将PMM中的单元、局部链和/或事件关联的新方式可以根据以下内容关联它们幅度、谐波关系、重复、开始时间、停止时间、峰值时间、长度、攻角和衰变角、在存储器中的模式、不在存储器中的模式、频率和/或时间、非随机发生模式。具体地,可以识别和标识以这些方式之一或者方式的组合相关的单元组和/或单元链。在图2-12中,其是图I中所示出的河流可视化模块116的屏幕截图,时间轴自左向右;频率轴自前向后并且自低频向高频施加颜色。应该理解,如果显示这样的屏幕截图的计算机监视器是彩色监视器,则低频可以通过例如紫色表示,而高频可以通过例如红色表示。可以通过高度表示幅度,并且随着幅度增长颜色示出更浅。在图2和7中分别示出用于第二和第三音频采样信号的示出全部PMM事件的河流
三维屏幕截图。根据公开的实施例,可以寻求以下的源其幅度使得其局部链将处于-70DBFS到-80DBFS的范围。这样,只有在-80DBFS到-90DBFS范围的单元(或者链)才可以被识别用于考虑。部分地在该范围内而有时偏移出该范围的链仍可以被接受和考虑。图3中示出对于第二采样在OdB到60dB范围内的幅度域的屏幕截图的示例,图8中示出对于第三采样在-85dB到-95dB范围内的幅度域的屏幕截图的示例。根据另一公开的实施例,被识别为谐波关联(根据引用的美国专利第6,766,288号)的局部链可以被关联并被认为可能来自同一源。这可以称作为谐波域;这种类型的例子,对于第二采样可见于图4A和4B,对于第五采样可见于图12。根据另一公开的实施例,前述两个概念被合并并且在-80DBFS到-90DBFS范围内的谐波关联链被识别为可能来自感兴趣的源。这是组合域的例子。
根据另一公开的实施例,基频在给定频率范围(根据引用的美国专利第6,766,288号)中的谐波关联链可以被识别为可能来自感兴趣的源。这可以再次与把搜索限制到一个幅度范围相组合(组合两个域)。图6示出了对于第二采样的例子。根据另一个公开的实施例,同时(或者在同时性的一定容限内)开始的链可以链接在一起如同可能来自相同源一样。图9A、B示出了对于第三采样的例子。这是局部链域的例子。如果链是谐波相关的,则证据强化它们来自单一源。这可以和将搜索限制到一个幅度范围相组合(组合三个域)。根据另一个公开的实施例,同时(或者在同时性的一定容限内)结束的链可以链接到一起如同可能来自相同源一样。这是局部链域的另一个示例。这也可以和所有以上技术组合在一起(组合域)。
根据另一个公开的实施例,相同标准(在时间方面)的链可以被识别为来自相同源。图10示出对于第三采样的例子。类似地,感兴趣的源可以被预期到产生一定长度的链从而该长度的链可以被识别为候选。这是局部链域的另一个示例。根据组合不同技术的公开的实施例,可以用已知幅度、基本谐波频率、链长度来寻找源并把匹配全部三个标准的链识别为可能来自该源(组合域)。根据另一公开的实施例,源可被已知为具有特定的重复模式(例如,每秒钟20毫秒的声音之后跟随980毫秒的寂静,如此反复)。对于第二采样,图5A、5B示出了这样的实现的例子。该模式可以在PMM中搜索并被识别。这是重复域的例子。搜索可以限制为幅度或者频率范围或者与任意以上技术组合(组合域)。在类似的公开实施例中,软件和硬件实现的处理可以搜索任何一致的重复模式,本质上随时间学习。这种搜索也可以和任何以上技术组合。这也是重复域的例子。应该理解,术语“模式”可以指代很多事物。软件和硬件实现的处理可以搜索该模式重复的频率(点、点、长划、停顿相对于点、点、长划、停顿),这可能更好地被称为“韵律(cadence)”。因此,还应该理解搜索可以基于事件形成的方式来执行。或者,软件和硬件实现的处理可能最关注模式的形状细节(例如,点、点、长划、停顿相对于长划、长划、点、停顿)。这些是重复域的更多例子。此外,音量可以变化(点、点、长划、停顿)或者基本频率(do、ra、me、停顿)(组合域)可以改变,软件和硬件实现的处理分析这些改变。这样,如上所述,不同类型分析技术的组合是无穷尽的(d0、ra、me、长停顿)并且这些组合正是区分例如一种鸟叫和另一种鸟叫的东西。正如人耳能够从林地声响的杂音中分拣出红尾鹰的声音,根据公开的实施例提供的软件和硬件实现的处理可以能够从胎心监视器的嘈杂声音中识别出心脏低音。用于心跳的局部链域/(角度参数)的例子示出于图11中。该角度是局部链的攻角和衰变角。在非随机域中,作为一个例子,非随机域可以是检测到的具有非谐波数学关系的局部链的单个或多个发生。图I示出了提供根据本发明的公开实施例执行的功能的各个部件的框图。模拟信号接收模块IOla捕获物理模拟信号。模拟信号接收模块IOla可以是例如播放磁带的磁带播放器、麦克风、视频摄像机、或者其它的换能器等。模拟/数字(A/D)转换器IOlb将物理模拟信号转换成数字格式。在一个可能的实施例中,A/D转换器IOlb可以例如嵌入到向数字音频站(DAW)进行馈送的数字音频机器上。然后,例如使用16比特量化和例如8KHz的采样频率,可以产生数字格式。每个量化比特可能提供大概6dB的动态范围。这样,示例的16比特量化可以带来大约125dB的总动态范围,这对于一些音频应用是足够的。可以获得其它的量化选择,包括但不限于32比特和24比特。量化也可以是使用在诸如CD-ROM的装置中普遍使用的过采样和Σ Δ调制的单比特。模拟信号接收模块IOla和A/D转换器IOlb可以是同一设备或单独的设备。在一个公开的实施例中,不是经由模拟信号接收模块IOla和A/D转换器IOlb提供数字信号,而是通过存储数字信号的数据存储器102提供数字信号。数据存储器102可以是任何类型的数据存储器,例如,硬盘驱动器、网络附接存储(NAS)设备、闪存驱动器等。然而,数据存储器102不限于这些特定的例子。在不脱离本发明的范围的情况下,数据存储器102可以包括其它现有的或者未来开发的数据存储器设备。利用公开的实施例可以处理很多类型的信号。例如,提供的数字信号可以是来自 音频频谱、视频频谱或者其它频谱的数字化模拟信号或者可以源于数字形式。在PMM生成模块103处,可以从模拟信号接收模块IOla和A/D转换器IOlb或者例如从数据存储器102接收数字信号;接着,可以将数字信号变换以生成PMM。在专利申请第PCT/US2009/064120号中描述了一个非限制性的生成PMM的例子的细节(如上所述)。PMM生成模块103生成的PMM输出数据104可以是任何数据形式。数据形式的一个例子将是二进制、技术数据管理流(TDMS)格式或者Excel RXML形式(XLSX)。可以使用任何适当的数据格式,包括定制的专有的数据格式。根据公开的实施例,可以提供PMM输出数据104给PMM输出模块105,PMM输出模块105可以以一种或者多种类型的被配置为存储或发送所生成的PMM数据的数据存储器或者发送装置实现。例如,PMM输出模块可以被配置为存储静态文件或者可以配置为对可以用于实时应用的数据进行组流。此外,PMM输出模块105可以部分地利用数据存储器实现以存储PMM。替代地或附加地,PMM输出模块105可以整体或者部分地实现在被配置用来发送PMM到另一装置的发送装置中,例如河流可视化模块116。然后这些结果可以输入到运行在信号处理器或者其他装置的软件中以修改原始波形。根据一个公开的实施例,河流可视化模块116可以经由计算机硬件和软件实现,计算机硬件和软件提供生成被设计为使能可视地翻译所生成的PMM数据的一个或者多个用户接口的可视化设备。这样的用户接口可以可选地利用触摸屏技术或者与图形用户接口(GUI)相关联的任何其他类型的输入和指令控制方法学。河流可视化模块116可以例如被实现为包括打印设备和/或显示设备,例如液晶显示器、投影监视器等。应该理解,可视化方法学可以不限于二维观众;因此,可以使用三维和全息显示器。示范的打印设备可以包括基于调色剂的打印机、液体喷墨打印机、无墨打印机等。该示范实施例的其它临时结果也可以提供给河流可视化模块116。在公开的实施例中,PMM输出模块105可以包括数据存储器和可视化设备两者以使得能够手动调节信号处理器来达到期望的效果。PMM输出数据104可以根据用户要求和被处理的信号的要求而应用到执行分选、评定和分析功能的各种算法。不同分析算法的范围和数量是不受限的。谐波域计算模块106可以应用谐波域计算算法软件到PMM输出数据。该模块的功能使得能够找到谐波相关的局部链。该功能可以利用美国专利第6,766,288B1 “快速找到基频方法”中公开的算法整体或者部分地实现。幅度域计算模块107可以应用幅度域计算算法软件,幅度域计算算法软件可以使得能够发现由幅度限定的全部局部链。这样的功能将进一步使得能够从更小幅度的局部链中分选大声的局部链。这将也允许分离具有幅度差的局部链。此外,这种功能可以使得能够分离大于或小于绝对阈值的信号。重复域计算模块108可以应用重复域计算算法软件,重复域计算算法软件可以使得能够发现由局部链按照·频率重复的数量限定的全部局部链。随着时间,该功能可以进一步使得能够发现随时间并在时间周期内重复的事件。此外,该功能还可以使得能够定位作为重复链的子群的重复局部链。频率域计算模块120可以应用频率域计算算法,频率域计算算法可以使得能够发现在限定的频率范围或者频率差内的局部链。时间域计算模块117可以应用时间域计算算法,时间域计算算法可以使得能够发现由时间范围或者时间差限定的局部链。存储器域计算模块118可以应用存储器域计算算法,存储器域计算算法被配置成匹配/关联能够从存储器(比如数据库)加载的局部链/信号模式。此外,可能匹配或者不匹配的局部链也可以存储在存储器中;应该理解存储的局部链可以可选地存储作为新的唯一的局部链。非随机域计算模块119可以应用非随机域计算算法,非随机域计算算法被配置为使得能够发现以不被其他域限定的方式数学相关的局部链。因此,模块119也可以使得能够发现可以嵌入噪声或者其它自然或者非自然随机信号中的信号。局部链域计算模块109可以应用局部链域计算算法软件,局部链域计算算法软件可以使得能够发现由以下内容限定的全部局部链这些内容例如,Ca) 一致开始时间;(b)一致停止时间;(C) 一致局部链长度;(d) —致局部链峰值;(e)局部链幅度随时间增长的角度;和/或(f)局部链幅度随时间减少的角度。在一些情况下,可以指定开始频率、峰值频率和结束频率。类似地可以使用幅度或者时间。组合域计算模块110可以应用域计算算法的组合来使两种或者更多种算法能够根据被分析的信号来组合实现。用来提供该功能的多种算法可以被应用到组合域输出重计算模块111,该模块可以运行被配置为对在域算法中限定的参数进行求和的软件。组合域输出重计算模块111的输出可以进一步输入到河流可视化模块116用于观看域组合的局部链发现结果。组合域输出重计算模块111的输出也可以应用到滤波器计算模块112。该模块112的功能是建立适当的滤波器以用于滤波器应用模块113。这样的滤波器应用模块113可以被配置为实施滤波器计算模块112的输出以过滤数字信号文件中不想要或者想要的信号。该滤波器可以使FIR或者I2R类型,但是不必限制于这些类型的滤波器。此外,滤波器深度和带宽也可以是滤波器参数控制的一部分。重计算输出模块114可以配置为用于运行滤波器应用模块113相对于原始数字信号的输出以获得信号差/滤出的信号。在一些情况下,与绝对滤出信号相反,可以要求使用差分信号。重计算输出模块114的输出可以输入到河流可视化模块116中。处理结果也可以输入到多维输出模块116,多维输出模块116可以被配置为使得能够实现三维或者全息显示类型的用户接口。参见例如,美国专利第6,798,886B1号“信号分片方法”,美国专利第7,003,120B1号“改进复杂波形的谐波内容的方法”。为更好理解上述各个模块的功能,图13提供图I中先前所示部件的操作的替代表示,用于提供新颖的域识别和分离方法以及用于精确测量波形的功能。如图13所示,1001处的输入信号被提供给信号处理模块1002。模块1002包括测量引擎1003、标记引擎1004和比较引擎1005,它们有效地配合以产生PMM。应该理解,包括在信号处理模块1102中的这些引擎1003-1005中的每一个(以及信号处理模块1002本身)可以利用具有至少一个中央处理单元(CPU)和至少一个存储装置(图13中未示出,但在图I中举例示出为102)的一个或者多个计算机来实现。此外,测量弓I擎1003、标记引擎1004和比较弓I擎1005可以整体或者部分地利用例如现场可编程门阵列(FPGA)、数字信号处理(DSP)芯片、图形处理单元(GPU)或者专用集成 电路(ASIC)等实现。此外,测量引擎1003、标记引擎1004、比较引擎1005可以至少部分地利用软件模块(参考图I上述讨论的模块)而实现为一个或者多个引擎并存储在计算机可读存储器上。由比较弓I擎1005生成的PMM可以提供给多域解析弓I擎1006,多域解析引擎1006也可以整体或者部分地利用以上描述的硬件结合一种或者多种软件算法来实现。多域解析引擎1006的输出可以是例如域矩阵,域矩阵可以被直接提供为输出数据1008(这种实现未示出)或者通过滤波器引擎1007被提供为输出数据1008。输出数据1008可以提供给输出模块1009,输出模块1009存储、显示和/或发送输出数据。如本公开通篇所解释的,所公开的实施例可以利用在一个或者多个硬件上操作的软件来实现,硬件可以包括例如计算机。这样,所公开的实施例可以运行在具有单核的单处理器上、具有多核的单处理器上或者具有单核或者多核的多处理器上。此外,软件可以运行在与一个或者多个用户接口交互的一个或者多个服务器上,以在可能彼此远离的一个或者多个位置提供PMM数据的可视化。此外,该软件可以实现此处参照图I和13中示出的模块、部件和引擎公开的功能。由所公开的实施例提供的一些或者全部功能可以使用软件、通用或者专用数字信号处理器芯片、专用硬件、固件等来提供。此外,这些功能可以实施在包括例如数字信号处理器芯片的一个或者多个电路板上,以安装在计算机或者其他模块中。所公开的实施例提供的一些功能可以使用并行计算硬件来实现。因此,例如,并行处理器计算设备的主存储器可以是共享存储器(以单一地址空间在全部处理元件之间共享)或者是分布式存储器(其中,每个处理元件具有自己的局部地址空间)。应该理解尽管PMM和域用于发现、显示和过滤,但也可以(或者替代地)用于各种其它功能。例如,可以将公开内容和其等价物或者类似未知的域/标准应用于在数据分析有用的几乎任何领域筛分数据(PMM)。这样,应该理解所公开实施例的功能具有宽广范围的应用,包括但不限于例如包括音频的信号时变分析、音频频谱分析、在任何频率范围内在适用行业中的信号分析、数据压缩、用于聋人的数字耳蜗、“声纹”信息等。例如,图11示出用于心跳的角度。此外,由所公开的实施例提供的功能和技术效果可用于为其它信号处理器、分析设备、算法、系统以及组织提供新的或改进的输入。例如,在时间-频率平面上运行的相关局部链的记录,与沿着每一个链的幅度或插入幅度一起,可提供特定信号源的分量的丰富简要的记录。之前被较强的信号掩盖的信号可被测量并可视化,特别是当在PMM视觉显示中局部被链接进局部链时。来自PMM或者任何域标准的输出可以用作对于现存的信号发现系统和机器的“副链(side chain)”控制装置。即使当声音分量是包含声音混合物的复合波形的一部分时,所公开的实施例也可以用于精确测量声音分量并解析这些分量。此外,即使当声音以短或长持续时间突发到来和/或在音调和/或幅度上变化时,所公开的实施例也可用于例如包含声音的复合波形。此处描述的示例和实施例是非限制性的示例。实施例是针对示意性实施例被详细 描述的,且对于本领域技术人员,根据前面的叙述应该清楚,可在不背离本发明的更广泛方面的情况下进行变化和修改,因此如在权利要求中限定的本发明旨在覆盖落入本发明实质精神内的所有此类变化和修改。
权利要求
1.一种用于数字信号处理的机器实现的方法,包括 从数据存储器或者从物理模拟信号的变换获得数字波形信号,所述物理模拟信号是从模拟源接收的或者通过物理模拟设备捕获的; 根据数字波形确定两个或者更多个測量矩阵,每个测量矩阵都包括多个单元,每个单元表示对应的时间片和频率点并且具有与针对该频率点和时间片的信号能量相对应的幅度; 在各个测量矩阵中基于它们具有的局部最大幅度来识别各种类型的最大值单元; 从多个测量矩阵识别作为在时间和频率方面位置一致的最大值单元、或作为测量矩阵的组合或多种类型最大值的相互关联最大值; 构建指示相互关联最大值的相互关联最大值矩阵; 在相互关联最大值矩阵中识别相互关联最大值的以下域关系中的至少ー个谐波域、幅度域、局部链域、重复域、存储器域、非随机域; 构建示出识别出的域关系的域矩阵; 经由计算机硬件存储、发送和/或显示所述域矩阵。
2.根据权利要求I所述的方法,其中所述域矩阵以河流三维格式显示在图形用户接ロ上。
3.根据权利要求2所述的方法,其中河流可视化格式使用不同顔色示出与不同频率相关联的数据。
4.根据权利要求2所述的方法,其中河流可视化格式通过高度示出幅度并且颜色随着幅度增大而被示出为越浅。
5.根据权利要求I所述的方法,其中识别局部链域关系包括识别相互关联最大值矩阵中的最大值,所述最大值在时间轴或者频率轴上彼此相邻并满足以下标准之一在预选数量的単元内相邻;是长度上最小数量的相邻单元;以及小于相邻単元之间的最大幅度变化。
6.根据权利要求I所述的方法,其中识别局部链域包括在第一轴上识别满足以下标准之一的局部链在第二轴上重复最小出现次数的局部链;在第二轴上在公共窗中具有ー个或者更多个开始、停止和峰值的局部链;谐波相关的局部链的一部分;以及幅度具有预选的变化速率或者角度的局部链。
7.根据权利要求I所述的方法,其中识别谐波域关系包括识别相互关联最大值矩阵中的最大值,所述最大值是谐波相关的并且满足以下标准之一具有在预选范围内的幅度;重复最小出现次数;存在最小数量的谐波。
8.根据权利要求I所述的方法,还包括分析相互关联矩阵和域矩阵中的ー个,并基于该分析来调整在确定所述测量矩阵时使用的參数。
9.根据权利要求I所述的方法,还包括过滤所发现的链用于隔离或者噪声去除。
全文摘要
一种用于计算机化数字信号处理的机器实现方法,从数据存储器或者从模拟信号的变换获得数字信号,并根据数字信号确定测量矩阵(MM)。每个测量矩阵具有多个单元,每个单元具有与对于时间片在频率点内的信号能量相对应的幅度。每个测量矩阵中在时间片内具有最大幅度的单元被识别为最大值单元。识别在时间和频率方面位置一致的最大值,构建被称作“精确测量矩阵”的表示位置一致最大值的相互关联最大值矩阵,以及相邻的被标记出的最大值被链接成局部链。如果仅构建一个MM,则识别多个类型的最大值以生成精确测量矩阵。然后将局部链分离成限定的域关系用于识别和分离。
文档编号G06F17/00GK102770856SQ201080058037
公开日2012年11月7日 申请日期2010年11月11日 优先权日2009年11月12日
发明者F·M·斯莱, J·W·史密斯(死亡), P·R·史密斯, S·G·W·莫里斯 申请人:保罗-里德-史密斯-吉塔尔斯股份合作有限公司