专利名称:声音信号的带宽扩展的制作方法
技术领域:
本发明总的涉及声音信号的处理。
原始的声音信号包含在一个频率范围内的信号分量;此后把这个范围称为“原始带宽”。如果原始的声音信号来自于自然源,诸如人讲的语音、或乐器产生的音乐,则原始的声音信号也被称为“自然声音”,以及它的带宽也被称为“自然带宽”。
当自然声音为了通信传送、记录等原因而由电子设备等进行处理时,信号的带宽常常相对于自然带宽受到限制。这样做的原因可能取决于环境。原因可以是信号传送路径不只是为传送高频设计的(例如电话)。原因也可以是为了减小要被记录或传送的数据量,信号被故意地在频带上受到限制。例如,在会讲话的书的情形下,数据载体可载送较长时间段的讲出的文本。在音乐的情形下,音频可被压缩,例如像MP3。
在许多情形下,由这样的带宽限制造成的信息损失是可忽略的,或至少是可接受的。然而,(对于人类观察者来说),限带信号一般比起具有自然带宽(全部带宽)的相应的原始信号听起来不太自然,是熟知的问题。
当然,感觉取决于受限制的频带的实际的带宽。例如,在电话的情形下,“窄带”通信涉及到0.30-3.4kHz的带宽,但已确定,最好采用0.05-7.0kHz的带宽的“宽带”通信。所以,目前技术水平包括用于从原始的窄带信号生成宽带信号的许多系统。这些已知的系统具有某些缺点。许多已知的系统是基于傅立叶变换和/或大范围的滤波;因此这些系统的计算复杂性很高。而且,这些已知的系统被设计为仅仅用于语音信号的处理,因此它们对于其他类型的声音的作用不佳。在许多情形下,该系统是一个自学习系统,它具有若干个需要被初始化、然后在训练时间间隔内自适应的参量,在训练时间间隔中系统被训练成根据窄带语音来预测宽带语音。
所以,本发明的总的目的是提供一种能够从原始的输入信号生成更宽带的信号的用于处理声音信号的方法和系统,在其中可以消除或至少缓和上面提到的缺点。
更具体地,本发明的目的是提供一种能够从原始的输入信号生成更宽带的信号的用于处理声音信号的方法和系统,它不需要训练时间以及它可被使用于许多类型的声音信号,例如音乐和语音。
而且,本发明的目的是提供具有减小了的复杂性的、这样的方法和系统,而该系统能够以模拟实施方案以及以数字实施方案被实施。
为了达到这些目的,本发明提出根据原始信号的至少部分信号内容来生成谐波信号,以及可能在某些滤波后把这些谐波信号加到原始的信号上。在这方面,已经证实,通过使用副谐波频率把低音频谱扩展到更低的频率这本身是已知的;然而,本发明寻求把频谱扩展到更高的频率,另外,副谐波频率的生成涉及到一种与谐波频率生成不同的技术。
通过参照附图对于按照本发明的信号处理系统的优选实施例的以下的说明,将会更详细地解释本发明的这些和其他方面、特性与优点,其中
图1示意地显示说明按照本发明的信号处理的功能性方框图;图2A-2E示意地显示在信号处理的各个阶段的信号的带宽;图3A-3E示意地显示对于另一种类型的输入信号,在信号处理的各个阶段的信号的带宽;图4示意地显示按照本发明的设备的实施例。
图1示意地显示信号处理系统的功能性方框图,该系统总的用数字1表示。系统1具有用于接收原始的声音信号SOR的输入端2和用于提供输出信号SOUT的输出端3。系统1包括分别在输入端2与输出端3之间的两条信号传送路径10和20。
第一信号传送路径10用于传送原始的声音信号SOR;所以,这个第一信号传送路径10也被称为原始信号传送路径。虽然这个原始信号传送路径10可包含用于改进该原始的信号的信号处理部件,这种处理部件对于本发明来说不是本质的,所以在图1上未示出。另一方面,原始的信号传送路径10通常将包含延时装置11,以便补偿另一条传送路径20上的延时。延时装置本身是已知的,以及任何适当的本身已知的延时装置可被使用来实施延时装置11,正如本领域技术人员清楚的;所以,这里不必要详细说明这样的延时装置的结构和功能。
第二信号传送路径20用于根据原始的声音信号SOR生成谐波信号SHAR;所以,这个第二信号传送路径20也被称为谐波信号传送路径。
谐波信号SHAR在组合器或相加器30中与(可任选地延时了的)原始的信号SOR相组合,以生成输出信号SOUT,它可被表示为SOUT=SOR+SHAR。这个输出信号SOUT具有频谱54,其带宽为BWOUT,它相对于原始的信号SOR的带宽BWOR已被扩展。在原始的信号SOR的带宽BWOR内,输出信号SOUT的信号分量基本上等于原始的信号SOR的信号分量。此外,输出信号SOUT也包含处在原始的信号SOR的带宽BWOR以外的频率范围的信号分量,这些附加信号分量实际上是在谐波信号传送路径中生成的谐波信号SHAR的分量。
下面参照图1和图2A-E解释在谐波信号传送路径20中的信号处理。图2A-E是示意地显示在信号处理的各个级处信号的带宽的图;水平轴代表频率。
图2A显示具有带宽BWOR的原始的信号SOR的频谱50。
在谐波信号传送路径20中,原始信号SOR首先被第一滤波器21滤波,以产生滤波的原始信号S1。滤波的原始信号S1只包含原始信号SOR的一部分信号分量。在图2B上,这是由具有带宽BW1的滤波的原始信号S1的频谱51显示的,带宽BW1明显地小于原始信号SOR的带宽BWOR。
带宽BW1的频率上限可以基本上等于带宽BWOR的频率上限59;在这种情形下,第一滤波器21可以是具有一个用于确定带宽BW1的频率下限的预定的截止频率的高通滤波器。然而,带宽BW1的频率上限也可以低于带宽BWOR的频率上限59;在这种情形下,第一滤波器21可以是具有一个用于确定带宽BW1的频率下限的预定的下部截止频率和一个用于确定带宽BW1的频率上限的预定的上部截止频率的带通滤波器。
滤波器装置本身是已知的,以及任何适当的本身已知的滤波器装置可被使用来实施滤波器装置21,正如本领域技术人员清楚的;所以,这里不必要详细说明这样的滤波器装置的结构和功能。例如,第一滤波器装置21可以是以数字实施方案的(线性相位)IIR滤波器或(线性相位)FIR滤波器。然而,在模拟电路中,模拟实施方案也是适当的。关于线性相位IIR滤波器,可参考论文S.R.Powell andP.M.Chau,”A technique for realizing linear phase IIR filters(用于实现线性相位I IR滤波器的技术)”,IEEE Trans.on SignalProcessing,39(11),1991,pp.2425-2435。
已滤波的原始的信号S1被处理设备22以非线性方式处理,这样,谐波失真以可控的方式被引入,以及具有带宽BW2的频谱52的、处理设备22的输出信号S2包含具有比起滤波的原始的信号S1的频带的频率上限更高的频率的频率分量,如图2C所示。
BW2的带宽限定的精确的宽度和位置取决于处理设备22的性质。一般地,处理设备22的输出信号S2的频谱将从BW1的频率下限扩展到最高可能的频率(即,奈奎斯特频率)。
在所示的实施例中,处理设备22的输出信号S2由第二滤波器23进行滤波,以产生具有带宽BW3的频谱53的滤波的谐波信号S3。第二滤波器23被设计成使得滤波的谐波信号S3的带宽BW3满足某些预定的要求。例如,为了不影响原始的信号SOR带宽BW3的频率下限优选地不低于带宽BWOR的频率上限。另一方面,带宽BW3优选地与带宽BWOR紧密地相邻。所以,带宽BW3的频率下限优选地基本上等于带宽BWOR的频率上限。
原理上,带宽BW3的频率上限可被自由地选择,这取决于“爱好”。第二滤波器23可被设计成可截断不能使用的频率分量,或把带宽BW3成形为具有预定的宽度,例如高于BWOR的下一个八度音或一个等于BWOR的宽度的宽度。优选地,第二滤波器23是具有一个等于预期的输入信号的带宽BWOR的频率上限的预定的下部截止频率、和具有一个用于确定带宽BW3的频率上限的预定的上部截止频率的带通滤波器。
原理上,第二滤波器23不是最重要的,因为把原始的信号SOR与信号S2组合已构成原始的信号SOR的改进。然而,第二滤波器23影响该改进,特别是在听众对于该改进信号的感觉方面。听众可以发现该改进信号或多或少更悦耳。按照本发明人进行的实验,如果第二滤波器2 3被安排为使得BW3基本上相应于高于BWOR的第一个八度音,则得到最悦耳的效果。因此,在优选实施例中,BW3的频率下限基本上等于BW1的频率下限的2倍,而BW3的频率上限基本上等于BW1的频率上限的2倍。
应当指出,在BWOR的频率上限处在低于奈奎斯特频率一个八度音的情形下,BW2固有地相应于高于BWOR的第一个八度音,即使不存在第二滤波器23的话。
正如以上对于第一滤波器21所提到的那样,任何适当的本身已知的滤波器装置可被使用来实施第二滤波器装置23,正如本领域技术人员清楚的;所以,这里不必要详细说明这样的滤波器装置的结构和功能。例如,第二滤波器装置23可以是以数字实施方案的(线性相位)IIR滤波器或FIR滤波器。然而,在模拟电路中,模拟实施方案也是适当的。
滤波的谐波信号S3被放大或被衰减适当的增益倍数G,以产生信号SHAR。增益G的精确的数值需要根据环境来确定,以使得SHAR适当地适配于SOR,即,输出信号SOUT的总的频谱尽可能平滑,正如本领域技术人员清楚的。
非线性处理装置22可以以各种本身已知的装置来实施。原理上,可以使用任何装置,只要该装置是输出信号包括谐波频率的那种类型。优选地,该装置应具有振幅线性度。适当的装置例如包括全波整流器;半波整流器;半波积分器;全波积分器;依赖于电平的削波器;限幅器。取决于类型的选择,非线性处理装置22生成偶次谐波(例如,在整流器的情形下)或奇次谐波(例如,在削波器的情形下)。
关于全波积分器,可以参考授权给R.M.Aarts和S.P.Straetemans的US-A-6,111,960。
而且,由该装置生成的输出信号S2应当优选地在输入信号的二倍频率处有很强的频率分量。这个要求可以由全波整流器;半波整流器;半波积分器;全波积分器来满足。由整流器生成的谐波几乎独有地处在二倍频率处,而积分器还生成更高次谐波的频率分量。而且,整流器的计算复杂性小于积分器的计算复杂性。所以,非线性处理装置22优选地用全波整流器或半波整流器实施。
应当指出,非线性处理装置22对于它的输入信号S1的每个信号分量生成谐波信号。因此,如果BW1的频率下限被选择得太低,则根据S1的低频分量生成的谐波信号将处在BWOR内,这是不希望的。所以,第一滤波器21的下部截止频率优选地被选择为使得生成的谐波都具有高于BWOR的频率上限的频率。而且,具有高于BWOR的频率上限的频率的、原始的信号SOR的那些信号分量将具有非常低的幅度,以及将导致谐波信号也具有非常低的幅度,这样,它们对于带宽的扩展只有非常小的贡献或完全没有贡献。具体地,第一滤波器21优选地被安排成使得BW1基本上对应于BWOR内的最高的八度音。
正如本领域技术人员已知的,每个滤波器特性显示对应于滤波器阶数的、从通带到阻带的过渡范围。窄的过渡范围对应于高的滤波器阶数。优选地,下部截止频率的滤波器阶数和上部截止频率的滤波器阶数的每一个都在3到6的范围内;更高的滤波器阶数是不必要的,它还增加计算复杂性。这可应用于第一滤波器21以及第二滤波器23。
应当指出,在谐波信号传送路径20中的信号受到延时。结果,谐波信号SHAR比起原始的信号SOR更迟一些才到达组合器30。然而,把原始的信号SOR与延时的谐波信号SHAR组合,已能导致输出信号SOUT比起原始的信号SOR有改进。通过引入延时装置11,可以得到进一步的改进,该延时装置优选地被安排成使得原始的信号SOR在原始的传送路径10上受到的延时基本上等于该信号在谐波信号传送路径20上受到的延时。本领域技术人员将会知道,如何计算或测量想要的延时和如何相应地设置延时装置11。
例1以下是对于具有0-6kHz频率范围(带宽BWOR=6kHz)的频谱的输入信号SOR的情形的例子。这样的频率范围可以对应于以互联网无线信号形式传送的或在MP3播放机中播放的MP3音频的频率范围。然后,第一滤波器21例如可以具有从3到6kHz的通带,以及第二滤波器23例如可以具有从6到12kHz的通带。
例2以下是对于以11.025kHz的采样频率采样的数字信号的情形的例子。这个信号的频谱可以达到约5kHz,即,约为采样频率的一半。这样的频率范围可以对应于以互联网无线信号形式传递的或在MP3播放机中播放的MP3音频的频率范围。通过本发明,有可能生成具有更高的频率上限的频谱的数字信号。然而,正如熟知的,采样频率应当至少是频谱的频率上限的两倍。所以,在进入到分支10和20之前,原始的信号SOR首先被上采样,然后被低通滤波器滤波,以去除混淆的分量,如果打算生成具有约11kHz的更高的频率上限的频谱的信号,则上采样应当至少涉及到倍数2。通过按倍数2的上采样,信号的新版本以22.05kHz的采样频率采样,仍旧具有高达5kHz的频谱。
在如上所述的信号处理系统1中处理后,输出信号SOUT将具有22.05kHz的采样频率,以及可具有高达11kHz的频谱。
在以上说明中,对于希望展宽信号的频谱的情形解释了本发明。然而,本发明也可应用来在不必展宽频谱的情形下改进频谱的内容,正如现在参照图1和图3A-3E说明的。这种情形的例子在例3中描述。
图3A显示原始的信号SOR的频谱,该频谱总的用参考数字60表示。频谱60具有较低频率的部分61和较高频率的部分62,分别具有带宽BW61和BW62。在较低频率的部分61和较高频率的部分62之间的过渡点被表示为66。在所显示的例子中,频谱部分61和62是相邻的,以及是相对于全频谱60为互补的。而且,在所显示的例子中,较低频率部分61的带宽BW61大于较高频率部分62的带宽BW62。
假设不满意由图3A上的起伏的和倾斜的顶线表示的较高频谱部分62的内容。改进较高频谱部分62的熟知的方法涉及较高频谱部分62内的信号分量的线性放大。然而,这个技术的缺点在于,较高频谱部分62内的噪声分量也被放大。按照本发明,通过对于较低频谱部分61执行本发明的处理步骤,较高频谱部分62的内容可被增强而不放大这样的噪声分量。应当指出,较低频谱部分61通常比起较高频谱部分62来说包含较少的噪声;所以,与较高频谱部分62的均衡相比较,按照本发明改进的频谱通常包含较少的噪声。
因此,第一滤波器21被设计成通过较低频谱部分61的上部频率部分63,如图3B所示。较低频谱部分61的所述上部频率部分63优选地相应于低于过渡点66的最高的八度音。非线性装置22产生包含较高频谱部分62的频谱64的信号,如图3C所示,以及第二滤波器23被设计成只通过在频谱64的该频谱部分65中的频率,该频谱部分65相应于较高频谱部分62,如图3D所示。替换地,第二滤波器23可被设计成只通过在频谱64的该频谱部分65中的频率,该频谱部分65相应于高于过渡点66的第一个八度音。
当非线性装置22的信号在适当的放大/衰减后与原始的信号SOR相组合时,最终得到的输出信号仍旧具有相应于原始的信号SOR的原始频谱的频谱,但较高频谱部分62的内容被增强,正如图3E的直线所显示的。
例3
在CD音频的情形下,数字信号具有0-22.05kHz的频谱。假设希望增强在11-22kHz的范围内的频谱。这例如可以通过把第一滤波器21设计为5.5-11kHz范围的带通滤波器和通过把第二滤波器23设计为11-22kHz范围的带通滤波器而达到。
应当指出,在这种情形下,虽然涉及数字信号,但不需要上采样。
图4A示意地显示按照本发明的设备101的实施例。设备101包含如上所述的信号处理设备1。
图上显示信号源102,它可以是RF天线、SACD、DVD、CD、具有例如MP3文件的CD-ROM、盒式磁带、乙烯树脂唱片、或被配备来用于把信息从一个信息载体变换到光信号或电信号的装置。然而,这个清单不是限制性的,正如本领域技术人员清楚的。图上也显示输出装置,它可以是CD刻盘器、电信号、或RF信号。然而,这个清单也不是限制性的,正如本领域技术人员清楚的。
图4B示意地显示按照本发明的信息载体110的实施例。信息载体110载送可以由处理器(未示出)读出和执行的指令,这些指令使得所述处理器能够执行如上所述的本发明的信号处理方法。
在所显示的实施例中,信息载体110是软盘。然而,信息载体可以具有不同的类型;例如,信息载体110可以被实施为CD-ROM、快闪卡、或被耦合到WAN(诸如互联网)的大容量贮存装置。另外类型的信息载体也是可能的,诸如本领域技术人员清楚的,以及属于本发明的范围。
因此,本发明通过增强和/或扩展信号频谱的较高频部分,成功地改进音频信号的感觉。本发明适合于以下所有类型的情形的应用其中信号频谱是带宽受限制的;和/或例如由于传送路径或记录媒体的故意的和/或自然的限制,因而信号频谱具有不满意的内容的场合。其中可应用本发明的具体的例子是互联网无线电装置;MP3压缩的音乐;会讲话的书;固定的网络电话;移动电话;通常的声音重现设备(电视机、收音机、磁带、CD等等)。
本领域技术人员将会看到,本发明并不限于以上讨论的例子,而是有可能在附属权利要求规定的本发明的范围内作出替换、修改、修正、和变化。
例如,本发明是对于一个信号描述的。在多信道信号(诸如立体声)的情形下,对于每个信道的、如上所述的处理是与其他信道无关地执行的。
而且,本发明不限于所提到的滤波器特性;其他设定也是可能的。例如,第二滤波器23可以具有比起所描述的更宽的带宽BW3。
而且,应当指出,本发明的系统的部件可以按照所希望的那样,以模拟部件或以数字部件实施。这些部件可以是单独的部件,或可以被集成在一个部件中。另外,本发明可以用软件形式实施为功能模块。
权利要求
1.一种用于处理声音信号(SOR)的方法,其中根据原始的信号(SOR)的至少一部分(51;63)生成谐波信号(52;64),以及其中所述谐波信号的至少一部分(53;65)与原始的信号(SOR)相组合。
2.按照权利要求1的方法,其中所述谐波信号的所述部分(53;65)与所述原始的信号(SOR)进行相加。
3.按照权利要求1或2的方法,其中所述谐波信号的所述部分(53;65)在与所述原始的信号(SOR)相组合之前被衰减或放大。
4.按照前述权利要求的任一项的方法,其中原始的信号(SOR)在与所述谐波信号的所述部分(53;65)相组合之前被延时。
5.按照前述权利要求的任一项的方法,其中原始的信号(SOR)的所述部分(51;63)相应于一个八度音的频率范围。
6.按照权利要求5的方法,原始的信号(SOR)的频谱具有频率上限,其中原始的信号(SOR)的所述部分(51)相应于低于所述频率上限的最高的八度音。
7.按照权利要求5的方法,原始的信号(SOR)的频谱(60)具有较低的频谱部分(61)和相邻的较高的频谱部分(62),其中原始的信号(SOR)的所述部分(63)相应于在所述较低的频谱部分(61)内的最高的八度音。
8.按照前述权利要求的任一项的方法,原始的信号(SOR)的频谱具有频率上限,其中所述谐波信号的所述部分(53)在它的频率上限处与所述原始的信号(SOR)的频谱相邻。
9.按照前述权利要求的任一项的方法,其中所述谐波信号的所述部分(53;65)相应于一个八度音的频率范围。
10.按照权利要求9的方法,原始的信号(SOR)的频谱具有频率上限,其中所述谐波信号的所述部分(53)相应于高于所述频率上限的第一个八度音。
11.按照权利要求9的方法,原始的信号(SOR)的频谱(60)具有较低的频谱部分(61)和相邻的较高的频谱部分(62),其中所述谐波信号的所述部分(65)相应于高于所述较低的频谱部分(61)的第一个八度音。
12.按照前述权利要求的任一项的方法,其中所述谐波信号由非线性装置生成。
13.按照权利要求12的方法,其中所述谐波信号由半波整流器或全波整流器;或半波积分器或全波积分器;或削波器;或限幅器生成;其中半波整流器或全波整流器是最优选采用的。
14.一种信号处理系统(1),包括用于接收原始的声音信号(SOR)的输入端(2),和用于提供输出信号(SOUT)的输出端(3);组合器(30),具有被耦合到系统(1)的输出端(3)的输出端;在所述输入端(2)与所述组合器(30)的第一输入端之间的第一信号传送路径(10),用于传送原始的信号(SOR);在所述输入端(2)与所述组合器(30)的第二输入端之间的第二信号传送路径(20);其中第二信号传送路径(20)包括被安排来根据原始的声音信号(SOR)生成谐波信号(S2)的处理装置(22)。
15.按照权利要求14的信号处理系统,其中组合器(30)包括相加器。
16.按照权利要求14或15的信号处理系统,其中所述第一信号传送路径(10)包括延时装置(11)。
17.按照权利要求16的信号处理系统,其中第一信号传送路径(10)中的延时基本上与第二信号传送路径(20)中的延时相一致。
18.按照权利要求14-17的任一项的信号处理系统,还包括在处理装置(22)与组合器(30)之间的信号路径中的衰减器或放大器(24)。
19.按照权利要求14-18的任一项的信号处理系统,还包括在输入端(2)与处理装置(22)之间在第二信号传送路径(20)中的第一滤波器(21)。
20.按照权利要求19的信号处理系统,其中第一滤波器(21)被安排来输出具有原始的信号(SOR)的频谱(50;60)的一部分的频谱(51;63)的信号(S1)。
21.按照权利要求20的信号处理系统,其中第一滤波器(21)的输出信号(S1)的频谱(51;63)具有低于第一预定的参考频率(59;66)的约1个八度音的带宽(BW1)。
22.按照权利要求14-21的任一项的信号处理系统,还包括在处理装置(22)与组合器(30)之间的第二信号传送路径(20)中的第二滤波器(23)。
23.按照权利要求22的信号处理系统,其中第二滤波器(23)被安排来输出具有处理装置(22)的输出信号(S2)的频谱(52;64)的一部分的频谱(53;65)的信号(S3)。
24.按照权利要求23的信号处理系统,其中第二滤波器(23)的输出信号(S3)的频谱(53;65)具有高于第二预定的参考频率(59;66)的约1个八度音的带宽(BW3)。
25.按照权利要求21和24的信号处理系统,其中所述第二预定的参考频率(59;66)基本上与所述第一预定的参考频率(59;66)一致。
26.按照权利要求14-25的任一项的信号处理系统,其中非线性处理装置(22)用全波整流器或半波整流器来实施。
27.按照权利要求14-26的任一项的信号处理系统,还包括用于上采样输入信号(SOR)的装置,以及还包括用于滤波上采样的输入信号(SOR)的低通滤波器装置。
28.按照权利要求14-27的任一项的信号处理系统,被实施为适当地编程的处理器。
29.一种信息载体(110),用来载送可被处理器读出和执行的指令,该指令使得所述处理器能够执行按照权利要求1-13的任一项的方法。
全文摘要
声音信号在两个支路(10、20)中被处理。在第一支路(10)中,保持原始的信号(SOR)。在第二支路(20)中,至少原始的信号的一部分(BW1;63)被馈送到非线性装置(22)。这个部分(BW1)优选地相应于原始的信号的最高的八度音。非线性装置(22)产生相对于在它的输入端处接收的频率分量的谐波频率(SHAR)。这个最后得到的谐波信号(S2;BW2;64)的至少一部分(BW3;65)任选地在衰减或放大后,与来自第一支路(10)可能被延时装置(11)延时的原始的信号(SOR)相组合。这个组合可以是简单的相加。最终得到的信号(S2;BW2;64)的所述部分(BW3;65)相应于原始的频谱的较高的频率部分(BW62),或是在它的频率上限处与原始的频谱(BWOR)相邻。
文档编号G10L21/02GK1550002SQ02816958
公开日2004年11月24日 申请日期2002年7月15日 优先权日2001年8月31日
发明者R·M·阿尔特斯, R M 阿尔特斯, E·拉尔森 申请人:皇家飞利浦电子股份有限公司