区分信号信息内容和控制信号处理功能的音频系统和方法

文档序号:7851421阅读:196来源:国知局
专利名称:区分信号信息内容和控制信号处理功能的音频系统和方法
技术领域
本发明主要地涉及音频系统并且更具体地涉及一种使用自适应智能区分乐器生成的音频信号的动态内容并且控制与音频信号关联的信号处理功能的音频系统和方法。
背景技术
音频音响系统常用来放大信号并且再现可听声音。声音生成源(诸如乐器、麦克风、多媒体播放器、或者其他电子设备)生成电音频信号。向音频放大器路由音频信号,该音频放大器控制量值并且对音频信号执行其他信号处理。音频放大器可以执行滤波、调制、失真增强或者减少、声音效果和其他信号处理功能以增强音频信号的音质和频率性质。向扬声器发送放大的音频信号以将电信号转换成可听声音并且用信号处理功能引入的增强来再现声音生成源。
乐器在社会中为许多人提供娱乐、社交互动、自我表达以及生计的商业和来源中一直颇为流行。弦乐器由于它们的活跃可弹奏性、音调性质和便携性而尤为流行。弦乐器弹奏起来可供享受并且又有挑战性、具有绝妙的声音质量并且易于从一个位置搬移动到另
一位置。在一个例子中,声音生成源可以是作为公知乐器的电吉他或者电低音吉他。吉他具有连接到音频放大器的音频输出。音频放大器的输出连接到扬声器以生成可听音乐声音。在一些情况下,音频放大器和扬声器为分离单元。在其他系统中,单元集成到一个便携机箱(chassis)中。电吉他通常需要音频放大器来运转。其他吉他使用放大器增强声音。吉他音频放大器提供诸如放大、滤波、音调均衡和声音效果的特征。用户调整音频放大器的前面板上的旋钮以转动选择所需音量、声学特性和声音效果。然而如果并非所有则为多数音频放大器在每个可以提供的特征上有限。高端放大器以高质量声音再现和多种信号处理选项的方式提供更多特征,但是其一般昂贵并且难以运送。扬声器一般是与高端机构(gear)中的放大器分离的单元。低端放大器可以更让人负担得起并且便携,但是具有有限的声音增强特征。存在很少的用于低到中端消费者市场的放大器,这些放大器提供完全特征、易于运送和低成本。在音频再现中,普遍根据音乐和弹奏风格来使用多种信号处理技术以实现更佳的声音质量、可弹奏性并且否则增强艺术家的创造性以及收听者对作品的享受和欣赏。例如吉他弹奏者将音频放大器设置和声音效果的大量选择用于不同音乐风格。低音乐器弹奏者使用不同的压缩器和均衡设置以增强声音质量。歌手根据歌曲的歌词和旋律使用不同回响和均衡设置。音乐制作人使用后处理效果以增强作品。对于家庭和汽车音响系统,用户可以选择不同的回响和均衡预设以优化古典或者摇滚音乐的再现。通常用前面板开关和控制旋钮控制音频放大器和其他信号处理设备(例如专用放大器、踏板或者声音架(sound rack))。为了适应针对不同音乐风格的处理要求,用户收听并且通过设置开关位置并且转动控制旋钮来手动选择所需功能(诸如放大、滤波、音调均衡和声音效果)。当改变弹奏风格或者转变成另一旋律时,用户必须暂时中止弹奏以对音频放大器或者其他信号处理设备进行调整。在一些数字或者模拟乐器中,用户可以配置并且保存优选设置作为预设,并且以后手动选择用于乐器的保存设置或者工厂预设。在专业应用中,技术人员可以在艺术家演奏时对音频放大器或者其他信号处理设备进行调整,但是在艺术家与技术人员之间的同步通常欠理想。在艺术家对琴弦或者声乐内容改变起奏或开始新作品时,技术人员必须预期艺术家动作并且相应对音频放大器进行手动调整。在如果并非所有则为多数情况下,很少按照音乐声音、至少未在逐个音符的基础上优化音频放大器。

发明内容
存在对实时动态地控制音频放大器或者其他信号处理设备的需要。因而在一个实施例中,本发明是一种包括信号处理器的音频系统,该信号处理器被耦合用于接收音频信号。音频信号的动态内容控制信号处理器的操作。 在另一实施例中,本发明是一种控制音频系统的方法,该方法包括以下步骤提供信号处理器,该信号处理器适于用于接收音频信号;并且使用音频信号的动态内容来控制信号处理器的操作。在另一实施例中,本发明是一种包括信号处理器的音频系统,该信号处理器被耦合用于接收音频信号。时域处理器接收音频信号并且生成音频信号的时域参数。频域处理器接收音频信号并且生成音频信号的频域参数。签名数据库包括多个签名记录,每个签名记录具有时域参数和频域参数以及控制参数。识别检测器匹配音频信号的时域参数和频域参数与签名数据库的签名记录。匹配签名记录的控制参数控制信号处理器的操作。在另一实施例中,本发明是一种控制音频系统的方法,该方法包括以下步骤提供信号处理器,该信号处理器适于用于接收音频信号,生成音频信号的时域参数,生成音频信号的频域参数,提供包括多个签名记录的签名数据库,每个签名记录具有时域参数和频域参数以及控制参数,匹配音频信号的时域参数和频域参数与签名数据库的签名记录,并且基于匹配签名记录的控制参数控制信号处理器的操作。


图I图示了音频声源生成音频信号并且通过信号处理设备向扬声器路由音频信号;
图2图示了连接到音频音响系统的吉他;
图3图不了具有如控制面板的首频系统外壳的正视 图4图示了音频系统的前控制面板的进一步细节;
图5图不了分离外壳中的音频放大器和扬声器;
图6图示了具有自适应智能控制的音频放大器的框 图7a-7b图示了音频信号的波形绘 图8图示了频域和时域分析块的框 图9a-9b图示了采样的音频信号的时序帧;
图10图示了时域分析块的框图;图11图示了频带中的时域能级隔离块的框 图12图示了时域音符(note)检测器块的框 图13图示了时域起奏(attack)检测器的框 图14图示了时域起奏检测器的另一实施例;
图15图示了频域分析块的框 图16图示了频域音符检测器块的框 图17图示了频率仓中的能级隔离的框 图18图示了频域起奏检测器的框图;
图19图示了频域起奏检测器的另一实施例;
图20图示了具有参数值、加权值和控制参数的音符签名数据库;
图21图示了与音符签名数据库的计算机接口 ;
图22图示了用于运行时矩阵和音符签名数据块的识别检测器;
图23图示了具有用分离的信号处理设备、音频放大器和扬声器实施的自适应智能控制的一个实施例;
图24图示了实施为计算机的信号处理设备;
图25图示了计算机内的信号处理功能的框 图26图示了实施为踏板的信号处理设备;
图27图示了实施为信号处理架的信号处理设备;
图28图示了向音频放大器和扬声器路由的声乐声源;
图29图示了具有在逐帧基础上的自适应智能控制的音频放大器的框 图30图示了在逐帧基础上的频域和时域分析块的框 图31a-31b图示了采样的音频信号的时序帧;
图32图示了时域分析块的框 图33图示了频带中的时域能级隔离块的框 图34图示了频域分析块的框 图35图示了具有参数值、加权值和控制参数的帧签名数据库;
图36图示了与帧签名数据库的计算机接口 ;并且 图37图示了用于运行时矩阵和帧签名数据库的识别检测器。
具体实施例方式参照附图在下文描述中在一个或者多个实施例中描述本发明,在这些附图中,同样标号代表相同或者相似兀素。尽管在用于实现本发明的目的的最佳模式方面描述本发明,但是本领域技术人员将理解它旨在于覆盖如可以在如所附权利要求书限定的本发明的精神和范围内包括的替代、修改和等同物及其由下文公开和附图支持的它们的等同物。参照图1,音频音响系统10包括音频声源12,该音频声源12生成代表声音内容的电信号。音频声源12可以是乐器、音频麦克风、多媒体播放器或者能够生成代表声音内容的电信号的其他设备。仅举几例,乐器可以是电吉他、低音吉他、小提琴、号、铜管、鼓、管乐器、弦乐器、钢琴、电子键盘和打击乐器。通过音频线缆14向信号处理设备16路由来自音频声源12的电信号用于信号调节和功率放大。信号处理设备16可以是音频放大器、计算机、踏板、信号处理架或者能够对音频信号执行信号处理功能的其他设备。信号处理功能可以包括放大、滤波、均衡、声音效果和用户限定的模块,这些模块调整功率电平并且增强音频信号的信号性质。通过音频线缆17向扬声器18路由信号调节的音频信号以用信号处理设备16向音频信号中引入的增强来再现音频声源12的声音内容。图2示出了作为音频声源12的乐器(在这一情况下为电吉他20)。一个或者多个拾取器22安装于电吉他20的琴弦24之下并且将琴弦移动或者振动转换成代表来自振动琴弦的既定声音的电信号。通过音频线缆26向音频系统32的前控制面板30上的音频输入插孔路由来自吉他20的电信号用于信号处理和功率放大。音频系统32包括共同位于外壳34内的音频放大器和扬声器。音频放大器提供的信号调节可以包括放大、滤波、均衡、声音效果、用户限定的模块和其他信号处理功能,这些功能调整功率电平并且增强音频信号的信号性质。向音频系统32内的扬声器路由信号调节的音频信号。功率放大增加或者减少音频信号的功率电平和信号强度以驱动扬声器并且用音频放大器向音频信号中引入的增强来再现电吉他20的振动琴弦24既定的声音内容。前控制面板30包括用于允许用户监视并且手动控制音频系统32的各种设置的显示器和控制旋钮。
图3示出了音频系统32的正视图。作为初始观察,音频系统32的外型规格和占用面积(footprint)被设计用于便携使用并且可易于运送。音频系统32测量约13英寸高、15英寸宽和7英寸深,并且重量约16磅。提供携带柄或者带40以支持运送特征的便携性和易用性。音频系统32具有由扬声器区域44之上的铝折叠机箱、木柜、黑乙烯树脂盖、前控制面板和布格限定的外壳42。前控制面板30具有用于音频输入、头戴式受话器、控制按钮和旋钮、液晶显示器(IXD)以及乐器数字接口(MIDI)输入/输出(I/O)插孔的连接。在图4中不出了首频系统32的如控制面板30的进一步细节。首频系统32的外部特征包括用于从吉他20或者其他乐器接收音频线缆26的音频输入插孔50、用于连接到外部头戴式受话器的头戴式受话器插孔52、可编程控制面板54、控制旋钮56和MIDI I/O插孔58。除了可编程控制面板54之外还提供用于用户频繁访问的音频控制功能的控制旋钮56。在一个实施例中,控制旋钮56提供用户对音量和音调的控制。附加控制旋钮56可以控制频率响应、均衡和其他声音控制功能。可编程控制面板54包括IXD 60、功能模式按钮62、选择按钮64和调整旋钮或者数据轮66。功能模式按钮62和选择按钮64是用于软触摸和长寿命的弹性计量橡胶垫。替代地,按钮可以是具有触感反馈微电子开关的硬塑料。音频系统32完全可编程、由菜单驱动并且使用软件配置并且控制声音再现特征。功能模式按钮62、选择按钮64和数据轮66的组合提供用于用户接口的对不同操作模式的控制、对用于选择和编辑功能的菜单的访问以及音频系统32的配置。音频系统32的可编程控制面板54也可以包括LED作为用于同步/轻拍、拍子、保存、记录和电源功能的指示器。 一般而言,可编程控制面板54是用于音频系统32内的电功能的完全可编程、菜单驱动配置和控制的用户接口。LCD 60随着用户选择改变以提供很多不同配置以及操作菜单和选项。操作模式可以包括启动和自测试、播放、编辑、实用工具、保存和调谐器。在一个操作模式中,LCD 60示出音频系统32的播放模式。在另一操作模式中,LCD 60显示进行中的MIDI数据传送。在另一操作模式中,IXD 60显示默认设置和预设。在又一操作模式中,IXD 60显示调谐计。
参照图5,也可以用包含于第一外壳70内的音频放大器和容置于第二分离外壳72内的扬声器实施音频系统。在这一,清况下,来自吉他20的音频线缆26路由到音频输入插孔74,该插孔74连接到外壳70内的音频放大器用于功率放大和信号处理。在外壳70的前控制面板78上的控制旋钮76允许用户监视并且手动控制音频放大器的各种设置。外壳70由音频线缆80电连接到外壳72以向扬声器82路由放大和调节的音频信号。在音频再现中普遍根据音频源的内容(例如演奏或者弹奏风格)来使用多种信号处理技术以实现更佳声音质量、可弹奏性并且否则增强艺术家的创造性以及收听者对作品的享受和欣赏。例如吉他弹奏者使用不同压缩器和均衡设置以增强声音质量。歌手根据歌曲的歌词和旋律使用不同回响和均衡设置。音乐制作人使用后处理效果以增强作品。对于家庭和汽车音响系统,用户可以选择不同回响和均衡预设以优化古典或者摇滚音乐的再现。图6是根据音频系统配置而包含于音频系统32内或者音频放大器外壳70内的音频放大器90的框图。音频放大器90通过音频线缆26从吉他20接收音频信号。音频放大器90对音频信号执行放大和其他信号处理功能(诸如均衡、滤波、声音效果和用户限定的 模块)以调整功率电平并且否则增强信号性质以求收听体验。为了根据音频源的动态内容适应信号处理要求,音频放大器90运用动态自适应智能特征(该特征涉及到在逐帧基础上对音频信号的频域分析和时域分析)并且自动和自适应地控制音频放大器内的信号处理功能的操作和设置以实现最优声音再现。每个帧包含音频信号的预定数量的采样(例如每帧32-1024个采样)。在逐帧基础上检测并且分析音频信号的每个传入帧以确定它的时域和频域内容以及特性。比较音频信号的传入帧与建立或者学习的音符签名的数据库以确定传入帧与音符签名的数据库的最佳匹配或者最接近相关。来自数据库的音符签名包含用于配置音频放大器90的信号处理部件的控制参数。最佳匹配音符签名实时控制音频放大器90以对信号处理功能连续并且自动进行调整以求最优声音再现。例如基于音符签名,可以针对音频信号的该特定帧自动增加或者减少音频信号的放大。可以针对弹奏的音符自动加入或者去除预设和声音效果。依次的下一帧可以与相同音符关联,该音符与数据库中的相同音符签名匹配,或者依次的下一帧可以与不同音符关联,该音符与数据库中的不同对应音符签名匹配。音频信号的每个帧被识别并且与音符签名匹配,该帧签名又控制音频放大器90内的信号处理功能的操作用于最优声音再现。根据与音频信号的每个个别传入帧对应的最佳匹配音符签名调整音频放大器90的信号处理功能以增强它的再现。音频放大器90的自适应智能特征可以学习音频信号的每个音符的属性并且基于用户反馈进行调整。例如,如果用户需要更多或者更少放大或者均衡或者插入用于给定音符的特定声音效果,则音频放大器向信号处理功能的控制参数中构建那些用户偏好以实现最优声音再现。具有相关控制参数的音符签名数据库对信号处理功能进行实时调整。用户可以限定向音频放大器90的数据库中集成的音频模块、效果和设置。利用自适应智能,音频放大器90可以基于当前音符签名来检测并且向音频信号自动应用音调模块和设置。音频放大器90可以按照需要在相似匹配音符签名之间插值以选择用于即时信号处理功能的最佳选择。继续图6,音频放大器90具有用于音频信号的信号处理路径,该路径包括前滤波器块92、前效果块94、非线性效果块96、用户限定的模块98、后效果块100、后滤波器块102和功率放大块104。前滤波块92和后滤波块102提供各种滤波功能(诸如音频信号的低通滤波和带通滤波)。前滤波和后滤波可以包括在各种频率范围上的音调均衡功能,这些功能用于提升或者衰减具体频率的电平而不影响邻近频率(诸如低音频率调整和高音(treble)频率调整)。例如音调均衡可以运用倾斜均衡(shelving equalization)用于提升或者衰减在目标频率或者基频以上或者以下的所有频率、铃形均衡用于提升或者衰减在目标频率或者基频周围的窄范围频率、图形均衡或者参数均衡。前效果块94和后效果块100向音频信号中引入声音效果(诸如回响、延迟、合唱、睡(wah)、自动音量、移相器、哼声取消器、噪声门、颤音、音高移位、颤声和动态压缩)。非线性效果块96向音频信号中引入非线性效果(诸如m建模、失真、过载(overdrive)、模糊和调制)。用户限定的模块块98允许用户限定定制的信号处理功能(诸如添加伴奏乐器、声乐和合成器选项)。功率放大块104提供音频信号的功率放大或者衰减。向音频系统32中的扬声器或者外壳72中的扬声器82路由后信号处理音频信号。
用图4中的前控制面板30或者图5中的前控制面板78可选择并且可控制音频放大器90内的前滤波器块92、前效果块94、非线性效果块96、用户限定的模块98、后效果块100、后滤波器块102和功率放大块104。通过转动前控制面板78上的旋钮76或者使用可编程控制面板54的IXD 60、功能模式按钮62、选择按钮64和调整旋钮或者数据轮66,用户可以直接控制音频放大器90内的信号处理功能的操作。音频信号可以源于多种音频源(诸如乐器或者声乐)。乐器可以是电吉他、低音吉他、小提琴、号、铜管、鼓、管乐器、钢琴、电子键盘或者打击乐器或者能够生成代表声音内容的电信号的其他乐器。音频信号可以源于男性或者女性操纵的音频麦克风,该男性或者女性具有包括女高音、女中高音、女低音、男高音、男中音和男低音的音域。在本讨论中,乐器为吉他20 (更具体为电子低音吉他)。当用音乐家的手指或者吉他拨子来激发低音吉他20的琴弦24时,琴弦开始由拾取器22检测的强振动或者振荡。琴弦振动随时间衰减并且返回到静止状态,这假设在振动终止之前未再次激发琴弦。琴弦24的初始激发称为起奏阶段。起奏阶段跟随有维系阶段(sustain phase),在该维系阶段期间琴弦振动保持相对强。衰退阶段在琴弦振动衰减时跟随维系阶段并且在琴弦返回到静止状态时最终跟随释放阶段。拾取器22将在起奏阶段、维系阶段、衰退阶段和释放阶段期间的琴弦振荡转换成电信号(即模拟音频信号),该信号在基频和基频的谐波具有初始并且然后衰退的幅度。图7a-7b图示了音频信号在时域中与琴弦24在各种弹奏模式中的起奏阶段和维系阶段并且根据该图而与衰退阶段和释放阶段对应的幅度响应。在图7b中,下一起奏阶段在完成先前衰退阶段或者甚至开始释放阶段之前开始。艺术家可以在弹奏低音吉他50时使用多种弹奏风格。例如艺术家可以将他的或者她的手放置于琴颈拾取器(neck pickup)或者琴桥拾取器(bridge pickup)附近并且用手指拨弄激发琴弦24 (称为“指弹奏(fingering)风格”(用于现代流行、节奏和蓝调以及前卫风格))。艺术家可以用手指或者手掌拍击琴弦24 (称为“拍击风格”(用于现代爵士、乡土爵士、节奏和蓝调以及摇滚风格))。艺术家可以用拇指激发琴弦24 (称为“拇指风格”(用于摩城节奏和蓝调))。艺术家可以用双手(每只手拨动(fret)音符)轻拍琴弦24 (称为“轻拍风格”(用于前卫和现代爵士风格))。在其他弹奏风格中,已知艺术家使用指弹奏附件(诸如拨子或者签子)。在每种情况下,琴弦24以特定幅度和频率振动并且根据诸如图7a和7b中所示琴弦振动阶段生成唯一音频信号。图6进一步图示了音频放大器90的动态自适应智能控制。音频放大器90的自适应智能特征的主要目的是在逐帧基础上检测并且隔离音频信号的频域特性和时域特性并且使用该信息控制放大器的信号处理功能的操作。向频域和时域分析块110路由来自音频线缆26的音频信号。向音符签名块112路由块110的输出,并且向自适应智能控制块114路由块112的输出。依次讨论块110、112和114的功能。图8图示了频域和时域分析块110的进一步细节,该块包括采样音频块116、频域分析块120和时域分析块122。向采样音频块116呈现模拟 音频信号。采样音频块116使用模数(A/D)转换器对模拟音频信号采样(例如每秒30至1024个采样)。将采样的音频信号118组织成一系列时间渐进帧(帧I至帧n),每个帧包含音频信号的预定数量的采样。图9a不出了巾贞I (该巾贞包含音频信号118在时间序列中的64个米样)、巾贞2 (该巾贞包含音频信号118在时间序列中的接下来64个采样)、帧3 (该帧包含音频信号118在时间序列中的接下来64个采样)并且以此类推至帧η (该帧包含音频信号118在时间序列中的64个采样)。图9b示出了在如图15中所描述的时域到频域转换中使用的帧l-η的重叠窗119。向频域分析块120和时域分析块122路由采样的音频信号118的帧1-n。图10图示了时域分析块122的进一步细节,该时域分析块122包括能级隔离块124,该能级隔离块124将采样的音频信号118的每个帧的能级隔离为多个频带。在图11中,能级隔离块124处理滤波器频带130a-130c内的在时间序列中的采样的音频信号118的每个帧以分离并且隔离音频信号的具体频率。滤波器频带130a-130c可以隔离音频范围ΙΟΟ-ΙΟΟΟΗζ中的具体频带。在一个实施例中,滤波器频带130a是具有以IOOHz为中心的通带的带通滤波器,滤波器频带130b是具有以500Hz为中心的通带的带通滤波器,并且滤波器频带130c是具有以1000Hz为中心的通带的带通滤波器。滤波器频带130a的输出包含以IOOHz为中心的采样的音频信号118的能级。滤波器频带130b的输出包含以500Hz为中心的采样的音频信号118的能级。滤波器频带130c的输出包含以1000Hz为中心的采样的音频信号118的能级。其他滤波器频带的输出中的每个包含用于具体频带的采样的音频信号118的能级。峰检测器132a监视并且存储以IOOHz为中心的采样的音频信号118的峰能级。峰检测器132b监视并且存储以500Hz为中心的采样的音频信号118的峰能级。峰检测器132c监视并且存储以1000Hz为中心的采样的音频信号118的峰能级。平滑滤波器134a去除寄生分量并且否则稳定以IOOHz为中心的采样的音频信号118的峰能级。平滑滤波器134b去除寄生分量并且否则稳定以500Hz为中心的采样的音频信号118的峰能级。平滑滤波器134c去除峰能级的寄生分量并且否则稳定以1000Hz为中心的采样的音频信号118。平滑滤波器134a-134c的输出是在采样的音频信号118的每个帧η中用于每个频带Ι-m的能级函数E (m, η)。图8的时域分析块122如图10中所示也包括音符检测器块125。块125检测每个音符的开始并且提供将采样的音频信号组织成离散段,每个段以音符的开始为开始(包括采样的音频信号的多个帧)并且以下一音符的开始为结束。在本实施例中,采样的音频信号的每个离散段对应于音乐的单个音符。音符检测器块125关联琴弦24的起奏阶段为音符的开始。也就是说,吉他20上的振动琴弦24的起奏阶段与具体音符的检测重合。对于其他乐器,音符检测与艺术家的不同身体动作(例如按压钢琴或者电子键盘的键、激发竖琴的琴弦、在按压号上的一个或者多个键之时向号中吐入空气或者用鼓槌打击鼓面)关联。在每种情况下,音符检测器块125监视采样的音频信号118的时域动态内容并且标识音符的开始。图12示出了包括起奏检测器136的音符检测器块125的进一步细节。一旦为采样的音频信号118的每个频带Ι-m确定能级函数E(m, η), —个巾贞n_l的能级l_m如图13中所示存储于起奏检测器136的块138中。如滤波器频带130a-130c、峰检测器132a_132c和平滑滤波器134a-134c确定的用于采样的音频信号118的下一帧η的频带l_m的能级存储于起奏检测器136的块140中。差值块142确定当前帧η和先前帧n_l的对应频带的能级之间的差。例如从用于帧η的频带I的能级减去用于帧η-l的频带I的能级。从用于帧η的频带2的能级减去用于巾贞η-l的频带2的能级。从用于巾贞η的频带m的能级减去用于中贞η-l的频带m的能级。用于巾贞η和巾贞η_1的每个频带l_m的能级之差在求和器144中求和。求和器144累积巾贞η和巾贞η_1的每个频带l_m的能级E(m, η)之差。音符的开始 将出现于用于采样的音频信号118的跨全部受监视频带Ι-m的能级E(m,n)之差的合计超过预定阈值时。比较器146比较求和器144的输出与阈值148。如果求和器144的输出大于阈值148,则用于采样的音频信号118的在整个频率频谱上的能极E (m,η)之差的累积超过阈值148并且在即时帧η中检测到音符的开始。如果求和器144的输出小于阈值148,则未检测到音符的开始。在每个帧结束时,起奏检测器136将标识即时帧是否包含音符的开始或者即时帧是否不含音符的开始。例如基于采样的音频信号118在频带Ι-m的整个频谱上的能级E (m, η)之差的和超过阈值148,起奏检测器136可以将图9a的帧I标识为包含音符的开始,而图9a的帧2和帧3没有音符的开始。图7a图示了音符在帧I中的点150的开始(基于采样的音频信号在频带Ι-m内的能级E(m,η))并且音符在帧2或者帧3中未开始。图7a具有音符在点152的另一次开始检测。图7b示出了音符在点154、156和158的开始检测。图14图示了起奏检测器132在直接用求和器160对能级E (m,η)求和时的另一实施例。求和器160累积帧η在采样的音频信号118的每个频带Ι-m中的能级E (m, η)。音符的开始将出现在用于采样的音频信号118的跨全部受监视频带Ι-m的能级E(m,n)的合计超过预定阈值时。比较器162比较求和器160的输出与阈值164。如果求和器160的输出大于阈值164,则用于采样的音频信号118的在整个频率频谱上的能级E (m,η)的累积超过阈值164并且在即时帧η中检测到音符的开始。如果求和器160的输出小于阈值164,则未检测到音符的开始。在每个帧结束时,起奏检测器136将标识即时帧是否包含音符的开始或者即时帧是否不含音符的开始。例如基于采样的音频信号118在频带Ι-m内的能级E(m,n)的和超过阈值164,起奏检测器136可以将图9a的帧I标识为包含音符的开始,而图9a的帧2和帧3无音符的开始。等式(I)提供音符的开始检测的另一示例。
g m f η = :na:< 0 f f E in, n) / E (n-ll j -1) I:,其中g(m,n)是在m个频带的n个巾贞上的能级的最大值函数E (m, η)是频带m的巾贞η的能级E (m, η-l)是频带m的巾贞n_l的能级。函数g(m, η)具有用于每个频带Ι-m和每个巾贞l-η的值。如果比值E(m,n)/E(m, η-l)(即在巾贞η中的频带m的能级与在巾贞n_l中的频带m的能级之比)小于一,则[E(m, n)/E(m, n_l)]_l为负。在巾贞η中的频带m的能级不大于在巾贞n_l中的频带m的能级。函数g(m,n)为零,其指示未发起起奏阶段并且因此未检测到音符的开始。如果比值E(m, n) /E (m, n_l)(即在巾贞η中的频带m的能级与在巾贞n_l中的频带m的能级之比)大于一(假如值二),则[E(m, n)/E(m, n-l)]-l为正(即值一)。在中贞η中的频带m的能级大于在中贞η-l中的频带m的能级。函数g(m,n)为[E (m, n)/E (m, n_l) ]-I的正值,其指示发起起奏阶段并且因此可能检测到音符的开始。回顾图12,起奏检测器136向静默门166、重复门168和噪声门170路由音符的开始检测。并非音符的每个开始检测都是真实的。静默门166监视采样的音频信号118在音符的开始检测之后的能级E(m,η)。如果采样的音频信号118在音符的开始检测之后的能级E(m,n)由于静默而为低(例如_45dB),则触发音符开始的采样的音频信号118的能级 E(m, η)视为寄生并且被拒绝。例如艺术家可能已经无意地触摸一个或者多个琴弦24而未有意地弹奏音符或者和弦。由于无意接触所致的采样的音频信号118的能级E(m,n)可能已经足以检测音符的开始,但是由于弹奏未继续(即采样的音频信号118在音符的开始检测之后的能级E(m,η)指示静默),所以拒绝开始检测。重复门168监视出现于时间段内的开始检测数量。如果在重复检测时间段(例如50毫秒(ms))内检测到音符的多个开始,则仅记录第一开始检测。也就是说,拒绝在重复检测时间段内在第一开始检测之后检测到的音符的任何后续开始。噪声门170监视采样的音频信号118在音符的开始检测周围的能级E(m,η)。如果采样的音频信号118在音符的开始检测周围的能级E(m,η) 一般在低噪声范围中,例如能级E(m, η)为-90dB,则开始检测被视为可疑并且因为不可靠而被拒绝。图8的时域分析块122如图10中所示也包括音符峰起奏块172。块172使用能级E(m,n)以确定在所有频带Ι-m上的能级的衰退之前在琴弦振动的起奏阶段或者维系阶段期间从音符的开始检测到音符的峰能级的时间(即频带Ι-m的求和)。起奏检测器136确定音符的开始检测。峰能级是能量函数E (m,η)在所有频带Ι-m上的能级的衰退之前在琴弦振动的起奏阶段或者维系阶段期间的最大值。在峰检测器132a-132c中逐帧监视峰能级。峰能级可以出现于与开始检测相同的帧中或者后续帧中。音符峰起奏是用于所有频带1-m的每个帧η的时域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。音符峰释放块176使用能量函数E (m,η)以确定在所有频带l_m上的音符的衰退阶段或者释放阶段期间从音符的开始检测到更低能级的时间(即频带Ι-m的求和)。起奏检测器136确定音符的开始检测。在峰检测器132a-132c中逐帧监视更低能级。在一个实施例中,更低能级在所有频带Ι-m上是相对于峰能级的_3dB。音符峰释放是用于所有频带1-m的每个帧η的时域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。多频带峰起奏块178使用能量函数E (m, η)以确定在针对每个具体频带l_m的能级的衰退之前在琴弦振动的起奏阶段或者维系阶段期间从音符的开始检测到音符的峰能级的时间。起奏检测器136确定音符的开始检测。峰能级是在每个具体频带Ι-m的能级的衰退之前在琴弦振动的起奏阶段或者维系阶段期间的最大值。在峰检测器132a-132c中逐帧监视峰能级。峰能级可以出现于与开始检测相同的帧中或者后续帧中。多频带峰起奏是用于每个频带Ι-m的每个帧η的时域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。多频带峰释放块180使用能量函数E(m,n)以确定在每个具体频带l_m中的音符的衰退阶段或者释放阶段期间从音符的开始检测到更低能级的时间。起奏检测器136确定音符的开始检测。在峰检测器132a-132c中逐帧监视更低能级。在一个实施例中,更低能级在每个频带Ι-m中是相对于峰能级的_3dB。多频带峰释放是用于每个频带Ι-m的每个中贞η的时域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。拍击(slap)检测器182监视频带l_m上的每个巾贞l_n中的能量函数E(m, η)以确定拍击风格事件的出现(即艺术家已经用他的或者她的手指或者手掌拍击琴弦24)。在音符的起奏阶段的帧期间的能级中的尖峰表征拍击事件。例如拍击事件在起奏阶段中引起在下一个帧中的能级之上和上方的6dB能级尖峰。6dB能级尖峰被解释为拍击事件。拍击检测 器是用于所有频带Ι-m的每个帧η的时域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。拍子检测器184监视频带Ι-m上的每个帧l_n中的能量函数E(m,n)以确定在相邻音符的开始检测之间的时间间隔(即每个音符的持续时间)。拍子检测器是用于所有频带Ι-m的每个帧η的时域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。图8中的频域分析块120如图15中所示包括STFT块185。块185使用恒定重叠相加(COLA)短时间傅里叶变换(STFT)或者其他快速傅里叶变换(FFT)来执行采样的音频信号118在逐帧基础上的时域到频域转换。COLA STFT 185如图9b中所示使用重叠分析窗119来执行时域到频域转换。采样窗119在COLA STFT分析中针对附加采样点按照音频信号的预定采样数量(称为跳跃大小)重叠以保证在相继帧中对数据相等地加权。等式(2)提供对采样的音频信号118的时域到频域转换的一般形式。
'.I ""=
I:Ak; = V 吟
"Γ-I 2 其中Xm是在频域中的音频信号
X (η)是第m帧音频输入信号 m是当前帧号 k是频率仓 N是STFT大小。图8的频域分析块120如图15中所示也包括音符检测器块186。一旦采样的音频信号118在频域中,块186就检测每个音符的开始并且提供将采样的音频信号组织成离散段,每个段以音符的开始为开始(包括采样的音频信号的多个帧)并且以下一音符的开始为结束。在本实施例中,采样的音频信号118的每个离散段对应于音乐的单个音符。音符检测器块186关联琴弦24的起奏阶段为音符的开始。也就是说,吉他20上的振动琴弦24的起奏阶段与具体音符的检测重合。对于其他乐器,音符检测与艺术家的不同身体动作(例如按压钢琴或者电子键盘的键、激发竖琴的琴弦、在按压号角上的一个或者多个键之时向号角中吐入空气或者用鼓槌打击鼓面)关联。在每种情况下,音符检测器块186监视采样的音频信号118的频域动态内容并且标识音符的开始。图16示出了频域音符检测器块186的进一步细节,该频域音符检测器块186包括能级隔离块187,该能级隔离块187将采样的音频信号118的每个帧的能级隔离为多个频率仓。在图17中,能级隔离块187处理滤波器频率仓188a-188c内的采样的音频信号118频域的每个帧以分离并且隔离音频信号的具体频率。滤波器频率仓188a-188c可以隔离音频范围ΙΟΟ-ΙΟΟΟΗζ中的具体频带。在一个实施例中,滤波器频率仓188a以IOOHz为中心,滤波器频率仓188b以500Hz为中心,并且滤波器频率仓188c以1000Hz为中心。滤波器频率仓188a的输出包含以IOOHz为中心的采样的音频信号118的能级。滤波器频率仓188b的输出包含以500Hz为中心的采样的音频信号118的能级。滤波器频率仓188c的输出包含以1000Hz为中心的采样的音频信号118的能级。其他滤波器频率仓的输出中的每个包含用于给定具体频带的采样的音频信号118的能级。峰检测器189a监视并且存储以IOOHz为中心的采样的音频信号118的峰能级。峰检测器189b监视并且存储以500Hz为中心的采样的音频信号118的峰能级。峰检测器189c监视并且存储以1000Hz为中心的采样的音 频信号118的峰能级。平滑滤波器190a去除寄生分量并且否则稳定以IOOHz为中心的采样的音频信号118的峰能级。平滑滤波器190b去除寄生分量并且否则稳定以500Hz为中心的采样的音频信号118的峰能级。平滑滤波器190c去除峰能级的寄生分量并且否则稳定以1000Hz为中心的采样的音频信号118。平滑滤波器190a_190c的输出是在采样的音频信号118的每个频率仓Ι-m中的用于每个巾贞η的能级函数E (m, η)。一个帧η-l的能级E (m, η)如图18中所示存储于起奏检测器192的块191中。如滤波器频率仓188a-188c、峰检测器189a_189c和平滑滤波器190a_190c确定的用于采样的音频信号118的下一个帧η的每个频率仓Ι-m的能级存储于起奏检测器192的块193中。差值块194确定当前帧η和先前帧η-l的对应仓的能级之间的差。例如从用于帧η的频率仓I的能级减去用于巾贞η-l的频率仓I的能级。从用于巾贞η的频率仓2的能级减去用于中贞η-l的频率仓2的能级。从用于巾贞η的频率仓m的能级减去用于巾贞n_l的频率仓m的能级。用于巾贞η和巾贞η-l的每个频率仓Ι-m的能极之差在求和器195中求和。求和器195累积帧η和帧η_1的每个频率仓l_m的能级E (m, η)之差。音符的开始将出现于用于采样的音频信号118的跨全部受监视频率仓Ι-m的能级E (m,η)之差的合计超过预定阈值时。比较器196比较求和器195的输出与阈值197。如果求和器195的输出大于阈值197,则用于采样的音频信号118的在整个频率频谱上的能极E (m,η)之差的累积超过阈值197并且在即时帧η中检测到音符的开始。如果求和器195的输出小于阈值197,则未检测到音符的开始。在每个帧结束时,起奏检测器192将标识即时帧是否包含音符的开始或者即时帧是否不含音符的开始。例如,基于采样的音频信号118在频率仓Ι-m的整个频谱上的能级E (m, η)之差的和超过阈值197,起奏检测器192可以将图9a的帧I标识为包含音符的开始,而图9a的子帧2和子帧3无音符的开始。图7a图示了音符在帧I中的点150开始(基于采样的音频信号在频率仓Ι-m内的能级E (m, η))并且音符在帧2或者帧3中未开始。图7a具有音符在点152的另一开始检测。图7b示出了音符在点154、156和158的开始检测。图19图示了起奏检测器192在直接用求和器198对能级E (m,η)求和时的另一实施例。求和器198累积采样的音频信号118的每个帧l-η和每个频率仓l_m的能级E(m,η)。音符的开始将出现在用于采样的音频信号118的跨全部受监视频率仓Ι-m的能级E(m, η)的合计超过预定阈值时。比较器199比较求和器198的输出与阈值200。如果求和器198的输出大于阈值200,则用于采样的音频信号118的在整个频率频谱上的能级E (m,η)的累积超过阈值200并且在即时帧η中检测到音符的开始。如果求和器198的输出小于阈值200,则未检测到音符的开始。在每个帧结束时,起奏检测器192将标识即时帧是否包含音符的开始或者即时帧是否不含音符的开始。例如基于采样的音频信号118在频率仓Ι-m内的能级E (m,η)的和超过阈值200,起奏检测器192可以将图9a的帧I标识为包含音符的开始,而图9a的帧2和帧3无音符的开始。回顾图16,起奏检测器192向静默门201、重复门202和噪声门203路由音符的开始检测。并非音符的每个开始检测都是真实的。静默门201监视采样的音频信号118在音符的开始检测之后的能级E(m,η)。如果采样的音频信号118在音符的开始检测之后的能级E(m,n)由于静默而为低(例如_45dB),则触发音符开始的采样的音频信号118的能级 E(m, η)被视为寄生并且被拒绝。例如艺术家可能已经无意地触摸一个或者多个琴弦24而未有意地弹奏音符或者和弦。由于无意接触所致的采样的音频信号118的能级E(m,n)可能已经足以检测音符的开始,但是由于弹奏未继续(即采样的音频信号118在音符的开始检测之后的能级E(m,η)指示静默),所以拒绝开始检测。等式(I)提供音符的开始检测的另一示例。函数g(m,n)具有用于每个频率仓l_m和每个巾贞l-η的值。如果比值E(m, n)/E(m, η-l)(即在巾贞η中的仓m的能级与在巾贞n_l中的仓m的能级之比)小于一,则[E(m, n)/E(m, n_l)]_l为负。在巾贞η中的仓m的能级不大于在中贞η-l中的仓m的能级。函数g(m,n)为零指示未发起起奏阶段,并且因此未检测到音符的开始。如果比值E(m, n)/E(m, η-l)(即在巾贞η中的仓m的能级与在巾贞n_l中的仓m的能级之比)大于一(假如值二 ),则[E (m, n) /E (m, η_1)]_1为正(即值一)。在中贞η中的仓m的能级大于在巾贞η-l中的仓m的能级。函数g(m,n)为[E (m, n)/E (m, n_l) ]-I的正值,这指示发起起奏阶段并且可能检测到音符的开始。重复门202监视出现于时间段内的开始检测数量。如果在重复检测时间段(例如50ms)内检测到音符的多次开始,则仅记录第一开始检测。也就是说,拒绝在重复检测时间段内在第一开始检测之后检测到的音符的任何后续开始。噪声门203监视采样的音频信号118在音符的开始检测周围的能级E (m,η)。如果采样的音频信号118在音符的开始检测周围的能级E(m,η) 一般在低噪声范围中(例如能级E(m, η)为-90dB),则开始检测被视为可疑并且因为不可靠而被拒绝。回顾图15,谐波起奏比值块204在逐帧基础上确定在音符的起奏阶段或者维系阶段期间在频域采样的音频信号118中的各种频率谐波的能级之比。替代地,谐波起奏比值监视基频的和基频的谐波。在一个实施例中,为了监视拍击风格,在音符的起奏阶段期间在拍击的200Hz基频和基频的4000Hz谐波处测量采样的音频信号118的频域能级。用于每个帧l-η的在音符的起奏阶段期间的4000/200HZ频域能级之比是谐波起奏比值。可以在逐帧基础上监视在音符的起奏阶段中的其他频率谐波比值。块204确定谐波比值中的能级改变速率(即能级在音符的起奏阶段期间相对于每个帧多么快地增加或者减少)。谐波起奏比值是每个帧η的频域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。谐波释放比值块205在逐帧基础上确定在音符的衰退阶段或者释放阶段期间频域采样的音频信号118的各种频率谐波的能级之比。替代地,谐波释放比值监视基频和基频的谐波。在一个实施例中,为了监视拍击风格,在音符的释放阶段期间在拍击的200Hz基频和4000Hz的基频的谐波处测量采样的音频信号118的频域能级。用于每个帧l-η的在音符的释放阶段期间的4000/200HZ频域能级之比是谐波释放比值。可以在逐帧基础上监视在音符的释放阶段中的其他频率谐波比值。块205确定谐波比值中的能级改变速率(即能级在音符的释放阶段期间相对于每个帧多么快地增加或者减少)。谐波释放比值是每个帧的频域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。开放和静音因子块206针对琴弦24的开放状态或者静音状态的出现来监视频域采样的音频信号118的能级。琴弦24的静音状态出现于艺术家将他的或者她的手指连续按压在琴弦上(通常在吉他20的琴桥附近)。在琴弦24上的手指压力迅速抑制或者衰减琴弦振动。开放状态为无静音状态(即无手指压力或者琴弦24的其他人为抑制),使得琴弦振 动自然衰退。在静音状态中,音符的维系阶段和衰退阶段由于引起的阻尼而比在开放状态中的自然衰退明显更短。采样的音频信号118的频域能级的高频内容缺失和迅速减少指示静音状态。采样的音频信号118的频域能级的高频值和自然衰退指示开放状态。开放和静音因子是每个帧η的频域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。琴颈和琴桥因子块207针对艺术家的琴颈弹奏或者琴桥弹奏的出现来监视频域采样的音频信号118的能级。琴弦24的琴颈弹奏出现于艺术家在吉他20的琴颈附近激发琴弦时。琴弦24的琴桥弹奏出现于艺术家在吉他20的琴桥附近激发琴弦时。当在琴颈附近弹奏时,第一频率陷波(notch)出现于采样的音频信号118的频域响应中的约IOOHz。当在琴桥附近弹奏时,第一频率陷波出现于采样的音频信号118的频域响应中的约500Hz。第一陷波在频率响应中的出现和位置指示琴颈弹奏或者琴桥弹奏。琴颈和琴桥因子是每个帧η的频域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。音高检测器块208监视频域采样的音频信号118的能级以确定音符的音高。块208记录音高的基频。音高检测器是每个帧η的频域参数或者特性并且在逐帧基础上存储为运行时矩阵174中的值。运行时矩阵174包含在频域分析块120中确定的频域参数和在时域分析块122中确定的时域参数。每个时域参数和频域参数是在逐帧基础上存储于运行时矩阵174中的数字参数值Pvn,j,其中η是帧并且j是参数。例如音符峰起奏参数具有帧I中的值PV1,I、帧2中的值PV2,I和帧η中的值PVn,I ;音符峰释放参数具有帧I中的值PV1,2、帧2中的值PV2,2和帧η中的值PVn,2 ;多频带峰起奏参数具有帧I中的值PV1,3、帧2中的值PV2,3和帧η中的值PVn,3 ;并且以此类推。表I示出了具有在运行时分析期间生成的时域和频域参数值PVn,j的运行时矩阵174。时域和频域参数值PVn,j是具体音符的特性以及因此在音符之间进行区分中有用。¢£2 ...Mn
音符峰起奏PVl, IPV2,1PVn, I
音符峰释放PVl, 2PV2,2PVn, 2
多频带峰起奏PVl, 3PV2,3PVn, 3多频带峰释放PVl, 4PV2,4PVn, 4
拍击检测器PVl, 5PV2,5PVn, 5
拍子检测器PVl, 6PV2,6PVn, 6
谐波起奏比值PVl, 7PV2,7PVn, 7
谐波释放比值PVl, 8PV2,8PVn, 8
开放和静音因子PV1,9PV2,9PVn,9
琴颈和琴桥因子PVl, 10PV2,10PVn, 10
音高检测器PVl, 11PV2,11PVn, 11
表I -具有来自运行时分析的时域参数和频域参数的运行时矩阵174。表2示出了运行时矩阵174的一个帧,该矩阵174具有由频域分析块120和时域分析块122生成的时域和频域参数,这些块被分配用于源于指弹奏风格的音频信号的采样数值。按照表1,运行时矩阵174包含用于源于指弹奏风格的音频信号的其他帧的时域和频域参数值PVn,j。遞Mt
音符峰起奏28
音符峰释放196
多频带峰起奏31,36,33
多频带峰释放193,177,122
拍击检测器O
拍子检测器42
谐波起奏比值0.26
谐波释放比值0.85
开放和静首因子O. 19
琴颈和琴桥因子207
音高检测器53
表2 -来自对指弹奏风格的一个帧的运行时分析的时域和频域参数。表3示出了运行时矩阵174的一个帧,该矩阵174具有由频域分析块120和时域分析块122生成的时域和频域参数,这些块被分配用于源于拍击风格的音频信号的采样数值。按照表1,运行时矩阵174包含用于源于拍击风格的音频信号的其他帧的时域和频域参数值PVn,j。皇数顿值
音符峰起奏6
音符峰释放33
多频带峰起奏6,4,7
多频带峰释放32,29,20
拍击检测器I
拍子检测器110
谐波起奏比值0.90
谐波释放比值0.24开放和静首因子O. 76
琴颈和琴桥因子881
音高检测器479
表3 -来自对拍击风格的 一个帧的运行时分析的时域参数和频域参数。回顾图6,数据库112维护于音频放大器90的存储器部件中并且包含多个音符签名记录1、2、3、…i,每个音符签名记录具有与运行时矩阵174对应的时域参数和频域参数。此外,音符签名记录l_i包含用于每个时域和频域参数的加权因子1、2、3、··· j以及多个控制参数1、2、3、…k。图20示出了数据库112,该数据库112具有用于每个音符签名记录l_i的时域和频域参数Ι-j、用于每个音符签名记录Ι-i的加权因子Ι-j以及用于每个音符签名记录1-i的控制参数Ι-k。每个音符签名记录i由作为与音符签名i相关联的音符的特性的参数ι-j和关联的权重Ι-j限定并且将用来将来自运行时矩阵174的传入帧标识为与音符签名i最佳匹配或者最接近相关。一旦来自运行时矩阵174的传入帧与特定音符签名i匹配,自适应智能控制114就使用匹配音符签名的控制参数Ι-k设置音频放大器90的信号处理块92-104的操作状态。例如在匹配音符签名记录i中,控制参数i,I设置前滤波器块92的操作状态;控制参数i,2设置前效果块94的操作状态;控制参数i,3设置非线性效果块96的操作状态;控制参数i,4设置用户限定的模块98的操作状态;控制参数i,5设置后效果块100的操作状态;控制参数i,6设置后滤波器块102的操作状态;并且控制参数i,7设置功率放大块104的操作状态。在音符签名数据库112中的时域参数和频域参数Ι-j包含制造商预设的或者用户录入的或者通过弹奏乐器随时间学习的值。音频放大器90的工厂或者制造商可以初始预设时域和频域参数l_j以及加权因子l_j和控制参数l_k的值。参见图21,用户可以使用具有用户接口屏幕或者显示器210的计算机209直接改变用于数据库112中的每个音符签名Ι-i的时域和频域参数l_j、加权因子l_j以及控制参数l_k。用接口屏幕210呈现用于时域和频域参数ι-j、加权因子ι-j以及控制参数ι-k的值以允许用户录入更新值。在另一实施例中,时域和频域参数l_j、加权因子l_j以及控制参数l_k可以由弹奏吉他20的艺术家学习。艺术家将音频放大器90设置成学习模式。艺术家反复弹奏吉他20上的相同音符。例如艺术家指弹奏特定音符或者拍击特定音符反复多次。图8的频域分析120和时域分析122每当弹奏相同音符时创建具有关联频域参数和时域参数Ι-j的运行时矩阵174。在数据库122中累积并且存储用于相同音符的一系列频域和时域参数l_j。在反复弹奏音符时,艺术家可以经由前控制面板78对音频放大器90进行手动调整。音频放大器90按照如艺术家手动设置的信号处理块92-104的设置来学习与音符关联的控制参数Ι-k。例如艺术家拍击低音吉他20上的音符。用于拍击的音符的频域参数和时域参数逐帧存储于数据库112中。艺术家通过前面板控制78手动调整音频放大器90的信号处理块92-104 (例如增加音频信号在放大块104中的放大率或者选择前效果块94中的声音效果)。存储如艺术家手动设置的信号处理块92-104的设置作为用于数据库112中学习的音符签名的控制参数l_k。艺术家拍击低音吉他20上的相同音符。在数据库112中累积用于相同拍击音符的频域参数和时域参数与先前频域和时域参数ι-j。艺术家通过前面板控制78手动调整音频放大器90的信号处理块92-104(例如调整音频信号在前滤波器块92中的均衡或者选择非线性效果块96中的声音效果)。累积如艺术家手动设置的信号处理块92-104的设置作为用于数据库112中学习的音符签名的控制参数Ι-k。该过程以相同音符的反复拍击针对学习模式而继续并且通过前面板控制78手动调整音频放大器90的信号处理块92-104。当学习模式完成时,用音符签名参数限定数据库112中的音符签名记录,这些参数是在数据库112中累积的频域参数和时域参数的平均值以及根据音频放大器90的信号处理块92-104的手动调整而取得的并且在数据库112中累积的控制参数l_k的平均值。在一个实施例中,平均值是数据库112中的系列累积频域和时域参数l_j以及累积控制参数l_k的均方根。
可以通过监视学习的时域和频域参数Ι-j并且基于该比较的接近度或者统计相关增加或者减少加权因子来学习加权因子Ι-j。如果特定参数表现一致的统计相关,则可以增加用于该参数的加权因子。如果特定参数表现不同的统计相关,则可以减少用于该参数的加权因子。一旦为数据库112建立音符签名Ι-i的参数l_j、加权因子l_j和控制参数l_k,就可以在逐帧基础上比较运行时矩阵174中的时域和频域参数Ι-j与每个音符签名Ι-i以发现最佳匹配或者最接近相关。在正常弹奏模式中,艺术家弹奏吉他20以生成与弹奏的旋律对应的音符序列。对于每个音符,运行时矩阵174在逐帧基础上由如图6-19中描述的那样根据音频信号的运行时分析而确定的时域参数和频域参数填充。可以在多种实现中进行在运行时矩阵174与数据库112中的音符签名l_i之间的比较。例如在时间序列中逐一比较运行时矩阵174中的时域和频域参数Ι-j与用于数据库112中的每个音符签名Ι-i的参数Ι-j。为运行时矩阵174的每个帧确定最佳匹配或者最接近相关。自适应智能控制块114使用数据库112中的与匹配音符签名关联的控制参数l_k控制音频放大器90的信号处理块92-104的操作。在另一例子中,比较运行时矩阵174中的音符的预定数量的帧(少于音符的所有帧)中的时域和频域参数l_j与用于数据库112中的每个音符签名Ι-i的参数Ι-j。在一个实施例中,比较运行时矩阵174中的每个音符的如该音符的开始检测所确定的前十个帧中的时域和频域参数l_j与用于每个音符签名Ι-i的参数l_j。在运行时矩阵174中的每个音符的前十个帧中的每个帧中的时域和频域参数l_j与用于每个音符签名Ι-i的参数Ι-j之间的比较的平均值将确定最佳匹配或者最接近相关以将运行时矩阵174中的帧标识为与音符签名i关联的特定音符。自适应智能控制块114使用数据库112中的与匹配音符签名关联的控制参数l_k控制音频放大器90的信号处理块92-104的操作。在用于确定在运行时矩阵174中的用于每个帧的时域和频域参数Ι-j与用于每个音符签名Ι-i的参数Ι-j之间的最佳匹配或者最接近相关的参数比较过程的示例数值例子中,表4示出了数据库112的具有用于音符签名I (指弹奏风格音符)的采样参数值的时域和频域参数l_j。表5示出了数据库112的具有用于帧签名2 (拍击风格音符)的采样参数值的时域和频域参数ι-j。皇数值加权
音符峰起奏300.83
音符峰释放2000.67
多频带峰起奏30,35,330.72多频带峰释放200,180,120O. 45
拍击检测器O1.00
拍子检测器500.38
谐波起奏比值0.250.88
谐波释放比值0.800.61
开放和静音因子O. 150.70
琴颈和琴桥因子2000.69
音高检测器500.40 表4 -用于音符签名I (指弹奏风格)的时域参数和频域参数。盡数值加极音符峰起奏 5 0.80音符峰释放 40 0.71多频带峰起奏 5,4,5 0.65多频带峰释放 30,25,23 0.35拍击检测器 I 1.00拍子检测器 100 0.27谐波起奏比值 0.85 0.92谐波释放比值 0.20 0.69开放和静音因子 0.65 0.74琴颈和琴桥因子 1000 0.80音高检测器 500 0.57表5 -用于音符签名2 (拍击风格)的时域参数和频域参数。在逐个基础上比较运行时矩阵174中的用于一个帧的时域和频域参数Ι-j与每个音符签名Ι-i中的参数l_j并且记录差值。例如运行时矩阵174中的帧I的音符峰起奏参数具有值28 (见表2),并且音符签名I中的音符峰起奏参数具有值30 (见表4)。图22示出了具有比较块212的识别检测器211,该比较块212用于确定运行时矩阵174中的用于一个帧的时域和频域参数ι-j与音符签名i中的参数ι-j之间的差。帧I与音符签名I之间的差30-28存储于识别存储器213中。运行时矩阵174中的帧I的音符峰释放参数具有值196 (见表2),并且音符签名I中的音符峰释放参数具有值200 (见表4)。比较块212确定差值200-196并且在识别存储器213中存储差值。对于帧I的每个参数,比较块212确定运行时矩阵174中的参数值与音符签名I中的参数值之间的差并且在识别存储器213中存储差值。将帧I的参数ι-j与音符签名I的参数ι-j之间的差求和以确定在帧I的参数Ι-j与音符签名I的参数ι-j之间的总差值。接着运行时矩阵174中的帧I的音符峰起奏参数具有值28 (见表2),并且音符签名2中的音符峰起奏参数具有值5 (见表5)。比较块212确定差值5-28并且在识别存储器213中存储帧I与音符签名2之间的差。运行时矩阵174中的帧I的音符峰释放参数具有值196 (见表2),并且音符签名2中的音符峰释放参数具有值40 (见表5)。比较块212确定差值40-196并且在识别存储器213中存储差值。对于帧I的每个参数,比较块212确定运行时矩阵174中的参数值与音符签名2中的参数值之间的差并且在识别存储器213中存储差值。将运行时矩阵174中的用于帧I的参数Ι-j与音符签名2的参数Ι-j之间的差求和以确定在运行时矩阵174中的用于帧I的参数Ι-j与音符签名2的参数Ι-j之间的总差值。如针对音符签名I和2描述的那样,比较运行时矩阵174中的用于帧I的时域和频域参数l_j与数据库112中的剩余音符签名3-i中的时域和频域参数Ι-j。在运行时矩阵174中的用于帧I的参数Ι-j与音符签名Ι-i的参数Ι-j之间的最小总差值是最佳匹配或者最接近相关。在这一情况下,运行时矩阵174中的用于帧I的时域和频域参数Ι-j与音符签名I中的时域和频域参数l_j更接近对准。将运行时矩阵174的帧I标识为指弹奏风格音符的帧。利用与音符签名I匹配的根据弹奏的音符生成的在运行时矩阵174中的帧I的时域参数和频域参数Ι-j,图6的自适应智能控制块114使用数据库112中的与匹配音符签名I关联的控制参数Ι-k控制音频放大器90的信号处理块92-104的操作。在音符签名I之 下的控制参数1,I、控制参数1,2至控制参数l,k中的每个具有数值(例如1-10)。例如控制参数1,I具有值5并且将前滤波器块92的操作状态设置成在200Hz具有低通滤波器功能;控制参数1,2具有值7并且将前效果块94的操作状态设置成加入回响声音效果;控制参数1,3具有值9并且将非线性效果块96的操作状态设置成引入失真;控制参数1,4具有值I并且将用户限定的模块98的操作状态设置成添加鼓伴奏;控制参数1,5具有值3并且将后效果块1000的操作状态设置成加入哼声取消器声音效果;控制参数1,6具有值4并且将后滤波器块102的操作状态设置成实现铃形均衡;并且控制参数1,7具有值8并且将功率放大块104的操作状态设置成将放大增加3dB。通过前滤波器块92、前效果块94、非线性效果块96、用户限定的模块98、后效果块100、后滤波器块102和功率放大块104处理处理音频信号,每个如音符签名I的控制参数1,I、控制参数1,2至控制参数l,k设置的那样操作。向外壳24中的扬声器46或外壳72中的扬声器82路由增强的音频信号。收听者听见用音频信号的动态内容确定的特性实时增强的再现音频信号。接着在逐个基础上比较运行时矩阵174中的用于帧2的时域和频域参数Ι-j与每个音符签名Ι-i中的参数Ι-j并且记录差值。对于帧2的每个参数Ι-j,比较块212确定运行时矩阵174中的参数值与音符签名i中的参数值之间的差并且在识别存储器213中存储差值。将帧2的参数Ι-j与音符签名i的参数Ι-j之间的差求和以确定在帧2的参数1-j与音符签名i的参数Ι-j之间的总差值。在运行时矩阵174的帧2的参数Ι-j与音符签名Ι-i的参数ι-j之间的最小总差值是最佳匹配或者最接近相关。用具有在对应参数之间的最小总差值的音符签名标识运行时矩阵174的帧2。在这一情况下,运行时矩阵174中的帧2的时域和频域参数Ι-j与音符签名I中的时域和频域参数Ι-j更接近对准。将运行时矩阵174的帧2标识为用于指弹奏风格作品的另一个帧。自适应智能控制块114使用数据库112中的与匹配音符签名I关联的控制参数l_k控制音频放大器90的信号处理块92-104的操作。该过程针对运行时矩阵174的每个帧η继续。在另一数值示例中,运行时矩阵174中的帧I的音符峰起奏参数具有值6 (见表3),并且音符签名I中的音符峰起奏参数具有值30 (见表4)。帧I与音符签名I之间的差30-6存储于识别存储器213中。运行时矩阵174中的帧I的音符峰释放参数具有值33(见表3),并且音符签名I中的音符峰释放参数具有值200 (见表4)。比较块212确定差值200-33并且在识别存储器213中存储差值。对于帧I的每个参数,比较块212确定运行时矩阵174中的参数值与音符签名I中的参数值之间的差并且在识别存储器213中存储差值。将运行时矩阵174中的帧I的参数Ι-j与音符签名I的参数Ι-j之间的差求和以确定在帧I的参数ι-j与音符签名I的参数ι-j之间的总差值。接着运行时矩阵174中的帧I的音符峰起奏参数具有值6 (见表3),并且音符签名2中的音符峰起奏参数具有值5 (见表5)。比较块212确定差值5-6并且在识别存储器213中存储差值。运行时矩阵174中的帧I的音符峰释放参数具有值33 (见表3),并且音符签名2中的音符峰释放参数具有值40 (见表5)。比较块212确定差值40-33并且在识别存储器213中存储差值。对于帧I的每个参数,比较块212确定运行时矩阵174中的参数值与音符签名2中的参数值之间的差并且在识别存储器213中存储差值。将帧I的参数Ι-j与音符签名2的参数Ι-j之间的差求和以确定帧I的参数Ι-j与音符签名2的参数1-j之间的总差值。如针对音符签名I和2描述的那样,比较运行时矩阵174中的用于帧I的时域和 频域参数Ι-j与数据库112中的剩余音符签名3-i的时域和频域参数Ι-j。在运行时矩阵174的帧I的参数Ι-j与音符签名Ι-i的参数Ι-j之间的最小总差值是最佳匹配或者最接近相关。用具有在对应参数之间的最小总差值的音符签名标识运行时矩阵174的帧I。在这一情况下,运行时矩阵174中的帧I的时域和频域参数Ι-j与音符签名2中的时域和频域参数Ι-j更接近对准。将运行时矩阵174的帧I标识为拍击风格音符的帧。利用与音符签名2匹配的根据弹奏的音符生成的在运行时矩阵174中的帧I的时域参数和频域参数l_j,图6的自适应智能控制块114使用数据库112中的与匹配音符签名2关联的控制参数l_k控制音频放大器90的信号处理块92-104的操作。通过前滤波器块92、前效果块94、非线性效果块96、用户限定的模块98、后效果块100、后滤波器块102和功率放大块104处理音频信号,每个如音符签名2的控制参数2,I、控制参数2,2至控制参数2,k设置的那样操作。向外壳24中的扬声器或外壳72中扬声器82路由增强的音频信号。收听者听见用音频信号的动态内容确定的特性实时增强的再现音频信号。在逐个基础上比较运行时矩阵174中的用于帧2的时域和频域参数Ι-j与每个音符签名Ι-i中的参数Ι-j并且记录差值。对于帧2的每个参数Ι-j,比较块212确定运行时矩阵174中的参数值与音符签名i中的参数值之间的差并且在识别存储器213中存储差值。将帧2的参数Ι-j与音符签名i的参数Ι-j之间的差求和以确定在帧2的参数1-j与音符签名i的参数Ι-j之间的总差值。在运行时矩阵174的帧2的参数Ι-j与音符签名Ι-i的参数ι-j之间的最小总差值是最佳匹配或者最接近相关。用具有在对应参数之间的最小总差值的音符签名标识运行时矩阵174的帧2。在这一情况下,运行时矩阵174中的帧2的时域和频域参数Ι-j与音符签名2中的时域和频域参数Ι-j更接近对准。将运行时矩阵174的帧2标识为拍击风格音符的另一个帧。自适应智能控制块114使用数据库112中的与匹配音符签名2关联的控制参数l_k控制音频放大器90的信号处理块92-104的操作。该过程针对运行时矩阵174的每个帧η继续。在另一实施例中,在逐个基础上比较运行时矩阵174中的用于一个帧的时域和频域参数Ι-j与每个音符签名Ι-i中的参数Ι-j并且记录加权差。例如运行时矩阵174中的帧I的音符峰起奏参数具有值28(见表2),并且音符签名I中的音符峰起奏参数具有值30(见表4)。比较块212确定加权差(30-28)*权重1,I并且在识别存储器213中存储加权差值。运行时矩阵174中的帧I的音符峰释放参数具有值196 (见表2),并且音符签名I中的音符峰释放参数具有值200 (见表4)。比较块212确定加权差(200-196)*权重1,2并且在识别存储器213中存储加权差。对于帧I的每个参数,比较块212确定如权重1,j确定的在运行时矩阵174中的参数值与音符签名I中的参数值之间的加权差并且在识别存储器213中存储加权差。将在帧I的参数Ι-j与音符签名I的参数Ι-j之间的加权差求和以确定在帧I的参数ι-j与音符签名I的参数ι-j之间的总加权差。接着运行时矩阵174中的帧I的音符峰起奏参数具有值28 (见表2),并且音符签名2中的音符峰起奏参数具有值5 (见表5)。比较块242确定加权差(5-28)*权重2,I并且在识别存储器213中存储加权差。运行时矩阵174中的帧I的音符峰释放参数具有值196(见表2),并且音符签名2中的音符峰释放参数具有值40 (见表5)。比较块212确定加权差(40-196) *权重2,2并且在识别存储器213中存储加权差。对于帧I的每个参数,比较块212按照权重2,j确定在运行时矩阵174中的参数值与音符签名中的参数值之间的加权差并且在识别存储器213中存储加权差。将在运行时矩阵174中的帧I的参数Ι-j与音符 签名2的参数Ι-j之间的加权差求和以确定在帧I的参数Ι-j与音符签名2的参数Ι-j之间的总加权差值。如针对音符签名I和2描述的那样,比较运行时矩阵174中的用于帧I的时域和频域参数Ι-j与数据库112中的剩余音符签名3-i中的时域和频域参数ι-j。在运行时矩阵174的帧I的参数Ι-j与音符签名Ι-i的参数Ι-j之间的最小总加权差是最佳匹配或者最接近相关。用具有在对应参数之间的最小总加权差的音符签名标识运行时矩阵174的帧I。自适应智能控制块114使用数据库112中的与匹配音符签名关联的控制参数Ι-k控制音频放大器90的信号处理块92-104的操作。在逐个基础上比较运行时矩阵174中的用于帧2的时域和频域参数ι-j与每个音符签名Ι-i中的参数Ι-j并且记录加权差值。对于帧2的每个参数Ι-j,比较块212按照权重i,j确定在运行时矩阵174中的参数值与音符签名i中的参数值之间的加权差并且在识别存储器213中存储加权差。将在帧2的参数Ι-j与音符签名i的参数Ι-j之间的加权差求和以确定在帧2的参数Ι-j与音符签名i的参数Ι-j之间的总加权差值。在运行时矩阵174的帧2的参数Ι-j与音符签名Ι-i的参数Ι-j之间的最小总加权差是最佳匹配或者最接近相关。用具有在对应参数之间的最小总加权差的音符签名标识运行时矩阵174的帧2。自适应智能控制块114使用数据库112中的与匹配音符签名关联的控制参数Ι-k控制音频放大器90的信号处理块92-104的操作。该过程针对运行时矩阵174的每个帧η继续。在另一实施例中,确定在运行时矩阵174与音符签名Ι-i中的对应参数之间的相关概率。换而言之,将相关概率确定为运行时矩阵174中的给定参数可能与音符签名i中的对应参数相同的百分比。百分比是匹配的可能性。如上文描述的那样,在逐帧基础上存储运行时矩阵174中的时域参数和频域参数。对于运行时矩阵174中的每个参数j的每个中贞 η 由 Pn, j=[Pnl, Pn2, ... Pnj]代表。在运行时矩阵174中的每个参数j的每个帧η与每个音符签名i的每个参数j之间确定概率等级列表R。可以通过等式(3)中针对Pn,j和音符签名数据库Si,j的均方根分析来确定概率值A
权利要求
1.一种音频系统,包括被耦合用于接收音频信号的信号处理器,其中所述音频信号的动态内容控制所述信号处理器的操作。
2.根据权利要求I所述的音频系统,还包括 时域处理器,其被耦合用于接收所述音频信号并且生成所述音频信号的时域参数; 频域处理器,其被耦合用于接收所述音频信号并且生成所述音频信号的频域参数; 签名数据库,其包括多个签名记录,每个签名记录具有时域参数和频域参数以及控制参数;以及 识别检测器,用于匹配所述音频信号的所述时域参数和频域参数与所述签名数据库的签名记录,其中匹配签名记录的控制参数控制所述信号处理器的操作。
3.根据权利要求I所述的音频系统,其中所述信号处理器包括前滤波器、前效果、非线性效果、用户限定的模块、后效果、后滤波器或者功率放大。
4.根据权利要求I所述的音频系统,其中对所述音频信号采样,并且所述时域处理器和频域处理器对采样的音频信号的多个帧操作。
5.根据权利要求I所述的音频系统,其中所述时域处理器或者频域处理器检测采样的音频信号的音符的开始。
6.根据权利要求I所述的音频系统,其中所述时域参数包括音符峰起奏参数、音符峰释放参数、多频带峰起奏参数、多频带峰释放参数、拍击检测器参数、拍子检测器参数、瞬态检测器参数或者颤音检测器参数。
7.根据权利要求I所述的音频系统,其中所述频域参数包括谐波起奏比值参数、谐波释放比值参数、开放和静音因子参数,琴颈和琴桥因子参数、音高检测器参数、元音共振峰参数或者陪音检测器参数。
8.根据权利要求I所述的音频系统,其中所述音频信号由吉他生成。
9.根据权利要求I所述的音频系统,其中所述音频信号由声乐生成。
10.一种控制音频系统的方法,包括 提供适于接收音频信号的信号处理器;并且 使用所述音频信号的动态内容来控制所述信号处理器的操作。
11.根据权利要求10所述的方法,还包括 生成所述音频信号的时域参数; 生成所述音频信号的频域参数; 提供包括多个签名记录的签名数据库,每个签名记录具有时域参数和频域参数以及控制参数; 匹配所述音频信号的时域参数和频域参数与所述签名数据库的签名记录;并且 基于匹配签名记录的所述控制参数控制所述信号处理器的操作。
12.根据权利要求10所述的方法,其中所述信号处理器包括前滤波器、前效果、非线性效果、用户限定的模块、后效果、后滤波器或者功率放大。
13.根据权利要求10所述的方法,还包括 对所述音频信号采样;并且 基于采样的音频信号的多个帧生成所述时域参数和频域参数。
14.根据权利要求10所述的方法,还包括检测采样的音频信号的音符的开始。
15.根据权利要求10所述的方法,其中所述时域参数包括音符峰起奏参数、音符峰释放参数、多频带峰起奏参数、多频带峰释放参数、拍击检测器参数、拍子检测器参数、瞬态检测器参数或者颤音检测器参数。
16.根据权利要求10所述的方法,其中所述频域参数包括谐波起奏比值参数、谐波释放比值参数、开放和静音因子参数,琴颈和琴桥因子参数、音高检测器参数、元音共振峰参数或者陪音检测器参数。
17.根据权利要求10所述的方法,还包括用吉他或者声乐生成所述音频信号。
全文摘要
本发明涉及区分信号信息内容和控制信号处理功能的音频系统和方法。一种音频系统具有被耦合用于从乐器或者声乐接收音频信号的信号处理器。时域处理器接收音频信号并且生成音频信号的时域参数。频域处理器接收音频信号并且生成音频信号的频域参数。对音频信号采样,并且时域处理器和频域处理器对采样的音频信号的多个帧操作。时域处理器检测采样的音频信号的音符的开始。签名数据库具有签名记录,每个签名记录具有时域参数和频域参数以及控制参数。识别检测器匹配音频信号的时域参数和频域参数与签名数据库的签名记录。匹配签名记录的控制参数控制信号处理器的操作。
文档编号H04R3/00GK102790932SQ20121015316
公开日2012年11月21日 申请日期2012年5月17日 优先权日2011年5月17日
发明者K.L.查普曼, S.J.科蒂, 邝志云 申请人:芬德乐器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1