根据多个音频主干的自动多声道音乐混合的制作方法

文档序号:9355589阅读:1490来源:国知局
根据多个音频主干的自动多声道音乐混合的制作方法
【技术领域】
[0001] 本公开涉及音频信号处理,并且具体涉及用于多声道音频信号的自动混合的方 法。
【背景技术】
[0002] 制作音频录制的处理通常通过捕捉并存储将被组合为最终录制的一个或更多个 不同音频对象而开始。在该上下文中,"捕捉"意味着将收听者可以听到的声音转换为可存 储的信息。"音频对象"是可以作为一个或更多个模拟信号或者数字数据流而被传送并且可 以被存储为模拟录制或者数字数据文件或者其他数据对象的音频信息体。原始或者未经处 理的音频对象通常可被称作"音轨",作为每个音频对象曾事实上被记录在磁性记录带上的 物理分离轨道上时的纪念。目前,"音轨"可以被记录在模拟记录带上或者可以被以数字方 式记录在数字音频带上或者计算机可读存储介质上。
[0003] 数字音频工作站(DAW)通常被音频音乐专业人员用来将单独音轨集成为最后交 付给最终用户的期望最终音频产品。这些最终音频产品通常被称作"艺术混合"(artistic mixes)。艺术混合的创建需要相当大量的努力和专业知识。此外,艺术混合通常由拥有特 定内容的权利的艺术家批准。
[0004] 术语"主干"(stem)被广泛用来描述音频对象。该术语也被广泛误解,因为"主干" 在不同的上下文中通常被给予不同的含义。在电影制作期间,术语"主干"通常指代环绕音 频呈现。例如,用于影片音频回放的最终音频通常被称作"发行母带主干(print master stem) "。对于5. 1呈现,发行母带主干由6个音频声道--左前、右前、中央、LFE (低频效 果,通常称作超低音音箱)、左后环绕和右后环绕一一组成。主干中的每个声道通常包含诸 如音乐、对话和效果之类的若干分量的混合。这些原始分量中的每个继而可以由数百个源 或者"音轨"创建。使事情更加复杂的是,当电影被混合时,音频呈现中的每个分量被分别 "发行"或者记录。在发行母带正被创建的同时,每个主要分量(例如,对话、音乐、效果)也 可以被记录或者"发行"到主干。这些被称作"DM&E"或者说对话、音乐和效果主干。这些 分量中的每个可以是包含六个音频声道的5. 1呈现。当D M&E主干被一起同步播放时,它 们听起来与发行母带主干完全一样。D M&E主干由于各种原因而被创建,外语对话替换是一 个常见示例。
[0005] 在录制音乐制作期间,主干的创建原因和主干的性质在本质上不同于上面描述的 影片"主干"。主干创建的主要动机是允许录制音乐被"重新混合"。例如,并非旨在在舞蹈 倶乐部中播放的流行歌曲可以被重新混合以便与舞蹈倶乐部音乐更加相容。艺术家及其记 录标签也可以由于公共关系原因将主干发布给公众。公众(通常为可以访问数字音频工作 站的相当复杂的用户)准备可以为了宣传目的而被发布的重新混合版。歌曲也可以被重新 混合以供在诸如非常成功的吉他英雄和摇滚乐队游戏之类的视频游戏中使用。这种游戏依 赖于表示单独乐器的主干的存在。在录制音乐制作期间创建的主干通常包含来自不同源的 音乐。例如,摇滚歌曲的一组主干可以包括鼓、一个或更多个吉他、贝斯、一个或更多个声乐 (vocal)、键盘和打击乐器。
[0006] 在本专利中,"主干"是通过处理一个或更多个音轨而生成的艺术混合的分量或者 子混合。该处理可以通常包括,但是不一定包括,混合多个音轨。处理可以包括以下各项中 的一个或更多个:通过放大或者衰减的电平修改;诸如低通滤波、高通滤波或者图形均衡 之类的频谱修改;诸如限幅或者压缩之类的动态范围修改;诸如相移或延迟之类的时域修 改;噪声、哼声(hum)和反馈抑制;混响;以及其他处理。主干通常在艺术混合的创建期间 生成。立体声艺术混合通常由四到八个主干组成。少至两个主干和多于八个主干可以被用 于一些混合。每个主干可以包括单个分量或者左分量和右分量。
[0007] 因为用于将音频内容交付给收听者的最常见技术是紧凑盘和无线电广播,因此多 数艺术混合是立体声,也就是说多数艺术混合只有两个声道。在本专利中,"声道"是准备好 通过音频再现系统向收听者播放的经完全处理的音频对象。然而,由于家庭影院系统的流 行,许多家庭和其他场所具有环绕声多声道音频系统。术语"环绕"要么指的是旨在在二维 或三维空间中分布的多于两个扬声器上播放的源素材,要么指的是包括在二维或者三维空 间中分布的多于两个扬声器的回放布置。常见的环绕声音格式包括:5. 1,其包括五个单独 的音频声道加上低频效果(LFE)或者重低音声道;5. 0,其包括五个音频声道而没有LFE声 道;以及7. 1,其包括七个音频声道加上LFE声道。音频内容的环绕混合具有实现更迷人收 听者体验的巨大潜力。环绕混合还可以提供更高质量的再现,这是因为音频通过增加数目 的扬声器而被再现并且因而可以需要单独声道的更少动态范围压缩和均衡。然而,指定用 于多声道再现的另一艺术混合的创建需要有艺术家和混合工程师参与的附加混合会话。环 绕艺术混合的成本可能不被内容所有者或者唱片公司批准。
[0008] 在本专利中,任何将被记录和再现的音频内容将被称作"歌曲"。歌曲例如可以是 3分钟流行歌曲、非音乐戏剧事件或者完整交响乐。
【附图说明】
[0009] 图1是用于创建艺术混合的传统系统的框图。
[0010] 图2A是用于分发环绕混合的系统的框图。
[0011] 图2B是用于分发环绕混合的另一系统的框图。
[0012] 图2C是用于分发环绕混合的另一系统的框图。
[0013] 图3是自动混合器的功能框图。
[0014] 图4是规则库的图形表示。
[0015] 图5是另一自动混合器的功能框图。
[0016] 图6是另一规则库的图形表不。
[0017] 图7是收听环境的图形表示。
[0018] 图8是用于自动创建环绕混合的处理的流程图。
[0019] 图9是用于自动创建环绕混合的另一处理的流程图。
[0020] 在整个本说明书中,在附图中出现的元件被指派了三数字参考指示符,其中最高 有效数字是引入该元件的附图编号并且两个最低有效数字是依元件而定的。未被结合附图 描述的元件可被假定为具有与先前描述的具有相同参考指示符的元件相同的特性和功能。
【具体实施方式】
[0021] 装置的描述
[0022] 现在参考图1,用于产生艺术混合的系统100可以包括多个音乐家和音乐乐器 110A-110F、录音机120和混合器130。音乐家和乐器110A-110F所产生的声音可以通过诸 如麦克风、磁性拾音器和压电拾音器之类的换能器而被转换为电信号。诸如电子键盘之类 的一些乐器可以在没有中间换能器的情况下直接产生电信号。在该上下文中,术语"电信 号"包括模拟信号和数字数据两者。
[0023] 这些电信号可以被录音机120记录为多个音轨。每个音轨可以记录由单个音乐家 或乐器产生的声音,或者由多个乐器产生的声音。在诸如鼓手打一组鼓之类的一些情况下, 由单个音乐家产生的声音可以被多个换能器捕捉。来自多个换能器的电信号可以被记录为 相对应的多个音轨或者可以在记录之前被组合为减少数目的音轨。将被组合为艺术混合的 各种音轨无需在相同时间或者甚至在相同位置记录。
[0024] -旦将被混合的所有音轨已被记录,则音轨可以使用混合器130而被组合为艺术 混合。混合器130的功能元件可以包括音轨处理器132A-132F和加法器134L和134R。在 历史上,音轨处理器和加法器是由对模拟音频信号进行操作的模拟电路实现的。目前,音轨 处理器和加法器通常是使用诸如数字信号处理器之类的一个或更多个数字处理器来实现 的。当存在两个或更多个个处理器时,在图1中示出的混合器130的功能划分无需与混合 器130在多个处理器之间的物理划分相一致。多个功能元件可以被实现在同一处理器内, 并且任一功能元件都可以在两个或更多个处理器之间被划分。
[0025] 每个音轨处理器132A-132F可以处理一个或更多个记录音轨。每个音轨处理器 所执行的处理可以包括以下各项中的一些或全部:对多个音轨进行加总或者混合;通过放 大或者衰减的电平修改;诸如低通滤波、高通滤波或者图形均衡之类的频谱修改;诸如限 幅或者压缩之类的动态范围修改;诸如相移或延迟之类的时域修改;噪声、哼声和反馈抑 制;混响;以及其他处理。可以对声乐音轨执行诸如咝声消除和合唱之类的专门处理。可 以在使单独音轨混合或者相加之前对其执行诸如电平修改之类的一些处理,并且可以在使 多个音轨混合之后执行其他处理。每个音轨处理器132A-132F的输出可以是相应的主干 140A-140F,其中只有主干140A和140
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1