立体声音频信号编码器的制造方法
【专利摘要】一种装置,包括:声道分析器,被配置成分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数;编码模式确定器,被配置成取决于该至少一个参数来选择多声道音频信号编码;以及声道编码器,被配置成用多声道音频信号编码对音频信号进行编码。
【专利说明】立体声音频信号编码器
【技术领域】
[0001] 本申请涉及立体声音频信号编码器,更具体但非排他地涉及用于在便携式装置中 使用的立体声音频信号编码器。
【背景技术】
[0002] 音频信号、如语音或音乐被编码例如以使得能够高效地传输或存储音频信号。
[0003] 音频编码器和解码器(也被称为编解码器)用来代表基于音频的信号、诸如音乐 和环境声音(其在语音编码方面可以被称为背景噪声)。这些类型的编码器通常未使用用 于编码处理的语音模型,相反,它们使用用于代表所有类型的音频信号、包括语音的处理。 语音编码器和解码器(编解码器)可以被认为是对于语音信号被最优化的音频编解码器, 并且可以在固定或可变比特率操作。
[0004] 音频编解码器还可以被配置成以变化的比特率操作。在较低的比特率,这样的音 频编解码器可以被最优化以便在等效于纯语音编解码器的编码速率与语音信号一起工作。 在较高的比特率,音频编解码器可以以较高的质量和性能对任何信号、包括音乐、背景噪声 和语音进行编码。可变速率音频编解码器还可以实施嵌入式可扩展编码结构和比特流,其 中附加比特(特定数量的比特通常被称为层)在较低速率时改进编码,并且其中可以截断 较高速率的比特流以获得较低速率编码的比特流。这样的音频编解码器可以使用纯粹被设 计用于语音信号的编解码器作为核心层或最低比特率编码。
[0005] 音频编解码器被设计成维持高的(感知)质量同时改善压缩比。因此,取代波形 匹配编码,通常采用各种参数方案以降低比特率。对于多声道音频、诸如立体声信号,通常 在单声声道表示上使用较大数量的可用比特率并且对立体声或多声道信息进行编码以开 发使用相对较少比特的参数方法。
[0006] 现实生活中可用的多声道信号类型包括双声道立体声和近远立体声表示。双声道 立体声是指通常通过用两个麦克风记录声音而获得的立体声信号,这两个麦克风被布置成 意图是为听众创建自然地三维立体声或空间声音感觉。这样的麦克风布置通常包括仿真 头,其中将在仿真头耳朵中的麦克风放置在真人的每个耳朵附近,或者甚至将两个麦克风 放置成彼此相距人耳的一般距离(通常使得两个麦克风之间的直达声被阻塞)。另一方面, 近远立体声是指与通常通过用两个麦克风记录声音获得的立体声信号兼容的立体声,这两 个麦克风被布置成使得一个麦克风靠近主声源、例如人嘴,而另一麦克风稍微远离(例如, 如果使用规则移动电话形式因子则靠近人耳)并且更专注于记录周围声音。在这样的情况 下,近声道可以直接用作单声输入信号。
[0007] 在使用头戴式耳机进行回放时,双声道立体声记录的感知通常使得正在倾听的人 感觉好像他们自身在记录环境中。另一方面,近远立体声表示可以被回放,使得一个耳朵接 收近声道而另一耳朵接收远声道音频信息。因此,该体验相似于在一个耳朵中收听说话者 而通过另一耳朵收听记录环境的周围声音而非他们自己的环境声音的传统的单耳电话呼 口q。因此这两个现实生活立体声信号类型都可以被认为是向听众提供的、具有记录环境的 自然和孕受:的感觉的表不。
【发明内容】
[0008] 根据第一方面,提供一种方法,包括:分析包括至少两个音频声道的音频信号以确 定与至少两个音频声道之间的差异关联的至少一个参数;取决于至少一个参数来选择多声 道音频信号编码;以及用多声道音频信号编码对音频信号进行编码。
[0009] 分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异 关联的至少一个参数可以包括:生成用于音频信号的至少两个音频声道的频域表示;将用 于音频信号的至少两个音频声道的频域表示划分到至少两个频带中;以及针对频带生成与 两个音频声道之间的差异关联的至少一个参数。
[0010] 参数可以包括以下各项中的至少一项:与至少两个音频声道关联的相对能量信号 电平;与至少两个音频声道关联的相关值;以及与至少两个音频声道关联的时移值。
[0011] 取决于至少一个参数来选择多声道音频信号编码可以包括:选择初始默认多声道 音频信号编码;取决于至少一个参数的第一选择来选择第二音频信号多声道音频信号编 码;以及取决于至少一个参数的第二选择来维持第二音频信号多声道音频信号编码。
[0012] 至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平 与相关值的组合,并且其中取决于至少一个参数的第一选择来选择第二音频信号多声道音 频信号编码可以包括:在组合大于确定阈值的情况下选择第二音频信号多声道音频信号编 码。
[0013] 至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平, 并且其中维持第二音频信号多声道音频信号编码可以包括:在相对能量信号电平小于第二 确定阈值的情况下维持第二音频信号多声道音频信号编码。
[0014] 多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立 体声编码。
[0015] 用多声道音频信号编码对音频信号进行编码可以包括:组合至少两个音频声道以 形成单个组合声道音频信号;对单个组合声道音频信号进行编码;以及通过使用多声道音 频信号编码来生成与至少两个音频声道关联的数据,使得数据使得能够根据单个组合声道 音频信号来重现至少两个音频声道。
[0016] 根据第二方面,提供一种方法,包括:接收编码音频信号;取决于编码音频信号的 第一部分来选择多声道音频信号解码;以及对编码音频信号的第二部分进行解码以致对编 码音频信号的第二部分进行解码生成包括至少两个音频声道的音频信号,该音频信号的第 二部分是利用多声道音频信号编码来编码的。
[0017] 对编码音频信号的第二部分进行解码可以包括:根据编码音频信号的第二部分的 第一分段生成第一声道音频信号;以及取决于由编码音频信号的第一部分所指示的多声道 音频信号解码来根据编码音频信号的第二部分的第二分段生成至少一个另外的声道音频 信号。
[0018] 第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声 道音频信号。
[0019] 第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括 左声道信号和右声道音频信号。
[0020] 根据第三方面,提供一种方法,包括:对于至少包括一对音频声道的音频信号确定 至少一个声道对距离值;用多声道音频信号编码对音频信号进行编码以至少生成编码信号 和差异信号;以及取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效 差异?目号。
[0021] 该方法还可以包括接收所述编码声道距离值。
[0022] 接收所述编码声道距离值可以包括以下各项中的至少一项:根据用户输入确定编 码声道距离值;以及从解码器接收编码声道距离值。
[0023] 该方法可以包括从一对麦克风接收音频信号,其中第一音频声道可以来自第一麦 克风并且第二音频声道可以来自第二麦克风,其中确定至少一个声道对距离值可以包括确 定第一麦克风与第二麦克风之间的距离。
[0024] 根据第四方面,提供一种方法,包括:接收编码信号和等效差异信号;取决于编码 信号和等效差异信号来重现具有确定声道距离的一对音频声道。
[0025] 该方法还可以包括:确定编码声道距离值;以及取决于编码信号、等效差异信号、 编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道。
[0026] 根据第五方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序 的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少 一个处理器一起使该装置至少执行:分析包括至少两个音频声道的音频信号以确定与至少 两个音频声道之间的差异关联的至少一个参数;取决于至少一个参数来选择多声道音频信 号编码;以及用多声道音频信号编码对音频信号进行编码。
[0027] 分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的差异 关联的至少一个参数可以使该装置执行:生成用于音频信号的至少两个音频声道的频域表 示;将用于音频信号的至少两个音频声道的频域表示划分到至少两个频带中;以及针对频 带生成与两个音频声道之间的差异关联的至少一个参数。
[0028] 参数可以包括以下各项中的至少一项:与至少两个音频声道关联的相对能量信号 电平;与至少两个音频声道关联的相关值;以及与至少两个音频声道关联的时移值。
[0029] 取决于至少一个参数来选择多声道音频信号编码可以使该装置执行:选择初始默 认多声道音频信号编码;取决于至少一个参数的第一选择来选择第二音频信号多声道音频 信号编码;以及取决于至少一个参数的第二选择来维持第二音频信号多声道音频信号编 码。
[0030] 至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平 与相关值的组合,并且其中取决于至少一个参数的第一选择来选择第二音频信号多声道音 频信号编码可以使该装置执行:在组合大于确定阈值的情况下选择第二音频信号多声道音 频信号编码。
[0031] 至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平, 并且其中维持第二音频信号多声道音频信号编码可以使该装置执行:在相对能量信号电平 小于第二确定阈值的情况下维持第二音频信号多声道音频信号编码。
[0032] 多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立 体声编码。
[0033] 用多声道音频信号编码对音频信号进行编码可以使该装置执行:组合至少两个音 频声道以形成单个组合声道音频信号;对单个组合声道音频信号进行编码;以及通过使用 多声道音频信号编码来生成与至少两个音频声道关联的数据,使得数据使得能够根据单个 组合声道音频信号来重现至少两个音频声道。
[0034] 根据第六方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序 的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少 一个处理器一起使该装置至少执行:接收编码音频信号;取决于编码音频信号的第一部分 来选择多声道音频信号解码;以及对编码音频信号的第二部分进行解码以致对编码音频信 号的第二部分进行解码生成包括至少两个音频声道的音频信号,该音频信号的第二部分是 利用多声道音频信号编码来编码的。
[0035] 对所述编码音频信号的第二部分进行解码可以使该装置执行:根据编码音频信号 的第二部分的第一分段生成第一声道音频信号;以及取决于由编码音频信号的第一部分所 指示的多声道音频信号解码来根据编码音频信号的第二部分的第二分段生成至少一个另 外的声道音频信号。
[0036] 第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声 道音频信号。
[0037] 第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括 左声道信号和右声道音频信号。
[0038] 根据第七方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序 的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少 一个处理器一起使该装置至少执行:对于至少包括一对音频声道的音频信号确定至少一个 声道对距离值;用多声道音频信号编码对音频信号进行编码以至少生成编码信号和差异信 号;以及取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效差异信号。
[0039] 还可以使该装置执行:接收编码声道距离值。
[0040] 接收所述编码声道距离值可以使该装置执行以下各项中的至少一项:根据用户输 入确定编码声道距离值;以及从解码器接收编码声道距离值。
[0041] 还可以使该装置执行:从一对麦克风接收音频信号,其中第一音频声道可以来自 第一麦克风并且第二音频声道可以来自第二麦克风,其中确定至少一个声道对距离值可以 包括:确定第一麦克风与第二麦克风之间的距离。
[0042] 根据第八方面,提供一种装置,包括至少一个处理器和包含用于一个或多个程序 的计算机程序代码的至少一个存储器,至少一个存储器和计算机程序代码被配置成与至少 一个处理器一起使该装置至少执行:接收编码信号和等效差异信号;以及取决于编码信号 和等效差异信号来重现具有确定声道距离的一对音频声道。
[0043] 还可以使该装置执行:确定编码声道距离值;以及取决于编码信号、等效差异信 号、编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道。
[0044] 根据第九方面,提供一种装置,包括:用于分析包括至少两个音频声道的音频信号 以确定与至少两个音频声道之间的差异关联的至少一个参数的装置;用于取决于至少一个 参数来选择多声道音频信号编码的装置;以及用于用多声道音频信号编码对音频信号进行 编码的装置。
[0045] 用于分析包括至少两个音频声道的音频信号以确定与至少两个音频声道之间的 差异关联的至少一个参数的装置可以包括:用于生成用于音频信号的至少两个音频声道的 频域表示的装置;用于将用于音频信号的至少两个音频声道的频域表示划分到至少两个频 带中的装置;以及用于针对频带生成与两个音频声道之间的差异关联的至少一个参数的装 置。
[0046] 参数可以包括以下各项中的至少一项:与至少两个音频声道关联的相对能量信号 电平;与至少两个音频声道关联的相关值;以及与至少两个音频声道关联的时移值。
[0047] 用于取决于至少一个参数来选择多声道音频信号编码的装置可以包括:用于选择 初始默认多声道音频信号编码的装置;用于取决于至少一个参数的第一选择来选择第二音 频信号多声道音频信号编码的装置;以及用于取决于至少一个参数的第二选择来维持第二 音频信号多声道音频信号编码的装置。
[0048] 至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平 与相关值的组合,并且其中取决于至少一个参数的第一选择来选择第二音频信号多声道音 频信号编码可以包括用于在组合大于确定阈值的情况下选择第二音频信号多声道音频信 号编码的装置。
[0049] 至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平, 并且其中维持第二音频信号多声道音频信号编码可以包括用于在相对能量信号电平小于 第二确定阈值的情况下维持第二音频信号多声道音频信号编码的装置。
[0050] 多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立 体声编码。
[0051] 用于用多声道音频信号编码对音频信号进行编码的装置可以包括:用于组合至少 两个音频声道以形成单个组合声道音频信号的装置;用于对单个组合声道音频信号进行编 码的装置;以及用于通过使用多声道音频信号编码来生成与至少两个音频声道关联的数据 使得数据使得能够根据单个组合声道音频信号来重现至少两个音频声道的装置。
[0052] 根据第十方面,提供一种装置,包括:用于接收编码音频信号的装置;用于取决于 编码音频信号的第一部分来选择多声道音频信号解码的装置;以及用于对编码音频信号的 第二部分进行解码以致对编码音频信号的第二部分进行解码生成包括至少两个音频声道 的音频信号的装置,该音频信号的第二部分是利用多声道音频信号编码来编码的。
[0053] 用于对编码音频信号的第二部分进行解码的装置可以包括:用于根据编码音频信 号的第二部分的第一分段生成第一声道音频信号的装置;以及用于取决于由编码音频信号 的第一部分所指示的多声道音频信号解码来根据编码音频信号的第二部分的第二分段生 成至少一个另外的声道音频信号的装置。
[0054] 第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声 道音频信号。
[0055] 第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括 左声道信号和右声道音频信号。
[0056] 根据第十一方面,提供一种装置,包括:用于对于至少包括一对音频声道的音频信 号确定至少一个声道对距离值的装置;用于用多声道音频信号编码对音频信号进行编码以 至少生成编码信号和差异信号的装置;以及用于取决于差异信号、至少一个声道对距离值 和编码声道距离值来生成等效差异信号的装置。
[0057] 该装置还可以包括用于接收编码声道距离值的装置。
[0058] 用于接收编码声道距离值的装置可以包括以下各项中的至少一项:用于根据用户 输入确定编码声道距离值的装置;以及用于从解码器接收编码声道距离值的装置。
[0059] 该装置还可以包括用于从一对麦克风接收音频信号的装置,其中第一音频声道可 以来自第一麦克风并且第二音频声道可以来自第二麦克风,其中用于确定至少一个声道对 距离值的装置可以包括:用于确定第一麦克风与第二麦克风之间的距离的装置。
[0060] 根据第十二方面,提供一种装置,包括:用于接收编码信号和等效差异信号的装 置;以及用于取决于编码信号和等效差异信号来重现具有确定声道距离的一对音频声道的 装直。
[0061] 该装置可以包括:用于确定编码声道距离值的装置;以及用于取决于编码信号、 等效差异信号、编码声道距离值和期望声道距离来生成具有期望声道距离的一对音频声道 的装置。
[0062] 根据第十三方面,提供一种装置,包括:声道分析器,被配置成分析包括至少两个 音频声道的音频信号以确定与至少两个音频声道之间的差异关联的至少一个参数;编码模 式确定器,被配置成取决于至少一个参数来选择多声道音频信号编码;以及声道编码器,被 配置成用多声道音频信号编码对音频信号进行编码。
[0063] 声道分析器可以包括:时频域转换器,被配置成生成用于音频信号的至少两个音 频声道的频域表示;滤波器,被配置成将用于音频信号的至少两个音频声道的频域表示划 分到至少两个频带中;以及参数确定器,被配置成针对频带生成与两个音频声道之间的差 异关联的至少一个参数。
[0064] 参数确定器可以包括以下各项中的至少一项:相对能量信号电平确定器,被配置 成确定与至少两个音频声道关联的相对能量信号电平;相关性确定器,被配置成确定与至 少两个音频声道关联的相关值;以及偏移确定器,被配置成确定与至少两个音频声道关联 的时移值。
[0065] 编码模式确定器可以被配置成:选择初始默认多声道音频信号编码;取决于至少 一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及取决于至少一个参数 的第二选择来维持第二音频信号多声道音频信号编码。
[0066] 至少一个参数的第一选择可以是与至少两个音频声道关联的相对能量信号电平 与相关值的组合,并且其中编码模式确定器可以被配置成在组合大于确定阈值的情况下选 择第二音频信号多声道音频信号编码。
[0067] 至少一个参数的第二选择可以是与至少两个音频声道关联的相对能量信号电平, 并且其中编码模式确定器可以被配置成在相对能量信号电平小于第二确定阈值的情况下 维持第二音频信号多声道音频信号编码。
[0068] 多声道音频信号编码可以包括以下各项中的至少一项:双声道编码;以及近远立 体声编码。
[0069] 声道编码器可以包括:单声声道生成器,被配置成组合至少两个音频声道以形成 单个组合声道音频信号;单声声道编码器,被配置成对单个组合声道音频信号进行编码; 以及另外的声道编码器,被配置成通过使用多声道音频信号编码来生成与至少两个音频声 道关联的数据,使得数据使得能够根据单个组合声道音频信号来重现至少两个音频声道。
[0070] 根据第十四方面,提供一种装置,包括:输入,被配置成接收编码音频信号;多声 道解码确定器,被配置成取决于编码音频信号的第一部分来选择多声道音频信号解码模 式;以及多声道解码器,被配置成对编码音频信号的第二部分进行解码以致解码所述编码 音频信号的第二部分生成包括至少两个音频声道的音频信号,该音频信号的第二部分是利 用多声道音频信号编码来编码的。
[0071] 多声道解码器可以包括:单声声道生成器,被配置成根据编码音频信号的第二部 分的第一分段生成第一声道音频信号;以及立体声声道生成器,被配置成取决于由编码音 频信号的第一部分所指示的多声道音频信号解码来根据编码音频信号的第二部分的第二 分段生成至少一个另外的声道音频信号。
[0072] 第一声道可以是左声道音频信号,并且至少一个另外的声道音频信号可以是右声 道音频信号。
[0073] 第一声道可以是组合声道音频信号,并且至少一个另外的声道音频信号可以包括 左声道信号和右声道音频信号。
[0074] 根据第十五方面,提供一种装置,包括:声道距离确定器,被配置成对于至少包括 一对音频声道的音频信号确定至少一个声道对距离值;多声道编码器,被配置成用多声道 音频信号编码对音频信号进行编码以至少生成编码信号和差异信号;以及等效器,被配置 成取决于差异信号、至少一个声道对距离值和编码声道距离值来生成等效差异信号。
[0075] 该装置还可以包括被配置成接收编码声道距离值的输入。
[0076] 该输入可以包括以下各项中的至少一项:用户输入,被配置成确定编码声道距离 值;以及编解码器握手输入,被配置成从解码器接收编码声道距离值。
[0077] 该装置可以包括被配置成从一对麦克风接收音频信号的输入,其中第一音频声道 可以来自第一麦克风并且第二音频声道可以来自第二麦克风,其中声道距离确定器还可以 包括被配置成确定第一麦克风与第二麦克风之间的距离。
[0078] 根据第十六方面,提供一种装置,包括:输入,被配置成接收编码信号和等效差异 信号;以及声道距离解码器,被配置成取决于编码信号和等效差异信号来重现具有确定声 道距离的一对音频声道。
[0079] 该装置可以包括:编码声道距离值确定器,被配置成确定编码声道距离值;以及 音频声道生成器,被配置成取决于编码信号、等效差异信号、编码声道距离值和期望声道距 离来生成具有期望声道距离的一对音频声道。
[0080] 一种计算机程序产品,使得装置执行如本文中所描述的方法。
[0081] 一种电子设备,可以包括如本文中所描述的装置。
[0082] 一种芯片组,可以包括如本文中所描述的装置。
【专利附图】
【附图说明】
[0083] 为了更好地理解本发明,现在将通过示例对附图进行参考,其中:
[0084] 图1示意性地示出采用一些实施例的电子设备;
[0085] 图2示意性地示出根据一些实施例的音频编解码系统;
[0086] 图3示意性地示出根据一些实施例的如图2中所示的编解码器;
[0087] 图4示意性地示出根据一些实施例的如图3中更具体地示出的声道分析器;
[0088] 图5示意性地示出根据一些实施例的如图3中更具体地示出的声道编码器; [0089] 图6示出根据一些实施例的图示在图2中所示的编码器的操作的流程图;
[0090] 图7示出根据一些实施例的图示如图4中所示的声道分析器的操作的流程图;
[0091] 图8示出根据一些实施例的图示如图5中所示的声道编码器的操作的流程图;
[0092] 图9示意性地示出根据一些实施例的如图2中所示的解码器;
[0093] 图10示出根据一些实施例的图示如图9中所示的解码器的操作的流程图;
[0094] 图11和图12示出在使用如本文中所描述的实施例时的示例模式选择;
[0095] 图13示出针对在其之间具有各种距离的两个麦克风的、根据不同角度的声音的 时间差。
【具体实施方式】
[0096] 以下更具体地描述可能的立体声语音和音频编解码器、包括分层或可扩展可变速 率语音和音频编解码器。在这点上,首先对图1进行参考,其示出示例性电子设备或装置10 的示意性框图,其可以包含根据本申请的实施例的编解码器。
[0097] 装置10例如可以是无线通信系统的移动终端或用户设备。在其他实施例中,装置 10可以是音频-视频设备,诸如摄像机、电视(TV)接收器、音频记录器、或者音频播放器诸 如mp3记录器/播放器、媒体记录器(也称为mp4记录器/播放器)、或者适于处理音频信 号的任何计算机。
[0098] 电子设备或装置10在一些实施例中包括麦克风11,其经由模数转换器(ADC) 14链 接至处理器21。该处理器21还经由数模转换器(DAC)32链接至扬声器33。该处理器21 还链接至收发器(RX/TX) 13、至用户界面(UI) 15以及至存储器22。
[0099] 该处理器21在一些实施例中可以被配置成执行各种程序代码。所实施的程序代 码在一些实施例中包括如本文中所描述的多声道或立体声编码或解码代码。所实施的程序 代码23在一些实施例中可以存储在例如存储器22中用于由处理器22在任何需要的时候 获取。存储器22还可以提供用于存储数据、例如已经根据应用被编码的数据的部分24。
[0100] 实施例中的编码和解码代码可以被实施在硬件和/或固件中。
[0101] 用户界面15使得用户能够例如经由键盘向电子设备10输入命令,和/或例如经 由显示器从电子设备10获得信息。在一些实施例中,触摸屏可以提供用于用户界面的输入 和输出功能二者。该装置10在一些实施例中包括适于例如经由无线通信网络实现与其他 装置的通信的收发器13。
[0102] 还应当理解,可以用很多方式对装置10的结构进行补充和变化。
[0103] 装置10的用户例如可以使用麦克风11用于输入要向一些其他装置传输或者要在 存储器22的数据部分24中存储的语音或其他音频信号。为此可以在一些实施例中由用户 经由用户界面15来实现对应应用。这一应用在这些实施例中可以由处理器21来执行,使 处理器21执行存储器22中所存储的编码代码。
[0104] 模数转换器(ADC) 14在一些实施例中将输入模拟音频信号转换成数字音频信号 并且向处理器21提供数字音频信号。在一些实施例中,麦克风11可以包括集成麦克风和 ADC功能并且直接向处理器提供数字音频信号用于处理。
[0105] 处理器21在这样的实施例中因此以与参考图2至图10描述的相同的方式处理数 字音频信号。
[0106] 所得比特流在一些实施例中可以被提供至收发器13用于向另一装置传输。备选 地,编码音频数据在一些实施例中可以存储在存储器22的数据部分22中,比如用于稍后传 输或者用于同一装置10稍后呈现.
[0107] 该装置10在一些实施例中还可以经由收发器13从另一装置接收具有对应编码数 据的比特流。在这一示例中,处理器21可以执行存储器22中所存储的解码程序代码。处 理器21在这样的实施例中对所接收的数据进行解码,并且向数模转换器32提供解码数据。 数模转换器32将数字解码数据转换成模拟音频数据并且在一些实施例中可以经由扬声器 33输出模拟音频。解码程序代码的执行在一些实施例中也可以由用户经由用户界面15调 用的应用来触发。
[0108] 所接收的编码数据在一些实施例中代替经由扬声器33的中间呈现,还可以被存 储在存储器22的数据部分24中,比如用于稍后解码和呈现或者解码和向又一装置转发。
[0109] 应当理解,在图3至图5和图9中所描述的示意性结构以及在图6至图8和图10 中所示出的方法步骤仅代表音频编解码器的操作的部分并且具体是如在图1中所示的装 置中示例性地示出实施的立体声编码器/解码器装置和方法的一部分。
[0110] 图2中示出如实施例所采用的音频编解码器的总体操作。普通音频编码/解码系 统包括编码器和解码器二者,如图2中示意性地图示的。然而,应当理解,一些实施例可以 实施编码器或解码器中的任一个、或者编码器和解码器二者。图2图示的是具有编码器104 并且具体是立体声编码器151、存储或介质声道106和解码器108的系统102。应当理解, 如以上所描述的,一些实施例可以包括或者实施编码器104或解码器108中的一个、或者编 码器104和解码器108二者。
[0111] 编码器104压缩输入音频信号110从而产生比特流112,该比特流112在一些实施 例中可以通过介质声道106来存储或传输。编码器104还可以包括立体声编码器151作为 整个编码操作的部分。应当理解,立体声编码器可以是整个编码器104的部分或者单独的 编码模块。编码器104还可以包括对多于两个音频信号进行编码的多声道编码器。
[0112] 比特流112可以在解码器108内被接收。该解码器108对比特流112解压缩并且 产生输出音频信号114。解码器108可以包括立体声解码器作为整个解码操作的部分。应 当理解,立体声解码器可以是整个解码器108的部分或者单独的解码模块。解码器108还可 以包括对多于两个音频信号进行解码的多声道解码器。与输入信号110有关的比特流112 的比特率和输出音频信号114的质量是限定编码系统102的性能的主要特征。
[0113] 图3示意性地示出根据一些实施例的编码器104。
[0114] 图6在流程图中示意性地示出根据一些实施例的编码器104的操作。
[0115] 如本文中所描述的实施例的概念是确定和应用立体声编码模式以产生高效高质 量且低比特率的现实生活立体声信号编码。在这方面,关于图3,示出根据一些实施例的示 例编码器104。另外,关于图6,更具体地示出编码器104的操作。
[0116] 编码器104在一些实施例中包括帧分段器/变换器201。帧分段器/变换器201 被配置成接收左右(或者更一般地为多声道音频表示)输入音频信号并且生成待分析和编 码的这些音频信号的频域表示。这些频域表示可以被传递至声道参数确定器203。
[0117] 在一些实施例中,帧分段器/变换器可以被配置成将音频信号数据分段或分割成 适于频域变换的部分或者帧。帧分段器/变换器201在一些实施例中还可以被配置成根据 任何合适的开窗函数对音频信号数据的这些帧或分段进行开窗。例如,帧分段器/变换器 201可以被配置成生成与在前帧和在后帧各自重叠 IOms的20ms的帧。
[0118] 在一些实施例中,帧分段器/变换器可以被配置成对音频信号数据执行任何合适 的时频域变换。例如,时频域变换可以是离散傅里叶变换(DFT)、快速傅里叶变换(FFT)Jf 改的离散余弦变换(MDCT)。在以下示例中,使用快速傅里叶变换(FFT)。另外,可以进一步 处理时频域变换的输出,以生成每个输入声道音频信号数据的单独的频带域表示。这些带 可以以任何合适的方式布置。例如,这些带可以被线性间隔,或者在感觉或心理声学上被分 配。
[0119] 图6中用步骤501示出生成音频帧带频域表示的操作。
[0120] 在一些实施例中,该频域表示被传递至声道分析器。
[0121] 在一些实施例中,编码器包括声道分析器203。声道分析器203可以被配置成分析 频域音频信号并且确定与每个声道的每个带关联的参数并且向编码模式确定器205输出 这些参数值。
[0122] 关于图4,更具体地描述根据一些实施例的示例声道分析器203。另外,关于图7, 示出如图4中所示的根据一些实施例的声道分析器203的操作。
[0123] 在一些实施例中,声道分析器203包括相对能量信号电平确定器301。该相对能量 信号电平确定器301被配置成接收输出频域表示并且对于每个带确定声道对之间的相对 信号电平。应当理解,在以下示例中,分析和处理单个声道对,然而,这可以通过多声道系统 的合适的配对而被扩展至任何数目的声道。
[0124] 在一@实施例中,对于毎个带的相对电平可以通过#用以下代码来计算。
【权利要求】
1. 一种方法,包括: 分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异 关联的至少一个参数; 取决于所述至少一个参数来选择多声道音频信号编码;以及 用所述多声道音频信号编码对所述音频信号进行编码。
2. 根据权利要求1所述的方法,其中分析包括至少两个音频声道的音频信号以确定与 所述至少两个音频声道之间的差异关联的至少一个参数包括: 生成用于所述音频信号的所述至少两个音频声道的频域表示; 将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个频带 中;以及 针对频带生成与两个音频声道之间的所述差异关联的至少一个参数。
3. 根据权利要求1和2所述的方法,其中所述参数包括以下各项中的至少一项: 与所述至少两个音频声道关联的相对能量信号电平; 与所述至少两个音频声道关联的相关值;以及 与所述至少两个音频声道关联的时移值。
4. 根据权利要求1至3所述的方法,其中取决于所述至少一个参数来选择多声道音频 信号编码包括: 选择初始默认多声道音频信号编码; 取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及 取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码。
5. 根据权利要求4所述的方法,其中所述至少一个参数的所述第一选择是与所述至少 两个音频声道关联的相对能量信号电平与相关值的组合,并且其中取决于所述至少一个参 数的第一选择来选择所述第二音频信号多声道音频信号编码包括:在所述组合大于确定阈 值的情况下选择所述第二音频信号多声道音频信号编码。
6. 根据权利要求4和5所述的方法,其中所述至少一个参数的所述第二选择是与所述 至少两个音频声道关联的相对能量信号电平,并且其中维持所述第二音频信号多声道音频 信号编码包括:在所述相对能量信号电平小于第二确定阈值的情况下维持所述第二音频信 号多声道音频信号编码。
7. 根据权利要求1至6所述的方法,其中所述多声道音频信号编码包括以下各项中的 至少一项: 双声道编码;以及 近远立体声编码。
8. 根据权利要求1至7所述的方法,其中用所述多声道音频信号编码对所述音频信号 进行编码包括: 组合所述至少两个音频声道以形成单个组合声道音频信号; 对所述单个组合声道音频信号进行编码;以及 使用所述多声道音频信号编码来生成与所述至少两个音频声道关联的数据,以致所述 数据使得能够根据所述单个组合声道音频信号来重现所述至少两个音频声道。
9. 一种方法,包括: 接收编码音频信号; 取决于所述编码音频信号的第一部分来选择多声道音频信号解码;以及 对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二部分 进行解码生成包括至少两个音频声道的音频信号,所述音频信号的所述第二部分是利用多 声道音频信号编码来编码的。
10. 根据权利要求9所述的方法,其中对所述编码音频信号的第二部分进行解码包括: 根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号;以及 取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码来根 据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号。
11. 根据权利要求10所述的方法,其中所述第一声道是左声道音频信号,并且所述至 少一个另外的声道音频信号是右声道音频信号。
12. 根据权利要求10所述的方法,其中所述第一声道是组合声道音频信号,并且所述 至少一个另外的声道音频信号包括左声道信号和右声道音频信号。
13. -种方法,包括: 对于至少包括一对音频声道的音频信号确定至少一个声道对距离值; 用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信号;以 及 取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效差异 信号。
14. 根据权利要求13所述的方法,还包括接收所述编码声道距离值。
15. 根据权利要求14所述的方法,其中接收所述编码声道距离值包括以下各项中的至 少一项: 根据用户输入确定编码声道距离值;以及 从解码器接收编码声道距离值。
16. 根据权利要求13至15所述的方法,包括从一对麦克风接收所述音频信号,其中第 一音频声道来自第一麦克风并且第二音频声道来自第二麦克风,其中确定所述至少一个声 道对距离值包括确定所述第一麦克风与所述第二麦克风之间的距离。
17. -种方法,包括: 接收编码号和等效差异号; 取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频声道。
18. 根据权利要求17所述的方法,还包括: 确定编码声道距离值;以及 取决于所述编码信号、所述等效差异信号、所述编码声道距离值和期望声道距离来生 成具有所述期望声道距离的一对音频声道。
19. 一种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的 至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处 理器一起使所述装置至少执行: 分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的差异 关联的至少一个参数; 取决于所述至少一个参数来选择多声道音频信号编码;以及 用所述多声道音频信号编码对所述音频信号进行编码。
20. 根据权利要求19所述的装置,其中分析包括至少两个音频声道的音频信号以确定 与所述至少两个音频声道之间的差异关联的至少一个参数使所述装置执行: 生成用于所述音频信号的所述至少两个音频声道的频域表示; 将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个频带 中;以及 针对频带生成与两个音频声道之间的所述差异关联的至少一个参数。
21. 根据权利要求19和20所述的装置,其中所述参数包括以下各项中的至少一项: 与所述至少两个音频声道关联的相对能量信号电平; 与所述至少两个音频声道关联的相关值;以及 与所述至少两个音频声道关联的时移值。
22. 根据权利要求19至21所述的装置,其中取决于所述至少一个参数来选择多声道音 频信号编码使所述装置执行: 选择初始默认多声道音频信号编码; 取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及 取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码。
23. -种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的 至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处 理器一起使所述装置至少执行: 接收编码音频信号; 取决于所述编码音频信号的第一部分来选择多声道音频信号解码;以及 对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二部分 进行解码生成包括至少两个音频声道的音频信号,所述音频信号的所述第二部分是利用多 声道音频信号编码来编码的。
24. 根据权利要求23所述的装置,其中对所述编码音频信号的第二部分进行解码使所 述装置执行: 根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号;以及 取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码来根 据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号。
25. -种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的 至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处 理器一起使所述装置至少执行: 对于至少包括一对音频声道的音频信号确定至少一个声道对距离值; 用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信号;以 及 取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效差异 信号。
26. -种装置,包括至少一个处理器和包含用于一个或多个程序的计算机程序代码的 至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置成与所述至少一个处 理器一起使所述装置至少执行: 接收编码号和等效差异号; 取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频声道。
27. -种装置,包括: 用于分析包括至少两个音频声道的音频信号以确定与所述至少两个音频声道之间的 差异关联的至少一个参数的装置; 用于取决于所述至少一个参数来选择多声道音频信号编码的装置;以及 用于用所述多声道音频信号编码对所述音频信号进行编码的装置。
28. 根据权利要求27所述的装置,其中用于分析包括至少两个音频声道的音频信号以 确定与所述至少两个音频声道之间的差异关联的至少一个参数的所述装置包括: 用于生成用于所述音频信号的所述至少两个音频声道的频域表示的装置; 用于将用于所述音频信号的所述至少两个音频声道的所述频域表示划分到至少两个 频带中的装置;以及 用于针对频带生成与两个音频声道之间的所述差异关联的至少一个参数的装置。
29. 根据权利要求27和28所述的装置,其中所述参数包括以下各项中的至少一项: 与所述至少两个音频声道关联的相对能量信号电平; 与所述至少两个音频声道关联的相关值;以及 与所述至少两个音频声道关联的时移值。
30. 根据权利要求27至29所述的装置,其中用于取决于所述至少一个参数来选择多声 道音频信号编码的所述装置包括: 用于选择初始默认多声道音频信号编码的装置; 用于取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码 的装置;以及 用于取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号 编码的装置。
31. -种装置,包括: 用于接收编码音频信号的装置; 用于取决于所述编码音频信号的第一部分来选择多声道音频信号解码的装置;以及 用于对所述编码音频信号的第二部分进行解码以致对所述编码音频信号的所述第二 部分进行解码生成包括至少两个音频声道的音频信号的装置,所述音频信号的所述第二部 分是利用多声道音频信号编码来编码的。
32. 根据权利要求31所述的装置,其中用于对所述编码音频信号的第二部分进行解码 的所述装置包括: 用于根据所述编码音频信号的所述第二部分的第一分段生成第一声道音频信号的装 置;以及 用于取决于由所述编码音频信号的所述第一部分所指示的所述多声道音频信号解码 来根据所述编码音频信号的所述第二部分的第二分段生成至少一个另外的声道音频信号 的装置。
33. -种装置,包括: 用于对于至少包括一对音频声道的音频信号确定至少一个声道对距离值的装置; 用于用多声道音频信号编码对所述音频信号进行编码以至少生成编码信号和差异信 号的装置;以及 用于取决于所述差异信号、所述至少一个声道对距离值和编码声道距离值来生成等效 差异信号的装置。
34. -种装置,包括: 用于接收编码信号和等效差异信号的装置;以及 用于取决于所述编码信号和所述等效差异信号来重现具有确定声道距离的一对音频 声道的装置。
35. -种装置,包括: 声道分析器,被配置成分析包括至少两个音频声道的音频信号以确定与所述至少两个 音频声道之间的差异关联的至少一个参数; 编码模式确定器,被配置成取决于所述至少一个参数来选择多声道音频信号编码;以 及 声道编码器,被配置成用所述多声道音频信号编码对所述音频信号进行编码。
36. 根据权利要求35所述的装置,其中所述声道分析器包括: 时频域转换器,被配置成生成用于所述音频信号的所述至少两个音频声道的频域表 示; 滤波器,被配置成将用于所述音频信号的所述至少两个音频声道的所述频域表示划分 到至少两个频带中;以及 参数确定器,被配置成针对频带生成与两个音频声道之间的所述差异关联的至少一个 参数。
37. 根据权利要求35和36所述的装置,其中所述参数确定器包括以下各项中的至少一 项: 相对能量信号电平确定器,被配置成确定与所述至少两个音频声道关联的相对能量信 号电平; 相关性确定器,被配置成确定与所述至少两个音频声道关联的相关值;以及 偏移确定器,被配置成确定与所述至少两个音频声道关联的时移值。
38. 根据权利要求35至37所述的装置,其中所述编码模式确定器被配置成: 选择初始默认多声道音频信号编码; 取决于所述至少一个参数的第一选择来选择第二音频信号多声道音频信号编码;以及 取决于所述至少一个参数的第二选择来维持所述第二音频信号多声道音频信号编码。
39. -种装置,包括: 输入,被配置成接收编码音频信号; 多声道解码确定器,被配置成取决于所述编码音频信号的第一部分来选择多声道音频 信号解码模式;以及 多声道解码器,被配置成对所述编码音频信号的第二部分进行解码以致对所述编码音 频信号的所述第二部分进行解码生成包括至少两个音频声道的音频信号,所述音频信号的 所述第二部分是利用多声道音频信号编码来编码的。
40. 根据权利要求39所述的装置,其中所述多声道解码器包括: 单声声道生成器,被配置成根据所述编码音频信号的所述第二部分的第一分段生成第 一声道音频信号;以及 立体声声道生成器,被配置成取决于由所述编码音频信号的所述第一部分所指示的所 述多声道音频信号解码来根据所述编码音频信号的所述第二部分的第二分段生成至少一 个另外的声道音频信号。
41. 一种装置,包括: 声道距离确定器,被配置成对于至少包括一对音频声道的音频信号确定至少一个声道 对距离值; 多声道编码器,被配置成用多声道音频信号编码对所述音频信号进行编码以至少生成 编码信号和差异信号;以及 等效器,被配置成取决于所述差异信号、所述至少一个声道对距离值和编码声道距离 值来生成等效差异信号。
42. -种装置,包括: 输入,被配置成接收编码信号和等效差异信号;以及 声道距离解码器,被配置成取决于所述编码信号和所述等效差异信号来重现具有确定 声道距离的一对音频声道。
43. -种计算机程序产品,用于使装置执行根据权利要求1至19中的任一项所述的方 法。
44. 一种电子设备,包括根据权利要求14至42所述的装置。
45. -种芯片组,包括根据权利要求14至42所述的装置。
【文档编号】G10L19/008GK104364842SQ201280073988
【公开日】2015年2月18日 申请日期:2012年4月18日 优先权日:2012年4月18日
【发明者】M·维勒莫, M·塔米, A·拉莫, A·瓦西拉切, L·拉克索南 申请人:诺基亚公司