一种音频采集的方法及装置与流程

文档序号：14197582阅读：206来源：国知局

本申请涉及音频处理技术领域，特别涉及一种音频采集的方法及装置。

背景技术：

随着科学技术的发展，各个领域对于音频质量的追求越来越高，音频研究的对象由最初的单路音频(mono)，逐渐过渡到立体声(stereo)、环绕声(surround)以及3d(3-dimensional)音频。相应的音频采集设备也由单麦克采集设备逐渐过渡到多麦克(麦克风阵列)采集设备。

现有的麦克风阵列采集中，通常是设置在固定放置方式下或者采用可旋转的机械装置，基于麦克风阵列获得多声道音频后进一步存储多声道音频，得到音频文件，具体流程为：

1.基于麦克风阵列获取多声道音频；

2.存储多声道音频，得到音频文件。

然而，当音频采集设备的放置方式发生变化时，普通用户无法旋转或者不知如何正确旋转，导致采集到的音频中包含的方位信息是不正确的，从而使得得到的音频文件播放效果不佳。

技术实现要素：

本申请的目的在于提供一种音频采集的方法及装置，能够得到高音质的音频文件。

为实现上述目的，本申请提供一种音频采集的方法，所述方法包括：基于麦克风阵列获取多声道音频信号；结合音频采集设备放置方式信息，对所述多声道音频信号进行调整；存储调整后的多声道音频信号，以得到音频文件。

进一步地，基于麦克风阵列获取多声道音频信号包括：

基于麦克风阵列获得ambisonica格式的4路音频信号，所述4路音频信号包括左前路音频信号、右前路音频信号、左后路音频信号以及右后路音频信号。

进一步地，结合音频采集设备放置方式信息，对所述多声道音频信号进行调整包括：

获得俯仰角参数、倾斜角参数以及首向角参数这三种放置方式信息；

按照下述公式将ambisonica格式的音频信号转换为ambisonicb格式的音频信号：

其中，表示ambisonicb格式的4路音频信号，表示ambisonica格式的4路音频信号，a为将ambisonica格式音频信号转换为ambisonicb格式音频信号的转换矩阵；

结合上述的三种放置方式信息，并按照下述公式确定旋转矩阵：

其中，αb表示倾斜角参数，αp表示俯仰角参数，αh表示首向角参数，arotate表示所述旋转矩阵；

基于所述旋转矩阵，对所述ambisonicb格式的4路音频信号进行旋转后得到：

其中，表示旋转后的ambisonicb格式的4路音频信号，arotate_ij表示所述旋转矩阵中第i行第j列的元素；

将旋转后的ambisonicb格式的4路音频信号转换为ambisonica格式的4路音频信号；

其中，表示转换得到的ambisonica格式的4路音频信号，b为将ambisonicb格式音频信号转换为ambisonica格式音频信号的转换矩阵。

进一步地，存储调整后的多声道音频信号，以得到音频文件包括：

存储转换得到的ambisonica格式的4路音频信号或者存储所述旋转后的ambisonicb格式的4路音频信号，以得到音频文件。

进一步地，结合音频采集设备放置方式信息，对所述多声道音频信号进行调整包括：

结合音频采集设备获得竖直放置信息和水平放置信息；

当音频采集设备的放置方式为竖直放置时，将ambisonica格式的音频信号中的左前路音频信号和右后路音频信号分别作为左声道音频信号和右声道音频信号；

当音频采集设备的放置方式为水平放置时，按照下述公式根据ambisonica格式的音频信号中的左前路音频信号和右后路音频信号得到左声道音频信号：

l＝w1*lfu+w2*rbu

其中，l表示左声道音频信号，w1和w2为介于0和1之间的权重系数，且w1+w2＝1；lfu表示左前路音频信号，rbu表示右后路音频信号；

按照下述公式根据ambisonica格式的音频信号中的右前路音频信号和左后路音频信号得到右声道音频信号：

r＝w3*rfd+w4*lbd

其中，r表示右声道音频信号，w3和w4为介于0和1之间的权重系数，且w3+w4＝1；rfd表示右前路音频信号，lbd表示左后路音频信号。

进一步地，存储调整后的多声道音频信号，以得到音频文件包括：

存储得到的左声道音频信号和右声道音频信号，以得到音频文件。

本申请还提供一种音频采集的装置，所述装置包括：

多声道音频信号获取单元，用于基于麦克风阵列获取多声道音频信号；

音频调整单元，用于结合音频采集设备放置方式信息，对所述多声道音频信号进行调整；

存储单元，用于存储调整后的多声道音频信号，以得到音频文件。

进一步地，所述多声道音频信号获取单元还用于基于麦克风阵列获得ambisonica格式的4路音频信号，所述4路音频信号包括左前路音频信号、右前路音频信号、左后路音频信号以及右后路音频信号。

相应地，所述音频调整单元包括：

参数获取模块，用于获得俯仰角参数、倾斜角参数以及首向角参数这三种放置方式信息；

格式转换模块，用于按照下述公式将ambisonica格式的音频信号转换为ambisonicb格式的音频信号：

其中，表示ambisonicb格式的4路音频信号，表示ambisonica格式的4路音频信号，a为将ambisonica格式音频信号转换为ambisonicb格式音频信号的转换矩阵；

旋转矩阵确定模块，用于结合上述的三种放置方式信息，并按照下述公式确定旋转矩阵：

其中，αb表示倾斜角参数，αp表示俯仰角参数，αh表示首向角参数，arotate表示所述旋转矩阵；

旋转模块，用于基于所述旋转矩阵，对所述ambisonicb格式的4路音频信号进行旋转后得到：

其中，表示旋转后的ambisonicb格式的4路音频信号，arotate_ij表示所述旋转矩阵中第i行第j列的元素；

转换模块，用于将旋转后的ambisonicb格式的4路音频信号转换为ambisonica格式的4路音频信号；

其中，表示转换得到的ambisonica格式的4路音频信号，b为将ambisonicb格式音频信号转换为ambisonica格式音频信号的转换矩阵。

进一步地，所述存储单元还用于存储转换得到的ambisonica格式的4路音频信号或者存储所述旋转后的ambisonicb格式的4路音频信号，以得到音频文件。

相应地，所述音频调整单元包括：

信息采集模块，用于获得竖直放置信息和水平放置信息；

竖直处理模块，用于当音频采集设备的放置方式为竖直放置时，将ambisonica格式的音频信号中的左前路音频信号和右后路音频信号分别作为左声道音频信号和右声道音频信号；

水平处理模块，用于当音频采集设备的放置方式为水平放置时，按照下述公式根据ambisonica格式的音频信号中的左前路音频信号和右后路音频信号得到左声道音频信号：

l＝w1*lfu+w2*rbu

其中，l表示左声道音频信号，w1和w2为介于0和1之间的权重系数，且w1+w2＝1；lfu表示左前路音频信号，rbu表示右后路音频信号；

按照下述公式根据ambisonica格式的音频信号中的右前路音频信号和左后路音频信号得到右声道音频信号：

r＝w3*rfd+w4*lbd

其中，r表示右声道音频信号，w3和w4为介于0和1之间的权重系数，且w3+w4＝1；rfd表示右前路音频信号，lbd表示左后路音频信号。

由上可见，本申请提供的技术方案，在通过麦克风阵列获取到多声道的音频信号后，可以通过音频采集设备或者结合与音频采集设备相连接的外接设备获得音频采集设备的放置方式信息，进一步根据音频采集设备的放置方式信息，对采集的音频信号进行调整。例如，可以基于俯仰角(pitch)参数、倾斜角(bank)参数以及首向角(heading)参数对音频信号进行调整，还可以基于音频采集设备的竖直放置方式或者水平放置方式进行调整。这样便可以保证采集音频中方位信息的正确性，从而可以提高音频信号的播放效果。

附图说明

图1为本申请中音频采集的方法流程图；

图2为本申请中四路音频信号的示意图；

图3为本申请中音频采集的方法的第一实施流程图；

图4为本申请中音频采集的方法的第二实施流程图；

图5为本申请中音频采集的装置结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施方式中的附图，对本申请实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本申请一部分实施方式，而不是全部的实施方式。基于本申请中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施方式，都应当属于本申请保护的范围。

请参阅图1，本申请提供一种音频采集的方法，所述方法包括：

s1：基于麦克风阵列获取多声道音频信号；

s2：结合音频采集设备放置方式信息，对所述多声道音频信号进行调整；

s3：存储调整后的多声道音频信号，以得到音频文件。

请结合图3，在一个实施方式中，首先可以基于麦克风阵列获得ambisonica格式的4路音频信号，所述4路音频信号包括左前路音频信号(left-front-up，lfu)、右前路音频信号(right-front-down，rfd)、左后路音频信号(left-back-down，lbd)以及右后路音频信号(right-back-up，rbu)，具体请参阅图2。

然后，通过音频采集设备或者与音频采集设备相连接的外部设备(例如手机、ipad、耳机等)获得俯仰角(pitch)参数、倾斜角(bank)参数以及首向角(heading)参数这三种放置方式信息；

按照下述公式将ambisonica格式的音频信号转换为ambisonicb格式的音频信号：

其中，表示ambisonicb格式的4路音频信号，表示ambisonica格式的4路音频信号，a为将ambisonica格式音频信号转换为ambisonicb格式音频信号的转换矩阵；

结合上述的三种放置方式信息，并按照下述公式确定旋转矩阵：

其中，αb表示倾斜角(bank)参数，αp表示俯仰角(pitch)参数，αh表示首向角(heading)参数，arotate表示所述旋转矩阵；

基于所述旋转矩阵，对所述ambisonicb格式的4路音频信号进行旋转后得到：

其中，表示旋转后的ambisonicb格式的4路音频信号，arotate_ij表示所述旋转矩阵中第i行第j列的元素；

将旋转后的ambisonicb格式的4路音频信号转换为ambisonica格式的4路音频信号；

其中，表示转换得到的ambisonica格式的4路音频信号，b为将ambisonicb格式音频信号转换为ambisonica格式音频信号的转换矩阵。

这样，存储转换得到的ambisonica格式的4路音频信号或者存储所述旋转后的ambisonicb格式的4路音频信号，便可以得到音频文件。

请结合图4，在另一个实施方式中，可以结合音频采集设备或者与音频采集设备相连接的外接设备(例如手机、ipad、耳机等)获得竖直放置信息和水平放置信息；

当音频采集设备的放置方式为水平放置时，按照下述公式根据ambisonica格式的音频信号中的左前路音频信号和右后路音频信号得到左声道音频信号：

l＝w1*lfu+w2*rbu

其中，l表示左声道音频信号，w1和w2为介于0和1之间的权重系数，且w1+w2＝1；lfu表示左前路音频信号，rbu表示右后路音频信号；

按照下述公式根据ambisonica格式的音频信号中的右前路音频信号和左后路音频信号得到右声道音频信号：

r＝w3*rfd+w4*lbd

其中，r表示右声道音频信号，w3和w4为介于0和1之间的权重系数，且w3+w4＝1；rfd表示右前路音频信号，lbd表示左后路音频信号。

这样，可以存储得到的左声道音频信号和右声道音频信号，从而可以得到stereo音频文件。

请参阅图5，本申请还提供一种音频采集的装置，所述装置包括：

多声道音频信号获取单元100，用于基于麦克风阵列获取多声道音频信号；

音频调整单元200，用于结合音频采集设备放置方式信息，对所述多声道音频信号进行调整；

存储单元300，用于存储调整后的多声道音频信号，以得到音频文件。

在本实施方式中，所述多声道音频信号获取单元还用于基于麦克风阵列获得ambisonica格式的4路音频信号，具体为lfu、rfd、lbd、rbu，请参阅图2。

相应地，所述音频调整单元包括：

参数获取模块，用于通过音频采集设备或者与音频采集设备相连接的外部设备，获得俯仰角(pitch)参数、倾斜角(bank)参数以及首向角(heading)参数这三种放置方式信息；

格式转换模块，用于按照下述公式将ambisonica格式的音频信号转换为ambisonicb格式的音频信号：

其中，表示ambisonicb格式的4路音频信号，表示ambisonica格式的4路音频信号，a为将ambisonica格式音频信号转换为ambisonicb格式音频信号的转换矩阵；

旋转矩阵确定模块，用于结合上述的三种放置方式信息，并按照下述公式确定旋转矩阵：

其中，αb表示倾斜角(bank)参数，αp表示俯仰角(pitch0参数，αh表示首向角(heading)参数，arotate表示所述旋转矩阵；

旋转模块，用于基于所述旋转矩阵，对所述ambisonicb格式的4路音频信号进行旋转后得到：

其中，表示旋转后的ambisonicb格式的4路音频信号，arotate_ij表示所述旋转矩阵中第i行第j列的元素；

转换模块，用于将旋转后的ambisonicb格式的4路音频信号转换为ambisonica格式的4路音频信号；

其中，表示转换得到的ambisonica格式的4路音频信号，b为将ambisonicb格式音频信号转换为ambisonica格式音频信号的转换矩阵。

在本实施方式中，所述存储单元还用于存储转换得到的ambisonica格式的4路音频信号或者旋转后的ambisonicb格式的4路音频信号，以得到音频文件。

相应地，所述音频调整单元包括：

信息采集模块，用于结合音频采集设备或者与音频采集设备相连接的外接设备，获得竖直放置信息和水平放置信息；

l＝w1*lfu+w2*rbu

其中，l表示左声道音频信号，w1和w2为介于0和1之间的权重系数，且w1+w2＝1；lfu表示左前路音频信号，rbu表示右后路音频信号；

按照下述公式根据ambisonica格式的音频信号中的右前路音频信号和左后路音频信号得到右声道音频信号：

r＝w3*rfd+w4*lbd

其中，r表示右声道音频信号，w3和w4为介于0和1之间的权重系数，且w3+w4＝1；rfd表示右前路音频信号，lbd表示左后路音频信号。

由上可见，本申请提供的技术方案，在通过麦克风阵列获取到多声道的音频信号后，可以通过音频采集设备或者结合与音频采集设备相连接的外接设备获得音频采集设备的放置方位信息，进一步根据音频采集设备的放置方式信息，对采集的音频信号进行调整。例如，可以基于俯仰角(pitch)参数、倾斜角(bank)参数以及首相角(heading)参数对音频信号进行调整，还可以基于音频采集设备的竖直放置方式或者水平放置方式进行调整。这样便可以保证采集音频中方位信息的正确性，从而可以提高音频信号的播放效果。

上面对本申请的各种实施方式的描述以描述的目的提供给本领域技术人员。其不旨在是穷举的、或者不旨在将本发明限制于单个公开的实施方式。如上所述，本申请的各种替代和变化对于上述技术所属领域技术人员而言将是显而易见的。因此，虽然已经具体讨论了一些另选的实施方式，但是其它实施方式将是显而易见的，或者本领域技术人员相对容易得出。本申请旨在包括在此已经讨论过的本发明的所有替代、修改、和变化，以及落在上述申请的精神和范围内的其它实施方式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙学京;张晨;张兴涛
技术所有人：北京时代拓灵科技有限公司
我是此专利的发明人

上一篇：一种可循环过滤式汽车滤芯的制作方法
上一篇：一种净化器的滤芯结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。