音频数据处理装置、音频装置、音频数据处理方法、程序以及记录该程序的记录介质的制作方法

文档序号:7914966阅读:275来源:国知局
专利名称:音频数据处理装置、音频装置、音频数据处理方法、程序以及记录该程序的记录介质的制作方法
技术领域
本发明涉及音频数据处理装置、音频装置、音频数据处理方法、程序以及记录该程序的记录介质。
背景技术
近年来,以欧洲为中心,以波阵面合成技术(Wave Field Synthesis WFS)为基本原理的音频系统的研究盛行(例如,参照非专利文献I) oWFS是将从排列成阵列状的多个扬声器(下面称作“扬声器阵列”)辐射的声音的波阵面基于惠更斯原理来予以合成的技术。在由WFS提供的音响空间中,与扬声器阵列面对面而听到声音的受听者产生如下感觉实际从扬声器阵列辐射的声音好像是从扬声器阵列的后方虚拟存在的声源(下面称作“虚拟声源”)辐射来的(例如参照图I)。作为能应用WFS系统的装置,有电影、音频系统、电视、AV箱架、电视会议系统、电视游戏等。例如,在数字内容为电影的情况下,演员的存在以虚拟声源这样的形式被记录在介质中。因此,在演员一边会话一边在银幕内移动的情况下,能配合银幕内的演员的移动方向来使虚拟声源相对于银幕在左右、前后以及任意的方向上定位。例如在专利文献I中记载了能使虚拟声源移动的系统。在先技术文献专利文献专利文献I JP特表2007-502590号公报非专利文献非专利文献I A. J. Berkhout, D. de Vries,和P. Vogel著,“通过波场合成来进行的音响控制(Acoustic control by wave field synthesis) ”(荷兰),第 93 (5)版,期刊美国声学协会(Acoustical Society of America) (J. Acoust. Soc), 1993 年 5 月,P.2764-2778。发明的概要发明要解决的课题由于作为声波的发生源的声源以及受听者的相对的速度不同而观测出声波的频率不同,作为这样的物理现象,已知多普勒效应。根据多普勒效应,在声波的发生源即声源靠近受听者的情况下,声波的振动缩短从而频率变高,反之,在声源远离受听者的情况下,声波的振动被拉长从而频率变低。这意味着即使声源移动,从声源而到达的声波的波的数量也不发生变化。但是,非专利文献I所记载的内容是以虚拟声源不移动而被固定的情况为前提,并没有研究伴随着虚拟声源的移动而发生的多普勒效应。因此,在虚拟声源向远离扬声器的方向移动或向接近扬声器的方向移动的情况下,以扬声器所发出的声音为基础的音频信号的波的数量发生变化,由于该波的数量的变化而导致波形失真。由于若在波形中产生失真则会让受听者将其感知为噪声,因此需要采取消除波形失真的措施。另外,关于波形失真的详细在后面叙述。另一方面,专利文献I所记载的内容中,考虑了伴随虚拟声源的移动而发生的多普勒效应,通过使相对于从成为音频信号的基础的音频数据内的某片段内的适当的标本数据至下一片段内的标本数据为止的范围的音频数据的权重系数进行变化,来补正该范围的音频数据。另外,所谓“片段”是音频数据的处理单位。通过补正音频数据能在某种程度上消除音频信号波形的极端的失真,降低由于波形失真而产生的噪声。但是,在专利文献I所记载的内容中,为了补正当前时间点的片段的音频数据,需要预先计算下一片段的音频数据的声波传播时间。即,在专利文献I所记载的内容中,只要下一片段的音频数据的声波传播时间的计算处理不结束,就不能补正当前时间点的片段的音频数据。因此,在输出当前时间点的片段的音频数据中,存在会产生I个片段的量的滞后这样的课题。

发明内容
本发明鉴于上述课题而提出,目的在于提供一种特定存在于音频数据中的失真的部分并对所特定的波形失真进行补正的音频数据处理装置等的能不产生上述滞后地输出音频数据的音频数据处理装置等。本发明的音频数据处理装置是如下的音频数据处理装置,输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置,基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据,包括计算单元,其计算在一前一后的时间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离;特定单元,其在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定;和补正单元,其通过使用了函数的内插来补正被特定的所述部分的所述音频数据。在本发明的音频数据处理装置中,所述音频数据包括标本数据,所述特定单元特定由于所述虚拟声源的相对于所述扬声器的远离或接近而引起的标本数据的反复部分以及缺失部分,所述补正单元通过使用了函数的内插来补正被特定的所述反复部分以及所述缺失部分。在本发明的音频数据处理装置中,所述使用了函数的内插是线性内插。在本发明的音频数据处理装置中,所述进行补正的部分是声波传播所述第I距离以及所述第2距离的时间幅度的差、或者与所述差成比例的时间幅度。本发明的音频装置是如下的音频装置使用与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置,并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据,具备数字内容输入部,其输入包含所述音频数据以及所述虚拟声源的位置的数字内容;内容信息分离部,其解析所述数字内容输入部所输入的数字内容,分离包含在该数字内容中的音频数据以及虚拟声源的位置的数据;音频数据处理部,其基于所述内容信息分离部所分离出的虚拟声源的位置的数据以及所述扬声器的位置的数据,来补正所述内容信息分离部所分离的音频数据;和音频信号生成部,其将补正后的音频数据变换成音频信号并输出给扬声器,所述音频数据处理部具备计算单元,其计算在一前一后的时间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离;特定单元,其在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定;和补正单元,其通过使用了函数的内插来补正被特定的所述部分的所述音频数据。在本发明的音频装置中,所述数字内容输入部从容纳数字内容的记录介质、经由网络来配送数字内容的服务器或广播数字内容的广播站来输入数字内容。 在本发明的音频数据处理方法中,所述音频数据处理方法是音频数据处理装置中的音频数据处理方法,该音频数据处理装置输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置,基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据,包括计算在一前一后的时 间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤;在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定的步骤;和通过使用了函数的内插来补正被特定的所述部分的所述音频数据的步骤。本发明的程序基于输入与音频数据对应的音频信号的扬声器所辐射的声音而形成的虚拟声源的位置以及该扬声器的位置,来补正与移动的声源所发出的声音对应的所述音频数据,使计算机执行如下步骤计算在一前一后的时间点的所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤;在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定的步骤;和通过使用了函数的内插来补正被特定的所述部分的所述音频数据的步骤。本发明的记录介质记录有所述程序。在本发明的音频数据处理装置中,与虚拟声源的相对于扬声器的接近以及远离相应,来特定波形失真的场所,接下来,通过使用了函数的内插来补正该被特定的波形失真,因此能没有滞后地补正音频数据,并输出。在本发明的音频数据处理装置中,特定由于虚拟声源的相对于扬声器的远离或接近而引起的标本数据的反复部分以及缺失部分,补正单元通过使用了函数的内插来补正被特定的反复的部分以及缺失的部分,因此,能没有滞后地补正音频数据,并输出。在本发明的音频数据处理装置中,与虚拟声源的相对于扬声器的接近以及远离相应,来特定波形失真的场所,接下来,通过线性内插来补正该被特定的波形失真,因此能没有滞后地补正音频数据,并输出。在本发明的音频装置中,与虚拟声源的相对于扬声器的接近以及远离相应,来特定波形失真的场所,接下来,通过使用了函数的内插来补正该被特定的波形失真,因此能没有滞后地补正音频数据,并输出。在本发明的音频数据处理方法中,与虚拟声源的相对于扬声器的接近以及远离相应,来特定波形失真的场所,接下来,通过使用了函数的内插来补正该被特定的波形失真,因此能没有滞后地补正音频数据,并输出。在本发明的程序中,与虚拟声源的相对于扬声器的接近以及远离相应,来特定波形失真的场所,接下来,通过使用了函数的内插来补正该被特定的波形失真,因此能没有滞后地补正音频数据,并输出。在记录本发明的程序的记录介质中,与虚拟声源的相对于扬声器的接近以及远离相应,来特定波形失真的场所,接下来,通过使用了函数的内插来补正该被特定的波形失真,因此能没有滞后地补正音频数据,并输出。发明的效果根据本发明所涉及的音频数据处理装置,能没有滞后地补正由于虚拟声源的相对于扬声器的接近或远离而引起的音频数据的失真,并输出补正后的音频数据。


图I是由WFS提供的音响空间的一例的说明图。图2A是一般说明音频信号的说明图。图2B是一般说明音频信号的说明图。
图2C是一般说明音频信号的说明图。图3是通过音频数据形成的音频信号波形的一部分的说明图。图4是通过第I片段内的音频数据形成的音频信号波形的一例的说明图。图5是通过第2片段内的音频数据形成的音频信号波形的一例的说明图。图6是结合了通过图4所示的音频数据形成的音频信号波形以及通过图5所示的音频数据形成的音频信号波形而得到的音频信号波形的一例的说明图。图7是说明通过第I片段内的音频信号数据形成的音频信号波形的一例的说明图。图8是说明通过第2片段内的音频信号数据形成的音频信号波形的一例的说明图。图9是表示在通过第I片段内的最初的部分的音频数据形成的音频信号波形以及通过第2片段内的最后的部分的音频数据形成的音频信号波形之间产生了4点的空白部分的状态的说明图。图10是结合了通过图7所示的音频数据形成的音频信号波形以及通过图8所示的音频数据形成的音频信号波形而得到的音频信号波形的一例的说明图。图11是具备表示实施方式I所涉及的音频数据处理部的音频装置的构成例的框图。图12是表示实施方式I所涉及的音频数据处理部的内部构成例的框图。图13是输入音频数据缓冲器的一个构成例的说明图。图14是声波传播时间缓冲器的一个构成例的说明图。图15是通过补正后的音频数据形成的音频信号波形的一例的说明图。图16是通过补正后的音频数据形成的音频信号波形的说明图。图17是表示实施方式I所涉及的数据处理的流程的流程图。图18是表示实施方式2所涉及的音频装置的内部构成例的框图。
具体实施例方式实施方式I首先,说明以在由WFS提供的音响空间内虚拟声源不移动为前提的运算模型以及考虑了虚拟声源的移动的运算模型,接下来转移到实施方式的说明。图I是由WFS提供的音响空间的一例的说明图。在图I所示的音响空间中,存在由M个扬声器103_1 103_M构成的扬声器阵列103以及与扬声器阵列103面对面来听声音的受听者102。在该音响空间中,从M个扬声器103_1 103_M辐射的声音的波阵面根据惠更斯原理而进行波阵面合成,作为合成波阵面104在音响空间内传播。此时,受听者102产生如下的感觉实际从扬声器阵列103辐射的声音好像是从并不实际存在于定位在扬声器阵列103的后方的N个虚拟声源101_1 101_N辐射来的。将N个虚拟声源101_1 101_N统称为虚拟声源101。另一方面,图2是一般地说明音频信号的说明图。在理论上对音频信号进行处理时,一般地,将音频信号表现为连续信号SU)。图2A表示连续信号S(t),图2B表示采样间隔At的脉冲序列,图2C是以采样间隔At来将连续信号S(t)标本化(sampling)且量化而得到的数据s(bAt)的图(其中b=正整数)。例如,如图2A所示,连续信号S(t)在时间t的轴上、振幅S的轴上都连续。标本化以从连续信号S(t)中获取在时间上离散的信号为目的。这是用离散的离散时刻b At中的数据s (b At)来表现连续信号S(t)的信号。虽然在理论上采样间隔也可以为可变,但实际上设为固定间隔。若设采样间隔为At,则如图2C所示,以采样间隔A t的脉冲序列(图2B)来消除抽取连续信号S (t),并将它们量化,由此来进行标本化以及量化操作。另外,在后面的说明中,将量化后的数据s(bAt)称作“标本数据”。不考虑虚拟声源101的移动的运算模型的内容如下所述。在本运算模型中,使用以下所示的数学式(I)到(4)来生成赋予扬声器阵列103的音频信号。在本运算模型中,生成对包含在扬声器阵列103中的第m个扬声器(下面称作“扬声器103_m”)赋予的音频信号的在离散时刻t的标本数据。在此,如图I所示,设虚拟声源101的数量为N,构成扬声器阵列103的扬声器的台数为M。[数I]
权利要求
1.一种音频数据处理装置,输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置,并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据, 所述音频数据处理装置的特征在于包括 计算单元,其计算在一前一后的时间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离; 特定单元,其在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定;和 补正单元,其通过使用了函数的内插来补正被特定的所述部分的所述音频数据。
2.根据权利要求I所述的音频数据处理装置,其特征在于, 所述音频数据包括标本数据, 所述特定单元特定由于所述虚拟声源的相对于所述扬声器的远离或接近而引起的标本数据的反复部分以及缺失部分, 所述补正单元通过使用了函数的内插来补正被特定的所述反复部分以及所述缺失部分。
3.根据权利要求I或2所述的音频数据处理装置,其特征在于, 所述使用了函数的内插是线性内插。
4.根据权利要求I 3中任一项所述的音频数据处理装置,其特征在于, 所述进行补正的部分是声波传播所述第I距离以及所述第2距离的时间幅度的差、或者与所述差成比例的时间幅度。
5.一种音频装置,其使用与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置,并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据, 所述音频装置的特征在于具备 数字内容输入部,其输入包含所述音频数据以及所述虚拟声源的位置的数字内容; 内容信息分离部,其解析所述数字内容输入部所输入的数字内容,分离在该数字内容中所含的音频数据以及虚拟声源的位置的数据; 音频数据处理部,其基于所述内容信息分离部所分离出的虚拟声源的位置的数据以及所述扬声器的位置的数据,来补正所述内容信息分离部所分离的音频数据;和音频信号生成部,其将补正后的音频数据变换成音频信号并输出给扬声器, 所述音频数据处理部具备 计算单元,其计算在一前一后的时间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离; 特定单元,其在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定;和 补正单元,其通过使用了函数的内插来补正被特定的所述部分的所述音频数据。
6.根据权利要求5所述的音频装置,其特征在于, 所述数字内容输入部从容纳数字内容的记录介质、经由网络来配送数字内容的服务器或广播数字内容的广播站来输入数字内容。
7.一种音频数据处理方法,其是音频数据处理装置中的音频数据处理方法,该音频数据处理装置输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置,并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据, 所述音频数据处理方法的特征在于包括 计算在一前一后的时间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤; 在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定的步骤;和 通过使用了函数的内插来补正被特定的所述部分的所述音频数据的步骤。
8.—种程序,基于输入与音频数据对应的音频信号的扬声器所福射的声音而形成的虚拟声源的位置以及该扬声器的位置,来补正与移动的声源所发出的声音对应的所述音频数据, 所述程序使计算机执行如下步骤 计算在一前一后的时间点的从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤; 在所述第I距离以及所述第2距离不同的情况下,对在前后的时间点处的存在于所述音频数据中的失真的部分进行特定的步骤;和 通过使用了函数的内插来补正被特定的所述部分的所述音频数据的步骤。
9.一种计算机可读取的记录介质,其特征在于,记录了权利要求8所述的程序。
全文摘要
提供一种音频数据处理装置等,通过对虚拟声源从扬声器而移动的情况下产生的波形失真进行线性内插,来谋求补正处理的高速化。所述音频数据处理装置具有计算单元其计算在一前一后的时间点的从扬声器的位置到虚拟声源的位置为止的各自的第1距离以及第2距离;特定单元,其在第1距离以及第2距离不同的情况下,特定在前后的时间点的存在于音频数据中的失真的部分;和补正单元,其通过使用了函数的内插来补正所特定的部分的音频数据。
文档编号H04S7/00GK102640522SQ20108005541
公开日2012年8月15日 申请日期2010年12月1日 优先权日2009年12月9日
发明者佐藤纯生, 倪婵斌, 服部永雄 申请人:夏普株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1