一种基于对象的环屏扬声器阵列的运动声源合成算法及其应用的制作方法

文档序号:29119557发布日期:2022-03-04 21:33阅读:75来源:国知局
一种基于对象的环屏扬声器阵列的运动声源合成算法及其应用的制作方法

1.本发明涉及一种基于对象的环屏扬声器阵列的运动声源合成算法及其应用。


背景技术:

2.目前,电影还音制式主要分为基于声道的还音制式,基于对象(audio object)的还音制式和基于声道和对象混合应用的还音制式这三大类。与基于声道还音制式不同,基于对象的还音制式把声源进行对象化处理,在声场的不同位置,观众能听到的声音真实的,沉浸式的。在基于对象的还音制式中,一个声源可以是一个对象例如人物的对话声,脚步声。背景氛围声也可以是一个对象,例如雨声,车流声。这是按照声音的内容类型进行分类对象按照声源类型可分为面声源,点声源,线声源。按照状态可分为静态声源和运动声源。在运动声源中,对象的位置不是固定不变的,而是拥有特定的运动轨迹。此时声音可以跟画面中对象的位置的移动而移动。运动声源首先需要建立对象的空间坐标系。声源在可以随着坐标进行移动,这样把声源进行对象化处理。


技术实现要素:

3.本发明设计了一种基于对象的环屏扬声器阵列的运动声源合成算法及其应用,其解决的技术问题是:(1)基于对象的环屏扬声器阵列的不同运动声源类型的合成算法问题;(2)基于对象的环屏扬声器阵列的多个运动声源的组合问题。
4.为了解决上述存在的技术问题,本发明采用了以下方案:
5.一种基于对象的环屏扬声器阵列的运动声源合成算法,其特征在于:对象按照声源类型为点声源时,
6.上侧扬声器阵列的驱动方程为:
[0007][0008]
下侧扬声器阵列的驱动方程为:
[0009][0010]
左侧扬声器阵列的驱动方程为:
[0011][0012]
右侧扬声器阵列的驱动方程为:
[0013][0014]
其中a1(w),a2(w),a3(w),a4(w)与w有关的函数。l为环屏扬声器阵列的x轴方向上的宽度.点声源的坐标为(xo,yo,zo),v为声速,h(w)为点声源的傅里叶变换。
[0015]
优选地,在频域是原驱动信号频域的共轭表达式:
[0016][0017]
其中a(w)与角频率w有关的函数,扬声器的坐标为(x
sn
,y
sn
,z
sn
),点声源的坐标为(xo,yo,zo),v为声速,h(w)为点声源的傅里叶变换。
[0018][0019]
一种基于对象的环屏扬声器阵列的运动声源合成算法,其特征在于:对象按照声源类型为运动声源时:
[0020]
上侧扬声器阵列的驱动方程为:
[0021][0022]
下侧扬声器阵列的驱动方程为:
[0023][0024]
左侧扬声器阵列的驱动方程为:
[0025][0026]
右侧扬声器阵列的驱动方程为:
[0027][0028]
其中a1(w),a2(w),a3(w),a4(w)与w有关的函数,l为环屏扬声器阵列的x轴方向上
的宽度.点声源的坐标为(x
δt
,y
δt
,z
δt
)。其中f为听到的频率,fs为原信号频率,每帧帧长为δt,v为声速,vs为运动声源的速度。原信号经过多普勒效应处理后为
[0029]
优选地,当运动声源在屏幕前方运动时,需要合成聚焦声源,
[0030]
上侧扬声器阵列的驱动方程为:
[0031][0032]
下侧扬声器阵列的驱动方程为:
[0033][0034]
左侧扬声器阵列的驱动方程为:
[0035][0036]
右侧扬声器阵列的驱动方程为:
[0037][0038]
其中a1(w),a2(w),a3(w),a4(w)与w有关的函数,l为环屏扬声器阵列的x轴方向上的宽度.点声源的坐标为(x
δt
,y
δt
,z
δt
)。其中f为听到的频率,fs为原信号频率,每帧帧长为δt,v为声速,vs为运动声源的速度。原信号经过多普勒效应处理后为
[0039]
优选地,形成多个运动对象时,
[0040]
上侧扬声器阵列的驱动方程为:
[0041][0042]
下侧扬声器阵列的驱动方程为:
[0043][0044]
左侧扬声器阵列的驱动方程为:
[0045][0046]
右侧扬声器阵列的驱动方程为:
[0047][0048]
其中a1(w),a2(w),a3(w),a4(w)与w有关的函数,l为环屏扬声器阵列的x轴方向上的宽度.第k个点声源的坐标为(x
δtk
,y
δtk
,z
δtk
)。其中f为听到的频率,fs为原信号频率,每
帧帧长为δt,v为声速,vs为运动声源的速度。第k个目标经过多普勒效应处理后为
[0049]
一种家庭影院,使用环屏扬声器阵列,其特征在于:所述环屏扬声器阵列应用上述的算法。
[0050]
该基于对象的环屏扬声器阵列的运动声源合成算法及其应用具有以下有益效果:
[0051]
本发明的声像合成算法是基于环屏扬声器阵列基础上进行声像合成,解决了不同声源类型的运动的连贯性不佳的问题,在声场的不同位置,观众能听到的声音跟随图像移动,可以提高整体还音制式的真实感和沉浸感的。
附图说明
[0052]
图1:本发明建立的基于对象的环屏扬声器阵列的空间坐标系。
[0053]
图2:本发明声像合成空间坐标系示意图。
[0054]
图3:本发明各扬声器编号示意图。
具体实施方式
[0055]
下面结合图1至图3,对本发明做进一步说明:
[0056]
如图1所示,图中建立了基于对象的环屏扬声器阵列的空间坐标系。在该坐标系中,有两个对象,这两个对象均为运动声源。马蹄的声音从屏幕的后方坐标(1,-3,0)处移动到屏幕前方坐标(2,-1,4)处。鸟叫的声音从屏幕前方坐标(0,0,2)移动到屏幕后方坐标(-1,4,0)处。此时在声场的不同位置,观众能听到的声音跟随图像移动,可以提高整体还音制式的真实感和沉浸感的。
[0057]
假设生成的声源为点声源也就是脉动球形声源,首先讨论脉动球形声源的辐射特性。设有一半径为r0的球体,其表面做均匀的微小涨缩震动,也就是他的半径在r0附近以微量dr做简谐的变化,从而在周围的媒质中辐射了声波,因为球面的振动过程具有各向均匀的脉动性质,因而它所产生的声波波阵面是球面辐射的是均匀球面波。取球坐标系比较简单,坐标原点取在球心,因而波阵面是球面的,所以在距离r处的波阵面面积就是球面面积s=4πr2,在这种情况下可以方便的运用特殊形式的波动方程式:
[0058][0059]
其中c0代表声速,t为时间,p代表声压,r表示波阵面的半径。
[0060]
将s=4πr2代入上式,则成为
[0061][0062]
现在作变量变换,令y=pr,那么上式就可化为:
[0063][0064]
因此可以直接得到这个上式的一般解为:
[0065]
y=ae
j(wt-kr)
+be
j(wt+kr)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0066]
其中a和b为两个待定常数
[0067]
解得y就可以(2)得的一般解为
[0068][0069]
上式第一项代表向外辐射的球面波;第二项代表向球心反射的球面波。我们现在讨论的为向无界空间辐射的自由行波,因而没有反射波,这里常数b=0.这样公式5就称为
[0070][0071]
公式6作为声像合成中驱动扬声器的基本公式。
[0072]
声像合成首先需要建立空间坐标系,如图2所示,环屏阵列的下阵列的横向坐标轴作为空间坐标系中的x轴,位于环屏阵列底部并且垂直于环屏阵列横向坐标轴的法线为y轴,环屏阵列的竖直方向上的纵向坐标轴作为空间坐标系的z轴。
[0073]
设生成声源o点的三维坐标设为(x0,y0,z0),环屏阵列中上下每排扬声器数量为n,左右每列扬声器数量为m,l为环屏扬声器阵列宽度。
[0074]
声像合成中驱动扬声器的基本公式为:
[0075][0076]
上式中k为波数,w为角频率,v为声速,r为虚拟声源到扬声器的距离。因此上式可转换形式为
[0077][0078]
其中e
jwt
为需要生成的声信号,与驱动单个扬声器的算法控制无关。
[0079]
因此可以得到扬声器的基本驱动方程为:
[0080][0081]
其中h(w)表示的需要生成的声信号的傅里叶变换。
[0082]
如图3所示,设各个扬声器的位置:上侧扬声器阵列为s11、s12、
……
s1n。下侧扬声器阵列为s21、s22、
……
s2n。左侧扬声器阵列为s31、s32、
……
s3m。右侧扬声器阵列为s41、s42、
……
s4m。其中上侧扬声器s1n的三维坐标设为(x
s1n
,y
s1n
,z
s1n
),其它方向以此类推。
[0083]
在上面的基本公式中r为虚拟声源到扬声器的距离,扬声器三维坐标设为(x
sn
,y
sn
,z
sn
),因此在上侧扬声器阵列中为了更精准的合成声像,其中扬声器的权值a也应与角频率w有关,用a(w)表示,基本驱动方程转化为:
[0084][0085]
本发明中采用的环屏扬声器阵列的结构生成声像,在屏幕中央区域并没有实际的扬声器发声单元。对象按照声源类型可分为面声源,点声源,线声源。首先讨论点声源的声
像合成算法。为了在屏幕中央区域生成声像,需要环屏扬声器阵列中上下左右这四组扬声器阵列同时进行驱动发声。在此提出一种多组扬声器阵列联动算法。设生成声源o点的为(x0,y0,z0),此时当x0=0,也就是当声源点位于扬声器横坐标的中心位置时,此时驱动上侧扬声器阵列和下侧扬声器阵列发声,左侧和右侧扬声器阵列不发声。随着x0向右移动,上侧和下侧扬声器阵列驱动信号的权值减小,右侧扬声器阵列的驱动信号的权值增加。采用线性移动的方式改变权值。当l为环屏扬声器阵列的x轴方向上的宽度。声源点位于环屏扬声器阵列横坐标中心位置靠右1/2处时。上侧和下侧扬声器阵列的权值是总权值的1/2,右侧扬声器阵列的驱动信号的权值为总权值的1/2。当也就是当声源点位于环屏扬声器阵列横坐标最右侧时,此时只有右侧扬声器阵列发声,也就是权值为1,其余阵列不发声及权值为0。
[0086]
整理成公式可得上侧扬声器阵列的驱动方程为:
[0087][0088]
下侧扬声器阵列的驱动方程为:
[0089][0090]
左侧扬声器阵列的驱动方程为:
[0091][0092]
右侧扬声器阵列的驱动方程为:
[0093][0094]
其中a1(w),a2(w),a3(w),a4(w)与w有关的函数。
[0095]
聚焦声源时扬声器的驱动信号是点声源的时间逆序,也就是当生成的声源在环屏扬声器前向方向,但不能超过听音者的位置处。也就是原声信号向外发散传播,变为向内收敛,在信号处理中,时域上信号的时间逆序,它的傅里叶变换是原信号的傅里叶变换的共轭函数,因此在频域是原驱动信号频域的共轭表达式:
[0096][0097]
在基于对象的还音制式中,对象也可以是线声源,下面是环屏扬声器阵列线声源合成算法,此时仅需上下扬声器阵列即可,左右两侧扬声器阵列不发声。
[0098]
上侧扬声器阵列的驱动方程为:
[0099][0100]
下侧扬声器阵列的驱动方程为:
[0101][0102]
其中d为扬声器间隔,n为扬声器阵列的数量,α为线声源的偏转的角度。
[0103]
以上为静态声源的声像合成算法。运动声源的算法在静态声源的基础上进行声像合成。
[0104]
本发明中采用对运动声源信号分帧的方法进行声像合成,每帧帧长应为δt。假设运动声源对象mobj坐标是与时间t有关的函数。设为mobj(x(t),y(t),z(t))。则每帧的坐标为mobj(x
δt
,y
δt
,z
δt
)其中对信号进行分帧。原信号的频域函数为h(w),则分帧后每帧的频域函数为h
δt
(w)。
[0105]
本发明涉及到运动声源,需要做相应的多普勒效应处理,多普勒效应的公式如下所示
[0106][0107]
其中f为听到的频率,fs为原信号频率,v为声速,vs为运动声源的速度。则原信号经过多普勒效应处理后为
[0108]
可得上侧扬声器阵列的驱动方程为:
[0109][0110]
下侧扬声器阵列的驱动方程为:
[0111][0112]
左侧扬声器阵列的驱动方程为:
[0113][0114][0115]
右侧扬声器阵列的驱动方程为:
[0116][0117]
当运动声源在屏幕前方运动时,需要合成聚焦声源。因此可得上侧扬声器阵列的驱动方程为:
[0118][0119]
下侧扬声器阵列的驱动方程为:
[0120][0121]
左侧扬声器阵列的驱动方程为:
[0122][0123]
右侧扬声器阵列的驱动方程为:
[0124][0125]
当形成多个运动对象时,假设对象1定义为obj1,对象2定义为obj2,
……
对象k定义为objk。则各对象的声信号频率响应为h
obj1
(w),h
obj2
(w),
……
,h
objk
(w)。各对象的声信号经过分帧后的频率响应为各运动声源对象每帧的坐标为obj1(x
δt1
,y
δt1
,z
δt1
),obj2(x
δt2
,y
δt2
,z
δt2
),objk(x
δtk
,y
δtk
,z
δtk
)。
[0126]
那么此时各扬声器阵列的驱动函数为各对象原驱动函数之和
[0127]
下侧扬声器阵列的驱动方程为:
[0128][0129]
下侧扬声器阵列的驱动方程为:
[0130][0131]
左侧扬声器阵列的驱动方程为:
[0132][0133]
右侧扬声器阵列的驱动方程为:
[0134][0135]
上面结合附图对本发明进行了示例性的描述,显然本发明的实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1