本发明涉及音频编解码技术领域,尤其涉及一种lc3音频编解码方法、装置及存储介质。
背景技术:
lc3蓝牙技术主要面向低功耗蓝牙,也可以用于经典蓝牙,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费的优点,受到广大厂商的关注。
某些听力损伤者,在其损伤的频率范围内对声音的适应能力大大降低了,他们在整个声音频率上的动态范围都缩小(如图1所示),其表现为正常人可以听到的较高或较低的声音,听力损伤者都无法听到,单纯进行增益的放大缩小无法满足要求,解决的方法就是‘动态压缩’声音的范围,如图1中所示的向下和向上的箭头展示的就是动态压缩示意图。
在传统的助听解决方案中,主要是在音频通路上增加上述解决方案,虽然效果不错,但其缺点也很明显。现有技术通过fft/mdct相关类算法转换到频域进行处理,涉及到时域和频域的转换运算,或者通过正交镜像滤波器分解成成不同频段的信号进行处理,运算量较大,增加了系统运算需求导致功耗增加,同时增加了系统的时延导致用户体验降低。
技术实现要素:
针对现有技术存在的问题,本申请主要提供一种lc3音频编解码方法、装置及存储介质,通过在lc3音频编解码的过程中,在频域对不同频段进行调整,实现对听力损伤者所适应的频率范围的声音进行有效压缩。
为了实现上述目的,本申请采用的一个技术方案是:提供一种lc3音频编解码方法,其包括:
在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级;根据每个频段的声压级以及预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线;以及,利用目标谱线继续进行lc3音频编码和/或解码步骤。
本申请采用的另一个技术方案是:提供一种lc3音频编解码装置,其包括:频段声压级计算模块,用于在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级;
目标谱线获取模块,用于根据每个频段的声压级以及预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线;以及,
目标谱线编解码模块,用于利用目标谱线继续进行lc3音频编码和/或解码步骤。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行第一种方案中的lc3音频编解码方法。
本申请的技术方案可以达到的有益效果是:提供一种lc3音频编解码方法、装置及存储介质,通过在编解码的过程中根据相应声压级输入输出曲线,对不同频段的谱系数进行不同的增益的调整,实现了对听力损伤者所适应的频率范围的声音进行有效压缩调整,能够减少系统运算需求,从而降低功耗,同时减少了系统的时延,提升了用户体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是听力损伤者受损音频范围适应能力降低示意图;
图2是本申请一种lc3音频编解码方法的一个具体实施方式流程示意图;
图3是本申请一种lc3音频编解码方法的一个具体实施例流程示意图;
图4是本申请一种lc3音频编解码方法的一个具体实施例流程示意图;
图5是本申请一种lc3音频编解码方法的一个具体实施例中预定的声压级输入输出曲线示意图;
图6是一种lc3音频编解码装置的具体实施方式示意图;
图7是一种lc3音频编解码装置的具体实施例示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
某些听力损伤者,在其损伤的频率范围内对声音的适应能力大大降低了,他们在整个声音频率上的动态范围都缩小(如图1所示),其表现为正常人可以听到的较高或较低的声音,听力损伤者都无法听到,单纯进行增益的放大缩小无法满足要求,解决的方法就是‘动态压缩’声音的范围,如图1中所示的向下和向上的箭头展示的就是动态压缩示意图。
在传统的助听解决方案中,主要是在音频通路上增加上述解决方案,虽然效果不错,但其缺点也很明显。现有技术通过fft/mdct相关类算法转换到频域进行处理,涉及到时域和频域的转换运算,或者通过正交镜像滤波器分解成成不同频段的信号进行处理,运算量较大,增加了系统运算需求导致功耗增加,同时增加了系统的时延导致用户体验降低。下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
lc3蓝牙技术主要面向低功耗蓝牙,也可以用于经典蓝牙,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费得优点,受到广大厂商的关注。
本发明结合低功耗低复杂度蓝牙编解码器lc3提出了一种基于蓝牙发射端和蓝牙接收端的音频助听方法、装置和系统。本发明在第一应用场景下,用手机打电话,音频使用手机上的蓝牙发射器的lc3编码器编码并通过蓝牙传输,用户使用蓝牙耳机收听,在蓝牙耳机上通过具备助听功能的lc3解码器解码成音频并播放,有助于用户听清听懂;本发明在第二应用场景下,用蓝牙发射器(譬如手机)的麦克风,收集声音并处理(降噪、lc3编码),在蓝牙接收器(譬如蓝牙耳机)上收听,在蓝牙耳机上通过具备助听功能的lc3解码器解码成音频并播放,可以有效的改善听觉效果。
图2示出了本申请一种lc3音频编解码方法的一个具体实施方式。
在图2示出的lc3音频编解码方法主要包括,过程以及201,在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级;过程s202,根据每个频段的声压级以及预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线;以及,过程s203,利用目标谱线继续进行lc3音频编码和/或解码步骤。
本发明通过在编解码的过程中根据相应声压级输入输出曲线,对不同频段的谱系数进行不同的增益的调整,实现了对听力损伤者所适应的频率范围的声音进行有效压缩调整,避免了现有技术通过fft/mdct转换再进行处理或者通过正交镜像滤波器分解成不同频段的信号进行处理,能够减少系统运算需求,从而降低功耗,同时减少了系统的时延导致,提升了用户体验。
在图2示出的lc3音频编解码方法中,过程s201表示的是在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级。
对于听力损伤者来说,在不同频率范围内对声音的适应能力不同,因此将音频谱线划分为多个频段,并计算每个频段的声压级,能够便于根据声压级对不同频段的谱线进行调整以满足听力损伤者的需求。
在本申请的一个具体实施例中,上述在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段的过程包括,在进行编码时输入pcm音频数据后,进行低延迟改进型离散余弦变换得到lc3音频谱线,如图3所示,将lc3音频谱线划分为多个频段。
在进行lc3编码时,在进行低延迟改进型离散余弦变换步骤之后,在频域将得到的音频谱线划分为多个频段,能够便于进一步计算每个频段的声压级,进一步便于在编码过程中,在频域根据声压级对不同频段的谱线进行调整以满足听力损伤者的需求。
在本申请的一个具体实施例中,上述在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段的过程包括,在进行解码时输入lc3音频码流后,进行解码直至完成变换域噪声整形解码步骤得到lc3音频谱线,如图4所示,将lc3音频谱线划分为多个频段。
在进行lc3解码时,在进行算术解码、噪声填充、全局增益、时域噪声整形解码和变换域噪声整形解码之后输出谱线数据,将此处得到的谱线数据划分为多个频段,能够便于进一步计算每个频段的声压级,进一步便于在解码过程中,在频域根据声压级对不同频段的谱线进行调整以满足听力损伤者的需求。
在图2示出的lc3音频编解码方法中,过程s202表示的是,根据每个频段的声压级以及预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线的过程。
将步骤s201得到各个频段的谱线的声压级作为输入声压级,目标谱线的声压级作为输出声压级,根据预定的声压级输入输出曲线就能够得到各频段初始谱线与目标谱线的声压级之间关系,据此得到对应的增益值,根据此增益值在以预定的输入声压级阈值确定的频段范围内对相应谱线进行调整,就能够得到满足听力受损者听懂需求。
在本申请的一个具体实施例中,上述预定的声压级输入输出曲线包括,根据听力受损者的听力测试得到的不同频段上的输入声压级和输出声压级的关系曲线。
在实际场景中,具有相关资质的从业人员会对听力损伤者进行听力测试,得到不同频段上的输入声压级和输出声压级的关系图,如图5所示。
因为听力受损情况不同时,不同人对不同频率范围内的适应程度是不相同的。根据对不同听力受损者的听力测试得到不同的输入声压级和输出声压级的关系曲线,能够为不同听力受损者定制不同的音频编解码方案,能够更加有效地满足听力受损者的听懂需求。
在本申请的一个具体实施例中,上述输入声压级阈值包括第一声压级阈值以及第二声压级阈值,优选的,第一声压级阈值为正常听阈,第二声压级阈值为正常痛阈。
在本申请的一个具体实施例中,上述根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线的过程包括,根据相应增益值,对声压级不小于第一声压级阈值并且小于第二声压级阈值的频段,调整其谱线值得到相应频段的目标谱线。
在本申请的一个具体实例中,对于声压级不小于正常听阈并且小于正常痛阈的频段内的谱线对其谱线值进行调整的得到相应频段的目标谱线。
如图5的声压级输入输出曲线所示,b即为正常听阈,d为正常痛阈,正常人能适应的声压级范围在b-d之间,即为正常听力下的动态声压级范围。把正常听力下的动态声压级范围按照由此图得到的增益调整为听力损伤者的动态声压级范围,就可以使听力受损者能听到正常人所听到的声音,满足听力受损者的听懂需求。
在本申请的一个具体实施例中,上述声压级阈值包括第三声压级阈值,优选的上述第三声压级阈值为正常舒适阈,在图5中,c表示的是正常舒适阈。
在本申请的一个具体实施例中,对于声压级不小于正常听阈并且小于正常舒适阈的频段内的谱线,对其谱线值进行放大,以便于听力受损者能听清。
在本申请的一个具体实施例中,对于声压级不小于正常舒适阈并且小于正常痛阈的频段内的谱线,对其谱线值进行压缩,能够便于避免引起听力受损者的不适。
在本申请的一个具体实施例中,上述根据每个频段的增益以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线的过程包括,对声压级小于第一声压级阈值的频段不做处理。
在本申请的一个具体实例中,对声压级小于听阈的频段的相应谱线不做处理。
如图5所示,当声压级在a-b之间时,表示声压级未达到正常听阈,正常人是听不到的,通常视作静音区,因此对声压级处于此区间频段谱线不作处理,能够节省运算量。
在本申请的一个具体实施例中,上述根据每个频段的增益以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线的过程包括,对声压级不小于第二声压级阈值的频段进行饱和处理。
在本申请的一个具体实例汇总,对声压级不小于痛阈的片段进行饱和处理。
如图5所示,当输入声压级在d-e时,表示声压级超过痛阈,声压级超过痛阈时会对听力造成损伤,因此本实施例对不小于痛阈的片段进行饱和处理有助于保护听力。
在本申请的一个具体实例中,在进行lc3音频解码时,解码至完成变换域噪声整形解码,低延迟改进型离散余弦逆变换之前,将谱线进行分段,并计算每个频段声压级,优选的,上述每个频段声压级的计算方法如下:
其中nb是总的频带数量,spln代表其中第n个频带的声压级,band(nstart)和band(nend)是第n个频带对应的谱线索引;
adj(k)是校正因子,k=0时,adj(k)=0.5,k!=0时,adj(k)=1;
预定的声压级输入输出曲线的函数表达式为,y=f(x);
计算增益,
计算目标谱线值,
其中
在图2示出的lc3音频编解码方法中,过程s203表示的是利用目标谱线继续进行lc3音频编码和/或解码步骤,保证完成完整的编解码过程,最终为听力损伤者提供高质量的音频。
在本申请的一个具体实施例中,上述利用目标谱线继续进行lc3音频编码和/或解码步骤,保证完成完整的编解码过程包括,利用目标谱线继续进行标准lc3音频编码步骤,如图3所示,继续进行变换域噪声整形、时域噪声整形、量化、噪声电平估计、算术编码以及残差编码直至码流封装,最终进行码流输出,保证进行完整的编码过程。
在本申请的一个具体实施例中,上述利用目标谱线继续进行lc3音频编码和/或解码步骤,保证完成完整的编解码过程包括,利用目标谱线继续进行标准lc3音频解码步骤,如图4所示,继续进行低延迟改进型离散余弦反变换步骤以及长期后置滤波解码步骤,直至最终输出音频数据(pcm)。
1)在本申请的一个具体实例中,上述利用目标谱线继续进行标准lc3音频解码步骤包括,根据lc3标准规范计算低延迟改进型离散余弦变换综合;
在本申请的一个具体实施例中,在进行lc3音频编码时以及lc3音频解码时,分别将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级,之后根据预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值,对编码过程中的相应频段以及解码过程中的相应频段的谱线值分别进行调整,得到目标谱线的过程。
图6示出了本申请一种lc3编解码装置的一个具体实施方式。
在图6示出的lc3编解码装置主要包括,频段声压级计算模块601,用于在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级;目标谱线获取模块602,用于根据每个频段的声压级以及预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线;以及,目标谱线编解码模块603,用于利用目标谱线继续进行lc3音频编码和/或解码步骤。
本发明能够在编解码的过程中根据相应声压级输入输出曲线,对不同频段的谱系数进行不同的增益的调整,实现了对听力损伤者所适应的频率范围的声音进行有效压缩调整,避免了现有技术通过fft/mdct转换再进行处理或者通过正交镜像滤波器分解成不同频段的信号进行处理,能够减少系统运算需求从而降低功耗,同时减少了系统的时延,提升了用户体验。
图6示出的频段声压级计算模块601,能够在进行lc3音频编解码时,将过程中的lc3音频谱线划分为多个频段,并计算每个频段的声压级。
对于听力损伤者来说,在不同频率范围内对声音的适应能力不同,因此将音频谱线划分为多个频段,并计算每个频段的声压级,能够便于根据声压级对不同频段的谱线进行调整以满足听力损伤者的需求。
在本申请的一个具体实施例中,上述频段声压级计算模块601能够在进行编码时输入pcm音频数据后,进行低延迟改进型离散余弦变换得到lc3音频谱线,如图3所示,将lc3音频谱线划分为多个频段。在进行lc3编码时,在进行低延迟改进型离散余弦变换步骤之后,在频域将得到的音频谱线划分为多个频段,能够便于进一步计算每个频段的声压级,进一步便于在编码过程中,在频域根据声压级对不同频段的谱线进行调整以满足听力损伤者的需求。
在本申请的一个具体实施例中,上述频段声压级计算模块601能够在进行解码时输入lc3音频码流后,进行解码直至完成变换域噪声整形解码步骤得到lc3音频谱线,如图4所示,将lc3音频划分为多个频段。在进行lc3解码时,在进行算术解码、噪声填充、全局增益、时域噪声整形解码和变换域噪声整形解码之后输出谱线数据,将此处得到的谱线数据划分为多个频段,能够便于进一步计算每个频段的声压级,进一步便于在解码过程中,在频域根据声压级对不同频段的谱线进行调整以满足听力损伤者的需求。
图6示出的目标谱线获取模块602,能够根据每个频段的声压级以及预定的声压级输入输出曲线计算得到每个频段的增益值,并根据每个频段的增益值以及预定的输入声压级阈值调整相应频段的谱线值得到目标谱线。将模块601得到各个频段的谱线的声压级作为输入声压级,目标谱线的声压级作为输出声压级,根据预定的声压级输入输出曲线就能够得到各频段初始谱线与目标谱线的关系,得到对应的增益值,根据此增益值在以预定的输入声压级阈值确定的频段范围内对相应谱线进行调整,就能够得到满足听力受损者的听懂需求。
在本申请的一个具体实施例中,上述预定的声压级输入输出曲线包括,根据听力受损者的听力测试得到的不同频段上的输入声压级和输出声压级的关系曲线。在实际场景中,具有相关资质的从业人员会对听力损伤者进行听力测试,得到不同频段上的输入声压级和输出声压级的关系图,如图5所示。因为听力受损情况不同时,不同人对不同频率范围内的适应程度是不相同的。根据对不同听力受损者的听力测试得到不同的输入声压级和输出声压级的关系曲线,能够为不同听力受损者定制不同的音频编解码方案,能够更加有效地满足听力受损者听懂需求。
在本申请的一个具体实施例中,上述输入声压级阈值包括第一声压级阈值以及第二声压级阈值,优选的,第一声压级阈值为正常听阈,第二声压级阈值为正常痛阈。上述目标谱线获取模块包括谱线值调整子模块以及饱和处理子模块,如图7所示,其中,谱线值调整子模块用于根据相应增益值,对声压级不小于第一声压级阈值并且小于第二声压级阈值的频段,调整其谱线值得到相应频段的目标谱线;饱和处理子模块,用于对声压级不小于第二声压级阈值的频段进行饱和处理。
如图5的声压级输入输出曲线所示,b即为正常听阈,d为正常痛阈,正常人能适应的声压级范围在b~d之间,即为正常听力下的动态声压级范围。把正常听力下的动态声压级范围按照由此图得到的增益调整为听力损伤者的动态声压级范围,就可以使听力受损者能听到正常人所听到的声音,满足听力受损者的听懂需求,当输入声压级在d~e时,表示声压级超过痛阈,声压级超过痛阈时会对听力造成损伤,因此本实施例对不小于痛阈的片段进行饱和处理有助于保护听力。
在本申请的一个具体实施例中,上述声压级阈值包括第三声压级阈值,优选的上述第三声压级阈值为正常舒适阈,在图5中,c表示的是正常舒适阈。目标谱线获取模块602,对于声压级不小于正常听阈并且小于正常舒适阈的频段内的谱线,对其谱线值进行放大,以便于听力受损者能听清。对于声压级不小于正常舒适阈并且小于正常痛阈的频段内的谱线,对齐谱线值进行压缩,能够便于避免引起听力受损者的不适。
图6示出的目标谱线编解码模块603,能够利用目标谱线继续进行lc3音频编码和/或解码步骤。保证完成完整的编解码过程,最终为听力损伤者提供高质量的音频。
在本申请的一个具体实施例中,上述目标谱线编解码模块603利用目标谱线继续进行标准lc3音频编码步骤,如图3所示,继续进行变换域噪声整形、时域噪声整形、量化、噪声电平估计、算术编码以及残差编码直至码流封装,最终进行码流输出,保证进行完整的编码过程。
在本申请的一个具体实施例中,上述目标谱线编解码模块603,利用目标谱线继续进行标准lc3音频解码步骤,如图4所示,继续进行低延迟改进型离散余弦反变换步骤以及长期后置滤波解码步骤,直至最终输出音频数据(pcm)。
在本申请的一个具体实施例中,本申请一种lc3音频编解码装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可装卸盘、cd-rom或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:centralprocessingunit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digitalsignalprocessor,简称:dsp)、专用集成电路(英文:applicationspecificintegratedcircuit,简称:asic)、现场可编程门阵列(英文:fieldprogrammablegatearray,简称:fpga)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如dsp与微处理器的组合、多个微处理器、结合dsp核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的另一个具体实施方式中,一种lc3音频编解码设备,包括lc3音频编码器以及lc3音频解码器,在lc3音频编解码器和/或lc3音频解码器上设置有上述方案中的lc3音频编解码装置。
在本申请的另一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述方案中的lc3音频编解码方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。