语音数据的编码方法和系统的制作方法

文档序号:9616942阅读:363来源:国知局
语音数据的编码方法和系统的制作方法
【技术领域】
[0001] 本发明涉及通信技术,尤其是一种语音数据的编码方法和系统。
【背景技术】
[0002] 随着语音编码技术的不断发展,语音编码方式逐渐丰富,从G. 711编码到最新提 出的Opus编码,在语音编码效率提升的同时,计算复杂度也迅速增大,软硬件实现难度也 更高。通信终端,特别是嵌入式移动终端,受到计算、存储、功耗、体积、成本等因素限制,在 引入复杂度较高的语音编码方式存在诸多限制。
[0003] 在现有的各种语音编码方式中,基于G. 729协议的语音编码方式,对输入语音性 质的模拟信号用8kHz、采样,16比特线性脉冲编码调制(PCM)量化。G. 729协议使用的算法 是共轭结构的算术码本激励线性预测(CS-ACELP),它基于码本激励线性预测(CELP)编码 模型。由于采用G. 729协议的编码器(本发明中简称为:G. 729编解码器)具有很高的语 音质量和很低的延时,目前已被广泛地应用在数据通信的各个领域,例如,互联网协议电话 (VoIP)和基于H. 323多媒体通信标准的网上多媒体通信系统等。
[0004] G. 729编解码过程的一个重要步骤是使用编码参数--矢量量化码本,对语音数 据进行两级矢量量化编码。其中的矢量量化码本由两级容量不同的码本构成:第一级是10 维码本(用7比特进行整体矢量量化),记为L1,如后续表1所示;第二级是将10维码本分 裂为两个5维的码本(分别用5比特进行矢量量化),分别记为L2、L3,如后续表2所示。
[0005] 在实现本发明的过程中,发明人发现,现有G.729编解码方式至少存在以下问题:
[0006] 现有的G. 729编码器中,采用的矢量量化码本LI、L2、L3都是固定的,基于不同语 言和不同用户训练得到,如后续表1、表2所示。因此,所有通信终端中G. 729编解码器采 用的编码参数均相同且确定,即:所有G. 729编解码器对不同语言、不同用户的语音数据进 行编码时,使用的矢量量化码本均相同。由于不同语言、不同用户的语音特征存在个性化差 异,对所有语言、用户的语音数据进行采用同样的编码参数进行编码,无法保证编码效率和 语音质量,用户体验较差。

【发明内容】

[0007] 本发明实施例所要解决的一个技术问题是:提供一种语音数据的编码方法和系 统,以提高语音编码的编码效率和语音质量。
[0008] 本发明实施例提供的一种语音数据的编码方法,包括:
[0009] 通信终端在与对端通信终端进行语音通话的过程中,提取所述通信终端采集的语 音数据的语音特征矢量,并发送给分析服务器;
[0010] 分析服务器采用基于距离的聚类算法对所述通信终端最近上传的N个语音特征 矢量进行计算,获得新的编解码参数;其中,N为预设正整数;
[0011] 分析服务器将所述新的编解码参数作为编码参数发送给所述通信终端,将所述新 的编解码参数作为解码参数发送给所述对端通信终端;
[0012] 所述通信终端将该通信终端中编码器的编码参数更新为所述新的编解码参数,所 述对端通信终端将该对端通信终端中解码器的解码参数更新为所述新的编解码参数;
[0013] 所述通信终端中编码器利用更新后的编码参数对所述通信终端采集的语音数据 进行编码,并通过通信网络向所述对端通信终端传输编码得到的语音码流数据;
[0014] 所述对端通信终端中解码器利用更新后的解码参数对所述通信终端传输的采集 的语音码流数据进行解码。
[0015] 本发明实施例提供的一种语音数据的编码系统,包括进行语音通话的通信终端 和对端通信终端,通信终端和对端通信终端中均设置有编码器和解码器,还包括分析服务 器;
[0016] 所述通信终端,用于在与对端通信终端进行语音通话的过程中,提取所述通信终 端采集的语音数据的语音特征矢量,并发送给分析服务器;以及将该通信终端中编码器的 编码参数更新为所述分析服务器发送的新的编解码参数;以及通过编码器利用更新后的编 码参数对所述通信终端采集的语音数据进行编码,并通过通信网络向所述对端通信终端传 输编码得到的语音码流数据;
[0017] 所述分析服务器,用于采用基于距离的聚类算法对所述通信终端最近上传的N个 语音特征矢量进行计算,获得新的编解码参数;其中,N为预设正整数;将所述新的编解码 参数作为编码参数发送给所述通信终端,将所述新的编解码参数作为解码参数发送给所述 对端通信终端;
[0018] 所述对端通信终端,用于将该对端通信终端中解码器的解码参数更新为所述新的 编解码参数;以及通过解码器利用更新后的解码参数对所述通信终端传输的采集的语音码 流数据进行解码。
[0019] 基于本发明上述实施例提供的语音数据的编码方法和系统,通信终端在与对端通 信终端进行语音通话的过程中,提取其自身采集的语音数据的语音特征矢量并发送给分析 服务器,由分析服务器采用基于距离的聚类算法对其进行计算,获得新的编解码参数,将其 作为编码参数发送给通信终端、作为解码参数发送给对端通信终端;通信终端将该通信终 端中编码器的编码参数更新为新的编解码参数,对端通信终端将该对端通信终端中解码器 的解码参数更新为新的编解码参数。这样,通信终端中编码器在随后便可以利用更新后的 编码参数对通信终端采集的语音数据进行编码,并通过通信网络向对端通信终端传输编码 得到的语音码流数据,由对端通信终端中解码器利用更新后的解码参数对通信终端传输的 采集的语音码流数据进行解码。与现有技术相比,本发明实施例具有以下有益技术效果:
[0020] 基于通信终端当前采集的语音数据的语音特征矢量来计算匹配的个性化的编码 参数,使得编码参数更符合当前用户、当前使用语言个性化的语音特征,例如,特定说话用 户的发声模型,利用该个性化的编码参数替代编码器中的原编码参数,实现了编码参数的 优化,利用优化的编码参数对语音数据进行编码,可以减少矢量量化造成的误差,从而提高 编码效率和语音质量,可以提高用户体验;
[0021] 本发明实施例由网络侧的分析服务器来计算匹配的个性化的编码参数,不会增加 终端侧编码器的实现复杂度,不会增加编码器和解码器的存储量和计算量,且并不需要修 改语音编码算法本身,不需要对通信终端的编解码器进行改造;
[0022] 由于通信终端上传给服务器的只是语音特征矢量,而非语音数据本身,因此不会 出现用户私隐泄露的问题。
[0023] 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
【附图说明】
[0024] 构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释 本发明的原理。
[0025] 参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
[0026] 图1为本发明语音数据的编码方法一个实施例的流程图。
[0027] 图2为本发明语音数据的编码方法另一个实施例的流程图。
[0028] 图3为本发明语音通信系统的一个示例性架构图。
[0029] 图4为本发明语音数据的编码系统一个实施例的结构示意图。
【具体实施方式】
[0030] 现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具 体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本 发明的范围。
[0031] 同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际 的比例关系绘制的。
[0032] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明 及其应用或使用的任何限制。
[0033] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适 当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0034] 在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不 是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0035] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一 个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0036] 图1为本发明语音数据的编码方法一个实施例的流程图。如图1所示,该实施例 语音数据的编码方法包括:
[0037] 110,通信终端在与对端通信终端进行语音通话的过程中,提取该通信终端自身采 集的语音数据的语音特征矢量,并发送给分析服务器。
[0038] 120,分析服务器采用基于距离的聚类算法,对通信终端最近上传的N个语音特征 矢量进行计算,获得新的编解码参数。
[0039] 其中,N为预设正整数。
[0040] 130,分析服务器将新的编解码参数作为编码参数发送给通信终端,并将该新的编 解码参数作为解码参数发送给对端通信终端。
[0041] 140,通信终端将该通信终端中编码器的编码参数更新为新的编解码参数,实现编 码参数的优化;对端通信终端将该对端通信终端中解码器的解码参数更新为新的编解码参 数。
[0042] 150,通信终端中编码器利用更新后的编码参数对该通信终端采集的语音数据进 行编码,并通过通信网络向对端通信终端传输编码得到的语音码流数据。
[0043]160,对端通信终端中解码器利用更新后的解码参数对通信终端传输的采集的语 音码流数据进行解码。
[0044]基于本发明上述实施例提供的语音数据的编码方法,通信终端在与对端通信终端 进行语音通话的过程中,提取其自身采集的语音数据的
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1