线性预测分析装置、方法、程序以及记录介质的制作方法_3

文档序号：9621055阅读：来源：国知局

的值决定为系数《。(0)，《。(1)，···，％$_)。此外，系数决定部24也可以取代周期而使用与周期处于正的相关关系的值，周期越大则将越大的值决定为系数w。(0)，w。(1)，…，w。(P_)。
[0123]艮P，系数w。⑴（i= 0, 1，..·，Ρ_)被决定为，对于至少一部分预测阶数i包含以下情况，即与该阶数i对应的系数W(](i)的大小具有随着与包含当前帧的输入信号X。(η)的全部或一部分的信号区间的基本频率处于负的相关关系的值的增加而单调增加的关系。
[0124] 换言之，根据阶数i，系数W(](i)的大小也可以不随着与基本频率处于负的相关关系的值的增加而单调增加。
[0125] 进而，在与基本频率处于负的相关关系的值可取的范围中，也可以存在系数wji) 的大小无论与基本频率处于负的相关关系的值是否增加都一定的范围，但设为在其他的范围中系数％α)的大小随着与基本频率处于负的相关关系的值的增加而单调增加。
[0126] 系数决定部24例如使用与所输入的有关周期的信息对应的有关周期的单调非减少函数，决定系数wji)。例如，通过以下的式（7)决定系数W(](i)。Τ是与所输入的有关周期的信息对应的周期。
[0127] [数 11]
[0128]
(7)
[0129] 或者，通过使用了大于0的预先决定的值即α的、以下的式（8)决定系数W(](i)。 α是在将系数W(](i)作为时滞窗来掌握时的时滞窗的宽度、换言之是用于调整时滞窗的强度的值。预先决定的α例如通过关于多个α的候选值，在包含线性预测分析装置2的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码，将解码声音信号或解码音响信号的主观质量或客观质量良好的候选值选择作为α而决定即可。
[0130] [数 12]
[0131]
(8)
[0132] 或者，也可以通过使用了有关周期Τ的预先决定的函数f(T)的、以下的式（8Α) 来决定系数《。⑴。函数f(T)是f(T) =αΤ+β(α是正的数，β是任意的数）、f(T)= αΤ2+βΤ+γ(α是正的数，β、γ是任意的数）等的、与周期T为正的相关关系且对于周期 Τ成为单调非减少的关系的函数。
[0133] [数 13]
[0134]
(8Α)
[0135] 此外，使用周期Τ来决定系数W(](i)的式不限于上述的式（7)、（8)、（8Α)，只要是能够描述相对于与基本频率处于负的相关关系的值的增加而单调非减少的关系的式，则也可以是其他的式。
[0136] 另外，也可以不是0兰i兰P_的各i，而仅关于至少一部分阶数i，系数W(](i)随着与基本频率处于负的相关关系的值的增加而单调增加。换言之，根据阶数i，系数W(](i) 的大小也可以不随着与基本频率处于负的相关关系的值的增加而单调增加。
[0137] 例如，在i= 0的情况下，也可以使用上述的式（7)、（8)、（8A)来决定《。(0)的值，也可以使用如在ITU-TG.718等中也使用的W(](0) = 1.0001、W(](0) = 1.003这样的不依赖与基本频率处于负的相关关系的值的、依据经验而得到的固定值。即，关于1gi5 ?_的各i，系数wji)在与基本频率处于负的相关关系的值越大时取越大的值，但关于i= 0的系数，并不局限于此，也可以使用固定值。
[0138] 根据第一实施方式的变形例的线性预测分析装置2,根据与基本频率处于负的相关关系的值，对于至少一部分预测阶数i，将包含以下情况的系数％α)与自相关相乘而求出变形自相关后求出能够变换为线性预测系数的系数，即与该阶数i对应的系数％α)的大小具有随着与包含当前帧的输入信号X。(η)的全部或一部分的信号区间的基本频率处于负的相关关系的值的增加而单调增加的关系，从而即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数，并且，即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数，能够实现与以往相比分析精度高的线性预测。从而，在包含第一实施方式的变形例的线性预测分析装置2的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码而得到的解码声音信号或解码音响信号的质量，比在包含以往的线性预测分析装置的编码装置和与该编码装置对应的解码装置中对声音信号或音响信号进行编解码而得到的解码声音信号或解码音响信号的质量要好。
[0139] [实验结果]
[0140] 图9是基于24个声音音响信号源和24人的被试验者的MOS评价实验的实验结果。图9的"以往方法""cutA"的6个MOS值是，对于使用包含以往的线性预测分析装置在内的图9中记载的各个位速率的编码装置和与这些编码装置对应的解码装置，对声音音响信号源进行编解码而得到的解码声音信号或解码音响信号的MOS值。图9的"提案方法《'cutB" 的6个MOS值是，对于使用包含第一实施方式的变形例的线性预测分析装置在内的图9中记载的各个位速率的编码装置和与这些编码装置对应的解码装置，对声音音响信号源进行编解码而得到的解码声音信号或解码音响信号的M0S值。根据图9的实验结果也可知，通过使用包含本发明的线性预测分析装置的编码装置和与该编码装置对应的解码装置，与包含以往的线性预测分析装置的情况相比，能够得到更高的M0S值即更好的质量。
[0141] [第二实施方式]
[0142] 第二实施方式将与基本频率处于正的相关关系的值或者与基本频率处于负的相关关系的值和预定的阈值进行比较，并根据该比较结果来决定系数wji)。第二实施方式只有系数决定部24中的系数wji)的决定方法不同于第一实施方式，其他点与第一实施方式同样。以下，以与第一实施方式不同的部分为中心进行说明，关于与第一实施方式同样的部分省略重复说明。
[0143] 在此，首先说明将与基本频率处于正的相关关系的值和预定的阈值进行比较，并根据该比较结果来决定系数W(](i)的例子，将与基本频率处于负的相关关系的值和预定的阈值进行比较，并根据该比较结果来决定系数％α)的例子在第二实施方式的第一变形例中进行说明。
[0144] 第二实施方式的线性预测分析装置2的功能结构和线性预测分析装置2的线性预测分析方法的流程图是与第一实施方式相同的图1和图2。第二实施方式的线性预测分析装置2除了系数决定部24的处理不同的部分以外，与第一实施方式的线性预测分析装置2 相同。
[0145]图3中示出第二实施方式的系数决定部24的处理的流程的例子。第二实施方式的系数决定部24例如进行图3的各步骤S41A、步骤S42、步骤S43的处理。
[0146] 系数决定部24将与基本频率处于正的相关关系的值和预定的阈值进行比较，该基本频率对应于所输入的有关基本频率的信息（步骤S41A)。与对应于所输入的有关基本频率的信息的基本频率处于正的相关关系的值，例如是与所输入的有关基本频率的信息对应的基本频率其本身。
[0147]系数决定部24在与基本频率处于正的相关关系的值为预定的阈值以上的情况下、即判断为基本频率高的情况下，通过预先决定的规则来决定系数wh(i)，将该决定的系数wh⑴（i= 0, 1，…，Pmax)设为w0⑴（i= 0, 1，…，Pmax)(步骤S42)。即，设为w0 ⑴= wh(i)〇
[0148] 系数决定部24在与基本频率处于正的相关关系的值不是预定的阈值以上的情况下、即判断为基本频率低的情况下，通过预先决定的规则来决定系数Wl (i)，将该决定的系数％⑴（i= 0, 1，…，Pmax)设为w0⑴（i= 0, 1，…，Pmax)(步骤S43)。即，设为w0⑴= wji)〇
[0149] 在此，wh(i)和wdi)决定为关于至少一部分的各i满足WhQXwJi)这样的关系。或者，wh(i)和％(1)决定为关于至少一部分的各i满足wh(i)〈Wl(i)这样的关系，关于除此以外的i满足wh(i)fWl(i)这样的关系。在此，至少一部分的各i是指例如0以外的i(即，1fifPmax)。例如，wh⑴和％⑴通过如下的预先决定的规则而求出：将在式 (1)中基本频率P为P1时的w。⑴作为wdi)而求出，将在式⑴中基本频率P为P2(其中，P1>P2)时的w。⑴作为而求出。此外，例如wh⑴和wji)通过如下的预先决定的规则而求出：将在式（2)中α为α1时的wQ(i)作为wh(i)而求出，将在式（2)中α为 α2(其中，α1>α2)时的w。⑴作为wji)而求出。该情况下，α1和α2都与式⑵的α 同样地预先决定。另外，也可以设为将通过这其中的任意规则而预先求出的wh(i)和^(1) 存储到表格中，并根据与基本频率处于正的相关关系的值是否为预定的阈值以上而从表格中选择wh(i)和％ (i)的其中一个的结构。此外，wh(i)和％ (i)分别被决定为随着i增大而 wh(i)，W(i)的值减小。另外，关于i= 0的系数wh(0),Wi(0)，不是必须要满足％(0) =Wi(0) 的关系，也可以使用满足wh (0)>Wl (0)的关系的值。
[0150] 通过第二实施方式也与第一实施方式同样地，即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数，并且，即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数，能够实现与以往相比分析精度高的线性预测。
[0151] 〈第二实施方式的第一变形例〉
[0152] 第二实施方式的第一变形例不是将与基本频率处于正的相关关系的值，而是将与基本频率处于负的相关关系的值和预定的阈值进行比较，并根据该比较结果来决定系数 W(](i)。第二实施方式的第一变形例中的预定的阈值，不同于在第二实施方式中和与基本频率处于正的相关关系的值进行比较的预定的阈值。
[0153] 第二实施方式的第一变形例的线性预测分析装置2的功能结构和流程图是与第一实施方式的变形例相同的图1和图2。第二实施方式的第一变形例的线性预测分析装置 2除了系数决定部24的处理不同的部分以外，与第一实施方式的变形例的线性预测分析装置2相同。
[0154] 图4中示出第二实施方式的第一变形例的系数决定部24的处理的流程的例子。第二实施方式的第一变形例的系数决定部24例如进行图4的步骤S41B、步骤S42、步骤S43 的处理。
[0155] 系数决定部24将与基本频率处于负的相关关系的值和预定的阈值进行比较，该基本频率对应于所输入的有关周期的信息（步骤S41A)。与对应于所输入的有关周期的信息的基本频率处于负的相关关系的值，例如是与所输入的有关周期的信息对应的周期。
[0156] 系数决定部24在与基本频率处于负的相关关系的值为预定的阈值以下的情况下、即判断为周期短的情况下，通过预先决定的规则来决定系数Wha)α= 〇,1，"·，ρ_)，将该决定的系数wh(i)(i= 0, 1，…，Pmax)设为W(j(i)(i= 0, 1，…，Pmax)(步骤S42)。SP，设为 w〇(i) =wh(i)〇
[0157]系数决定部24在与基本频率处于负的相关关系的值不是预定的阈值以下的情况下、即判断为周期长的情况下，通过预先决定的规则来决定系数Wla)α= 〇,1，"·，ρ_)，将该决定的系数Wi(i)设为w。(i)(步骤S43)。即，设为w。(i) =Wi(i)。
[0158] 在此，wh(i)和wdi)决定为关于至少一部分i满足WhQXwiQ)这样的关系。或者，wh(i)和％(;〇决定为关于至少一部分i满足WhQXwJi)这样的关系，关于其他的i满足^⑴刍Wl⑴这样的关系。在此，至少一部分i是指例如0以外的i(BP，l刍i刍P_)。例如，wh(i)和^(1)通过如下的预先决定的规则而求出：将在式（7)中周期T为T1时的 w〇(i)作为wh(i)而求出，将在式（7)中周期T为T2(其中，T1〈T2)时的w〇(i)作为Wl(i)而求出。此外，例如wh(i)和^(1)通过如下的预先决定的规则而求出：将在式（8)中α为 α1时的w。⑴作为而求出，将在式⑶中α为α2(其中，α1〈α2)时的w。⑴作为％(1)而求出。该情况下，α1和α2都与式（8)的α同样地预先决定。另外，也可以设为将通过这其中的任意规则而预先求出的wh(i)和^(1)存储到表格中，并根据与基本频率处于负的相关关系的值是否为预定的阈值以下而从表格中选择Wh(i)和￥1(1)的其中一个的结构。此外，wh(i)和^(;〇分别被决定为随着i增大而的％(;〇，'\￥1(;〇值减小。另外，关于i=〇的系数wh(0)，Wl(0)，不是必须要满足％(0)fWl(0)的关系，也可以使用满 Mwh(0)>Wl(0)的关系的值。
[0159] 通过第二实施方式的第一变形例也与第一实施方式的变形例同样地，即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系数，并且，即使在输入信号的基本频率低时也能够求出能够变换为可表现频谱包络的线性预测系数的系数，能够实现与以往相比分析精度高的线性预测。
[0160] 〈第二实施方式的第二变形例〉
[0161] 在第二实施方式中使用一个阈值决定了系数W(](i)，但第二实施方式的第二变形例使用两个以上的阈值来决定系数wji)。以下，例举使用两个阈值thl'，th2'来决定系数的方法进行说明。假设阈值也1'，也2'满足0〈也1'〈也2'这样的关系。
[0162] 第二实施方式的第二变形例的线性预测分析装置2的功能结构是与第二实施方式相同的图1。第二实施方式的第二变形例的线性预测分析装置2除了系数决定部24的处理不同的部分以外，与第二实施方式的线性预测分析装置2相同。
[0163] 系数决定部24将与基本频率处于正的相关关系的值和阈值thl'，th2'进行比较，该基本频率对应于所输入的有关基本频率的信息。与对应于所输入的有关基本频率的信息的基本频率处于正的相关关系的值，例如是与所输入的有关基本频率的信息对应的基本频率其本身。
[0164] 系数决定部24在与基本频率处于正的相关关系的值大于阈值th2'的情况下、即判断为基本频率高的情况下，通过预先决定的规则来决定系数wh(i)(i= 0, 1，···，？_)，将该决定的系数wh(i)(i= 0, 1，…，Pmax)设为wji)(i= 0, 1，…，Pmax)。即，设为wji)= wh(i)〇
[0165] 系数决定部24在与基本频率处于正的相关关系的值大于阈值thl'且为阈值 th2'以下的情况下、即判断为基本频率是中等程度的情况下，通过预先决定的规则来决定系数wji)(i= 0, 1，…，Pmax)，将该决定的系数wji)(i= 0, 1，…，Pmax)设为w。⑴（i= 〇，l，"％Pmax)。即，设为W(j(i) =wm(i)。
[0166] 系数决定部24在与基本频率处于正的相关关系的值为阈值thl'以下的情况下、即判断为基本频率低的情况下，通过预先决定的规则来决定系数Wl(i)(i= 〇, 1，-·，Ρ_)，将该决定的系数％ (i)(i= 0, 1，…，Pmax)设为wji)(i= 0, 1，…，Pmax)。即，设为wji)= wji)〇
[0167] 在此，假设wh⑴，Wni⑴，wji)决定为关于至少一部分的各i满足 Wh⑴〈Wm⑴〈Wi⑴这样的关系。在此，至少一部分的各i是指例如0以外的各 i(即，1fifPmax)。或者，wh (i)，wm(i)，Wi⑴决定为关于至少一部分的各i满足 wh(i)〈wm(i)fwji)，关于除此以外的i中的至少一部分的各i满足wh(i)fWmQXwJi)，关于剩余的至少一部分的各i满足wh⑴fwm⑴fWi⑴这样的关系。例如， wh(i),wm(i),wji)通过如下的预先决定的规则而求出：将在式（1)中基本频率P为P1时的wji)作为wh(i)而求出，将在式（1)中基本频率P为P2(其中，P1>P2)时的W(](i)作为wji)而求出，将在式（1)中基本频率P为P3(其中，P2>P3)时的W(](i)作为Wl(i)而求出。此外，例如wh(i)，wm(i)，w1⑴通过如下的预先决定的规则而求出：将在式⑵中α为 a1时的w。⑴作为而求出，将在式⑵中a为a2(其中，a1>a2)时的w。⑴作为wji)而求出，将在式⑵中a为a3(其中，a2>a3)时的w。⑴作为％⑴而求出。该情况下，a1，a2,a3都与式（2)的a同样地预先决定。另外，也可以设为将通过这其中的任意规则而预先求出的wh(i),wm(i),Wi(i)存储到表格中，并通过与基本频率处于正的相关关系的值和预定的阈值的比较而从表格中选择wh(i)，wm(i)，Wi(i)的其中一个的结构。另外，也可以使用wh⑴和wji)来决定其中间的系数wji)。即，也可以通过wji)= β'Xwj/i) + (l-0 '）Xwji)来决定wm(i)。在此，β'是，0兰β'兰1，并且，通过在基本频率Ρ取较小的值时β'的值也会减小而在基本频率Ρ取较大的值时β'的值也会增大的函数β' =c(P)，根据基本频率Ρ而求出的值。这样，若求出Wni(i)，则通过在系数决定部24 中只将存储了wh(i)(i= 0, 1，"·，Ρ_)的表格和存储了Wl(i)(i= 0, 1，"·，Ρ_)的表格这两个表格进行存储，从而在基本频率为中等程度的情况中的基本频率较大时能够得到接近 wh(i)的系数，相反在基本频率为中等程度的情况中的基本频率较小时能够得到接近％ (i) 的系数。此外，wh (i)，wm (i)，Wi⑴被决定为随着i增大而wh (i)，wm (i)，Wi⑴的值分别减小。另外，关于1 = 〇的系数》11(0)，'\￥"1(0)，'\￥1(0)，不是必须要满足％(0)5'\￥" 1(0)5'\￥1(0)的关系，也可以使用满足wh(0)>Wni(0)和/或Wni(0)>Wl(0)的关系的值。
[0168] 通过第二实施方式的第二变形例也与第二实施方式同样地，即使在输入信号的基本频率高时也能够求出能够变换为抑制了间距分量引起的谱峰的发生的线性预测系数的系

完整全部详细技术资料下载

当前第3页1 2 3 4 5 6