音频去噪方法、装置、计算机设备和存储介质与流程

文档序号:33636828发布日期:2023-03-29 00:53阅读:83来源:国知局
音频去噪方法、装置、计算机设备和存储介质与流程

1.本技术涉及计算机技术领域,特别是涉及一种音频去噪方法、装置、计算机设备和存储介质。


背景技术:

2.随着噪声处理领域的发展,出现了音频去噪技术,在传统的音频去噪技术中,可以采用比如高通滤波器消除低频噪声,或者用一些陷波滤波器消除某些频段的持续声。
3.然而,目前的音频去噪方法,需要先提前进行噪声特征的标注,比如确定噪声出现的频段,或者预先确定噪声的频谱能量等,再基于所确定的噪声特征进行噪声处理;这种方式,对于未提前标注噪声特征的使用场景,处理效果不够理想。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种能够无需事先标注噪声特征,即可直接对音频数据进行去噪处理的音频去噪方法、装置、计算机设备和存储介质。
5.第一方面,本技术提供了一种音频去噪方法,该方法包括:
6.对音频数据的编码序列进行移位变换,得到移位序列集;
7.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
8.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
9.根据子序列的统计特征,对音频数据进行去噪处理。
10.在其中一个实施例中,对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集,包括:
11.基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集;
12.基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得到移位序列对应的子序列集;其中,第一设定长度大于第二设定长度。
13.在其中一个实施例中,对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征,包括:
14.针对子序列集中的每一子序列,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征;其中,第一目标字符串与目标字符串不同。
15.在其中一个实施例中,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征,包括:
16.将该子序列的长度与该子序列中第一目标字符串的数量之间的比值,作为该子序列的统计特征中的第一概率分布;
17.将该子序列的长度与该子序列中第二目标字符串的数量之间的比值,作为该子序列的统计特征中的第二概率分布。
18.在其中一个实施例中,根据子序列的统计特征,对音频数据进行去噪处理,包括:
19.根据统计特征,对子序列进行聚类;
20.根据各类中子序列的数量,确定音频数据中噪声分布区域;
21.对噪声分布区域进行去噪处理。
22.在其中一个实施例中,根据子序列的统计特征,对音频数据进行去噪处理,包括:
23.根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布;
24.根据移位序列的第一概率分布,得到移位序列集的第一概率分布;
25.根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的第二概率分布;
26.根据移位序列的第二概率分布,得到移位序列集的第二概率分布;
27.根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
28.第二方面,本技术还提供了一种音频去噪装置,该装置包括:
29.数据移位模块,用于对音频数据的编码序列进行移位变换,得到移位序列集;
30.序列划分模块,用于对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
31.测度分析模块,用于对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
32.音频去噪模块,用于根据子序列的统计特征,对音频数据进行去噪处理。
33.第三方面,本技术还提供了一种计算机设备,该计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
34.对音频数据的编码序列进行移位变换,得到移位序列集;
35.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
36.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
37.根据子序列的统计特征,对音频数据进行去噪处理。
38.第四方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
39.对音频数据的编码序列进行移位变换,得到移位序列集;
40.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
41.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
42.根据子序列的统计特征,对音频数据进行去噪处理。
43.第五方面,本技术还提供了一种计算机程序产品,该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
44.对音频数据的编码序列进行移位变换,得到移位序列集;
45.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
46.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
47.根据子序列的统计特征,对音频数据进行去噪处理。
48.上述音频去噪方法、装置、计算机设备和存储介质,通过对音频数据的编码序列进行移位变换,可得到移位序列集,并对移位序列集中的移位序列进行划分,可得到移位序列
对应的子序列集,进而对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征,并基于子序列的统计特征,可直接对音频数据进行去噪处理。上述方案,通过直接对需要进行去噪处理的音频数据的编码序列进行移位变换、划分、测度分析等处理,获得统计特征,并基于统计特征,即可对音频数据中可能存在的噪声进行识别和去噪处理,相比于相关音频去噪方法而言,无需提前进行噪声特征的标注,降低了音频去噪的复杂度,扩宽了音频去噪处理的使用场景;此外,本技术通过对音频数据移位变换、划分、测度分析等处理所引入的统计特征,抗干扰能力较强,进而使得音频去噪的结果更为精准。
附图说明
49.图1为一个实施例中音频去噪方法的应用环境图;
50.图2为一个实施例中音频去噪方法的流程示意图;
51.图3为一个实施例中对移位序列进行划分的流程示意图;
52.图4为一个实施例中确定子序列的统计特征的流程示意图;
53.图5为一个实施例中基于统计特征进行音频去噪的流程示意图;
54.图6为另一个实施例中基于统计特征进行音频去噪的流程示意图;
55.图7为又一个实施例中音频去噪方法的流程示意图;
56.图8为一个实施例中音频去噪装置的结构框图;
57.图9为一个实施例中序列划分模块的结构框图;
58.图10为一个实施例中测度分析模块的结构框图;
59.图11为一个实施例中计算机设备的内部结构图。
具体实施方式
60.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
61.本技术实施例提供的音频去噪方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据,例如,待去噪的音频数据等。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。本技术实施例提供的音频去噪方法可应用于服务器104,也可以应用于终端102,还可以通过终端102和服务器104的交互实现。示例性的,服务器104对音频数据的编码序列进行移位变换,得到移位序列集,对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集,对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征,进而根据子序列的统计特征,可对音频数据进行去噪处理;进一步的,服务器104可以将经过处理后的音频数据发送给终端102,以便终端102基于实际使用场景对处理后的音频数据进行后续处理,比如进行声源识别等。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
62.目前的音频去噪方法,需要先提前进行噪声特征的标注,比如确定噪声出现的频段,或者预先确定噪声的频谱能量等噪声特征才能进行去噪处理。例如,针对车内通话录音
进行去噪时,通过对其他的车内通话录音进行分析,确定噪声频谱能量,进而基于所确定的噪声能量谱,来对待去噪的音频数据进行去噪处理。这种方式,对于未提前标注噪声特征的使用场景,处理效果不够理想。
63.基于此,在一个实施例中,如图2所示,提供了一种音频去噪方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
64.s201,对音频数据的编码序列进行移位变换,得到移位序列集。
65.其中,音频数据即为待去噪的音频数据;编码序列即为按照设定的编码规则,对音频数据进行编码所得到的序列。可选的,可以根据其他音频数据的去噪结果来确定编码规则。例如,编码规则是二进制编码,此时对音频数据进行编码得到的编码序列即为比特序列。
66.可选的,移位变换指的是通过移位来改变编码序列排序的一种方式,本实施例中可以根据编码序列的编码方式,以及音频数据的来源和使用场景等来确定移位方式。移位方式包括向右移位、向左移位、以及向左和向右交叉移位等。例如,对采用二进制编码规则对音频数据进行编码所得到的编码序列进行移位变换的方式可以是,将编码序列向右移位设定长度,且对于移出的字符,按原顺序添加到编码序列的起始位置。
67.移位序列集中可以包括一个或多个移位序列。可选的,可以采用多个不同移位长度,分别对编码序列进行移位变换,得到移位序列集。在一个可实施方式中,不同移位长度可构成一个等差数列,例如第一个移位长度为1,第二个移位长度为2,

第n个移位长度为n等。例如,在移位变换为向右移动方式的情况下,假设待去噪的音频数据采用二级制编码得到的编码序列为1011010010100110,一个移位长度m=4,一个移位长度为m=8,则在进行移位变换后,可以得到移位序列0110101101001010,以及移位序列1010011010110100。
68.示例性的,由于采用二进制编码的音频数据的编码序列的长度过长,且该序列的长度多为2n,所以进行移位变换时,可以选择长度m=2n为移位长度。其中,移位长度小于编码序列的长度。进一步的,移位序列的长度等于编码序列的长度。
69.s202,对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集。
70.可选的,可以基于编码方式和编码序列的长度等,来确定划分规则;按照划分规则,对移位序列集中的各移位序列进行划分。具体的,针对移位序列集中的每一移位序列,按照划分规则,对该移位序列进行划分,以得到该移位序列对应的子序列集。示例性的,为便于后续处理,划分规则中的划分长度可以为移位序列长度可以整除的数。
71.例如,假设一个移位序列为0110101101001010,根据该移位序列的长度确定划分长度可以为4,采用自左向右的方式对该移位序列进行划分,得到该移位序列的子序列集为{0110,1011,0100,1010}。
72.进一步的,由于移位序列的长度过长,可以采用对该移位序列进行多层次划分的方式得到子序列集,即划分的次数可以大于一次。在实际应用中,为了保证去噪结果的准确性,以及去噪的高效性,可以采用两次划分的方式对移位序列进行划分,具体划分的过程将在后续实施例中进行详细说明。
73.s203,对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征。
74.本实施例中,可以根据编码序列中所包含的编码字符来确定目标字符串。例如,编
码序列中所包含的编码字符包括1、0、10、11、01、00等,由于在进行移位变化的时候字符串会发生变化,因此在本实施例中可以针对字符串1、01进行分析。测度分析也可称为统计分析,用于统计目标字符串在子序列中出现的情况。
75.具体的,针对每一移位序列对应的子序列集中的每一子序列,可以统计目标字符串在该子序列中出现的数量,并按照设定转换规则,对所统计的数量进行转化处理,得到该子序列的统计特征。例如,可以基于所统计的数量与该子序列所对应的移位序列的长度之比来确定该子序列的统计特征。
76.需要说明的是,本实施例中目标字符串的数量可以为一个或多个;为保证去噪处理的准确度,在一可实施方式中,目标字符串的数量为至少两个。进一步的,对于每一子序列,分别对该子序列进行每一目标字符串的测度分析,来确定该子序列的统计特征。
77.s204,根据子序列的统计特征,对音频数据进行去噪处理。
78.具体的,可以对所有子序列的统计特征进行统计分析,得到噪声分布情况;基于得到的噪声分布情况,将具有噪声的子序列映射到音频数据的编码序列中,基于该编码序列能够准确的得到噪声所处的频段,进一步的,针对已经确定的噪声频段进行去噪处理。其中,去噪处理可以采用滤波处理等操作。
79.示例性的,还可以基于历史的音频去噪数据训练得到一个可以进行音频去噪处理的神经网络模型,将音频数据和上述得到的噪声分布情况输入到已经训练好的神经网络模型中,该模型就可以进行自动去噪处理。
80.上述音频去噪方法中,通过对音频数据的编码序列进行移位变换,可得到移位序列集,并对移位序列集中的移位序列进行划分,可得到移位序列对应的子序列集,进而对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征,并基于子序列的统计特征,可直接对音频数据进行去噪处理。上述方案,通过直接对需要进行去噪处理的音频数据的编码序列进行移位变换、划分、测度分析等处理,获得统计特征,并基于统计特征,即可对音频数据中可能存在的噪声进行识别和去噪处理,相比于相关音频去噪方法而言,无需提前进行噪声特征的标注,降低了音频去噪的复杂度,扩宽了音频去噪处理的使用场景;此外,本技术通过对音频数据移位变换、划分、测度分析等处理所引入的统计特征,抗干扰能力较强,进而使得音频去噪的结果更为精准。
81.图3为一个实施例中对移位序列进行划分的流程示意图,本实施例在上述实施例的基础上,对s202即对移位序列进行划分得到子序列集的操作进行进一步的详细阐述,具体可以包括以下步骤:
82.s301,基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集。
83.其中,第一设定长度指的是,基于音频数据的编码方式和移位序列的长度等设置的一个可以对移位序列进行合理划分的长度。进一步的,第一设定长度小于移位序列的长度。
84.具体的,对于移位序列集中的每一移位序列,可以以第一设定长度为划分单位,按照从左到右的顺序,对该移位序列进行划分,并将划分后得到的序列按照时间顺序进行排列,得到该移位序列对应的窗口序列集,即一个移位序列对应一个窗口序列集。进一步的,一个窗口序列集中包括至少两个窗口序列。
85.s302,基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得到移位序列对应的子序列集。
86.与第一设定长度相对应,第二设定长度指的是,基于音频数据的编码方式和窗口序列的长度等设置的一个可以对窗口序列进行合理划分的长度。其中,第二设定长度小于第一设定长度。
87.具体的,对于每一移位序列而言,可以以基于第二设定长度为划分单位,按照从左到右的顺序,对该移位序列对应的窗口序列集中的各窗口序列进行划分,可以得到移位序列对应的子序列集。可选的,一个窗口序列可以划分为多个子序列,即一个窗口序列对应一个子序列集。进一步的,一个移位序列包括多个窗口序列,进而一个移位序列对应多个子序列集。
88.可以理解的是,本实施例中,通过对移位序列进行多次划分,使得到的子序列更为细粒度,进而能够更精准的分析音频数据的特征,即可更精准的定位噪声位置,从而提高音频去噪处理的准确性。
89.需要说明的是,进行移位序列的划分时,可能会出现子序列长度划分不均的情况,为了规避划分所引入的误差。在上述实施例的基础上,在确定子序列的统计特征的过程中,引入子序列的长度。可选的,针对每一移位序列对应的子序列集中的每一子序列,可以根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征;其中,第一目标字符串与目标字符串不同。
90.可选的,结合图4所示,具体实现过程包括以下步骤:
91.s401,将该子序列的长度与该子序列中第一目标字符串的数量之间的比值,作为该子序列的统计特征中的第一概率分布。
92.其中,第一目标字符串指的是基于音频数据的编码方式得到的一种可以衡量子序列中字符分布情况的字符串;第一概率分布指的是第一目标字符串在该子序列中出现的频率。
93.可选的,在编码序列为比特序列的情况下,可以将第一目标字符串设置为1,第一概率分布设为p。进一步的,基于目标子序列的长度k与该子序列中第一目标字符串的数量m1,可以得到该子序列的统计特征中的第一概率分布p=k/m1。
94.s402,将该子序列的长度与该子序列中第二目标字符串的数量之间的比值,作为该子序列的统计特征中的第二概率分布。
95.其中,第二目标字符串指的是基于音频数据的编码方式得到的另一种可以衡量子序列中字符分布情况的字符串;第二概率分布指的是第二目标字符串在该子序列中出现的频率。
96.可选的,在编码序列为比特序列的情况下,可以将第二目标字符串设置为01,第二概率分布设为q。进一步的,基于目标子序列的长度k与该子序列中第二目标字符串的数量m2,可以得到该子序列的统计特征中的第二概率分布q=k/m2。
97.本实施例中,通过采用统计方法提取统计特征,即计算子序列中目标字符串的概率分布,来获取该子序列的统计特征,提高了音频去噪的抗干扰能力。
98.图5为一个实施例中基于统计特征进行音频去噪的流程示意图,在上述实施例的基础上,本实施例进一步对s204进行详细解释说明,具体包括以下步骤:
99.s501,根据统计特征,对子序列进行聚类。
100.可选的,本实施例中将具有相同统计特征的子序列作为一类。进一步的,在子序列的统计特征包括第一概率分布和第二概率分布的情况下,可以将具有相同第一概率分布,且相同第二概率分布的子序列作为一类。即一类实质为一种类型的统计特征。
101.s502,根据各类中子序列的数量,确定音频数据中噪声分布区域。
102.可以理解的是,音频数据中的噪声数据的统计特征相比于正常音频数据的统计特征而言种类多,数量少,这就导致了在对子序列的统计特征进行聚类时,会出现一些数量少的统计特征种类,具有该统计特征的子序列则为噪声所在序列。
103.可选的,可以统计s501中得到的每一类中子序列的数量,并基于各类中子序列的数量,按照降序排序方式,对各类进行排序;从排序结果中选择数量小于设定阈值的目标类;基于对编码序列移位、划分的方式,将目标类中的子序列映射至音频数据的编码序列中,得到噪声分布区域,即音频数据中噪声分布区域。
104.s503,对噪声分布区域进行去噪处理。
105.具体的,在确定噪声分布区域后,针对噪声分布区域进行滤波处理。可选的,可以通过消除该子序列的方法进行去噪处理,以实现对音频数据的去噪处理。
106.本实施例中,通过根据统计特征对子序列进行聚类,确定音频数据中噪声分布区域,相比于相关音频去噪方法而言,无需提前进行噪声特征的标注,降低了音频去噪的复杂度,扩宽了音频去噪处理的使用场景。同时对噪声分布区域进行去噪处理,提高音频去噪的准确性。
107.图6为另一个实施例中基于统计特征进行音频去噪方的流程示意图,在上述实施例的基础上,本实施例进一步对s204进行详细解释说明,具体包括以下步骤:
108.s601,根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布。
109.具体的,对于移位序列集中每一移位序列,基于该移位序列对应的子序列集中各子序列统计特征中的第一概率分布,统计出具有相同第一概率分布的子序列的个数,进而确定该移位序列的第一概率分布。
110.例如,该移位序列对应的子序列集中存在100个p=0.2的子序列,存在110个p=0.3的子序列,存在200个p=0.5的子序列,那么此时该移位序列的第一概率分布可以表示为:{(0.2,100),(0.3,110),(0.5,200)}。
111.s602,根据移位序列的第一概率分布,得到移位序列集的第一概率分布。
112.具体的,对移位序列集中各移位序列的第一概率分布进行统计分析,即可得到整个移位序列集的第一概率分布。例如,可以对各移位序列中相同的p进行线性相加,以得到整个移位序列集的第一概率分布。
113.例如,移位序列集中包括3个移位序列,其中移位序列1的第一概率分布为{(0.2,100),(0.3,110),(0.5,200)},移位序列2的概率分布为{(0.1,100),(0.4,110),(0.5,200)},移位序列3的概率分布为{(0.6,100),(0.3,110),(0.1,200)},对各移位序列进行线性相加,可得到整个移位序列集的第一概率分布为{(0.1,300),(0.2,100),(0.3,220),(0.4,110),(0.5,400),(0.6,100)}。
114.s603,根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的
第二概率分布。
115.与步骤s601相对应,对于移位序列集中每一移位序列,基于该移位序列对应的子序列集中各子序列统计特征中的第二概率分布,统计出具有相同第二概率分布的子序列的个数,进而确定该移位序列的第二概率分布。
116.例如,该移位序列对应的子序列集中存在120个q=0.15的子序列,存在150个q=0.2的子序列,存在180个q=0.33的子序列,那么此时该移位序列的第二概率分布可以表示为:{(0.15,120),(0.2,150),(0.33,180)}。
117.s604,根据移位序列的第二概率分布,得到移位序列集的第二概率分布。
118.同理可知,对移位序列集中各移位序列的第二概率分布进行统计分析,即可得到整个移位序列集的第二概率分布。例如,可以对各移位序列中相同的q进行线性相加,以得到整个移位序列集的第二概率分布。
119.例如,移位序列集中包括3个移位序列,其中移位序列1的第二概率分布为{(0.15,120),(0.2,150),(0.33,180)},移位序列2的概率分布为{(0.1,100),(0.33,110),(0.5,200)},移位序列3的概率分布为{(0.33,100),(0.5,110),(0.7,200)},对各移位序列进行线性相加,可得到整个移位序列集的第一概率分布为{(0.1,100),(0.15,120),(0.2,150),(0.33,220),(0.4,390),(0.5,310),(0.7,200)}。
120.s605,根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
121.具体的,将移位序列集中的第一概率分布p和第二概率分布q进行组合,随后将得到的p、q概率组合,与子序列存在的概率组合进行比对,若在子序列中存在该概率组合,则该概率组合有效;若在子序列中不存在该概率组合,则该概率组合无效。
122.进一步的,基于有效的p、q概率组合,得到一系列(x,y,z)坐标。其中,x代表第一概率分布,y代表第二概率分布,z代表概率组合出现的次数,比如一个概率组合为p=0.2,q=0.5,此时z=c1(即移位序列集中p=0.2出现的次数)+c2(即移位序列集中q=0.5出现的次数)。随后,基于转化得到的一系列的(x,y,z)坐标,构建一个三维立体图,从图中可以直观的得到在子序列中出现次数较少的概率组合,这些出现次数小于预设阈值的概率组合即可视为噪声的统计特征。
123.更进一步的,基于对编码序列移位、划分的方式,将视为噪声统计特征的概率组合映射至音频数据的编码序列中,得到噪声分布区域,即音频数据中噪声分布区域。在确定噪声分布区域后,针对噪声分布区域进行去噪处理。
124.本实施例中,基于对编码序列的移位、划分处理的逻辑,根据子序列的统计特征可推导出移位序列集的第一概率分布和第二概率分布,进而基于移位序列集的概率分布,可实现对音频数据的去噪处理,上述方案,为精准识别以及去除音频数据的噪声提供了一种可选方式。
125.图7为又一个实施例中音频去噪方法的流程示意图,在上述实施例的基础上,本实施例提供了一种音频去噪方法的可选实例。结合图7,具体实现过程如下:
126.s701,对音频数据的编码序列进行移位变换,得到移位序列集。
127.s702,基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集。
128.s703,基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得到移位序列对应的子序列集。
129.s704,针对子序列集中的每一子序列,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征。
130.其中,第一目标字符串与目标字符串不同。
131.s705,根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布。
132.s706,根据移位序列的第一概率分布,得到移位序列集的第一概率分布。
133.s707,根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的第二概率分布。
134.s708,根据移位序列的第二概率分布,得到移位序列集的第二概率分布。
135.s709,根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
136.上述s701-s709的具体过程可以参见上述方法实施例的描述,其实现原理和技术效果类似,在此不再赘述。
137.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
138.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的音频去噪方法的音频去噪装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个音频去噪装置实施例中的具体限定可以参见上文中对于音频去噪方法的限定,在此不再赘述。
139.在一个实施例中,如图8所示,提供了一种音频去噪装置1,包括:数据移位模块10、序列划分模块20、测度分析模块30和音频去噪模块40,其中:
140.数据移位模块10,用于对音频数据的编码序列进行移位变换,得到移位序列集;
141.序列划分模块20,用于对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
142.测度分析模块30,用于对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
143.音频去噪模块40,用于根据子序列的统计特征,对音频数据进行去噪处理。
144.在一个实施例中,如图9所示,图8中的序列划分模块20还包括:
145.第一划分单元21,用于基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集;
146.第二划分单元22,用于基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得到移位序列对应的子序列集;其中,第一设定长度大于所述第二设定长
度。
147.在一个实施例中,测度分析模块30用于:
148.针对子序列集中的每一子序列,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征;其中,第一目标字符串与所述目标字符串不同。
149.在一个实施例中,如图10所示,图8中的测度分析模块30还包括:
150.第一分析单元31,用于将该子序列的长度与该子序列中第一目标字符串的数量之间的比值,作为该子序列的统计特征中的第一概率分布;
151.第二分析单元32,用于将该子序列的长度与该子序列中第二目标字符串的数量之间的比值,作为该子序列的统计特征中的第二概率分布。
152.在一个实施例中,音频去噪模块40用于:
153.根据统计特征,对子序列进行聚类;
154.根据各类中子序列的数量,确定音频数据中噪声分布区域;
155.对噪声分布区域进行去噪处理。
156.在一个实施例中,音频去噪模块40还用于:
157.根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布;
158.根据移位序列的第一概率分布,得到移位序列集的第一概率分布;
159.根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的第二概率分布;
160.根据移位序列的第二概率分布,得到移位序列集的第二概率分布;
161.根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
162.上述音频去噪装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
163.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待去噪的音频数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种音频去噪方法。
164.本领域技术人员可以理解,图11中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
165.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
166.对音频数据的编码序列进行移位变换,得到移位序列集;
167.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
168.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
169.根据子序列的统计特征,对音频数据进行去噪处理。
170.在上一个实施例的基础上,处理器执行计算机程序中对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集的逻辑时,具体实现以下步骤:
171.基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集;基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得到移位序列对应的子序列集;其中,第一设定长度大于第二设定长度。
172.在上一个实施例的基础上,处理器执行计算机程序中对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征的逻辑时,具体实现以下步骤:
173.针对子序列集中的每一子序列,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征;其中,第一目标字符串与目标字符串不同。
174.在上一个实施例的基础上,处理器执行计算机程序中根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征的逻辑时,具体实现以下步骤:
175.将该子序列的长度与该子序列中第一目标字符串的数量之间的比值,作为该子序列的统计特征中的第一概率分布;将该子序列的长度与该子序列中第二目标字符串的数量之间的比值,作为该子序列的统计特征中的第二概率分布。
176.在上一个实施例的基础上,处理器执行计算机程序中根据子序列的统计特征,对音频数据进行去噪处理的逻辑时,具体实现以下步骤:
177.根据统计特征,对子序列进行聚类;根据各类中子序列的数量,确定音频数据中噪声分布区域;对噪声分布区域进行去噪处理。
178.在上一个实施例的基础上,处理器执行计算机程序中根据子序列的统计特征,对音频数据进行去噪处理的逻辑时,具体实现以下步骤:
179.根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布;根据移位序列的第一概率分布,得到移位序列集的第一概率分布;根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的第二概率分布;根据移位序列的第二概率分布,得到移位序列集的第二概率分布;根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
180.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
181.对音频数据的编码序列进行移位变换,得到移位序列集;
182.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
183.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
184.根据子序列的统计特征,对音频数据进行去噪处理。
185.在上一个实施例的基础上,计算机程序中对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集的这一代码逻辑被处理器执行时,具体实现以下步骤:
186.基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集;基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得
到移位序列对应的子序列集;其中,第一设定长度大于第二设定长度。
187.在上一个实施例的基础上,计算机程序中对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征的这一代码逻辑被处理器执行时,具体实现以下步骤:
188.针对子序列集中的每一子序列,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征;其中,第一目标字符串与目标字符串不同。
189.在上一个实施例的基础上,计算机程序中根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征的这一代码逻辑被处理器执行时,具体实现以下步骤:
190.将该子序列的长度与该子序列中第一目标字符串的数量之间的比值,作为该子序列的统计特征中的第一概率分布;将该子序列的长度与该子序列中第二目标字符串的数量之间的比值,作为该子序列的统计特征中的第二概率分布。
191.在上一个实施例的基础上,计算机程序中根据子序列的统计特征,对音频数据进行去噪处理的这一代码逻辑被处理器执行时,具体实现以下步骤:
192.根据统计特征,对子序列进行聚类;根据各类中子序列的数量,确定音频数据中噪声分布区域;对噪声分布区域进行去噪处理。
193.在上一个实施例的基础上,计算机程序中根据子序列的统计特征,对音频数据进行去噪处理的这一代码逻辑被处理器执行时,具体实现以下步骤:
194.根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布;根据移位序列的第一概率分布,得到移位序列集的第一概率分布;根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的第二概率分布;根据移位序列的第二概率分布,得到移位序列集的第二概率分布;根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
195.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
196.对音频数据的编码序列进行移位变换,得到移位序列集;
197.对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集;
198.对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征;
199.根据子序列的统计特征,对音频数据进行去噪处理。
200.在上一个实施例的基础上,计算机程序被处理器执行对移位序列集中的移位序列进行划分,得到移位序列对应的子序列集的操作时,具体实现以下步骤:
201.基于第一设定长度,对移位序列集中的移位序列进行划分,得到移位序列对应的窗口序列集;基于第二设定长度,对移位序列对应的窗口序列集中的窗口序列进行划分,得到移位序列对应的子序列集;其中,第一设定长度大于第二设定长度。
202.在上一个实施例的基础上,计算机程序被处理器执行对子序列集中的子序列进行目标字符串的测度分析,得到子序列的统计特征的操作时,具体实现以下步骤:
203.针对子序列集中的每一子序列,根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征;其中,第一目标字符串与目标字符串不同。
204.在上一个实施例的基础上,计算机程序被处理器执行根据该子序列的长度、该子序列中第一目标字符串的数量和该子序列中第二目标字符串的数量,确定该子序列的统计特征的操作时,具体实现以下步骤:
205.将该子序列的长度与该子序列中第一目标字符串的数量之间的比值,作为该子序列的统计特征中的第一概率分布;将该子序列的长度与该子序列中第二目标字符串的数量之间的比值,作为该子序列的统计特征中的第二概率分布。
206.在上一个实施例的基础上,计算机程序被处理器执行根据子序列的统计特征,对音频数据进行去噪处理的操作时,具体实现以下步骤:
207.根据统计特征,对子序列进行聚类;根据各类中子序列的数量,确定音频数据中噪声分布区域;对噪声分布区域进行去噪处理。
208.在上一个实施例的基础上,计算机程序被处理器执行根据子序列的统计特征,对音频数据进行去噪处理的操作时,具体实现以下步骤:
209.根据子序列的统计特征中的第一概率分布,确定移位序列集中移位序列的第一概率分布;根据移位序列的第一概率分布,得到移位序列集的第一概率分布;根据子序列的统计特征中的第二概率分布,确定移位序列集中移位序列的第二概率分布;根据移位序列的第二概率分布,得到移位序列集的第二概率分布;根据移位序列集的第一概率分布和第二概率分布,对音频数据进行去噪处理。
210.需要说明的是,本技术所涉及的音频信息(包括但不限于待去噪的音频信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
211.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
212.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
213.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并
不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1