一种音频信号的处理方法及装置制造方法

文档序号：2827980阅读：170来源：国知局

一种音频信号的处理方法及装置制造方法
【专利摘要】本发明提供了一种音频信号的处理方法及装置。一方面，本发明通过对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；从而利用不同声道分别放置所述第一音频信号和所述伴奏音频信号；进而对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。因此，本发明提供的技术方案能够自动提取伴奏音频信号，以及自动生成待播放的音频信号，能够提高音频信号的处理效率。
【专利说明】一种音频信号的处理方法及装置
【【技术领域】】
[0001]本发明涉及信号处理【技术领域】，尤其涉及一种音频信号的处理方法及装置。
【【背景技术】】
[0002]随着多媒体技术和智能设备的不断发展，利用终端收听音乐、广播等多媒体信息已经是一项基本功能。
[0003]目前，终端上安装的客户端能够向用户提供各种与音频相关的功能，如音频信号的播放功能、检索功能或者推荐功能等。现有技术中，客户端播放的音频信号主要包括原始的音频信号以及该音频信号相应的伴奏音频信号。
[0004]然而，现有技术中播放的伴奏音频信号是有依据原始的音频信号，由人工手动制作而成，并人工利用伴奏音频信号和原始的音频信号制作用于播放的音频信号，这样才能够在播放音频信号时只播放其中的伴奏音频信号。这种人工手动对伴奏音频信号进行处理的方式，使得音频信号的处理效率比较低。
【
【发明内容】
】
[0005]有鉴于此，本发明实施例提供了一种音频信号的处理方法及装置，可以实现自动提取伴奏音频信号，以及自动生成待播放的音频信号，能够提高音频信号的处理效率。
[0006]本发明实施例的一方面，提供一种音频信号的处理方法，包括:
[0007]对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；
[0008]利用不同声道分别放置所述第一音频信号和所述伴奏音频信号；
[0009]对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
[0010]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号，包括:
[0011]获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；
[0012]依据所述第一音频信号，获得分离矩阵；
[0013]利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
[0014]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号，包括:
[0015]获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；
[0016]对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道；
[0017]对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号。
[0018]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号，包括:
[0019]利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号；或者，
[0020]利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号。
[0021]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号，包括:
[0022]利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理；
[0023]利用左声道放置所述加密处理后的所述第一音频信号，利用右声道放置加密处理后的所述伴奏音频信号；或者，利用右声道放置所述加密处理后的所述第一音频信号，利用左声道放置加密处理后的所述伴奏音频信号。
[0024]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号，包括:
[0025]依据目标音频格式，确定编码方式；
[0026]利用所述编码方式，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号；
[0027]其中，所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式；相应的，所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
[0028]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述方法还包括:
[0029]获得所述第一音频信号中演唱音频信号；
[0030]接收用户输入的演唱音频信号；
[0031]获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度；
[0032]依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
[0033]本发明实施例的一方面，提供一种音频信号的处理装置，包括:
[0034]信号分离单元，用于对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；
[0035]信号处理单元，用于利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
[0036]信号编码单元，用于对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
[0037]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述信号分离单元，具体用于:
[0038]获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；
[0039]依据所述第一音频信号，获得分离矩阵；
[0040]利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
[0041]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述信号分离单元，具体用于:
[0042]获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；
[0043]对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道；
[0044]对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号。
[0045]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述信号处理单元，具体用于:
[0046]利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号；或者，
[0047]利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号。
[0048]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述信号处理单元，具体用于:
[0049]利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理；
[0050]利用左声道放置所述加密处理后的所述第一音频信号，利用右声道放置加密处理后的所述伴奏音频信号；或者，利用右声道放置所述加密处理后的所述第一音频信号，利用左声道放置加密处理后的所述伴奏音频信号。
[0051]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述信号编码单元，具体用于:
[0052]依据目标音频格式，确定编码方式；
[0053]利用所述编码方式，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号；
[0054]其中，所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式；相应的，所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
[0055]如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述信号分离单元，还用于获得所述第一音频信号中演唱音频信号；
[0056]所述装置还包括:分数获取单元，用于接收用户输入的演唱音频信号；获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度；依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
[0057]由以上技术方案可以看出，本发明实施例具有以下有益效果:
[0058]本发明实施例通过对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；从而利用不同声道分别放置所述第一音频信号和所述伴奏音频信号；进而对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。本发明实施例提供的技术方案能够自动提取伴奏音频信号，以及自动生成待播放的音频信号，与现有技术相比，能够提高音频信号的处理效率，提高获得伴奏音频信号的效率，减少人力成本。
【【专利附图】

【附图说明】】
[0059]为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。
[0060]图1是本发明实施例所提供的音频信号的处理方法的流程示意图；
[0061]图2是本发明实施例所提供的音频信号的处理方法的实施例一的流程示意图；
[0062]图3是本发明实施例中对第一音频信号进行信号分离处理的示例图；
[0063]图4是本发明实施例所提供的音频信号的处理装置的功能方块图。
【【具体实施方式】】
[0064]为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。
[0065]应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0066]在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。
[0067]应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系,例如,A和/或B，可以表示:单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
[0068]应当理解，尽管在本发明实施例中可能采用术语第一、第二来描述音频信号，但这些关键词不应限于这些术语。这些术语仅用来将关键词彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一音频信号也可以被称为第二音频信号，类似地，第二音频信号也可以被称为第一音频信号。
[0069]取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
[0070]本发明实施例给出一种音频信号的处理方法，请参考图1，其为本发明实施例所提供的音频信号的处理方法的流程示意图，如图所示，该方法包括以下步骤:
[0071]S101，对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
[0072]具体的，对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号的方法可以包括但不限于以下两种:
[0073]第一种:首先，获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号。然后，依据所述第一音频信号，获得分离矩阵。最后，利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
[0074]第二种:首先，获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号。然后，对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道。最后，对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号。
[0075]请参考图2，其为本发明实施例所提供的音频信号的处理方法的实施例一的流程示意图，如图所示，获得第一音频信号的方法可以包括但不限于:可以利用爬虫工具，从互联网上爬取第一音频信号，然后将爬取到的第一音频信号存储在音频数据库中。或者，也可以接收音频提供者上传的第一音频信号，然后该第一音频信号将存储在音频数据库中。这样，就可以从音频数据库中获得需要进行处理的第一音频信号。
[0076]可以理解的是，该第一音频信号中可以包含伴奏音频信号和演唱音频信号，即该第一音频信号是伴奏音频信号和演唱音频信号的混合音频信号，因此，才需要从第一音频信号中分离出伴奏音频信号。
[0077]其中，该第一音频信号的音频格式可以包括但不限于动态影像专家压缩标准音频层面 3(Moving Picture Experts Group Aud1 Layer 3, MP3)格式、动态图像专家组(Moving Pictures Experts Group 4, MP4)格式或者微软媒体编码(Windows MediaAud1, WMA)格式等。
[0078]优选的，上述第一种方法中，依据所述第一音频信号，获得分离矩阵，然后利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号的方法可以包括但不限于:
[0079]请参考图3，其为本发明实施例中对第一音频信号进行信号分离处理的示例图，如图所示，包含伴奏音频信号和演唱音频信号的源音频信号S(t)经过一个2X2维线性的混合矩阵A后，可以得到第一音频信号X(t)，即X(t) = S(t)XA，基于该原理，本发明实施例中，可以将第一音频信号X (t)经过一个2 X 2维线性的分离矩阵W后，就可以得到源音频信号S(t)中伴奏音频信号的估计和演唱音频信号的估计U(t) = [Ul(t)，U2(t)]TjpU(t)=X(t) Xff0其中，分离矩阵W其实质为混合矩阵A的逆矩阵，因此能够实现第一音频信号的信号分离处理。在获得U(t)后，可以获得音频信号Ul(t)和音频信号u2(t)的能量，并比较这两个能量，两个能量中能量较大的音频信号就是第一音频信号中的伴奏音频信号，能量较小的音频信号就是第一音频信号中的演唱音频信号。
[0080]需要说明的是，Ul(t)和?⑴分别表示伴奏音频信号的估计和演唱音频信号的估计，或者分别表示演唱音频信号的估计和伴奏音频信号的估计。其中，T表示转置。这里，由于经过分离矩阵处理后，会存在信号还原的误差，因此只能得到伴奏音频信号的最优近似值和演唱音频信号的最优近似值，即奏音频信号的估计和演唱音频信号的估计。
[0081]需要说明的是，U(t)中的两个分量与S(t)中的两个分量的排序可以不相同，也可以相同，上述方案中通过分离矩阵W的信号分离处理，使得第一音频信号中的演唱音频信号和伴奏音频信号之间的独立性最强。
[0082]例如，依据所述第一音频信号X(t)，获得分离矩阵W的方法可以包括但不限于:利用对称快速独立成分分析(Fast-1ndependent Component Analysis,FastICA)算法对第一音频信号x(t)进行处理，以获得第一音频信号X(t)中每个分量的估计，然后对于每个分量的估计自适应地选择对应的对比函数，接着先利用一单元FastICA算法对每个分量的估计进行第一次修正，以及利用对比函数对每个分量进行第二次修正，最后使用优化参数对分量的估计进行第三次修正，依据经过三次修正后获得每个分量的估计生成分离矩阵W，分离矩阵W实际上是混合矩阵A的逆矩阵，因此，利用混合矩阵A的逆矩阵对第一音频信号X (t)进行处理，就可以得到源音频信号S(t)。
[0083]上述第二种方法是利用相关性技术实现的，相关性技术指的是利用左声道和右声道的相关性，消除两个声道中共同的演唱音频信号，由于两个声道中的伴奏音频信号是不相关的，因此，对两个声道经过相关处理后就可以剩下伴奏音频信号。
[0084]基于该原理，该第二种方法中，对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道。然后对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号的方法可以包括但不限于:
[0085]对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道X1 [k]和右声道Xr [W。
[0086]利用如下公式对所述左声道X1 [k]和所述右声道XJk]进行相关处理:
Γ ? rni X 丨[k] + xr[k]
[0087]S[k] — -----
sin(Yb) + COS(Yb)
[0088]D[k] = X1 [k] -sin ( Y b) S [k]
[0089]其中，S[k]表示利用相关处理获得的演唱音频信号。
[0090]其中，D[k]表示利用相关处理获得的伴奏音频信号。
[0091]其中，X1Iik]表不第一音频信号的左声道。
[0092]其中，Xr[k]表不第一音频信号的右声道。
[0093]其中，Yb为预设的中间参数。
[0094]另外，在对第一音频信号进行信号分离处理后，除了可以获得所述第一音频信号中的伴奏音频信号，还可以获得第一音频信号中的演唱音频信号；然后接收用户输入的演唱音频信号，以及依据第一音频信号中演唱音频信号和用户输入的演唱音频信号，计算第一音频信号中演唱音频信号与用户输入的演唱音频信号的相似度，从而可以依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
[0095]需要说明的是，现有技术中，获得演唱分数时，都是直接计算第一音频信号与用户输入的演唱音频信号的相似度，依据该相似度获得演唱分数。由于第一音频信号中不仅含有演唱音频信号，也包括伴奏音频信号，所以获得的演唱分数的准确性较低，不能准确评价用户的演唱水平。本发明实施例中，还可以获得第一音频信号中的演唱音频信号，利用该演唱音频信号获得演唱分数可以提高演唱分数的准确性。
[0096]S102，利用不同声道分别放置所述第一音频信号和所述伴奏音频信号。
[0097]具体的，如图2所示，在从第一音频信号中分离出伴奏音频信号后，可以利用不同声道分别放置所述第一音频信号和所述伴奏音频信号。
[0098]本发明实施例中，利用不同声道分别放置所述第一音频信号和所述伴奏音频信号的方法可以包括但不限于以下几种:
[0099]第一种:利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号。
[0100]第二种:利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号。
[0101]第三种:首先，利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理。然后，利用左声道放置所述加密处理后的所述第一音频信号，利用右声道放置加密处理后的所述伴奏音频信号。
[0102]第四种:首先，利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理。然后，利用右声道放置所述加密处理后的所述第一音频信号，利用左声道放置加密处理后的所述伴奏音频信号。
[0103]例如，利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号的方法可以包括但不限于:左声道和右声道分别占用若干位的存储空间，如左声道占用I?10位中的第1、3、5、7、9位，右声道占用I?10位中的第2、4、6、8、10位，将第一音频信号放置在第1、3、5、7、9位，就可以实现利用左声道放置第一音频信号，即存储空间的奇数位放置第一音频信号。将伴奏音频信号放置在第2、4、6、8、10位，就可以实现利用右声道放置所述伴奏音频信号，即存储空间的偶数位放置伴奏音频信号。
[0104]再例如，左声道占用I?10位中的第1、2、3、4、5位，右声道占用I?10位中的第6、7、8、9、10位，将第一音频信号放置在第1、2、3、4、5位，就可以实现利用左声道放置第一音频信号；将伴奏音频信号放置在第6、7、8、9、10位，就可以实现利用右声道放置所述伴奏音频信号。
[0105]另外，利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号的方法与上述利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号的方法原理相同，这里不再赘述。
[0106]例如，所述加密算法可以包括但不限于消息摘要算法第五版(Message DigestAlgorithm V, MD5)、数据加密算法(Data Encrypt1n Standard, DES)、3DES 或者高级加密标准(Advanced Encrypt1n Standard, AES)等。
[0107]需要说明的是，对所述第一音频信号进行加密处理所使用的加密算法与对所述伴奏音频信号进行加密处理所使用的加密算法可以相同也可以不同。
[0108]另外，利用不同声道放置第一音频信号和伴奏音频信号时，还可以将第一音频信号分为两部分，将伴奏音频信号也分为两部分，然后利用左声道放置第一音频信号的前一部分，利用右声道放置伴奏音频信号的前一部分，然后利用左声道放置伴奏音频信号的后一部分，利用右声道放置第一音频信号的后一部分，从而实现依据时间，并利用不同声道放置第一音频信号和伴奏音频信号。
[0109]S103，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
[0110]具体的，在如图3所示，利用不同声道分别放置所述第一音频信号和所述伴奏音频信号后，可以对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号，其方法可以包括但不限于:
[0111]首先，依据目标音频格式，确定编码方式。然后，利用所述编码方式，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
[0112]另外，如果在服务器侧获得第二音频信号，则服务器可以对该第二音频信号进行存储。服务器可以在收到客户端的音频下载请求时，将存储的第二音频信号提供给客户端。如果在客户端侧获得第二音频信号，则客户端可以在本地终端中存储该第二音频信号，在需要进行播放时，可以直接播放所存储的第二音频信号。
[0113]其中，对放置第一音频信号的声道和放置伴奏音频信号的声道一起进行编码处理，以获得第二音频信号，该第二音频信号在播放时，先对第二音频信号进行解码处理，从而获得第一音频信号和伴奏音频信号，并利用两个声道分别播放第一音频信号和伴奏音频信号，以实现利用不同声道播放第一音频信号和伴奏音频信号。这样，就可以通过设置声道，选择只播放左声道或者只播放右声道或者两个声道同时播放，进而能够实现在客户端中只播放伴奏音频信号，以实现客户端的K歌功能。
[0114]可以理解的是，放置第一音频信号的声道可以包括放置第一音频信号本身的声道，还可以包括放置加密处理后的第一音频信号的声道。同理，放置伴奏音频信号的声道可以包括放置伴奏音频信号本身的声道，还可以包括放置加密处理后的伴奏音频信号的声道。
[0115]需要说明的是，本发明实施例中所述声道，指的是音频在录制或者播放时，在不同空间位置采集或回放的相互独立的音频信号。
[0116]本发明实施例中，所述目标音频格式包括MP3格式、MPEG-4格式、WMA格式或者高级音频编码(Advanced Aud1 Coding, AAC)格式。相应的,所述编码方式包括MP3编码、MPEG-4编码、WMA编码或者AAC编码。
[0117]需要说明的是，本发明实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer, PC)、个人数字助理(Personal Digital Assistant, PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
[0118]需要说明的是，SlOl?S103的执行主体可以为音频信号的处理装置，该装置可以位于本地终端的应用，或者还可以为位于本地终端的应用中的插件或软件开发工具包(Software Development Kit, SDK)等功能单元,该装置也可以位于服务器,本发明实施例对此不进行特别限定。
[0119]另外，若该装置位于服务器时，可以是服务器预先生成并存储获得的第二音频信号，然后在客户端从服务器下载时直接提供给客户端。或者，也可以在接收到客户端的下载请求后,依据下载请求,即时获得第二音频信号,然后再将该第二音频信号提供给客户端。
[0120]可以理解的是，所述应用可以是安装在终端上的应用程序(nativeApp)，或者还可以是终端上的浏览器的一个网页程序(webApp)，本发明实施例对此不进行限定。
[0121 ] 本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
[0122]请参考图4，其为本发明实施例所提供的音频信号的处理装置的功能方块图。如图所示，该装置包括:
[0123]信号分离单元40，用于对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；
[0124]信号处理单元41，用于利用不同声道分别放置所述第一音频信号和所述伴奏音频信号;
[0125]信号编码单元42，用于对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
[0126]优选的，所述信号分离单元40，具体用于:
[0127]获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；
[0128]依据所述第一音频信号，获得分离矩阵；
[0129]利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
[0130]优选的，所述信号分离单元40，具体用于:
[0131]获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；
[0132]对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道；
[0133]对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号。
[0134]优选的，所述信号处理单元41，具体用于:
[0135]利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号；或者，
[0136]利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号。
[0137]优选的，所述信号处理单元41，具体用于:
[0138]利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理；
[0139]利用左声道放置所述加密处理后的所述第一音频信号，利用右声道放置加密处理后的所述伴奏音频信号；或者，利用右声道放置所述加密处理后的所述第一音频信号，利用左声道放置加密处理后的所述伴奏音频信号。
[0140]优选的，所述信号编码单元42，具体用于:
[0141]依据目标音频格式，确定编码方式；
[0142]利用所述编码方式，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号；
[0143]其中，所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式；相应的，所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
[0144]所述信号分离单元40，还用于获得所述第一音频信号中演唱音频信号；
[0145]所述装置还包括:分数获取单元43，用于接收用户输入的演唱音频信号；获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度；依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
[0146]由于本实施例中的各单元能够执行图1所示的方法，本实施例未详细描述的部分，可参考对图1的相关说明。
[0147]本发明实施例的技术方案具有以下有益效果:
[0148]本发明实施例通过对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；从而利用不同声道分别放置所述第一音频信号和所述伴奏音频信号；进而对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
[0149]本发明实施例提供的技术方案能够自动提取伴奏音频信号，以及自动生成待播放的音频信号，与现有技术相比，能够提高音频信号的处理效率，提高获得伴奏音频信号的效率，减少人力成本。
[0150]另外，本发明实施例能够自动提取伴奏音频信号，从而实现可以只播放伴奏音频信号，使得客户端能够实现K歌功能，使得客户端可以输出更加丰富的音频信号，带来良好的用户体验。
[0151]所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0152]在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0153]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0154]另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。
[0155]上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory, RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0156]以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。
【权利要求】
1.一种音频信号的处理方法，其特征在于，所述方法包括: 对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；利用不同声道分别放置所述第一音频信号和所述伴奏音频信号；对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
2.根据权利要求1所述的方法，其特征在于，所述对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号，包括: 获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；依据所述第一音频信号，获得分离矩阵；利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
3.根据权利要求1所述的方法，其特征在于，所述对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号，包括: 获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道；对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号。
4.根据权利要求1所述的方法，其特征在于，所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号，包括: 利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号；或者，利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号。
5.根据权利要求1所述的方法，其特征在于，所述利用不同声道分别放置所述第一音频信号和所述伴奏音频信号，包括: 利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理；利用左声道放置所述加密处理后的所述第一音频信号，利用右声道放置加密处理后的所述伴奏音频信号；或者，利用右声道放置所述加密处理后的所述第一音频信号，利用左声道放置加密处理后的所述伴奏音频信号。
6.根据权利要求1、4或5所述的方法，其特征在于，所述对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号，包括: 依据目标音频格式，确定编码方式；利用所述编码方式，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号；其中，所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式；相应的，所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
7.根据权利要求2或3所述的方法，其特征在于，所述方法还包括: 获得所述第一音频信号中演唱音频信号；接收用户输入的演唱音频信号；获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度；依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
8.一种音频信号的处理装置，其特征在于，所述装置包括: 信号分离单元，用于对第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号；信号处理单元，用于利用不同声道分别放置所述第一音频信号和所述伴奏音频信号；信号编码单元，用于对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号。
9.根据权利要求8所述的装置，其特征在于，所述信号分离单元，具体用于: 获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；依据所述第一音频信号，获得分离矩阵；利用所述分离矩阵，对所述第一音频信号进行信号分离处理，以获得所述第一音频信号中伴奏音频信号。
10.根据权利要求8所述的装置，其特征在于，所述信号分离单元，具体用于: 获得包含所述伴奏音频信号和演唱音频信号的所述第一音频信号；对所述第一音频信号进行解码处理，以获得所述第一音频信号的左声道和右声道；对所述左声道和所述右声道进行相关处理，以获得所述第一音频信号中伴奏音频信号。
11.根据权利要求8所述的装置，其特征在于，所述信号处理单元，具体用于: 利用左声道放置所述第一音频信号，利用右声道放置所述伴奏音频信号；或者，利用右声道放置所述第一音频信号，利用左声道放置所述伴奏音频信号。
12.根据权利要求9所述的装置，其特征在于，所述信号处理单元，具体用于: 利用加密算法分别对所述第一音频信号和所述伴奏音频信号进行加密处理；利用左声道放置所述加密处理后的所述第一音频信号，利用右声道放置加密处理后的所述伴奏音频信号；或者，利用右声道放置所述加密处理后的所述第一音频信号，利用左声道放置加密处理后的所述伴奏音频信号。
13.根据权利要求8、11或12所述的装置，其特征在于，所述信号编码单元，具体用于: 依据目标音频格式，确定编码方式；利用所述编码方式，对放置所述第一音频信号的声道和放置所述伴奏音频信号的声道进行编码处理，以获得第二音频信号；其中，所述目标音频格式包括MP3格式、MPEG-4格式或者WMA格式；相应的，所述编码方式包括MP3编码、MPEG-4编码或者WMA编码。
14.根据权利要求9或10所述的装置，其特征在于，所述信号分离单元，还用于获得所述第一音频信号中演唱音频信号；所述装置还包括:分数获取单元，用于接收用户输入的演唱音频信号；获得所述第一音频信号中演唱音频信号与所述用户输入的演唱音频信号的相似度；依据所述相似度获得所述用户输入的演唱音频信号对应的演唱分数。
【文档编号】G10H1/36GK104269174SQ201410575199
【公开日】2015年1月7日申请日期:2014年10月24日优先权日:2014年10月24日
【发明者】田彪申请人:百度在线网络技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：田彪
技术所有人：百度在线网络技术(北京)有限公司
我是此专利的发明人