本发明涉及耳机声道切换技术领域,更具体地,涉及一种自适应切换耳机声道的方法、装置及耳机。
背景技术:
随着科学技术的发展与应用,市场中各种耳机不断出现,这极大的方便了人们的生活工作与学习需要。但当前市面的耳机存在着佩戴时无法正确并快速的分辨左右耳机的困难,虽然部分耳机厂商在耳机上添加左右标识或者结构上做一些区分左右耳机的改变,消费者在使用中耳机戴反的情况依旧时常出现。通常情况下,这会带来一定的问题,比如:在用户听立体声音乐的过程中,耳机戴反会导致音场混乱,带来较差的听觉感受,尤其是对hifi级音质输出的播放器会大大影响其原有音效。在用户在观看2d或3d电影时,耳机戴反会导致电影中声音与图像位置的不一致,大大降低人们的观影感受和放映效果。对于游戏爱好者,耳机戴反会影响游戏者的发挥,带来较差的游戏娱乐感。
因此,提出一种可以自动切换耳机声道的方案是十分有价值的。
技术实现要素:
本发明的一个目的是提供一种能够自适应切换耳机声道的新技术方案。
根据本发明的第一方面,提供了一种自适应切换耳机声道的方法,所述耳机具有两个听筒,所述方法包括:
采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像;
将所述当前侧脸图像与预先存储的图像模板进行比对;
根据比对结果判断所述第一个听筒对应的声道与所述第一个听筒的佩戴位置是否匹配,如否,则:
切换所述两个听筒对应的声道。
可选的是,所述将所述当前侧脸图像与预先存储的图像模板进行比对的步骤包括:
提取所述当前侧脸图像的当前特征向量;
将所述当前特征向量与所述图像模板的参考特征向量进行比对,以计算出所述当前侧脸图像与所述图像模板的相似度。
可选的是,所述根据比对结果判断所述第一个听筒对应的声道与所述第一个听筒的佩戴位置是否匹配的步骤包括:
判断所述相似度是否超过预先设定的阈值,如是,则判定所述第一个听筒对应的声道与所述第一个听筒的佩戴位置匹配。
可选的是,所述耳机的音频数据为i2s格式的数字音频数据,所述对所述耳机听筒进行声道切换的步骤包括:
对所述i2s格式的数字音频数据的帧时钟信号进行反相处理。
可选的是,所述耳机的音频数据为模拟的左声道信号和右声道信号,所述对所述耳机听筒进行声道切换的步骤还包括:
切换所述左声道信号和所述右声道信号的传输路径。
可选的是,所述采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像之前还包括:
检测所述耳机的佩戴动作是否发生,如是,则采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像。
根据本发明的第二方面,提供了一种自适应切换耳机声道的装置,所述耳机具有两个听筒,所述装置包括:
采集模块,用于采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像;
比对模块,用于将所述当前侧脸与预先存储的图像模板进行比对;
判断模块,用于根据比对结果判断所述第一个听筒对应的声道与所述第一个听筒的佩戴位置是否匹配;
切换模块,用于在所述判断模块的判断结果为否的情况下,切换所述两个听筒对应的声道。
可选的是,所述比对模块包括:
特征提取单元,用于提取所述当前侧脸图像的当前特征向量;
比对单元,用于将所述当前特征向量与所述图像模板的参考特征向量进行比对,以计算出所述当前侧脸图像与所述图像模板的相似度。
可选的是,所述判断模块还用于判断所述相似度是否超过预先设定的阈值,如是,则判定所述第一个听筒对应的声道与所述第一个听筒的佩戴位置匹配。
可选的是,所述耳机的音频数据为i2s格式的数字音频数据,所述切换模块还用于对所述i2s格式的数字音频数据的帧时钟信号进行反相处理。
可选的是,所述耳机的音频数据为模拟的左声道信号和右声道信号,所述切换模块还用于切换所述左声道信号和所述右声道信号的传输路径。
可选的是,所述装置还包括检测模块,用于检测所述耳机的佩戴动作是否发生;
所述采集模块用于在所述检测模块的检查结果为是的情况下,采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像。
根据本发明的第三方面,提供了一种耳机,包括根据本发明第二方面所述的装置。
根据本发明的第四方面,提供了一种耳机,包括处理器和存储器,所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行根据本发明第一方面所述的方法。
本发明的一个有益效果在于,通过本发明的自适应切换耳机声道的方法,可以根据第一个听筒的佩戴位置自适应切换耳机声道,从而保证用户无需在佩戴耳机前执行区分左右听筒的步骤,提升用户的听觉体验。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1为根据本发明一种自适应切换耳机声道的方法的一种实施方式的流程图;
图2为根据本发明一种自适应切换耳机声道的方法的另一种实施方式的流程图;
图3为根据本发明一种自适应切换耳机声道的装置的一种实施结构的方框原理图;
图4为根据本发明一种自适应切换耳机声道的装置的另一种实施结构的方框原理图;
图5为根据本发明一种耳机的一种实施结构的方框原理图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
为了解决现有技术中存在的耳机戴反导致影响用户听觉体验的问题,提出了一种自适应切换耳机声道的方法。其中,该耳机包括两个听筒。
图1为根据本发明一种自适应切换耳机声道的方法的一种实施方式的流程图。
根据图1所示,该方法包括以下步骤:
步骤s110,采集用户与第一个听筒的佩戴位置对应的侧脸的图像,作为第一侧脸图像。
具体的,该耳机的两个听筒在结构上可以是完全对称的,以保证两个听筒在任意佩戴位置时当前用户的舒适度。第一个听筒的佩戴位置为当前用户的左耳或者是右耳。例如当第一个听筒的佩戴位置为当前用户的左耳时,与其对应的侧脸为用户的左侧脸,当前侧脸图像则为当前用户的左侧脸图像;当第一个听筒的佩戴位置为当前用户的右耳时,与其对应的侧脸为用户的右侧脸,当前侧脸图像则为当前用户的右侧脸图像。
当前侧脸图像例如可以但不局限于是由深度摄像头模组采集的,深度摄像头可以是设置在耳机的第一个听筒上,也可以是设置在两个听筒上。具体的,深度摄像头在听筒上的位置为在听筒佩戴过程中贴近用户面部一侧,以保证其能够采集当前用户对应侧脸的图像。
在此基础上,该本发明的方法还可以包括:检测耳机的佩戴动作是否发生,如是,则执行上述的自适应切换耳机声道的方法,如否,则继续检测耳机的佩戴动作是否发生。具体的,检测耳机的佩戴动作是否发生的方法是现有技术,在此不再赘述。
这样,就可以只在每次佩戴耳机时执行本发明自适应切换耳机声道的方法。
步骤s120,将当前侧脸图像与预先存储的图像模板进行比对。
具体的,图像模板是通过对第一个听筒上的深度摄像头预先采集的一组图像进行训练得到的,且在所述一组图像的采集过程中,第一个听筒的佩戴位置为固定的,使得一组图像中的所有图像均为当前用户的左脸图像或者均为右脸图像。
在本发明的第一个实施例中,图像模板是由一组左脸图像进行训练得到的,该图像模板为左侧脸图像模板。进一步地,可以预先设定第一个听筒对应的声道为左声道,第二个听筒对应的声道为右声道。
在此基础上,将当前侧脸图像与预先存储的图像模板进行比对的方法可以采用但不局限于以下实施例。
实施例1:
如图2所示,可以包括步骤s210-s220。
步骤s210,提取当前侧脸图像的当前特征向量。
具体方法例如可以是根据特征脸方法,确定当前侧脸图像中脸部轮廓的大小、位置、距离等属性,再分别计算出上述属性对应的几何特征量,根据所述几何特征量形成描述该当前侧面图像的特征向量,即当前特征向量。
步骤s220,将当前特征向量与图像模板的参考特征向量进行比对,以计算出当前侧脸图像与图像模板的相似度。
进一步地,例如可以是预先根据特征脸方法确定图像模板中脸部轮廓的大小、位置、距离等属性,再分别计算出上述属性对应的几何特征量,根据所述几何特征量形成描述该图像模板的特征向量,即参考特征向量。其中,当前侧脸图像的属性和图像模板的属性需相同。
再根据距离函数计算出当前特征向量和参考特征向量之间的相似度,所述距离函数例如为minkowsky距离函数或者camberra距离函数等。
步骤s130,根据比对结果判断第一个听筒对应的声道与第一个听筒的佩戴位置是否匹配,如是,则结束,如否,则执行步骤s140。
具体的,如果第一个听筒对应的声道为左声道,第一个听筒的佩戴位置为当前用户的左耳,则说明第一个听筒对应的声道与第一个听筒的佩戴位置匹配;如果第一个听筒对应的声道为左声道,第一个听筒的佩戴位置为当前用户的右耳,则说明第一个听筒对应的声道与第一个听筒的佩戴位置不匹配。
在前述实施例1的基础上,执行该步骤s130的方法可以包括如图2所示的步骤s230。
步骤s230,判断相似度是否超过预先设定的阈值,如是,则执行步骤s241,判定第一个听筒对应的声道与第一个听筒的佩戴位置匹配;如否,则执行步骤s242,判定第一个听筒对应的声道与第一个听筒的佩戴位置不匹配。该阈值例如可以但不局限于是95%。
由于人的左侧脸和右侧脸均是不对称的,因此,第一个听筒的声道与其佩戴位置匹配的情况下的相似度一定大于不匹配情况下的相似度。这样,可以预先设定一个阈值,使其大于第一个听筒的声道与其佩戴位置不匹配情况下的相似度、且小于第一个听筒的声道与其佩戴位置匹配情况下的相似度。
如果相似度超过阈值,则说明当前侧脸图像为当前用户的左侧脸图像,第一个听筒的佩戴位置为当前用户的左耳。由于预先设定第一个听筒对应的声道为左声道,第二个听筒对应的声道为右声道,因此,不需要切换两个听筒对应的声道。
如果相似度小于阈值,则说明当前侧脸图像为当前用户的右侧脸图像,第一个听筒的佩戴位置为当前用户的右耳。由于预先设定第一个听筒对应的声道为左声道,第二个听筒对应的声道为右声道,因此,需要执行步骤s140以切换两个听筒对应的声道。
步骤s140,对耳机听筒进行声道切换。
具体的,对耳机听筒进行声道切换的方式可以是通过硬件电路实现的,也可以通过软件算法实现的。对耳机听筒进行声道切换的操作可以采用但不局限于以下实施例。
实施例2:
如果该耳机的音频信号为模拟的左声道信号和右声道信号,例如在初始状态下,左声道信号传输至第一个听筒,右声道信号传输至第二个听筒,那么,对耳机听筒进行声道切换的方法可以是切换左声道信号和右声道信号的传输路径,以使左声道信号传输至第二个听筒,右声道信号传输至第一个听筒。
例如可以是左声道信号和右声道信号均经对应的开关连接至每个听筒,通过控制这些开关的状态来实现对左声道信号和右声道信号的传输路径的切换。具体的,可以是左声道信号通过第一开关传输至第一个听筒,左声道信号通过第二开关传输至第二个听筒,右声道信号通过第三开关传输至第一个听筒,右声道信号通过第四开关传输至第二个听筒。其中,第一开关和第四开关的状态相同,第二开关和第三开关的状态相同。这样,可以通过控制这些开关的状态来实现对左声道信号和右声道信号的传输路径的切换。
在此基础上,第一开关和第三开关可以通过第一个单刀双掷开关提供,第二开关和第四开关可以是由第二个单刀双掷开关提供。左声道线用于输出左声道信号,右声道线用于输出右声道信号。设置单刀双掷模拟开关的动端为输入端,不动端为输出端,那么,每个单刀双掷开关都设置有两个输入端和一个输出端,不动端为公共连接端,第一个单刀双掷开关的两个输入端分别与左声道线和右声道线连接,输出端与第一个听筒连接;第二个单刀双掷开关的两个输入端分别与左声道线和右声道线连接,输出端与第二个听筒连接。而且,在通过第一个单刀双掷开关使得左声道线与第一个听筒连接的情况下,第二个单刀双掷开关需使得右声道线与第二个听筒连接,保证两个听筒连接不同的声道线。具体的,这两个单刀双掷开关可以均为模拟开关。在本发明的一个具体实施例中,可以通过一个模拟开关芯片提供两个单刀双掷开关。
由于在初始状态下,第一个听筒对应左声道,第二个听筒对应右声道,因此,两个单刀双掷开关的初始状态具体为第一个单刀双掷开关的输入端连接至左声道线,第二个单刀双掷开关的输入端连接至右声道线。在此情况下,如果切换两个听筒对应的声道,可以切换两个单刀双掷开关的输入端,使得第一个单刀双掷开关的输入端连接至右声道线,第二个单刀双掷开关的输入端连接在左声道线。
进一步地,如果在耳机使用时进行了声道切换,那么,在耳机被摘下时,两个个单刀双掷开关的状态将恢复至初始状态,即第一个单刀双掷开关的输入端连接至左声道线,第二个单刀双掷开关的输入端连接至右声道线。进而将两个听筒对应的声道切换至初始状态。以便于当前用户再次佩戴时判断第一个听筒对应的声道与第一个听筒的佩戴位置是否匹配。
实施例3:
该耳机的音频信号可以是i2s格式的数字音频信号,由于在初始状态下,第一个听筒对应左声道,第二个听筒对应右声道,因此,i2s格式的数字音频信号需经过解码模块进行解码处理得到模拟的左声道信号和右声道信号,分别对应传输至第一个听筒和第二个听筒。i2s格式的数字音频信号主要包括串行时钟信号、帧时钟信号和串行数据信号,其中,串行时钟信号对应数字音频的每一位数据,帧时钟信号用于切换左右声道数据,串行数据信号就是用二进制补码表示的音频数据。在帧时钟信号为高电平时,表示正在传输的是右声道数据信号;在帧时钟信号为低电平时,表示正在传输的是左声道数据信号。那么,对i2s格式的数字音频信号进行声道切换处理可以是通过对帧时钟信号进行反相处理实现的。对帧时钟信号进行反相处理之后,当帧时钟信号为低电平时,就表示正在传输的是右声道数据信号;当帧时钟信号为高电平时,就表示正在传输的是左声道数据信号。这样,经过切换处理的i2s格式的数字音频信号需经过解码模块进行解码处理得到模拟的左声道信号和右声道信号,并将模拟的左声道信号传输至第二个听筒,将模拟的右声道信号传输至第一个听筒。
进一步地,可以只对本次佩戴过程中的i2s格式的数字音频信号进行处理。每次当耳机被摘下时,i2s格式的数字音频信号均恢复至初始状态,即停止对帧时钟信号进行反相处理。
这样,通过本发明的自适应切换耳机声道的方法,可以根据第一个听筒的佩戴位置自适应切换耳机声道,从而保证用户无需在佩戴耳机前执行区分左右听筒的步骤,提升用户的听觉体验。
与上述方法相对应的,本发明还提供了一种自适应切换耳机声道的装置。图3为根据本发明一种自适应切换耳机声道的装置的一种实施结构的方框原理图。
根据图3所示,该装置300包括采集模块310、比对模块320、判断模块330和切换模块340。
上述采集模块310用于采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像。
上述比对模块320用于将当前侧脸与预先存储的图像模板进行比对。
上述判断模块330用于根据比对结果判断第一个听筒对应的声道与第一个听筒的佩戴位置是否匹配。
切换模块340用于在判断模块330的判断结果为否的情况下,切换两个听筒对应的声道。
在本发明的一个具体实施例中,如图4所示,比对模块320包括特征提取单元321和比对单元322,该特征提取单元321用于提取当前侧脸图像的当前特征量;该比对单元322用于将当前特征量与图像模板的参考特征量进行比对,以计算出当前侧脸图像与图像模板的相似度。
在此基础上,判断模块330还用于判断相似度是否超过预先设定的阈值,如是,则判定第一个听筒对应的声道与第一个听筒的佩戴位置匹配。
如果耳机的音频数据为i2s格式的数字音频数据,切换模块340还用于对i2s格式的数字音频数据的帧时钟信号进行反相处理。
如果耳机的音频数据为模拟的左声道信号和右声道信号,切换模块340还用于切换左声道信号和右声道信号的传输路径。
进一步地,如图4所示,装置还包括检测模块410,用于检测耳机的佩戴动作是否发生;
采集模块310用于在检测模块410的检查结果为是的情况下,采集当前用户与第一个听筒的佩戴位置对应的侧脸的图像,作为当前侧脸图像。
本发明还提供了一种耳机,根据一方面,该耳机包括本发明的自适应切换耳机声道的装置300。
图5为根据本发明另一方面的该耳机的实施结构的方框原理图。
根据图5所示,该耳机500包括存储器501和处理器502,该存储器501用于存储指令,该指令用于控制处理器502进行操作以执行上述自适应切换耳机声道的方法。
上述各实施例主要重点描述与其他实施例的不同之处,但本领域技术人员应当清楚的是,上述各实施例可以根据需要单独使用或者相互结合使用。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分相互参见即可,每个实施例重点说明的都是与其他实施例的不同之处,但本领域技术人员应当清楚的是,上述各实施例可以根据需要单独使用或者相互结合使用。另外,对于装置实施例而言,由于其是与方法实施例相对应,所以描述得比较简单,相关之处参见方法实施例的对应部分的说明即可。以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的。
本发明可以是装置、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。