使用面部识别调节扬声器的制造方法_3

文档序号：9915049阅读：来源：国知局

辆，诸如船、摩托车、飞机等。此外，车辆500可以包括用于识别和优化音频系统的性能的任何数量的扬声器或摄像头。
[0038]图6A和图6B图示基于车辆600中的乘客的数量调节扬声器布置。如由图6A和图6B的顶视图中所示，车辆600包括摄像头115A和115B以及四个扬声器605。扬声器605A和605B安装在车辆600的前面，而扬声器605C和60?安装在车辆600的后面。为了清楚起见，用于移动扬声器605的致动器，以及用于处理由摄像头115捕获的数据并且确定致动器的控制信号的计算设备已被省略。在一个实施方案中，计算设备可以集成到机载计算机中，所述机载计算机用于操作车辆或集成到车辆600中的信息娱乐系统。
[0039]基于由摄像头115A和115B捕获的数据，计算设备中的面部识别应用确定有多少乘客在车辆600中以及这些乘客在2D或3D空间中处于的位置。为此，摄像头115A位于车辆600的前面，而摄像头115B安装在车辆600的后面。两个摄像头可能是需要的，因为车辆600的后面相对于摄像头115A的视图可能被两个前排座椅遮挡。然而，在其他实施方案中，车辆600可以只使用一个摄像头115以便识别在车辆600的前面和后面的乘客。
[0040]在图6A中，计算设备确定只有一名位于位置610(即，驾驶员的座椅)的乘客在车辆600中。即，基于由后置摄像头115B提供的图像数据，面部识别应用确定在车辆600的后排座椅中没有乘客，而由前置摄像头115A提供的图像数据指示驾驶员在位置610。作为响应，计算设备识别用以引导扬声器605的点或区域以优化音频系统的性能。在一个实施方案中，四个扬声器605都指向与位置610相关联的同一个3D点。例如，计算设备可以计算相对于用户的中央位置并且产生相应的致动器信号，使得四个扬声器605导向在这个位置。或者，右边的两个扬声器(扬声器605B和605D)可以面向驾驶员的右耳，而左边的两个扬声器(扬声器605A和605C)面向驾驶员的左耳。或者，计算设备可以布置扬声器605以便为驾驶员提供环绕声体验，在这种情况下，扬声器605可以都导向到不同的3D点或区域。
[0041]如上所述，计算设备可以通过使用面部识别应用唯一地识别用户来优化音频系统。例如，计算设备可以使用面部识别应用考虑用户偏好，诸如用户是否更喜欢更多的低音或更多的高音，并且改变这些音频参数来匹配用户偏好。在一个示例中，计算设备包括I/o接口，其中用户可以为计算设备输入偏好来考虑。或者，计算设备可以耦合到车辆600中的信息娱乐系统，其与计算设备共享用户的偏好来改变音频或视频参数。替代地或另外，计算设备可以使用历史信息来了解用户的偏好。例如，当用户A是车上唯一的乘客时，最初计算设备可以将所有四个扬声器605导向在中央位置。使用I/O接口，用户A可以代替地指示计算，当她是唯一的乘客时她更喜欢环绕声。以这种方式，计算设备可以了解和调节特定用户或用户组的音频/视频参数或其他参数(例如，座椅或方向盘调节)。
[0042]在图6B中，计算设备确定在车辆600中有坐在位置610、615、620和625的多名乘客。对于在位置620和625的后排乘客，计算设备将右边的后置扬声器60f5D调节成面向位置625，并且将左边的后置扬声器605C调节成面向位置620。扬声器605C和605D可以指向在这些位置的乘客的一个耳朵。相比之下，对于在位置610和615的前排乘客，计算设备调节右边的前置扬声器605B和左边的前置扬声器605A以指向位置610与位置615之间的位置630。为此，计算设备可以对位置610和615的坐标求平均值以识别位置630。因此，图6B图示在车辆600的前半部的扬声器605的最佳布置可能不同于在车辆600的后半部的扬声器605的最佳布置。换句话说，为了为车辆600中的用户提供最佳性能，计算设备可以根据车辆600中的用户的不同的位置使用不同的扬声器布置。例如，不同的位置可以具有不同的声学性质，因此即使同一用户移动到不同的位置，计算设备仍然可以使用不同的扬声器布置来提供改进的性能。例如，如果用户A在驾驶员的座椅中，则计算设备可以将扬声器605A调节成直接指向用户的耳朵。然而，如果用户A在车辆的后面，则计算设备可以指示扬声器605C指向在用户的头部的背面的中央位置。
[0043]本文所描述的不同的示例、实施方案和方面讨论调节扬声器布置以优化一个或多个用户的音频体验。使用“最佳”并不旨在意指扬声器布置必须是最佳的布置，而是相对于其中扬声器保持固定的扬声器布置，最佳或优化的布置改进了用户的体验。换句话说，本文所描述的示例通过使用致动器来改变扬声器所面向的方向并且适应一个或多个用户的当前位置来改进收听体验。
[0044]图7是用于识别路径715以基于面部识别引导可变向扬声器105的系统700。在一些情况下，可能需要创建沿着路径模拟对象的运动的声音体验。为此，系统700包括用户701、摄像头115、面部识别应用225、致动器控制器230和扬声器105。摄像头115捕获包括用户701的图像数据，接着将图像数据传输到面部识别应用225。应用225使用面部识别算法来识别边界框705，边界框705限定用户的脸部在3D或2D空间中的位置。当然，其他面部识别算法可以使用不同于边界框705的方法来识别用户的脸部。
[0045]面部识别应用225将边界框705的坐标传输到致动器控制器230。在这个示例中，致动器控制器230确定路径715，而不是使用坐标识别指向扬声器105的点或区域。通过指示扬声器105的音频输出遵循路径715，扬声器105可以被用来模拟从正在移动的源(例如，在用户701上方飞行的鸟或飞机或跑过用户701的人)发出的声音。在一个方面，响应于从音频系统接收用于模拟从移动源发出的声音的命令，致动器控制器230可以确定路径715。例如，致动器控制器230可以等待确定路径715，直到音频控制器(例如，电影或视频游戏控制器)将用于确定特定声音的路径715的指令发送到致动器控制器230。在一个示例中，音频控制器和致动器控制器230可以是同步的，使得当控制器230移动扬声器105来跟踪路径715时，音频控制器输出对应于移动源的声音。例如，当扬声器105的输出区域710沿着路径715移动时，扬声器105输出鸟鸣叫的声音。
[0046]为了确定路径715，音频控制器可以向致动器控制器230通知音频输出应模拟的声音或运动的类型。尽管图7中的路径715是线性的，但是在其他示例中，路径715可以具有一个或多个曲线、环线等。例如，路径715可以模拟围绕用户701的头部盘旋的鸟或围绕用户的耳朵嗡嗡叫的蚊子。因此，根据这个信息，致动器控制器230使用边界框705的坐标来识别路径715。在所示示例中，致动器控制器230可以使用第一预定义的偏移来识别在3D空间中的第一点(其是边界框705的最左上角的左边)，并且使用第二预定义的偏移来识别在3D空间中的第二点(其是边界框705的最右上角的右边)。接着致动器控制器230通过绘制第一点与第二点之间的线来产生路径715。
[0047]致动器控制器230可以根据要使用扬声器105模拟的声音以不同方式计算路径715。例如，对于围绕用户701的耳朵嗡嗡叫的蚊子，致动器控制器230可以使用边界框705的坐标估计耳朵的位置，并且使用随机数生成器来确定接近用户的耳朵的随机路径。或者，对于在头顶盘旋的鸟，致动器控制器230可以使用预定义的垂直偏移来识别在用户701的头部上方的点。接着致动器控制器230计算在用户701上方的点为中心的圆以用作路径715。以这种方式，致动器控制器230可以被配置成使用用于计算路径715的不同的技术来模拟声音的不同的移动源。
[0048]系统700可以用于音频/视频演示，诸如电影、电视节目、视频游戏等。例如，系统700可以安装在剧场中以识别一个或多个用户的位置，并且将定制的音频体验提供给每个用户或用户组。在一个示例中，系统700包括多个扬声器105(例如，针对剧场中的每个用户的扬声器)，其使用相应的致动器来沿着不同的个别路径715移动扬声器105的相应的输出区域710。或者，多个扬声器105可以被用来模拟在用户701附近的不同的声源。一个扬声器105可以遵循模拟在用户701上方飞行的鸟的路径，而不同的扬声器105遵循模拟呼嘯经过用户701的抛射体(例如，子弹或箭)的路径。系统700还可以用于音频演示，其中没有相应的视频演示。例如，系统700可以用于动画/木偶表演或在现场演员的舞台演出期间用于为用户701提供更逼真的环境。
[0049]各种实施方案的描述已为了说明的目的被呈现，但不旨在是详尽的或限于所公开的实施方案。在不脱离所描述实施方案的范围和精神的情况下，许多修改和变化对于本领域普通技术人员将是明显的。本文所用的术语被选择以最好地解释实施方案的原理、实际应用或优于在市场上发现的技术的技术改进，或使其他本领域普通技术人员能够理解本文所公开的实施方案。
[0050]在前述内容中，参考在本公开中提出的实施方案。然而，本公开的范围不限于具体描述的实施方案。相反，前述特征和元件的任何组合，无论是否涉及不同的实施方案，预期实施和实践预期的实施方案。此外，尽管本文所公开的实施方案可以实现优于其他可能的解决方案或现有技术的优点，但是是否特定优点是通过给定实施方案来实现不限制本公开的范围。因此，前述方面、特征、实施方案和优点仅仅是说明性的，并且除非在权利要求书中明确叙述，否则不被认为是所附权利要求书的

完整全部详细技术资料下载

当前第3页1 2 3 4