技术特征:
1.一种系统,包括:一个或多个处理器;以及一个或多个计算机可读介质,存储可由所述一个或多个处理器执行的指令,其中所述指令在被执行时使所述系统执行操作,所述操作包括:从与车辆相关联的一对音频传感器接收音频数据;确定与所述音频数据相关联的特征;将所述特征输入到机器学习模型中;从所述机器学习模型接收与所述音频数据相关联的波达方向(doa)值;至少部分地基于所述音频数据,确定与音频事件相关联的声音的出现;以及至少部分地基于所述doa值,确定所述音频事件相对于所述车辆的方向。2.根据权利要求1所述的系统,还包括:至少部分地基于所述音频数据的一部分来确定角谱数据,其中:所述音频数据包括随着时间推移而捕获的多个音频帧,所述角谱数据包括多个角谱,所述多个角谱中的角谱与所述多个音频帧中的音频帧相关联,确定所述特征包括确定多个特征,所述多个特征中的特征与所述多个角谱中的角谱相关联,以及将所述特征输入到所述机器学习模型中包括:将所述多个特征输入到所述机器学习模型中。3.根据权利要求1或2所述的系统,其中:所述特征包括以下各项中的至少一项:所述角谱数据的分布;所述角谱数据的峰值;波达时间差(tdoa);或者所述音频数据的能量值;所述音频事件包括以下各项中的至少一项:紧急声音类别,包括救护车用警报器类别、警察用警报器类别、或消防车用警报器类别中的至少一种;或者非紧急声音类别,包括发动机声音类别、音乐声音类别、雷鸣声音类别或说话声音类别中的至少一种。4.根据权利要求1至3所述的系统,其中:所述音频数据被离散化为多个音频帧;其中确定所述声音的出现包括:将至少一部分所述音频数据输入分类器;以及从所述分类器接收所述声音的分类,所述分类包括救护车用警报器类别、警察用警报器类别、或消防车用警报器类别中的一个或多个,以及其中所述操作还包括:确定指示所述声音的开始呈现的开始时间帧;以及确定指示所述声音的结束呈现的结束时间帧。5.根据权利要求4所述的系统,所述操作还包括:
确定在所述声音的开始呈现处开始、并在所述声音的结束呈现处结束的事件;确定与所述事件相关联的音频帧的计数;以及当与所述事件相关联的音频帧的计数小于阈值时,移除所述事件。6.一种方法,包括:从与车辆相关联的第一音频传感器和第二音频传感器接收音频数据;确定与所述音频数据相关联的特征;至少部分地基于所述特征,确定与所述音频数据相关联的波达方向(doa)值;至少部分地基于所述音频数据,确定音频事件的发生;至少部分地基于所述doa值,确定所述音频事件相对于所述车辆的方向;以及至少部分地基于所述音频事件相对于所述车辆的方向,控制所述车辆。7.根据权利要求6所述的方法,其中,与所述车辆相关联的第一音频传感器和第二音频传感器包括以下各项中的至少一项:与所述车辆的前部区域相关联的两个音频传感器;与所述车辆的左侧相关联的两个音频传感器;与所述车辆的后部区域相关联的两个音频传感器;或者与所述车辆的右侧相关联的两个音频传感器;其中,所述前部区域、所述后部区域、所述左侧和所述右侧是相对于所述车辆的行驶方向的。8.根据权利要求6或7所述的方法,还包括:以下各项中的至少一项:(i)确定所述音频事件包括紧急事件;以及进一步至少部分地基于包括所述紧急事件的音频事件来控制所述车辆,其中,控制所述车辆包括停止所述车辆、或将所述车辆改变到另一车道中的至少一项,或者(ii)至少部分地基于多普勒频移,确定接近所述车辆的音频事件、或在远离所述车辆的方向上行进的所述音频事件中的至少一项。9.根据权利要求6或7所述的方法,还包括:至少部分地基于广义互相关相位变换算法(gcc-phat)、多重信号分类(music)算法或状态相干变换(sct)算法中的一种算法来确定角谱,其中:至少部分地基于所述角谱,确定与所述音频数据相关联的所述特征。10.根据权利要求6或7所述的方法,其中:所述音频数据包括多个音频帧,所述方法还包括:至少部分地基于所述多个音频帧中的音频帧,确定所述第一音频传感器和所述第二音频传感器的角谱;至少部分地基于所述角谱,确定与所述音频帧相关联的一个或多个参数;以及至少部分地基于所述一个或多个参数,确定与所述音频帧相关联的波达方向(doa)值。11.根据权利要求10所述的方法,其中,所述一个或多个参数包括以下各项中的至少一项:与所述角谱相关联的分布;与所述角谱相关联的峰值;波达时间差(tdoa)值;
所述音频数据的能量值;频谱;本底噪声;噪声谱;零交叉;能量分布;互相关;或者机器学习嵌入。12.根据权利要求6或7所述的方法,其中将所述音频数据离散化为多个音频帧;其中确定所述音频事件的发生包括:将所述音频数据的至少一部分输入到分类器;以及从所述分类器接收所述音频事件的分类,所述分类包括救护车用警报器类别、警察用警报器类别、或消防车用警报器类别中的一个或多个,以及其中所述方法还包括:确定指示所述音频事件的开始呈现的开始音频帧;以及确定指示所述音频事件的结束呈现的结束音频帧。13.根据权利要求12所述的方法,还包括:确定在第一开始音频帧和第一结束音频帧之间发生的第一音频事件;确定与所述第一音频事件相关联的音频帧的计数;以及当与所述第一音频事件相关联的音频帧的计数小于阈值时,移除所述第一音频事件。14.根据权利要求12所述的方法,还包括:确定在第二开始音频帧和第二结束音频帧之间发生的第二音频事件;确定在第三开始音频帧和第三结束音频帧之间发生的第三音频事件;确定所述第二音频事件和所述第三音频事件之间的音频帧的计数;以及当所述音频帧的计数小于阈值时,移除所述第二音频事件和所述第三音频事件之间的音频帧的所述计数。15.一种计算机程序产品,包括编码的指令,当所述编码的指令在计算机上运行时,实施根据权利要求6至14中任一项所述的方法。
技术总结
详细描述了用于确定紧急情况的波达方向的技术。车辆的多个音频传感器可以接收与车辆相关联的音频数据。可以从多个音频传感器中选择音频传感器配对以生成表示在车辆所处环境中的声音的音频数据。基于音频数据,可以确定与音频传感器配对相关联的角谱。基于角谱和/或音频数据本身,可以确定与音频数据相关联的特征。基于该特征使用机器学习模型,可以确定与声音相关联的波达方向(DoA)值。在音频数据中可以检测到紧急声音(例如警报声),并且基于该特征和DoA值,可以确定与紧急情况相关联的相对于车辆的方向。相对于车辆的方向。相对于车辆的方向。
技术研发人员:赵南国 S
受保护的技术使用者:祖克斯有限公司
技术研发日:2020.10.20
技术公布日:2022/6/5