本发明涉及语音处理技术领域,尤其涉及一种会议语音数据处理方法、设备及存储介质。
背景技术:
在面积较大的会议室中一般会设有麦克风,发言者可通过麦克风来放大自己的声音,使得所有参会人员都能听清发言者说的内容。但是,参会人员在进入会议室后一般是自由入座的,无法快速找到指定目标人物的位置;若指定目标人物想要发言,会议主持人需要将麦克风传递到指定目标人物手上,才可将指定目标人物的声音进行广播,期间,从众多参与人员中找到指定的目标人物,并将麦克风传递到指定目标人物手上的过程需要耗费一定的时间;且现有的麦克风只是对其采集到的声音进行放大播放,麦克风本身无法剔除掉声音中的杂声;当发言者发言时若其身旁的其他参会人员说话,麦克风则有可能会把发言者身旁的参会人员说话的声音连通发言者的声音一起放大,使得现场人员无法听清发言者的声音,导致现场的广播效果较差,杂声较多。
技术实现要素:
为了克服现有技术的不足,本发明的目的之一在于提供一种会议语音数据处理方法,可快速定位目标人物的入座位置,同时提高目标人物声音的广播清晰度,减少杂声。
本发明的目的之二在于提供一种电子设备。
本发明的目的之三在于提供一种存储介质。
本发明的目的之一采用如下技术方案实现:
一种会议语音数据处理方法,包括:
步骤s1:获取摄像设备拍摄会议现场所获得的现场图片,对现场图片中所有人像进行面部识别以确定指定目标人物在会议现场中的位置,并将位于目标人物周边的人物标记为剔除目标;
步骤s2:接收采集指令,根据采集指令控制目标人物及剔除目标所在位置上的麦克风开启,同步采集目标人物和剔除目标的实时语音;
步骤s3:对目标语音进行解析,将目标语音中夹杂的剔除语音进行剔除,并通过麦克风对剔除后的目标语音进行播放。
进一步地,所述步骤s1之前还包括:预先录入所有参会人员的身份信息,所述身份信息至少包括脸部图片和人物名称;并根据需求在所有参会人员中指定至少一人为目标人物。
进一步地,所述步骤s1中确定指定目标人物在会议现场中的位置的方法为:
预先创建会议现场的会议室模型,并在会议室模型中编辑座位分布使其与会议现场的座位分布相一致,并对每个座位均标记有其唯一编码;
获取现场拍摄的现场图片后,将现场图片与会议室模型进行比对分析,识别出现场图片中每个人在会议室模型中的位置;
识别出目标人物的身份信息后,根据目标人物在会议模块的位置将目标人物的身份信息及其对应的座位编码进行绑定。
进一步地,所述步骤s1中将位于目标人物周边的人物标记为剔除目标的方法为:
以目标人物的原点向外延伸预设半径形成收音范围;
根据会议室模型中的座位分布将位于收音范围内的人物标记为剔除目标。
进一步地,所述步骤s3中对目标语音进行解析,将目标语音中夹杂的剔除语音进行剔除的方法为:
对剔除语音进行声纹识别分析,以获取每个剔除目标的声纹特征;
判断目标语音中是否包含有与剔除目标的声纹特征相同的声音,若有,则将目标语音中与剔除目标的声纹特征相同的声音进行删除,保留剔除目标以外的声音。
进一步地,所述步骤s3还包括:将保留下来的剔除目标以外的声音进行声纹识别分析以获得目标人物的声纹特征,保留目标语音中与目标人物的声纹特征相同的声音,并将目标语音中目标人物声音以外的杂声进行删除。
进一步地,所述会议现场中每个座位所对应的麦克风均设有提示灯,仅在目标人物所对应的麦克风开启时该麦克风的提示灯亮起。
进一步地,所述会议现场中每个座位所对应的麦克风均设有手动开启按键,按下任意一麦克风的手动开启按键时该麦克风所在位置所对应的人物则被标记为新的目标人物。
本发明的目的之二采用如下技术方案实现:
一种电子设备,其包括处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的会议语音数据处理方法。
本发明的目的之三采用如下技术方案实现:
一种存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述的会议语音数据处理方法。
相比现有技术,本发明的有益效果在于:
通过人脸识别的方式从众多参会人员中找到目标人物,可提高人员查找效率;同时,可将目标人物及其周边人员的声音进行采集,将目标语音中存在的周边人员的声音进行剔除,达到剔除杂声的效果,从而提高目标人物的语音清晰度。
附图说明
图1为本发明会议语音数据处理方法的流程示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
实施例一
本实施例提供一种会议语音数据处理方法,可自动识别目标人物的入座位置,并对采集所得的目标人物的语音进行杂声剔除,避免将采集到的杂声一同对外播放,提高广播中目标人物的声音清晰度。
在本实施例中,会议现场中设有至少一会议桌、若干个座位和设在会议桌上的若干个麦克风,麦克风的数量和座位数量相同,且麦克风的摆放位置与座位的分布一一对应,使得每个入座的参会人员都配有麦克风。
而在本实施例的会议现场中还设有摄像设备,摄像设备的拍摄范围覆盖会议现场中所有座位,使得每个入座的参会人员都可被拍摄和识别。摄像设备可对会议内容进行录像,同时还可利用摄像设备拍摄到场人员的人脸图像进行人脸识别以获知每个到场人员的身份信息。
如图1所示,本实施例的会议语音数据处理方法具体包括如下步骤:
步骤s1:获取摄像设备拍摄会议现场所获得的现场图片,对现场图片中所有人像进行面部识别以确定指定目标人物在会议现场中的位置,并将位于目标人物周边的人物标记为剔除目标。
所述步骤s1之前需预先录入所有参会人员的身份信息,所述身份信息至少包括脸部图片和人物名称;系统接收到参会人员的身份信息后,对脸部图像进行特征分析以获得特征信息,并将特征信息和人物名称绑定在一起,便于后续识别每个参会人员的身份。同时,会议管理人员可根据需求在众多参会人员中指定若干个人员为目标人物,该目标人物可以是会议中的重要人物,例如重要来宾或企业管理人员等。
利用摄像设备对会议现场进行拍摄,以生成现场图片,将现场图片中每个人像进行人脸分析,通过分析所得的人脸特征和预存的参会人员的人脸特征信息进行比对,即可获知每个到场人员的身份。此外,根据参会人员到场情况生成对应的签到表,将已经到达会议现场的人员和未到达会场的人员分别标注在签到表中,可让管理人员清楚地了解到参会人员到场情况;同时,可预先录入每个参会人员的用户终端信息,在会议开始后对未到场的参会人员的用户终端发送会议提醒,提醒参会人员到场参加会议。
此外,摄像设备的拍摄时间和拍摄次数均可预先设置,摄像设备按照拍摄时间对会议现场进行多次拍摄,并对每次拍摄所得的现场图片进行人脸识别分析,以确保人脸识别的准确性。
当识别出到场人员中包含有目标人物后,即可确定目标人物的入座位置;其中,确定指定目标人物在会议现场中的位置的方法为:预先创建会议现场的会议室模型,并在会议室模型中编辑座位分布使其与会议现场的座位分布相一致,并对每个座位均标记有其唯一编码,由于每个座位都有其对应的麦克风,因此,在对每个座位标记唯一编码时相当于对每个麦克风也进行编码,即每个麦克风也具有其各自的编码;本实施例的系统软件具有创建模型的功能,且系统软件中预存有大量的会议桌模型和座椅模型,会议管理人员在系统软件中创建一个会议室模型后,可根据实际会议室中会议桌和座位的摆放方式将会议桌模型和座椅模型添加入会议室模型中,使得会议室模型的座椅分布与会议现场的座椅分布相同,并根据座椅的顺序对每个座位标记有其唯一的编码;当获取摄像设备拍摄所得的现场图片后,将现场图片导入至系统软件中,根据现场图片的拍摄角度将会议室模型旋转至与现场图片相同的角度,再将现场图片与会议室模型进行比对,即可分析出现场图片中每个入座的参会人员对应会议室模型中的哪个位置;再根据会议室模型中每个座位的唯一编码将目标人物所在位置的唯一编码与目标人物的身份信息进行绑定。
当摄像设备拍摄到同一目标人物在会议现场中的位置发生改变时,则将目标人物的身份信息和原座位编码进行解绑,重新确定该目标人物所在位置后再将目标人物当前位置的唯一编码与目标人物的身份信息进行重新绑定,以便后续控制目标人物所在位置上的麦克风启动。
步骤s2:接收采集指令,根据采集指令控制目标人物及剔除目标所在位置上的麦克风开启,同步采集目标人物和剔除目标的实时语音以生成对应的目标语音和剔除语音。
当会议开始并需要目标人物发言时,会议管理人员可发起目标语音采集指令,此时即可根据目标人物所在位置所对应的唯一编码控制该座位上的麦克风开启,同时,让位于目标人物周边的剔除目标的麦克风也开启,对目标人物和剔除目标进行同步语音采集。
期间,确定剔除目标的方法为:以目标人物的原点向外延伸预设半径形成收音范围;该收音范围内所有人或物发出的声音都容易被目标人物所在位置的麦克风采集到,因此,将位于收音范围内的人物标记为剔除目标;若会议现场中参会人员的座位是呈矩阵形分布的,收音范围内的剔除目标则为目标人物的前方、后方、左方和右方四个方向的参会人员;若会议现场中参会人员的座位是单排分布的,收音范围内的剔除目标则为目标人物的左方和右方的参会人员。
步骤s3:对目标语音和剔除语音进行解析,将目标语音中夹杂的剔除语音进行剔除,并通过麦克风对剔除后的目标语音进行播放。
目标人物所在位置所对应的麦克风所采集到的声音为目标语音,剔除人物所在位置所对应的麦克风所采集到的声音为剔除语音;目标语音除了包含有目标人物的声音外,还可能包括剔除目标的声音和外界环境的声音;在本实施例中,对剔除语音进行声纹识别分析,识别出每个剔除目标的声纹特征;其后,判断目标语音中是否包含有与剔除目标的声纹特征相同的声音,若有,则将目标语音中与剔除目标的声纹特征相同的声音进行删除,保留剔除目标以外的声音。
此外,由于剔除后的目标语音中有可能存在外界环境嘈杂声,因此将保留下来的剔除目标以外的声音进行再次声纹识别分析,以确定目标人物的声纹特征,保留目标语音中与目标人物的声纹特征相同的声音,并将目标语音中的其他杂声进行删除,以获得仅有目标人物声音的目标语音,可实现将外界环境声音进行剔除,获得清晰的目标人物的声音。
而所述会议现场中每个座位所对应的麦克风均设有手动开启按键,按下任意一麦克风的手动开启按键时该麦克风所在位置所对应的人物则被标记为新的目标人物,此时即可采集新目标人物的目标语音进行处理和播放;当按键关闭时,则关闭该麦克风,此时不采集语音信号,使得除了系统指定的目标人物外,每个到场人员都可随时发言。且所述会议现场中每个座位所对应的麦克风均设有提示灯,麦克风的提示灯仅在目标人物所对应的麦克风开启时亮起,剔除目标的麦克风开启时提示灯不亮,会议管理人员和到场人员可根据提示灯的亮灭情况确定目标人物与目标人物所在位置上的麦克风是否匹配,若不匹配,会议管理人员即可通过系统软件调整麦克风的开关状态,使得目标人物与目标人物所在位置上的麦克风相互匹配,提高语音采集的准确率。
实施例二
本实施例提供一种电子设备,包括存储器、处理器以及存储在存储器中的程序,所述程序被配置成由处理器执行,处理器执行所述程序时实现实施例一所述的会议语音数据处理方法。
另外,本发明还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述会议语音数据处理方法。本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本实施例中的设备及存储介质与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施中的系统的结构及实施过程,为了说明书的简洁,在此就不再赘述。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。