本技术涉及语音会议的,尤其是涉及一种无纸化办公会议设备及方法。
背景技术:
1、随着经济全球化的进程,许多大型企业在不同的国家或地区开设有分公司、子公司、门店等,因此,许多大型企业的会议需要身处不同地区的职员参与,不同地区的职员可能存在语种、口音和语言习惯的差异,从而造成容易造成其他参会人员理解上的偏差,进而影响会议的信息传达效果;目前,市场上已有许多用于远程会议的多媒体会议设备,然而,现有的多媒体会议设备难以解决不同地区职员语言差异的问题。
技术实现思路
1、为了提高远程会议中信息传达的准确性,本技术提供一种无纸化办公会议设备及方法。
2、本技术的发明目的一采用如下技术方案实现:
3、一种无纸化办公会议设备,包括若干参会终端和通信连接于各所述参会终端的主控制器,所述参会终端包括显示器、录像器、录音器和播音器,所述主控制器包括:
4、语言特征信息获取模块,用于识别所有参会终端对应参会者的身份信息,以获取各参会者的语言特征信息;
5、发言文本数据生成模块,用于获取发言参会者的发言语音数据和语言特征信息并输入至预设的语音语义识别模型中,识别语音语种信息,基于发言参会者的口语特征信息和语音语种信息匹配对应的特征语音识别算法,识别所述发言语音数据以生成发言文本数据;
6、收听文本音频数据生成模块,用于获取收听参会者的语言特征信息,基于收听参会者的人员语种信息将所述发言文本数据翻译为收听文本数据,基于收听文本数据生成收听音频数据;
7、收听文本音频数据发送模块,用于若收听参会者的人员语种信息包含发言参会者的语音语种信息,将发言语音数据和收听文本数据发送至收听终端;若收听参会者的人员语种信息不包含发言参会者的语音语种信息,将收听音频数据和收听文本数据发送至收听终端;
8、所述语言特征信息包括口语特征信息和人员语种信息。
9、通过采用上述技术方案,无纸化办公会议设备包括若干供参会人员使用的参会终端和通信连接于各参会终端的主控制器,其中参会终端包括显示器、录像器、录音器和播音器,以便使各参会人员之间进行视频语音会议,录像器和录音器还具备作为识别参会人员身份的输入设备的功能;主控制器包括语言特征信息获取模块、发言文本数据生成模块、收听文本音频数据生成模块和收听文本音频数据发送模块,以便对发言参会者的语音进行采集、识别和翻译等处理,并将处理后的信息传递至各收听参会者。
10、本技术的发明目的二采用如下技术方案实现:
11、一种无纸化办公会议方法,应用于上述无纸化办公会议设备,包括:
12、识别所有参会终端对应参会者的身份信息,以获取各参会者的语言特征信息;
13、获取发言参会者的发言语音数据和语言特征信息并输入至预设的语音语义识别模型中,识别语音语种信息,基于发言参会者的口语特征信息和语音语种信息匹配对应的特征语音识别算法,识别所述发言语音数据以生成发言文本数据;
14、获取收听参会者的语言特征信息,基于收听参会者的人员语种信息将所述发言文本数据翻译为收听文本数据,基于收听文本数据生成收听音频数据;
15、若收听参会者的人员语种信息包含发言参会者的语音语种信息,将发言语音数据和收听文本数据发送至收听终端;若收听参会者的人员语种信息不包含发言参会者的语音语种信息,将收听音频数据和收听文本数据发送至收听终端;
16、所述语言特征信息包括口语特征信息和人员语种信息。
17、通过采用上述技术方案,识别所有参会终端对应参会者的身份信息,以便确定各参会者所掌握的语种情况,以及参会者的口语特征情况等语言特征信息;获取发言参会者的发言语音数据和语言特征信息并输入至预设的语音语义识别模型,识别发言语音数据对应的语种,根据发言参会者的口语特征和语种,匹配经过对应类型语音数据特化训练的特征语音识别算法,从而对发言语音数据进行识别,得到对应的发言文本数据;获取收听参会者的语言特征信息,以便确定收听参会者所掌握的语种类型,以便将发言文本数据翻译为符合收听参会者所掌握语言的收听文本数据,便于后续通过收听参会者所了解的语种文字向收听参会者展示翻译后的字幕,基于收听文本数据生成收听音频数据,便于后续通过收听参会者所了解的语种音频向收听参会者播放翻译后的语音;若收听参会者所掌握的语种包括语音语种信息,则仅向该收听参会者展示翻译后的文本信息,对发言参会者的原始发言语音数据无需进行翻译,便于收听参会者根据发言参会者的原始发言语音数据理解发言参会者所表达的内容,若收听参会者不掌握原始发言语音的语种,则还需要向收听参会者播放收听音频数据,便于收听参会者通过视觉或听觉获知发言参会者所需传达的内容。
18、本技术在一较佳示例中:所述识别所有参会终端对应参会者的身份信息,以获取各参会者的语言特征信息,包括:
19、获取参会者的生物特征数据,将所述生物特征数据输入至职员生物数据库中,基于所述生物特征数据匹配对应的身份信息;
20、基于所述身份信息,从职员资料数据库中匹配对应参会者的语言特征信息。
21、通过采用上述技术方案,获取参会者的生物特征数据并输入至职员生物数据库中进行匹配,以确定各参会者的身份信息;根据参会者的身份信息从职员资料数据库中匹配对应的语言特征信息,以便后续根据各参会者的语言特征信息选择合适的语音识别算法,并确定对应的语种翻译程序。
22、本技术在一较佳示例中:所述基于所述身份信息,从职员资料数据库中匹配对应参会者的语言特征信息,包括:
23、基于参会者的身份信息从职员资料数据库中获取对应的年龄信息、性别信息,以及学习经历信息、工作经历信息、户籍信息和籍贯信息;
24、基于所述年龄信息和性别信息,以确定生理特征信息;基于所述学习经历信息、工作经历信息、户籍信息和籍贯信息,以确定参会者在每一曾住地区的生活时长;
25、基于参会者在各曾住地区的生活时长占比,确定参会者的每一种地区口音的可靠性参数,以确定口音特征信息;
26、基于所述生理特征信息和所述口音特征信息,生成口语特征信息。
27、通过采用上述技术方案,根据参会者的身份信息从职员资料数据库中获取该参会者的个人信息包括参会者的性别、年龄,以及户籍信息、籍贯信息、学习经历信息和工作经历信息;根据参会者的年龄信息和性别信息,获知参会者的生理特征,从而确定参会者的生理特征信息,基于参会者的学习经历信息、工作经历信息、户籍信息和籍贯信息,分析参会者在每一曾住地区的生活时长,以便后续判断该参会者的口音受各地口音的影响程度;基于参会者在各曾住地区的生活时长占比,计算参会者的每一种地区口音的可靠性参数,进而确定口音特征参数;进一步根据生理特征信息和口音特征信息生成口语特征信息。
28、本技术在一较佳示例中:所述获取发言参会者的发言语音数据和语言特征信息并输入至预设的语音语义识别模型中,识别语音语种信息,基于发言参会者的口语特征信息和语音语种信息匹配对应的特征语音识别算法,识别所述发言语音数据以生成发言文本数据,包括:
29、接收来自发言终端的发言语音数据并输入至语音语义识别模型中,对所述发言语音数据进行语种识别,生成语音语种信息;
30、获取发言参会者的口语特征信息,基于所述口语特征信息和语音语种信息匹配对相应口语特征、语种进行过特化训练的特征语音识别算法;
31、将所述发言语音数据输入至特征语音识别算法中,识别所述发言语音数据,以生成发言文本数据。
32、通过采用上述技术方案,接收发言终端发出的发言参会者的发言语音数据并输入至预设的语音语义识别模型中,初步对发言语音数据进行语种识别,确定发言参会者所使用的语种,以得到语音语种信息;获取发言参会者的口语特征信息,以便获知发言参会者口语的特征,如口音、年龄、性别等的特征,进而匹配对发言参会者对应的口语特性、语种进行过特化训练的特征语音识别算法,以便提高对发言语音数据识别的准确性;将发言语音数据输入至特征语音识别算法中,使用特征语音识别算法识别发言语音数据,以得到发言文本数据。
33、本技术在一较佳示例中:所述人员语种信息包括第一语种信息和第二语种信息,所述第一语种信息为参会者的最擅长语种;
34、所述基于收听参会者的人员语种信息将所述发言文本数据翻译为收听文本数据,基于收听文本数据生成收听音频数据,包括:
35、基于收听参会者的人员语种信息确定第一语种信息;
36、将发言文本数据输入至语音语种译第一语种程序,生成收听文本数据;
37、将收听文本数据输入至文本转音频程序,生成收听音频数据。
38、通过采用上述技术方案,从收听参会者的人员语种信息确定收听参会者最擅长的第一语种;将发言文本数据从语音语种翻译为第一语种的文本,得到收听文本数据,便于收听参会者通过阅读收听文本数据,接收发言参会者在会议上传达的信息;将收听文本数据输入至文本转音频程序中,以得到收听音频数据,便于收听参会者通过听收听音频数据,接收发言参会者在会议上传达的信息。
39、本技术在一较佳示例中:所述若收听参会者的人员语种信息包含发言参会者的语音语种信息,将发言语音数据和收听文本数据发送至收听终端;若收听参会者的人员语种信息不包含发言参会者的语音语种信息,将收听音频数据和收听文本数据发送至收听终端之后,包括:
40、将所述收听文本数据发送至审稿终端;
41、实时接收所述审稿终端发出的翻译修正信息,基于所述翻译修正信息对收听文本数据进行更正,生成更正提示信息并发送至对应的收听终端。
42、通过采用上述技术方案,由于对发言参会者的发言语音数据进行翻译处理后得到的收听文本数据可能存在错误,因此,将所述收听文本数据发送至审稿终端,便于由审核终端协助检查收听文本数据是否存在翻译错误;实时接收所述审稿终端发出的翻译修正信息,基于翻译修正信息对收听文本数据进行更正,并发出更正提示信息,以便提示收听参会者之前所查看的收听文本数据存在错误且已经修正,从而提高收听参会者对发言参会者所传达内容理解的准确性。
43、本技术在一较佳示例中:所述将所述收听文本数据发送至审稿终端之前,还包括:
44、将所述语音语种信息、发言参会者的口语特征信息与各收听参会者的语言特征信息进行匹配,计算各收听参会者与发言参会者的之间的语言特征相似度;
45、基于语言特征相似度从高到低对各发言参会者进行排序,生成相似度排序表单;
46、基于所述相似度表单确定选取至少一个收听参会者为翻译审稿者,并将对应的收听终端定义为审稿终端;
47、向所述审稿终端发送审稿请求信息。
48、通过采用上述技术方案,将发言语音信息对应的语音语种信息、发言参会者的口语特征信息与每一收听参会者的语言特征信息进行匹配,以计算各收听参会者与发言参会者之间的语言相似度数值;根据语言相似度数值从高到低对各发言参会者进行排序,得到相似度排序名单,以便获知各收听参会者与发言参会者所掌握语种和口语特征的相似程度;基于相似度表单选取至少一个收听参会者作为翻译审稿者,并将其所使用的收听终端定义为审稿终端,便于后续对收听文本数据的准确性进行审核和修正;向审稿终端发送审稿请求信息,以便提示翻译审稿者协助对翻译后音频和文本的准确性进行审核。
49、本技术的发明目的三采用如下技术方案实现:
50、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述无纸化办公会议方法的步骤。
51、本技术的发明目的四采用如下技术方案实现:
52、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述无纸化办公会议方法的步骤。
53、综上所述,本技术包括以下至少一种有益技术效果:
54、1. 无纸化办公会议设备包括若干供参会人员使用的参会终端和通信连接于各参会终端的主控制器,其中参会终端包括显示器、录像器、录音器和播音器,以便使各参会人员之间进行视频语音会议,录像器和录音器还具备作为识别参会人员身份的输入设备的功能;主控制器包括语言特征信息获取模块、发言文本数据生成模块、收听文本音频数据生成模块和收听文本音频数据发送模块,以便对发言参会者的语音进行采集、识别和翻译等处理,并将处理后的信息传递至各收听参会者。
55、2. 识别所有参会终端对应参会者的身份信息,以便确定各参会者所掌握的语种情况,以及参会者的口语特征情况等语言特征信息;获取发言参会者的发言语音数据和语言特征信息并输入至预设的语音语义识别模型,识别发言语音数据对应的语种,根据发言参会者的口语特征和语种,匹配经过对应类型语音数据特化训练的特征语音识别算法,从而对发言语音数据进行识别,得到对应的发言文本数据;获取收听参会者的语言特征信息,以便确定收听参会者所掌握的语种类型,以便将发言文本数据翻译为符合收听参会者所掌握语言的收听文本数据,便于后续通过收听参会者所了解的语种文字向收听参会者展示翻译后的字幕,基于收听文本数据生成收听音频数据,便于后续通过收听参会者所了解的语种音频向收听参会者播放翻译后的语音;若收听参会者所掌握的语种包括语音语种信息,则仅向该收听参会者展示翻译后的文本信息,对发言参会者的原始发言语音数据无需进行翻译,便于收听参会者根据发言参会者的原始发言语音数据理解发言参会者所表达的内容,若收听参会者不掌握原始发言语音的语种,则还需要向收听参会者播放收听音频数据,便于收听参会者通过视觉或听觉获知发言参会者所需传达的内容。
56、3. 获取参会者的生物特征数据并输入至职员生物数据库中进行匹配,以确定各参会者的身份信息;根据参会者的身份信息从职员资料数据库中匹配对应的语言特征信息,以便后续根据各参会者的语言特征信息选择合适的语音识别算法,并确定对应的语种翻译程序。