同声传译方法和系统、存储介质及电子装置与流程

文档序号:16308848发布日期:2018-12-19 05:11阅读:267来源:国知局
同声传译方法和系统、存储介质及电子装置与流程

本发明涉及计算机领域,具体而言,涉及一种同声传译方法和系统、存储介质及电子装置。

背景技术

如今,越来越多的会议开始涉及来自多个不同国家的参会人员。为了使所有参会人员了解会议内容,往往需要对会议内容进行同声传译。例如,通过工作人员在现场进行同步口译,或为每个参会人员配置同传耳机。

然而,随着同声传译过程中所涉及的语种的数量的增加,采用上述相关技术进行同声传译的操作难度也将随之增加。如每增加一个新的语种进行同声传译,都需增加对应的翻译操作,从而导致同声传译的效率受到很大影响。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种同声传译方法和系统、存储介质及电子装置,以至少解决相关技术中存在的同声传译效率低的的技术问题。

根据本发明实施例的一个方面,提供了一种同声传译方法,包括:第一终端获取参与目标会议的第一对象所输入的第一语种;上述第一终端将上述第一语种发送给应用服务器,以使上述应用服务器按照上述第一语种对从上述目标会议中获取到的音频数据执行同声传译处理,其中,上述音频数据为上述应用服务器对上述目标会议中配置的同声传译设备所采集到的语音进行识别后得到,上述同声传译设备用于对参与上述目标会议的全部对象所产生的语音进行采集;在上述第一终端中显示上述应用服务器所返回的同声传译处理结果,其中,上述同声传译处理结果中携带有按照上述第一语种执行同声传译处理后所得到的第一会议译文文本。

根据本发明实施例的另一方面,还提供了一种用于实现上述同声传译方法的智能终端,包括:输入输出装置,用于获取参与目标会议的第一对象所输入的第一语种;传输装置,用于将上述第一语种发送给应用服务器,以使上述应用服务器按照上述第一语种对从上述目标会议中获取到的音频数据执行同声传译处理,其中,上述音频数据为上述应用服务器对上述目标会议中配置的同声传译设备所采集到的语音进行识别后得到,上述同声传译设备用于对参与上述目标会议的全部对象所产生的语音进行采集;显示装置,用于在上述智能终端中显示上述应用服务器所返回的同声传译处理结果,其中,上述同声传译处理结果中携带有按照上述第一语种执行同声传译处理后所得到的第一会议译文文本。

根据本发明实施例的又一方面,还提供了一种同声传译系统,包括:第一终端,用于获取参与目标会议的第一对象所输入的第一语种;应用服务器,用于在接收到上述第一终端发送的上述第一语种后,按照上述第一语种对从上述目标会议中获取到的音频数据执行同声传译处理,并将同声传译处理结果返回给上述第一终端;同声传译设备,用于对参与上述目标会议的全部对象所产生的语音进行采集,并将采集到的上述语音发送给上述应用服务器,以使上述应用服务器对上述语音进行识别,得到上述音频数据。

根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述同声传译方法。

根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的同声传译方法。

在本发明实施例中,采用了第一终端获取参与目标会议的第一对象所输入的第一语种;上述第一终端将上述第一语种发送给应用服务器,以使上述应用服务器按照上述第一语种对从上述目标会议中获取到的音频数据执行同声传译处理;在上述第一终端中显示上述应用服务器所返回的同声传译处理结果的方法。在上述方法中,由于可以在第一终端上由第一对象输入第一语种,从而可以在目标会议进行中,在获取到目标会议的音频数据后,将目标会议的音频数据进行识别以及同声传译处理,得到同声传译处理结果,同声传译处理结果为第一语种的处理结果。实现了将目标会议的多种音频数据转化为第一语种的效果,进而解决了相关技术中存在的同声传译效率低的的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种可选的同声传译方法的应用环境的示意图;

图2是根据本发明实施例的一种可选的同声传译方法的流程示意图;

图3是根据本发明实施例的另一种可选的同声传译方法的流程示意图;

图4是根据本发明实施例的一种可选的同声传译方法的示意图;

图5是根据本发明实施例的另一种可选的同声传译方法的示意图;

图6是根据本发明实施例的又一种可选的同声传译方法的示意图;

图7是根据本发明实施例的又一种可选的同声传译方法的示意图;

图8是根据本发明实施例的又一种可选的同声传译方法的示意图;

图9是根据本发明实施例的一种可选的智能终端的结构示意图;

图10是根据本发明实施例的一种可选的同声传译系统的结构示意图;

图11是根据本发明实施例的一种可选的电子装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例的一个方面,提供了一种同声传译方法,可选地,作为一种可选的实施方式,上述同声传译方法可以但不限于应用于如图1所示的环境中。图1中用户102可以与用户设备104进行交互,用户设备104中包括存储器106与处理器108。同声传译设备118中包括麦克风120,麦克风120用于手机目标会议中的音频数据,在收集到音频数据后,同声传译设备118通过步骤s102将收集到的音频数据发送给应用服务器112。应用服务器112中包括翻译引擎114与数据库116。翻译引擎114负责将获取到的音频数据翻译成同声传译处理结果,并保存到数据库116中。应用服务器112可以通过步骤s104将同声传译处理结果中的第一会议译文文本发送给用户设备104。

需要说明的是,相关技术中,在参会过程中需要翻译时,通常由工作人员进行同步口译,或者配置同传耳机。然而,由于同声传译过程中所涉及的语种的数量在增加,因此,采用上述方法会造成同步传译的操作难度增大。而本实施例中,由于可以在第一终端上由第一对象输入第一语种,从而可以在目标会议进行中,在获取到目标会议的音频数据后,将目标会议的音频数据进行识别以及同声传译处理,得到同声传译处理结果,同声传译处理结果为第一语种的处理结果。实现了将目标会议的多种音频数据转化为第一语种的效果。

可选地,上述同声传译方法可以但不限于应用于可以计算数据的终端上,例如手机、平板电脑、笔记本电脑、pc机等终端上,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:蓝牙、wifi及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器可以包括但不限于任何可以进行计算的硬件设备。

可选地,作为一种可选的实施方式,如图2所示,上述同声传译方法包括:

s202,第一终端获取参与目标会议的第一对象所输入的第一语种;

s204,第一终端将第一语种发送给应用服务器,以使应用服务器按照第一语种对从目标会议中获取到的音频数据执行同声传译处理,其中,音频数据为应用服务器对目标会议中配置的同声传译设备所采集到的语音进行识别后得到,同声传译设备用于对参与目标会议的全部对象所产生的语音进行采集;

s206,在第一终端中显示应用服务器所返回的同声传译处理结果,其中,同声传译处理结果中携带有按照第一语种执行同声传译处理后所得到的第一会议译文文本。

可选地,上述同声传译方法可以但不限于应用于国际交流会议中,或者应用于多国交换生演讲中,或者应用于多国贸易交流的场景中。具体地,上述同声传译方法可以但不限于应用于安装有同声传译软件的终端上,例如,应用于手机、平板电脑、笔记本电脑、pc机上等。

需要说明的是,在第一终端获取到参与目标会议的第一对象输入的第一语种后,将第一语种发送给应用服务器。应用服务器在获取到了第一对象所输入的第一语种后,以及在获取到目标会议中的音频数据以后,可以将获取到的音频数据按照第一语种进行处理,并返回第一会议译文文本给第一终端。从而使第一终端上可以显示与第一语种匹配的第一会议译文文本。实现了无论应用服务器获取到任何语种的音频数据都可以将其转换成第一语种并返回给第一终端的目的,达到了降低多语种同声传译难度的效果。

如图3所示,第一终端302通过步骤s302向应用服务器304发送第一语种,同声传译装置306通过步骤s304向应用服务器304发送采集到的语音。应用服务器304在获取到上述第一语种与采集到的语音后,通过步骤s306对上述采集到的语音进行识别,得到音频数据,并通过步骤s308向第一终端302返回对音频数据进行转换后得到的第一会议译文文本。从而可以使第一终端302所获取到的第一会议译文文本为根据第一语种对音频数据进行转换后得到的文本,实现了降低多语种同声传译难度的效果。

可选地,在本实施例中,上述第一语种可以为任何机器可识别的语种,例如可以但不限于为汉语、英语、德语、法语、西班牙语、韩语、日语等。上述语音可以但不限于为会议中或者贸易场所或者演讲中产生的任何机器可收集到的声音。可以包含一种语种,也可以包含多种语种。可以由一人产生,或者由多人产生,或者由机器产生。例如,会议中的发言产生的声音、视音频产生的声音、交易中询问价格的声音等。服务器可以但不限于在获取到上述语音后,对上述语音进行去噪处理,得到音频数据。上述同声传译处理可以但不限于对获取到的音频数据进行语种转换,上述第一会议译文文本可以为对语种转换后的音频数据进行转换后得到的译文文本。

以下以上述音频数据包含多种语种,例如包含英语、德语、法语,上述第一终端为手机、上述第一语种为汉语的情况进行说明。手机接收到第一对象输入的第一语种,为汉语,手机将上述第一语种发送给应用服务器。应用服务器保存第一语种。在同声传译设备采集到音频数据后,将上述音频数据发送给应用服务器。其中,音频数据包括英语、德语、法语等多个语种。应用服务器在获取到上述多个语种后,根据接收到的第一语种,将上述多个语种的音频数据翻译为汉语,并将翻译后的汉语生成第一会议译文文本,发送给手机。

可选地,第一终端可以向应用服务器发送第一配置信息,第一配置信息中携带有第一语种与领域信息。上述领域信息用于在应用服务器接收到领域信息后,将获取到的音频数据翻译成第一语种且翻译成上述领域信息所在的领域对应的词汇。

可选地,上述将获取到的音频数据翻译成第一语种且翻译成上述领域信息所在的领域对应的词汇可以但不限于包括以下至少之一:

(1)在领域信息标识为计算机领域的情况下,将获取到的音频数据翻译成第一语种的计算机领域的专有名词。

(2)在领域信息标识为生物领域的情况下,将获取到的音频数据翻译成第一语种的计算机领域的专有名词。

(3)在领域信息标识为化学领域的情况下,将获取到的音频数据翻译成第一语种的计算机领域的专有名词。

例如,以上述领域信息为生物领域、第一语种为汉语为例,当第一终端将汉语与生物领域的信息发送给应用服务器后,应用服务器在获取到不同语种的音频数据后,将上述音频数据翻译成汉语的过程中,如果产生既可以翻译成生物领域的常用词汇,又可以翻译成其他词汇的情况下,则应用服务器将上述音频数据翻译成生物领域的常用词汇。

可选地,作为一种可选的示例,第一终端显示界面可以如图4所示,在图4中,第一终端的显示界面上显示有多个按钮,每一个按钮指示一种领域信息,还存在一个输入框。用户可以选择在输入框中输入领域信息,或者按下下方的按钮选择领域信息。则第一终端在接收到输入的领域信息或者在检测到按钮被按下后,即可获得领域信息,并将获取到的领域信息发送给应用服务器。

可选地,在第一终端获取第一对象所输入的第一语种时,可以采用如下方法:

(1)第一终端中显示有多种语种,第一对象从多种语种中选择其中一种,第一终端获取第一对象所选择的语言作为第一对象所输入的第一语种。

可选地,在第一终端上显示多种语种可以为以按钮的形式显示多种语种,每一个按钮表示一个语种,或者以下拉菜单的形式显示多种语种,点击下拉菜单后,下拉菜单中携带有多个语种。

例如,结合上述多人会议的过程进行说明。以在第一终端上显示按钮的情形为例,如图5所示,图5为一种可选的手机显示界面。在手机的显示界面上显示有多个语种,上述多个语种可以按照固定顺序排序,也可以按照热度、使用次数等进行排序。图5中的多个语种按照固定顺序排序。当手机获取到第一对象按下按钮所产生的指令后,获取上述指令对应的语种,并将上述语种发送给应用服务器。

(2)第一终端获取第一对象输入的文字,并对文字进行识别,得到第一对象输入的第一语种。

可选地,上述第一终端获取第一对象输入的文字可以但不限于为第一终端的终端显示界面上显示有输入框,通过获取第一对象输入到输入框中的文字来获取第一对象输入的文字。

(3)第一终端获取第一对象的语音信息,并对语音信息进行识别,得到第一对象输入的第一语种。

可选地,上述第一终端获取第一对象的语音信息可以但不限于为第一终端通过麦克风等设备获取第一对象所发出的声音,并对上述声音进行识别,得到第一语种。则将上述第一语种作为第一对象所输入的第一语种。

可选地,第一终端在显示第一会议译文文本时,可以但不限于采用如下任意一种方法:

(1)第一终端在第一终端的终端显示界面上一次性显示第一会议译文文本;

(2)第一终端在第一终端的显示界面上逐条显示第一会议译文文本;

(3)第一终端在第一终端外接的显示设备上显示第一会议译文文本。

可选地,上述第一终端在第一终端外接的显示设备上显示第一会议译文文本并可以但不限于为第一终端将获取到的第一会议译文文本发送给投影设备,并使用投影设备投放上述第一会议译文文本。

可选地,第一终端还可以获取第二配置信息,并将第二配置信息发送给应用服务器。上述第二配置信息可以但不限于为用于执行同声传译处理的对象的对象标识,或者用于执行同声传译处理的文本范围。上述对象标识可以但不限于为对象编号、对象姓名、对象昵称。获取上述文本范围内的文本可以但不限于使用如下方法:获取某一个时间段内的文本;获取某两个标志性语句中间的文本。

例如,以上述第二配置信息为用于执行同声传译处理的对象的对象标识,上述对象标识为对象姓名为例进行说明。第一终端获取上述对象姓名,并将上述对象姓名发送给应用服务器,应用服务器在获取到上述对象姓名后,将获取到的音频数据中上述对象姓名所标识的对象所发出的音频数据筛选出来,并翻译成第一语种,返回给第一终端。

作为一种可选的示例,如图6所示,图6为一种可选的第一终端的显示界面,在显示界面上有多个选项,第一终端可以通过获取第一对象所点击的发言人来获取对象标识,并将上述对象标识发送给应用服务器,以使应用服务器在收到上述对象标识后,将上述对象标识对应的音频信息翻译成第一语种的第一会议译文文本并返回给第一终端,或者通过获取第一对象所选择的时间段来获取该时间段,并将上述时间段发送给应用服务器,以使应用服务器在收到上述时间段后,将上述时间段中的音频信息翻译成第一语种的第一会议译文文本并返回给第一终端,或者通过获取第一对象所选择的翻译语句获取两句翻译语句,并将上述翻译语句发送给应用服务器,以使应用服务器在收到上述翻译语句后,将上述翻译语句中的音频信息翻译成第一语种的第一会议译文文本并返回给第一终端。

可选地,应用服务器可以预先获取到所有的参会人员的语音样本信息,在获取到第一终端所发送的第二配置信息后,应用服务器将获取到的音频数据与预先保存的语音样本信息做比对,将与获取到的对象标识匹配的语音样本数据相似度超过第一阈值的音频信息作为翻译对象并进行翻译,将翻译结果返回给第一终端。

需要说明的是,图6中的发言人、翻译时间段、翻译语句等可以选择一项或者多项,例如,获取张三从18:00:00到18:20:00的音频数据。图6中所示出的选择发言人等为一种可选的示例,具体还可以设置一个触发条件,在触发条件被触发时,在第一终端上显示被翻译的音频数据,在触发条件未被触发时,在第一终端上显示未被翻译的音频数据。例如,按下一个按钮则触发上述触发条件,并显示被翻译的音频数据,在上述按钮未被按下时,则显示未被翻译的音频数据。

可选地,在第一终端获取参与目标会议的第一对象所输入的第一语种之前,可以使用如下方法参与目标会议:

(1)第一终端向应用服务器发送标识分配请求,其中,标识分配请求用于请求应用服务器为目标会议分配会议标识;第一终端获取应用服务器所返回的会议标识;第一终端利用会议标识参与目标会议;

可选地,上述会议标识可以为会议的编号,用于区分不同的会议。上述标识分配请求可以为创建会议的请求。例如,第一终端可以向应用服务器发送请求,应用服务器接收到上述请求后,创建一个会议,并为创建的会议分配会议的编号,并将会议的编号返回给第一终端。例如,如图7所示,图7为第一终端的显示界面。在第一终端获取到上述会议的编号后,可以通过接收用户输入的上述会议的编号而进入到对应的会议中。

(2)第一终端获取第二终端所分享的目标会议的会议标识,其中,第二终端为参与目标会议的第二对象所使用的终端;第一终端利用会议标识参与目标会议。

可选地,上述第二终端可以为其他参与目标会议的对象所使用的终端。第一终端可以获取第二终端分享给第一终端的会议的编号,并将上述会议的编号显示给第一对象。在获取到第一对象输入的上述会议的编号后,第一终端跳转到上述目标会议对应的页面或场景中。

可选地,应用服务器在获取到第一终端发送的第一语种后,应用服务器获取同声传译设备所采集的语音;应用服务器对语音进行语音识别,得到音频数据;应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本。

可选地,上述语音可以为目标会议中产生的任何声音,可以为参与目标会议的人员所产生的声音,或者为机器产生的声音,例如为多媒体播放视音频产生的声音等。以上述声音为参与目标会议的人员所产生的声音。应用服务器在获取到上述声音后,首先对上述声音进行去噪处理,然后对去噪处理后的声音进行语音识别,识别出音频数据。然后,将上述音频数据翻译成第一语种所标识的语言,并形成第一会议译文文本。

例如,继续结合上述多人会议进行说明。应用服务器在获取到同声传译装置所采集的声音后,对声音进行识别,得到音频数据,并对音频数据进行同声传译处理,得到第一会议译文文本。从而可以将上述第一会议译文文本返回给第一终端,并在第一终端上进行显示。

可选地,在应用服务器将上述第一会议译文文本返回给第一终端时,可以采用如下方法:

(1)应用服务器将第一会议译文文本主动推送给第一终端进行显示;

(2)应用服务器获取第一终端发送的显示请求;应用服务器响应显示请求将第一会议译文文本推送给第一终端进行显示。

可选地,推送结果可以如图8所示,图8为第一终端的显示界面。显示界面上显示有第一会议译文文本。译文文本中可以显示有参与会议的其他对象的对象标识。上述其他对象的对象标识可以包括以下至少之一:其他对象的姓名、其他对象的昵称。

可选地,上述第一会议译文文本中还可以包括第一对象或者其他对象产生音频数据的时间。

例如,以下结合上述音频数据包含英语、德语、法语,第一语种为汉语的情况,对上述同声传译方法进行说明。

第一终端的显示界面上显示有如图7所示的界面。在上述界面中,用户可以输入所要参加会议的会议编号。在第一终端获取到上述会议编号后,跳转到如图5所示的语种选择界面。第一终端接收到用户所选择的第一语种为汉语。则第一终端将上述汉语发送给应用服务器。然后第一终端跳转到如图6所示的显示界面。在显示界面上显示有可选择的发言人、翻译时间段与翻译语句。在接收到按钮被按下时,例如接收到用户选择张三、18:00:00-18:50:00时,将上述信息发送给应用服务器。在应用服务器获取到上述第一语种与用户所选择的信息后,保存上述信息。同时,应用服务器获取同声传译装置收集到的语音,并对上述语音执行去噪处理,得到音频数据。在得到上述音频数据后,音频数据中包含有英语、法语、德语等多种语言。应用服务器根据获取到的第一语种,将上述英语、法语、德语等多种语言翻译成汉语。并根据用户的选择信息,将翻译后的汉语中,张三在18:00:00-18:50:00之间的发言内容返回给第一终端,由第一终端进行显示。通过本实施例,从而实现了可以在第一终端上由第一对象输入第一语种,实现了在目标会议进行中,在获取到目标会议的音频数据后,将目标会议的音频数据进行识别以及同声传译处理,得到同声传译处理结果,同声传译处理结果为第一语种的处理结果。实现了将目标会议的多种音频数据转化为第一语种的效果。

作为一种可选的实施方案,

s1,第一终端获取参与目标会议的第一对象所输入的第一语种包括:在目标会议开始之前,第一终端通过配置操作界面获取第一配置信息,其中,第一配置信息包括:第一语种;

s2,在第一终端中显示应用服务器所返回的同声传译处理结果包括:获取按照第一语种对目标会议中全部的音频数据执行同声传译处理后得到的第一会议译文文本;在第一终端中显示第一会议译文文本。

例如,以上述领域信息为生物领域、第一语种为汉语为例,当第一终端将汉语与生物领域的信息发送给应用服务器后,应用服务器在获取到不同语种的音频数据后,将上述音频数据翻译成汉语的过程中,如果产生既可以翻译成生物领域的常用词汇,又可以翻译成其他词汇的情况下,则应用服务器将上述音频数据翻译成生物领域的常用词汇。

可选地,作为一种可选的示例,第一终端显示界面可以如图4所示,在图4中,第一终端的显示界面上显示有多个按钮,每一个按钮指示一种领域信息,还存在一个输入框。用户可以选择在输入框中输入领域信息,或者按下下方的按钮选择领域信息。则第一终端在接收到输入的领域信息或者在检测到按钮被按下后,即可获得领域信息,并将获取到的领域信息发送给应用服务器。

通过本实施例,通过在目标会议开始前第一终端获取第一配置信息,以使应用服务器根据第一配置信息中的第一语种获取第一会议译文文本,从而可以根据第一语种灵活获取译文文本,达到了降低多语种同声传译的难度的效果。

作为一种可选的实施方案,

s1,第一终端获取参与目标会议的第一对象所输入的第一语种包括:在目标会议开始之后,第一终端通过配置操作界面获取第二配置信息,其中,第二配置信息包括:第一语种及同声传译范围指示信息,同声传译范围指示信息包括以下至少之一:用于执行同声传译处理的对象的对象标识、用于执行同声传译处理的文本范围;

s2,在第一终端中显示应用服务器所返回的同声传译处理结果包括:获取按照第一语种对同声传译范围指示信息所指示的范围执行同声传译处理后得到的第一会议译文文本;在第一终端中显示第一会议译文文本。

例如,以上述第二配置信息为用于执行同声传译处理的对象的对象标识,上述对象标识为对象姓名为例进行说明。第一终端获取上述对象姓名,并将上述对象姓名发送给应用服务器,应用服务器在获取到上述对象姓名后,将获取到的音频数据中上述对象姓名所标识的对象所发出的音频数据筛选出来,并翻译成第一语种,返回给第一终端。

作为一种可选的示例,如图6所示,图6为一种可选的第一终端的显示界面,在显示界面上有多个选项,第一终端可以通过获取第一对象所点击的发言人来获取对象标识,并将上述对象标识发送给应用服务器,以使应用服务器在收到上述对象标识后,将上述对象标识对应的音频信息翻译成第一语种的第一会议译文文本并返回给第一终端,或者通过获取第一对象所选择的时间段来获取该时间段,并将上述时间段发送给应用服务器,以使应用服务器在收到上述时间段后,将上述时间段中的音频信息翻译成第一语种的第一会议译文文本并返回给第一终端,或者通过获取第一对象所选择的翻译语句获取两句翻译语句,并将上述翻译语句发送给应用服务器,以使应用服务器在收到上述翻译语句后,将上述翻译语句中的音频信息翻译成第一语种的第一会议译文文本并返回给第一终端。

通过本实施例,通过第一终端根据获取的第二配置信息对第一会议译文文本进行处理,得到处理后的第一会议译文文本,从而提高了多语种同声传译的灵活性。

作为一种可选的实施方案,在第一终端中显示应用服务器所返回的同声传译处理结果之后,还包括:

s1,第一终端将第一会议译文文本投影到显示设备上进行显示,其中,第一会议译文文本在显示设备上动态滚动显示。

例如,第一终端将获取到的第一会议译文文本发送给外接的投影设备,投影设备在获取到上述第一会议译文文本后,可以将上述第一会议译文文本进行投影显示。

通过本实施例,通过第一终端将第一会议译文文本投影到显示设备上进行显示,从而使第一会议译文文本的显示面积增大,提高了显示第一会议译文文本的显示效率。

作为一种可选的实施方案,在第一终端获取参与目标会议的第一对象所输入的第一语种之前,还包括:

s1,第一终端建立与同声传译设备之间的无线通信连接;

s2,第一终端通过无线通信连接启动同声传译设备。

例如,继续结合上述多人会议的过程进行说明。在目标会议中,第一终端可以根据接收到的第一对象所输入的指令开启同声传译设备或者关闭同声传译设备,从而控制同声传译设备是否采集参会人员的语音信息。

通过本实施例,通过在第一终端与同声传译设备之间建立无线通信连接,以及第一终端通过无线通信连接启动同声传译设备,从而可以灵活地启动或者关闭同声传译设备,提高了采集音频数据的灵活性。

作为一种可选的实施方案,在第一终端通过无线通信连接启动同声传译设备之后,还包括:

s1,同声传译设备通过内置的麦克风阵列,采集第一终端所参与的目标会议中全部对象所产生的语音;

s2,同声传译设备通过内置通信模组,将语音发送给应用服务器。

可选地,可以同声传译设备可以包含一个或多个,每一个同声传译设备可以包含一个或者多个麦克风阵列。

通过本实施例,通过使用麦克风阵列采集语音,并将语音发送给应用服务器,从而可以对语音进行准确地采集,达到了提高语音采集准确度的效果。

作为一种可选的实施方案,在第一终端获取参与目标会议的第一对象所输入的第一语种之前,还包括:

(1)第一终端向应用服务器发送标识分配请求,其中,标识分配请求用于请求应用服务器为目标会议分配会议标识;第一终端获取应用服务器所返回的会议标识;第一终端利用会议标识参与目标会议;或者

(2)第一终端获取第二终端所分享的目标会议的会议标识,其中,第二终端为参与目标会议的第二对象所使用的终端;第一终端利用会议标识参与目标会议。

可选地,上述会议标识可以为会议的编号,用于区分不同的会议。上述标识分配请求可以为创建会议的请求。例如,第一终端可以向应用服务器发送请求,应用服务器接收到上述请求后,创建一个会议,并为创建的会议分配会议的编号,并将会议的编号返回给第一终端。例如,如图7所示,图7为第一终端的显示界面。在第一终端获取到上述会议的编号后,可以通过接收用户输入的上述会议的编号而进入到对应的会议中。或者,第一终端可以获取第二终端分享给第一终端的会议的编号,并将上述会议的编号显示给第一对象。在获取到第一对象输入的上述会议的编号后,第一终端跳转到上述目标会议对应的页面或场景中。

通过本实施例,通过第一终端使用会议标识参与会议,从而可以根据会议标识准确地参与到目标会议中,提高了参与目标会议的效率与准确度。

作为一种可选的实施方案,在第一终端中显示应用服务器所返回的同声传译处理结果之前,还包括:

s1,第一终端将会议标识发送给应用服务器,以使应用服务器根据会议标识确定与目标会议相匹配的音频数据。

可选地,上述会议标识可以为会议的编号,或者会议的主题等。以上述会议标识为会议主题为例,第一终端将会议主题发送给应用服务器,应用服务器在获取到上述会议的主题后,从多个会议主题中查找上述会议主题,并查找到与上述会议主题匹配的音频数据。在将上述音频数据翻译成第一语种所指示的第一会议译文文本后,将上述第一会议译文文本返回给第一终端。

通过本实施例,通过第一终端使用会议标识参与会议,从而可以根据会议标识准确地参与到目标会议中,提高了参与目标会议的效率与准确度。

作为一种可选的实施方案,在第一终端将第一语种发送给应用服务器之后,还包括:

s1,应用服务器获取同声传译设备所采集的语音;

s2,应用服务器对语音进行语音识别,得到音频数据;

s3,应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本。

可选地,上述语音可以为目标会议中产生的任何声音,可以为参与目标会议的人员所产生的声音,或者为机器产生的声音,例如为多媒体播放视音频产生的声音等。以上述声音为参与目标会议的人员所产生的声音。应用服务器在获取到上述声音后,首先对上述声音进行去噪处理,然后对去噪处理后的声音进行语音识别,识别出音频数据。然后,将上述音频数据翻译成第一语种所标识的语言,并形成第一会议译文文本。

例如,继续结合上述多人会议进行说明。应用服务器在获取到同声传译装置所采集的声音后,对声音进行识别,得到音频数据,并对音频数据进行同声传译处理,得到第一会议译文文本。从而可以将上述第一会议译文文本返回给第一终端,并在第一终端上进行显示。

通过本实施例,通过应用服务器按照第一语种对音频数据进行同声传译处理,得到第一会议译文文本,从而可以将音频数据转换成第一语种的第一会议译文文本,提高了多语种同声传译效率。

作为一种可选的实施方案,在应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本之后,还包括:

(1)应用服务器将第一会议译文文本主动推送给第一终端进行显示;或者

(2)应用服务器获取第一终端发送的显示请求;应用服务器响应显示请求将第一会议译文文本推送给第一终端进行显示。

可选地,推送结果可以如图8所示,图8为第一终端的显示界面。显示界面上显示有第一会议译文文本。译文文本中可以显示有参与会议的其他对象的对象标识。上述其他对象的对象标识可以包括以下至少之一:其他对象的姓名、其他对象的昵称。

可选地,上述第一会议译文文本中还可以包括第一对象或者其他对象产生音频数据的时间。

通过本实施例,通过将第一会议译文文本推送给第一终端并进行显示,从而提高了多语种同声传译的显示灵活性。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台第一终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。

根据本发明实施例的另一方面,还提供了一种用于实施上述同声传译方法的智能终端。

可选地,作为一种可选的示例,如图9所示,上述智能终端包括:

(1)输入输出装置902,用于获取参与目标会议的第一对象所输入的第一语种;

(2)传输装置904,用于将所述第一语种发送给应用服务器,以使所述应用服务器按照所述第一语种对从所述目标会议中获取到的音频数据执行同声传译处理,其中,所述音频数据为所述应用服务器对所述目标会议中配置的同声传译设备所采集到的语音进行识别后得到,所述同声传译设备用于对参与所述目标会议的全部对象所产生的语音进行采集;

(3)显示装置906,用于在所述智能终端中显示所述应用服务器所返回的同声传译处理结果,其中,所述同声传译处理结果中携带有按照所述第一语种执行同声传译处理后所得到的第一会议译文文本。

可选地,上述智能终端可以但不限于应用于国际交流会议中,或者应用于多国交换生演讲中,或者应用于多国贸易交流的场景中。

需要说明的是,在智能终端获取到参与目标会议的第一对象输入的第一语种后,将第一语种发送给应用服务器。应用服务器在获取到了第一对象所输入的第一语种后,以及在获取到目标会议中的音频数据以后,可以将获取到的音频数据按照第一语种进行处理,并返回第一会议译文文本给智能终端。从而使智能终端的显示界面上可以显示与第一语种匹配的第一会议译文文本。实现了无论应用服务器获取到任何语种的音频数据都可以将其转换成第一语种并返回给智能终端的目的,达到了降低多语种同声传译难度的效果。

可选地,在本实施例中,上述第一语种可以为任何机器可识别的语种,例如可以但不限于为汉语、英语、德语、法语、西班牙语、韩语、日语等。上述语音可以但不限于为会议中或者贸易场所或者演讲中产生的任何机器可收集到的声音。可以包含一种语种,也可以包含多种语种。可以由一人产生,或者由多人产生,或者由机器产生。例如,会议中的发言产生的声音、视音频产生的声音、交易中询问价格的声音等。服务器可以但不限于在获取到上述语音后,对上述语音进行去噪处理,得到音频数据。上述同声传译处理可以但不限于对获取到的音频数据进行语种转换,上述第一会议译文文本可以为对语种转换后的音频数据进行转换后得到的译文文本。

以下以上述音频数据包含多种语种,例如包含英语、德语、法语,上述智能终端为手机、上述第一语种为汉语的情况进行说明。手机接收到第一对象输入的第一语种,为汉语,手机将上述第一语种发送给应用服务器。应用服务器保存第一语种。在同声传译设备采集到音频数据后,将上述音频数据发送给应用服务器。其中,音频数据包括英语、德语、法语等多个语种。应用服务器在获取到上述多个语种后,根据接收到的第一语种,将上述多个语种的音频数据翻译为汉语,并将翻译后的汉语生成第一会议译文文本,发送给手机。

可选地,智能终端可以向应用服务器发送第一配置信息,第一配置信息中携带有第一语种与领域信息。上述领域信息用于在应用服务器接收到领域信息后,将获取到的音频数据翻译成第一语种且翻译成上述领域信息所在的领域对应的词汇。

可选地,上述将获取到的音频数据翻译成第一语种且翻译成上述领域信息所在的领域对应的词汇可以但不限于包括以下至少之一:

(1)在领域信息标识为计算机领域的情况下,将获取到的音频数据翻译成第一语种的计算机领域的专有名词。

(2)在领域信息标识为生物领域的情况下,将获取到的音频数据翻译成第一语种的计算机领域的专有名词。

(3)在领域信息标识为化学领域的情况下,将获取到的音频数据翻译成第一语种的计算机领域的专有名词。

例如,以上述领域信息为生物领域、第一语种为汉语为例,当智能终端将汉语与生物领域的信息发送给应用服务器后,应用服务器在获取到不同语种的音频数据后,将上述音频数据翻译成汉语的过程中,如果产生既可以翻译成生物领域的常用词汇,又可以翻译成其他词汇的情况下,则应用服务器将上述音频数据翻译成生物领域的常用词汇。

可选地,作为一种可选的示例,智能终端显示界面可以如图4所示,在图4中,智能终端的显示界面上显示有多个按钮,每一个按钮指示一种领域信息,还存在一个输入框。用户可以选择在输入框中输入领域信息,或者按下下方的按钮选择领域信息。则智能终端在接收到输入的领域信息或者在检测到按钮被按下后,即可获得领域信息,并将获取到的领域信息发送给应用服务器。

可选地,在智能终端获取第一对象所输入的第一语种时,可以采用如下方法:

(1)智能终端中显示有多种语种,第一对象从多种语种中选择其中一种,智能终端获取第一对象所选择的语言作为第一对象所输入的第一语种。

可选地,在智能终端上显示多种语种可以为以按钮的形式显示多种语种,每一个按钮表示一个语种,或者以下拉菜单的形式显示多种语种,点击下拉菜单后,下拉菜单中携带有多个语种。

例如,结合上述多人会议的过程进行说明。以在智能终端上显示按钮的情形为例,如图5所示,图5为一种可选的智能终端显示界面。在智能终端的显示界面上显示有多个语种,上述多个语种可以按照固定顺序排序,也可以按照热度、使用次数等进行排序。图5中的多个语种按照固定顺序排序。当智能终端获取到第一对象按下按钮所产生的指令后,获取上述指令对应的语种,并将上述语种发送给应用服务器。

(2)智能终端获取第一对象输入的文字,并对文字进行识别,得到第一对象输入的第一语种。

可选地,上述智能终端获取第一对象输入的文字可以但不限于为智能终端的终端显示界面上显示有输入框,通过获取第一对象输入到输入框中的文字来获取第一对象输入的文字。

(3)智能终端获取第一对象的语音信息,并对语音信息进行识别,得到第一对象输入的第一语种。

可选地,上述智能终端获取第一对象的语音信息可以但不限于为智能终端通过麦克风等设备获取第一对象所发出的声音,并对上述声音进行识别,得到第一语种。则将上述第一语种作为第一对象所输入的第一语种。

可选地,智能终端在显示第一会议译文文本时,可以但不限于采用如下任意一种方法:

(1)智能终端在智能终端的终端显示界面上一次性显示第一会议译文文本;

(2)智能终端在智能终端的显示界面上逐条显示第一会议译文文本;

(3)智能终端在智能终端外接的显示设备上显示第一会议译文文本。

可选地,上述智能终端在智能终端外接的显示设备上显示第一会议译文文本并可以但不限于为智能终端将获取到的第一会议译文文本发送给投影设备,并使用投影设备投放上述第一会议译文文本。

可选地,智能终端还可以获取第二配置信息,并将第二配置信息发送给应用服务器。上述第二配置信息可以但不限于为用于执行同声传译处理的对象的对象标识,或者用于执行同声传译处理的文本范围。上述对象标识可以但不限于为对象编号、对象姓名、对象昵称。获取上述文本范围内的文本可以但不限于使用如下方法:获取某一个时间段内的文本;获取某两个标志性语句中间的文本。

例如,以上述第二配置信息为用于执行同声传译处理的对象的对象标识,上述对象标识为对象姓名为例进行说明。智能终端获取上述对象姓名,并将上述对象姓名发送给应用服务器,应用服务器在获取到上述对象姓名后,将获取到的音频数据中上述对象姓名所标识的对象所发出的音频数据筛选出来,并翻译成第一语种,返回给智能终端。

作为一种可选的示例,如图6所示,图6为一种可选的智能终端的显示界面,在显示界面上有多个选项,智能终端可以通过获取第一对象所点击的发言人来获取对象标识,并将上述对象标识发送给应用服务器,以使应用服务器在收到上述对象标识后,将上述对象标识对应的音频信息翻译成第一语种的第一会议译文文本并返回给智能终端,或者通过获取第一对象所选择的时间段来获取该时间段,并将上述时间段发送给应用服务器,以使应用服务器在收到上述时间段后,将上述时间段中的音频信息翻译成第一语种的第一会议译文文本并返回给智能终端,或者通过获取第一对象所选择的翻译语句获取两句翻译语句,并将上述翻译语句发送给应用服务器,以使应用服务器在收到上述翻译语句后,将上述翻译语句中的音频信息翻译成第一语种的第一会议译文文本并返回给智能终端。

可选地,应用服务器可以预先获取到所有的参会人员的语音样本信息,在获取到智能终端所发送的第二配置信息后,应用服务器将获取到的音频数据与预先保存的语音样本信息做比对,将与获取到的对象标识匹配的语音样本数据相似度超过第一阈值的音频信息作为翻译对象并进行翻译,将翻译结果返回给智能终端。

需要说明的是,图6中的发言人、翻译时间段、翻译语句等可以选择一项或者多项,例如,智能终端获取张三从18:00:00到18:20:00的音频数据。图6中所示出的选择发言人等为一种可选的示例,具体还可以设置一个触发条件,在触发条件被触发时,在智能终端上显示被翻译的音频数据,在触发条件未被触发时,在智能终端上显示未被翻译的音频数据。例如,按下一个按钮则触发上述触发条件,并显示被翻译的音频数据,在上述按钮未被按下时,则显示未被翻译的音频数据。

可选地,在智能终端获取参与目标会议的第一对象所输入的第一语种之前,可以使用如下方法参与目标会议:

(1)智能终端向应用服务器发送标识分配请求,其中,标识分配请求用于请求应用服务器为目标会议分配会议标识;智能终端获取应用服务器所返回的会议标识;智能终端利用会议标识参与目标会议;

可选地,上述会议标识可以为会议的编号,用于区分不同的会议。上述标识分配请求可以为创建会议的请求。例如,智能终端可以向应用服务器发送请求,应用服务器接收到上述请求后,创建一个会议,并为创建的会议分配会议的编号,并将会议的编号返回给智能终端。例如,如图7所示,图7为智能终端的显示界面。在智能终端获取到上述会议的编号后,可以通过接收用户输入的上述会议的编号而进入到对应的会议中。

(2)智能终端获取第二终端所分享的目标会议的会议标识,其中,第二终端为参与目标会议的第二对象所使用的终端;智能终端利用会议标识参与目标会议。

可选地,上述第二终端可以为其他参与目标会议的对象所使用的终端。智能终端可以获取第二终端分享给智能终端的会议的编号,并将上述会议的编号显示给第一对象。在获取到第一对象输入的上述会议的编号后,智能终端跳转到上述目标会议对应的页面或场景中。

可选地,应用服务器在获取到智能终端发送的第一语种后,应用服务器获取同声传译设备所采集的语音;应用服务器对语音进行语音识别,得到音频数据;应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本。

可选地,上述语音可以为目标会议中产生的任何声音,可以为参与目标会议的人员所产生的声音,或者为机器产生的声音,例如为多媒体播放视音频产生的声音等。以上述声音为参与目标会议的人员所产生的声音。应用服务器在获取到上述声音后,首先对上述声音进行去噪处理,然后对去噪处理后的声音进行语音识别,识别出音频数据。然后,将上述音频数据翻译成第一语种所标识的语言,并形成第一会议译文文本。

例如,继续结合上述多人会议进行说明。应用服务器在获取到同声传译装置所采集的声音后,对声音进行识别,得到音频数据,并对音频数据进行同声传译处理,得到第一会议译文文本。从而可以将上述第一会议译文文本返回给智能终端,并在智能终端上进行显示。

可选地,在应用服务器将上述第一会议译文文本返回给智能终端时,可以采用如下方法:

(1)应用服务器将第一会议译文文本主动推送给智能终端进行显示;

(2)应用服务器获取智能终端发送的显示请求;应用服务器响应显示请求将第一会议译文文本推送给智能终端进行显示。

可选地,推送结果可以如图8所示,图8为智能终端的显示界面。显示界面上显示有第一会议译文文本。译文文本中可以显示有参与会议的其他对象的对象标识。上述其他对象的对象标识可以包括以下至少之一:其他对象的姓名、其他对象的昵称。

可选地,上述第一会议译文文本中还可以包括第一对象或者其他对象产生音频数据的时间。

例如,以下结合上述音频数据包含英语、德语、法语,第一语种为汉语的情况,对上述同声传译方法进行说明。

智能终端的显示界面上显示有如图7所示的界面。在上述界面中,用户可以输入所要参加会议的会议编号。在智能终端获取到上述会议编号后,跳转到如图5所示的语种选择界面。智能终端接收到用户所选择的第一语种为汉语。则智能终端将上述汉语发送给应用服务器。然后智能终端跳转到如图6所示的显示界面。在显示界面上显示有可选择的发言人、翻译时间段与翻译语句。在接收到按钮被按下时,例如接收到用户选择张三、18:00:00-18:50:00时,将上述信息发送给应用服务器。在应用服务器获取到上述第一语种与用户所选择的信息后,保存上述信息。同时,应用服务器获取同声传译装置收集到的语音,并对上述语音执行去噪处理,得到音频数据。在得到上述音频数据后,音频数据中包含有英语、法语、德语等多种语言。应用服务器根据获取到的第一语种,将上述英语、法语、德语等多种语言翻译成汉语。并根据用户的选择信息,将翻译后的汉语中,张三在18:00:00-18:50:00之间的发言内容返回给智能终端,由智能终端进行显示。

作为一种可选的实施方式,

s1,智能终端获取参与目标会议的第一对象所输入的第一语种包括:在目标会议开始之前,智能终端通过配置操作界面获取第一配置信息,其中,第一配置信息包括:第一语种;

s2,在智能终端中显示应用服务器所返回的同声传译处理结果包括:获取按照第一语种对目标会议中全部的音频数据执行同声传译处理后得到的第一会议译文文本;在智能终端中显示第一会议译文文本。

例如,以上述领域信息为生物领域、第一语种为汉语为例,当智能终端将汉语与生物领域的信息发送给应用服务器后,应用服务器在获取到不同语种的音频数据后,将上述音频数据翻译成汉语的过程中,如果产生既可以翻译成生物领域的常用词汇,又可以翻译成其他词汇的情况下,则应用服务器将上述音频数据翻译成生物领域的常用词汇。

可选地,作为一种可选的示例,智能终端显示界面可以如图4所示,在图4中,智能终端的显示界面上显示有多个按钮,每一个按钮指示一种领域信息,还存在一个输入框。用户可以选择在输入框中输入领域信息,或者按下下方的按钮选择领域信息。则智能终端在接收到输入的领域信息或者在检测到按钮被按下后,即可获得领域信息,并将获取到的领域信息发送给应用服务器。

通过本实施例,通过在目标会议开始前智能终端获取第一配置信息,以使应用服务器根据第一配置信息中的第一语种获取第一会议译文文本,从而可以根据第一语种灵活获取译文文本,达到了降低多语种同声传译的难度的效果。

作为一种可选的实施方式,

s1,智能终端获取参与目标会议的第一对象所输入的第一语种包括:在目标会议开始之后,智能终端通过配置操作界面获取第二配置信息,其中,第二配置信息包括:第一语种及同声传译范围指示信息,同声传译范围指示信息包括以下至少之一:用于执行同声传译处理的对象的对象标识、用于执行同声传译处理的文本范围;

s2,在智能终端中显示应用服务器所返回的同声传译处理结果包括:获取按照第一语种对同声传译范围指示信息所指示的范围执行同声传译处理后得到的第一会议译文文本;在智能终端中显示第一会议译文文本。

例如,以上述第二配置信息为用于执行同声传译处理的对象的对象标识,上述对象标识为对象姓名为例进行说明。智能终端获取上述对象姓名,并将上述对象姓名发送给应用服务器,应用服务器在获取到上述对象姓名后,将获取到的音频数据中上述对象姓名所标识的对象所发出的音频数据筛选出来,并翻译成第一语种,返回给智能终端。

作为一种可选的示例,如图6所示,图6为一种可选的智能终端的显示界面,在显示界面上有多个选项,智能终端可以通过获取第一对象所点击的发言人来获取对象标识,并将上述对象标识发送给应用服务器,以使应用服务器在收到上述对象标识后,将上述对象标识对应的音频信息翻译成第一语种的第一会议译文文本并返回给智能终端,或者通过获取第一对象所选择的时间段来获取该时间段,并将上述时间段发送给应用服务器,以使应用服务器在收到上述时间段后,将上述时间段中的音频信息翻译成第一语种的第一会议译文文本并返回给智能终端,或者通过获取第一对象所选择的翻译语句获取两句翻译语句,并将上述翻译语句发送给应用服务器,以使应用服务器在收到上述翻译语句后,将上述翻译语句中的音频信息翻译成第一语种的第一会议译文文本并返回给智能终端。

通过本实施例,通过智能终端根据获取的第二配置信息对第一会议译文文本进行处理,得到处理后的第一会议译文文本,从而提高了多语种同声传译的灵活性。

作为一种可选的实施方式,在智能终端中显示应用服务器所返回的同声传译处理结果之后,还包括:

s1,智能终端将第一会议译文文本投影到显示设备上进行显示,其中,第一会议译文文本在显示设备上动态滚动显示。

例如,智能终端将获取到的第一会议译文文本发送给外接的投影设备,投影设备在获取到上述第一会议译文文本后,可以将上述第一会议译文文本进行投影显示。

通过本实施例,通过智能终端将第一会议译文文本投影到显示设备上进行显示,从而使第一会议译文文本的显示面积增大,提高了显示第一会议译文文本的显示效率。

作为一种可选的实施方式,在智能终端获取参与目标会议的第一对象所输入的第一语种之前,还包括:

s1,智能终端建立与同声传译设备之间的无线通信连接;

s2,智能终端通过无线通信连接启动同声传译设备。

例如,继续结合上述多人会议的过程进行说明。在目标会议中,智能终端可以根据接收到的第一对象所输入的指令开启同声传译设备或者关闭同声传译设备,从而控制同声传译设备是否采集参会人员的语音信息。

通过本实施例,通过在智能终端与同声传译设备之间建立无线通信连接,以及智能终端通过无线通信连接启动同声传译设备,从而可以灵活地启动或者关闭同声传译设备,提高了采集音频数据的灵活性。

作为一种可选的实施方式,在智能终端通过无线通信连接启动同声传译设备之后,还包括:

s1,同声传译设备通过内置的麦克风阵列,采集智能终端所参与的目标会议中全部对象所产生的语音;

s2,同声传译设备通过内置通信模组,将语音发送给应用服务器。

可选地,可以同声传译设备可以包含一个或多个,每一个同声传译设备可以包含一个或者多个麦克风阵列。

通过本实施例,通过使用麦克风阵列采集语音,并将语音发送给应用服务器,从而可以对语音进行准确地采集,达到了提高语音采集准确度的效果。

作为一种可选的实施方式,在智能终端获取参与目标会议的第一对象所输入的第一语种之前,还包括:

(1)智能终端向应用服务器发送标识分配请求,其中,标识分配请求用于请求应用服务器为目标会议分配会议标识;智能终端获取应用服务器所返回的会议标识;智能终端利用会议标识参与目标会议;或者

(2)智能终端获取第二终端所分享的目标会议的会议标识,其中,第二终端为参与目标会议的第二对象所使用的终端;智能终端利用会议标识参与目标会议。

可选地,上述会议标识可以为会议的编号,用于区分不同的会议。上述标识分配请求可以为创建会议的请求。例如,智能终端可以向应用服务器发送请求,应用服务器接收到上述请求后,创建一个会议,并为创建的会议分配会议的编号,并将会议的编号返回给智能终端。例如,如图7所示,图7为智能终端的显示界面。在智能终端获取到上述会议的编号后,可以通过接收用户输入的上述会议的编号而进入到对应的会议中。或者,智能终端可以获取第二终端分享给智能终端的会议的编号,并将上述会议的编号显示给第一对象。在获取到第一对象输入的上述会议的编号后,智能终端跳转到上述目标会议对应的页面或场景中。

通过本实施例,通过智能终端使用会议标识参与会议,从而可以根据会议标识准确地参与到目标会议中,提高了参与目标会议的效率与准确度。

作为一种可选的实施方式,在智能终端中显示应用服务器所返回的同声传译处理结果之前,还包括:

s1,智能终端将会议标识发送给应用服务器,以使应用服务器根据会议标识确定与目标会议相匹配的音频数据。

可选地,上述会议标识可以为会议的编号,或者会议的主题等。以上述会议标识为会议主题为例,智能终端将会议主题发送给应用服务器,应用服务器在获取到上述会议的主题后,从多个会议主题中查找上述会议主题,并查找到与上述会议主题匹配的音频数据。在将上述音频数据翻译成第一语种所指示的第一会议译文文本后,将上述第一会议译文文本返回给智能终端。

通过本实施例,通过智能终端使用会议标识参与会议,从而可以根据会议标识准确地参与到目标会议中,提高了参与目标会议的效率与准确度。

作为一种可选的实施方式,在智能终端将第一语种发送给应用服务器之后,还包括:

s1,应用服务器获取同声传译设备所采集的语音;

s2,应用服务器对语音进行语音识别,得到音频数据;

s3,应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本。

可选地,上述语音可以为目标会议中产生的任何声音,可以为参与目标会议的人员所产生的声音,或者为机器产生的声音,例如为多媒体播放视音频产生的声音等。以上述声音为参与目标会议的人员所产生的声音。应用服务器在获取到上述声音后,首先对上述声音进行去噪处理,然后对去噪处理后的声音进行语音识别,识别出音频数据。然后,将上述音频数据翻译成第一语种所标识的语言,并形成第一会议译文文本。

例如,继续结合上述多人会议进行说明。应用服务器在获取到同声传译装置所采集的声音后,对声音进行识别,得到音频数据,并对音频数据进行同声传译处理,得到第一会议译文文本。从而可以将上述第一会议译文文本返回给智能终端,并在智能终端上进行显示。

通过本实施例,通过应用服务器按照第一语种对音频数据进行同声传译处理,得到第一会议译文文本,从而可以将音频数据转换成第一语种的第一会议译文文本,提高了多语种同声传译效率。

作为一种可选的实施方式,在应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本之后,还包括:

(1)应用服务器将第一会议译文文本主动推送给智能终端进行显示;或者

(2)应用服务器获取智能终端发送的显示请求;应用服务器响应显示请求将第一会议译文文本推送给智能终端进行显示。

可选地,推送结果可以如图8所示,图8为智能终端的显示界面。显示界面上显示有第一会议译文文本。译文文本中可以显示有参与会议的其他对象的对象标识。上述其他对象的对象标识可以包括以下至少之一:其他对象的姓名、其他对象的昵称。

可选地,上述第一会议译文文本中还可以包括第一对象或者其他对象产生音频数据的时间。

通过本实施例,通过将第一会议译文文本推送给智能终端并进行显示,从而提高了多语种同声传译的显示灵活性。

根据本发明实施例的又一个方面,还提供了一种用于实施上述同声传译方法的同声传译系统,如图10所示,该系统包括:

(1)第一终端1002,用于获取参与目标会议的第一对象所输入的第一语种;

(2)应用服务器1004,用于在接收到所述第一终端发送的所述第一语种后,按照所述第一语种对从所述目标会议中获取到的音频数据执行同声传译处理,并将同声传译处理结果返回给所述第一终端;

(3)同声传译装置1006,用于对参与所述目标会议的全部对象所产生的语音进行采集,并将采集到的所述语音发送给所述应用服务器,以使所述应用服务器对所述语音进行识别,得到所述音频数据。

可选地,上述第一终端1002中可以但不限于包含存储器1002-1以及处理器1002-2,上述应用服务器1004中可以但不限于包含数据库1004-1以及翻译引擎1004-2,上述同声传译设备1006中可以但不限于包含麦克风1006-1

可选地,第一终端1002、应用服务器1004、同声传译装置1006所执行的方法、步骤请参见上述实施例中的第一终端、应用服务器、同声传译装置所执行的方法与步骤,在此不做具体赘述。

根据本发明实施例的又一个方面,还提供了一种用于实施上述同声传译方法的的电子装置,可选地,上述电子装置可以但不限于应用于上述方法或系统中的第一终端中,或者应用于上述智能终端中。如图11所示,该电子装置包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为通过计算机程序执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

s1,获取参与目标会议的第一对象所输入的第一语种;

s2,将第一语种发送给应用服务器,以使应用服务器按照第一语种对从目标会议中获取到的音频数据执行同声传译处理,其中,音频数据为应用服务器对目标会议中配置的同声传译设备所采集到的语音进行识别后得到,同声传译设备用于对参与目标会议的全部对象所产生的语音进行采集;

s3,显示应用服务器所返回的同声传译处理结果,其中,同声传译处理结果中携带有按照第一语种执行同声传译处理后所得到的第一会议译文文本。

可选地,本领域普通技术人员可以理解,图11所示的结构仅为示意,电子装置也可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobileinternetdevices,mid)、pad等第一终端设备。图11其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图11中所示更多或者更少的组件(如显示装置等),或者具有与图11所示不同的配置。

其中,存储器1102可用于存储软件程序以及模块,如本发明实施例中的同声传译方法和装置对应的程序指令/模块,处理器1104通过运行存储在存储器1102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的同声传译方法。存储器1102可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1102可进一步包括相对于处理器1104远程设置的存储器,这些远程存储器可以通过网络连接至第一终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1102可以但不限于用于存储同声传译设备采集到的语音以及识别到的音频数据等。

上述的传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1106包括一个网络适配器(networkinterfacecontroller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1106为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。

此外,上述电子装置还包括显示器1108,用于显示应用服务器返回的第一会议译文文本;和连接总线1111,用于连接上述电子装置中的各个模块部件。可选地,上述系统总线可以但不限于为内总线(internalbus)或者为板级总线(board-level)或者计算机总线(microcomputerbus)等。

本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,第一终端获取参与目标会议的第一对象所输入的第一语种;

s2,第一终端将第一语种发送给应用服务器,以使应用服务器按照第一语种对从目标会议中获取到的音频数据执行同声传译处理,其中,音频数据为应用服务器对目标会议中配置的同声传译设备所采集到的语音进行识别后得到,同声传译设备用于对参与目标会议的全部对象所产生的语音进行采集;

s3,在第一终端中显示应用服务器所返回的同声传译处理结果,其中,同声传译处理结果中携带有按照第一语种执行同声传译处理后所得到的第一会议译文文本。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,在目标会议开始之前,第一终端通过配置操作界面获取第一配置信息,其中,第一配置信息包括:第一语种;

s2,获取按照第一语种对目标会议中全部的音频数据执行同声传译处理后得到的第一会议译文文本;在第一终端中显示第一会议译文文本。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,在目标会议开始之后,第一终端通过配置操作界面获取第二配置信息,其中,第二配置信息包括:第一语种及同声传译范围指示信息,同声传译范围指示信息包括以下至少之一:用于执行同声传译处理的对象的对象标识、用于执行同声传译处理的文本范围;

s2,获取按照第一语种对同声传译范围指示信息所指示的范围执行同声传译处理后得到的第一会议译文文本;在第一终端中显示第一会议译文文本。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,第一终端将第一会议译文文本投影到显示设备上进行显示,其中,第一会议译文文本在显示设备上动态滚动显示。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,第一终端建立与同声传译设备之间的无线通信连接;

s2,第一终端通过无线通信连接启动同声传译设备。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,同声传译设备通过内置的麦克风阵列,采集第一终端所参与的目标会议中全部对象所产生的语音;

s2,同声传译设备通过内置通信模组,将语音发送给应用服务器。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

(1)第一终端向应用服务器发送标识分配请求,其中,标识分配请求用于请求应用服务器为目标会议分配会议标识;第一终端获取应用服务器所返回的会议标识;第一终端利用会议标识参与目标会议;或者

(2)第一终端获取第二终端所分享的目标会议的会议标识,其中,第二终端为参与目标会议的第二对象所使用的终端;第一终端利用会议标识参与目标会议。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,第一终端将会议标识发送给应用服务器,以使应用服务器根据会议标识确定与目标会议相匹配的音频数据。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

s1,应用服务器获取同声传译设备所采集的语音;

s2,应用服务器对语音进行语音识别,得到音频数据;

s3,应用服务器按照获取到的第一语种对音频数据执行同声传译处理,得到第一会议译文文本。

可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:

(1)应用服务器将第一会议译文文本主动推送给第一终端进行显示;或者

(2)应用服务器获取第一终端发送的显示请求;应用服务器响应显示请求将第一会议译文文本推送给第一终端进行显示。

可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令第一终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-onlymemory,rom)、随机存取器(randomaccessmemory,ram)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1