本发明涉及语音传译,具体来说,涉及一种基于视频和直播版面中的语音即时传译方法。
背景技术:
1、视频直播是在点播业务的基础上演变而来,是指利用互联网及流媒体技术进行直播,它因融合了图像、文字、声音等丰富元素,声形并茂,效果极佳,逐渐成为互联网的主流表达方式,视频直播的实现过程是当用户发出直播请求时,服务器就会根据直播信息,将该直播频道的播放地址(一般是一个组播url,而非组播文件)告诉用户,用户根据该地址加入对应的组播组,即可接收到该直播电视的码流。
2、视频直播不仅仅针对于国内,现目前的直播可实现跨国直播,实现无国界直播,不受地理位置的影响,但跨国直播语言成了沟通的阻碍,需要语音即时传译技术进行翻译,目前的传译技术不够完善,需要一种基于视频和直播版面中的语音即时传译方法来解决这一问题。
技术实现思路
1、本发明的目的在于提供一种基于视频和直播版面中的语音即时传译方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种基于视频和直播版面中的语音即时传译方法,包括如下步骤:
3、(1).打开手机,通过无线的连接方式进行网络连接,点开微视直播app,登录相关账号在平台画面中点击添加直播画面,通过“来源”连接直播画面进行直播;
4、(2).直播过程中可进行连麦,判断观众客户端优质进行优先连麦,并检测对应的用户是否有连麦权限;若有,则向控制服务器发送连麦请求,以供控制服务器将所述连麦请求转发给主播端服务器,进而以供控制服务器根据主播端服务器返回的针对连麦请求的确定指令,建立主播客户端和观众客户端的连麦直播;
5、(3).观众与商家主播连麦后可实现“面对面”购物,整个直播连麦过程可实现无国界直播,不受地理位置的影响,帮买家解决了以往要亲身去到海外购物和找人代购的麻烦;
6、(4).直播过程中通过ai智能翻译实时翻译字幕,将主播的语音和文字实时显示转译字幕,实现“无障碍”直播,直播的内容和画面会通过储存模块存储下来,给后续做出短视频提供了素材。
7、进一步的,所述ai智能翻译由语音/文字采集单元、语音/文字识别单元、文字翻译单元、文字合成语音单元以及语音播放单元组成。
8、进一步的,所述语音/文字采集单元用来采集连麦观众的声音,语音/文字识别单元可对采集的声音进行识别并进行处理,将观众的声音进行优化,减少声音中的杂音。
9、进一步的,所述文字翻译单元是将优化,减少声音中的杂音后的声音进行进行翻译,由同声传译app进行实时翻译。
10、进一步的,所述文字合成语音单元将语音识别单元输出的经过翻译的文字合成为语音,生成音频文件。
11、进一步的,所述语音播放单元,实时播放文字合成语音单元输出的音频文件。
12、与现有技术相比,本发明具有以下有益效果:
13、(1)本发明是一种基于视频和直播版面中的语音即时传译方法,本发明设置的即时传译技术可以实现无国界直播,使其地理位置的影响,便于实时与商家主播连麦,从而实现“面对面”购物,不需要在现场进行专门的视频采集,直播方式简单,解除了现有直播技术的局限性。
14、(2)本发明是一种基于视频和直播版面中的语音即时传译方法,本发明设置的即时传译技术通过ai智能翻译实时翻译字幕,将主播的语音和文字实时显示转译字幕,实现“无障碍”直播。
1.一种基于视频和直播版面中的语音即时传译方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于视频和直播版面中的语音即时传译方法,其特征在于,所述ai智能翻译由语音/文字采集单元、语音/文字识别单元、文字翻译单元、文字合成语音单元以及语音播放单元组成。
3.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法,其特征在于,所述语音/文字采集单元用来采集连麦观众的声音,语音/文字识别单元可对采集的声音进行识别并进行处理,将观众的声音进行优化,减少声音中的杂音。
4.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法,其特征在于,所述文字翻译单元是将优化,减少声音中的杂音后的声音进行进行翻译,由同声传译app进行实时翻译。
5.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法,其特征在于,所述文字合成语音单元将语音识别单元输出的经过翻译的文字合成为语音,生成音频文件。
6.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法,其特征在于,所述语音播放单元,实时播放文字合成语音单元输出的音频文件。