一种基于视频和直播版面中的语音即时传译方法与流程

文档序号：35063020发布日期：2023-08-09 02:04阅读：43来源：国知局

本发明涉及语音传译，具体来说，涉及一种基于视频和直播版面中的语音即时传译方法。

背景技术：

1、视频直播是在点播业务的基础上演变而来，是指利用互联网及流媒体技术进行直播，它因融合了图像、文字、声音等丰富元素，声形并茂，效果极佳，逐渐成为互联网的主流表达方式，视频直播的实现过程是当用户发出直播请求时，服务器就会根据直播信息，将该直播频道的播放地址(一般是一个组播url，而非组播文件)告诉用户，用户根据该地址加入对应的组播组，即可接收到该直播电视的码流。

2、视频直播不仅仅针对于国内，现目前的直播可实现跨国直播，实现无国界直播，不受地理位置的影响，但跨国直播语言成了沟通的阻碍，需要语音即时传译技术进行翻译，目前的传译技术不够完善，需要一种基于视频和直播版面中的语音即时传译方法来解决这一问题。

技术实现思路

1、本发明的目的在于提供一种基于视频和直播版面中的语音即时传译方法，以解决上述背景技术中提出的问题。

2、为实现上述目的，本发明提供如下技术方案：一种基于视频和直播版面中的语音即时传译方法，包括如下步骤：

3、(1).打开手机，通过无线的连接方式进行网络连接，点开微视直播app，登录相关账号在平台画面中点击添加直播画面，通过“来源”连接直播画面进行直播；

4、(2).直播过程中可进行连麦，判断观众客户端优质进行优先连麦，并检测对应的用户是否有连麦权限；若有，则向控制服务器发送连麦请求，以供控制服务器将所述连麦请求转发给主播端服务器，进而以供控制服务器根据主播端服务器返回的针对连麦请求的确定指令，建立主播客户端和观众客户端的连麦直播；

5、(3).观众与商家主播连麦后可实现“面对面”购物，整个直播连麦过程可实现无国界直播，不受地理位置的影响，帮买家解决了以往要亲身去到海外购物和找人代购的麻烦；

6、(4).直播过程中通过ai智能翻译实时翻译字幕，将主播的语音和文字实时显示转译字幕，实现“无障碍”直播，直播的内容和画面会通过储存模块存储下来，给后续做出短视频提供了素材。

7、进一步的，所述ai智能翻译由语音/文字采集单元、语音/文字识别单元、文字翻译单元、文字合成语音单元以及语音播放单元组成。

8、进一步的，所述语音/文字采集单元用来采集连麦观众的声音，语音/文字识别单元可对采集的声音进行识别并进行处理，将观众的声音进行优化，减少声音中的杂音。

9、进一步的，所述文字翻译单元是将优化，减少声音中的杂音后的声音进行进行翻译，由同声传译app进行实时翻译。

10、进一步的，所述文字合成语音单元将语音识别单元输出的经过翻译的文字合成为语音，生成音频文件。

11、进一步的，所述语音播放单元，实时播放文字合成语音单元输出的音频文件。

12、与现有技术相比，本发明具有以下有益效果：

13、(1)本发明是一种基于视频和直播版面中的语音即时传译方法，本发明设置的即时传译技术可以实现无国界直播，使其地理位置的影响，便于实时与商家主播连麦，从而实现“面对面”购物，不需要在现场进行专门的视频采集，直播方式简单，解除了现有直播技术的局限性。

14、(2)本发明是一种基于视频和直播版面中的语音即时传译方法，本发明设置的即时传译技术通过ai智能翻译实时翻译字幕，将主播的语音和文字实时显示转译字幕，实现“无障碍”直播。

技术特征：

1.一种基于视频和直播版面中的语音即时传译方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于视频和直播版面中的语音即时传译方法，其特征在于，所述ai智能翻译由语音/文字采集单元、语音/文字识别单元、文字翻译单元、文字合成语音单元以及语音播放单元组成。

3.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法，其特征在于，所述语音/文字采集单元用来采集连麦观众的声音，语音/文字识别单元可对采集的声音进行识别并进行处理，将观众的声音进行优化，减少声音中的杂音。

4.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法，其特征在于，所述文字翻译单元是将优化，减少声音中的杂音后的声音进行进行翻译，由同声传译app进行实时翻译。

5.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法，其特征在于，所述文字合成语音单元将语音识别单元输出的经过翻译的文字合成为语音，生成音频文件。

6.根据权利要求2所述的一种基于视频和直播版面中的语音即时传译方法，其特征在于，所述语音播放单元，实时播放文字合成语音单元输出的音频文件。

技术总结
本发明公开了一种基于视频和直播版面中的语音即时传译方法，包括打开手机，通过无线的连接方式进行网络连接，点开微视直播APP，登录相关账号在平台画面中点击添加直播画面，通过“来源”连接直播画面进行直播，直播过程中通过Ai智能翻译实时翻译字幕，将主播的语音和文字实时显示转译字幕，实现“无障碍”直播，直播的内容和画面会通过储存模块存储下来，给后续做出短视频提供了素材，本发明设置的即时传译技术可以实现无国界直播，使其地理位置的影响，便于实时与商家主播连麦，从而实现“面对面”购物，不需要在现场进行专门的视频采集，直播方式简单，解除了现有直播技术的局限性，本发明设置的即时传译技术通过Ai智能翻译实时翻译字幕。

技术研发人员：李健强,梁颖娴,杨柏浓,谭伟文,李达强,林鹏杰,何宝华
受保护的技术使用者：深圳市微商移动科技有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李健强梁颖娴杨柏浓谭伟文李达强林鹏杰何宝华
技术所有人：微视店智能科技（中山）有限公司
我是此专利的发明人

上一篇：ZIP7作为靶点在制备治疗肝细胞癌的药物或制剂中的应用
上一篇：一种基于物候先验的通用作物制图损失函数

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。