翻译图片中的文字的方法、装置、电子设备、及存储介质与流程

文档序号：21365362发布日期：2020-07-04 04:40阅读：来源：国知局

技术特征：

1.一种翻译图片中的文字的方法，其特征在于，包括：

识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；

对所述至少一个文本行进行段落合并，得到至少一个文本段；

将所述至少一个文本段翻译成指定语种的目标文本段；

用所述目标文本段来替换所述目标图片中的文字。

2.根据权利要求1所述的方法，其特征在于，在得到至少一个文本行之后所述方法还包括：

获取各文本行对应文字的图片特征，其中所述图片特征包括页边距、字体大小、字体颜色、以及与相邻行的行间距中的至少一项；

对所述至少一个文本行进行段落合并包括：

根据各文本行对应文字的图片特征，对所述至少一个文本行进行段落合并。

3.根据权利要求2所述的方法，其特征在于，所述识别嵌入在目标图片中的文字,得到至少一个文本行,获取各文本行对应文字的图片特征包括：

通过用于识别图片文字的机器学习模型识别嵌入在所述目标图片中的所述文字，得到至少一个文本行、以及各文本行对应文字的图片特征。

4.根据权利要求2所述的方法，其特征在于，根据各文本行对应文字的图片特征，对所述至少一个文本行进行段落合并包括：

通过用于将文本行合并为段落的机器学习模型根据各文本行对应文字的图片特征，对所述至少一个文本行进行段落合并。

5.根据权利要求1所述的方法，其特征在于：

在得到至少一个文本行之后所述方法还包括：获取各文本行对应文字的位置信息；

在得到至少一个文本段之后还包括：对任一文本段，根据该文本段所对应的各文本行对应图片文字的位置信息，确定该文本段对应图片文字的位置信息；

所述用所述目标文本段来替换所述目标图片中的文字包括：将所述目标图片中的文字擦除，对所述至少一个文本段，将该文本段的翻译结果根据该文本段对应文字的位置信息进行排版后，根据该文本段对应文字的位置信息将排版结果嵌入到所述目标图片中。

6.根据权利要求5所述的方法，其特征在于，所述排版包括调整页边距、调整框边距、调整行边距、调整字距、以及缩放处理中的至少一项。

7.一种翻译图片中的文字的装置，其特征在于，包括：

文本行识别单元，用于识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；

段落合并单元，用于对所述至少一个文本行进行段落合并，得到至少一个文本段；

文字翻译单元，用于将所述至少一个文本段翻译成指定语种的目标文本段；

文字替换单元，用于用所述目标文本段来替换所述目标图片中的文字。

8.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储可执行指令，所述可执行指令在被所述一个或多个处理器执行时，使得所述电子设备执行如权利要求1-6中任一项所述的方法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6任一项所述的方法。

技术总结
本公开实施例公开了一种翻译图片中的文字的方法、装置、电子设备、及存储介质，方法包括：识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；对所述至少一个文本行进行段落合并，得到至少一个文本段；将所述至少一个文本段翻译成指定语种的目标文本段，用所述目标文本段来替换所述目标图片中的文字。本公开实施例的技术方案能够根据不同语种的用户调整嵌入图片或视频中的文字，能够提升图片或视频中信息的传播范围。

技术研发人员：李磊;曹军;王明轩;钱舟
受保护的技术使用者：北京字节跳动网络技术有限公司
技术研发日：2020.02.28
技术公布日：2020.07.03

完整全部详细技术资料下载

当前第2页1 2