文本翻译方法、装置、电子设备和存储介质与流程

文档序号:29627189发布日期:2022-04-13 14:47阅读:60来源:国知局
文本翻译方法、装置、电子设备和存储介质与流程

1.本发明涉及自然语言处理技术领域,尤其涉及一种文本翻译方法、装置、电子设备和存储介质。


背景技术:

2.图像文本翻译是利用计算机系统自动地将图片或视频中包含的源语言文本翻译为目标语言文本。图像文本翻译技术能够快速、有效地帮助人们翻译和理解图片、视频中的文本内容。
3.目前,多通过扫描设备获取包含有待翻译文本的图像,然后对图像进行光学字符识别(optical character recognition,ocr),得到待翻译文本,并对源语言文本进行翻译(如中英互译),得到翻译结果。然而,上述翻译结果通常会脱离待翻译文本所在区域图像的语义内容,导致翻译结果的准确度较低。


技术实现要素:

4.本发明提供一种文本翻译方法、装置、电子设备和存储介质,用以解决现有技术中文本翻译精度较低的缺陷。
5.本发明提供一种文本翻译方法,包括:
6.获取待翻译的目标文本,以及所述目标文本所在区域的区域图像;
7.对所述目标文本进行文本翻译,得到以目标语言表达的翻译文本;
8.对所述区域图像进行语义理解,得到以所述目标语言表达的图像描述文本;
9.基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果。
10.根据本发明提供的一种文本翻译方法,所述基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果,包括:
11.基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述翻译文本与所述图像描述文本之间的语义相似度;
12.在所述语义相似度大于阈值时,基于所述图像描述文本,对所述翻译文本进行纠正,得到所述目标文本的翻译结果。
13.根据本发明提供的一种文本翻译方法,所述基于所述图像描述文本,对所述翻译文本进行纠正,得到所述目标文本的翻译结果,包括:
14.对所述图像描述文本与所述翻译文本进行匹配,确定所述翻译文本中的待纠正分词以及所述图像描述文本中与所述待纠正分词对应的校正分词;
15.以所述校正分词替换所述翻译文本中的待纠正分词,得到所述目标文本的翻译结果。
16.根据本发明提供的一种文本翻译方法,所述确定所述翻译文本与所述图像描述文本之间的语义相似度,之后还包括:
17.在所述语义相似度小于等于阈值时,以所述翻译文本作为所述翻译结果。
18.根据本发明提供的一种文本翻译方法,所述获取待翻译的目标文本,以及所述目标文本所在区域的区域图像,包括:
19.获取包含有所述目标文本和所述区域图像的全局图像;
20.对所述全局图像进行文字识别,得到所述目标文本;
21.从所述全局图像中删除所述目标文本对应的图像,得到所述区域图像。
22.根据本发明提供的一种文本翻译方法,所述获取待翻译的目标文本,以及所述目标文本所在区域的区域图像,包括:
23.基于第一扫描元件,采集所述目标文本的文本图像;
24.对所述文本图像进行文字识别,得到所述目标文本;
25.基于第二扫描元件,采集所述目标文本所在区域的区域图像。
26.根据本发明提供的一种文本翻译方法,所述确定所述目标文本的翻译结果,之后还包括:展示所述翻译结果。
27.本发明还提供一种文本翻译装置,包括:
28.数据获取单元,用于获取待翻译的目标文本,以及所述目标文本所在区域的区域图像;
29.初始翻译单元,用于对所述目标文本进行文本翻译,得到以目标语言表达的翻译文本;
30.图像描述单元,用于对所述区域图像进行语义理解,得到以所述目标语言表达的图像描述文本;
31.文本翻译单元,用于基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果。
32.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文本翻译方法的步骤。
33.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述文本翻译方法的步骤。
34.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述文本翻译方法的步骤。
35.本发明提供的文本翻译方法、装置、电子设备和存储介质,对目标文本所在区域的区域图像进行语义理解,从而可以得到贴合区域图像语义内容的图像描述文本,并基于翻译文本的语义信息以及图像描述文本的语义信息,确定目标文本的翻译结果,从而使得翻译结果能够贴合区域图像的语义内容,进而提高了文本翻译精度。
附图说明
36.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
37.图1是本发明提供的文本翻译方法的流程示意图;
38.图2是本发明提供的文本翻译方法中步骤140的实施方式的流程示意图;
39.图3是本发明提供的文本翻译方法中步骤142的实施方式的流程示意图;
40.图4是本发明提供的文本翻译方法中步骤110的实施方式的流程示意图之一;
41.图5是本发明提供的文本翻译方法中步骤110的实施方式的流程示意图之二;
42.图6是本发明提供的文本翻译装置的结构示意图;
43.图7是本发明提供的电子设备的结构示意图。
具体实施方式
44.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.目前,多通过扫描设备获取包含有待翻译文本的图像,然后对图像进行ocr识别,得到待翻译文本,并对源语言文本进行翻译(如中英互译),得到翻译结果。然而,待翻译文本通常是图像中的文本,而上述翻译结果是脱离待翻译文本所在区域图像进行翻译得到的,从而使得翻译结果脱离区域图像的语义内容,降低了翻译结果精度。
46.例如,图像中有个人穿着蓝色的裤子,蓝色的衬衫,戴着蓝色的帽子,绿色的面具,黑色的眼罩,其该图像中包含有文本“i'm wearing blue trousers,a blue shirt,a blue hat and a black mask.who am i?”。传统方法中通常通过扫描笔扫描该图像中的文本内容,然后进行ocr识别得到该文本,并对其进行翻译,得到的翻译结果为“我穿着蓝色的裤子,蓝色的衬衫,蓝色的帽子和一个黑色的面具。我是谁啊?”。由此可见,翻译结果中的“黑色的面具”与图像中“黑色的眼罩”明显不符,这是因为“mask”作名字解释同时具备面具和眼罩的意思,从而在对文本单独进行翻译时得到的翻译结果与图像中表达的内容不一致,进而影响翻译结果的精度。
47.对此,本发明提供一种文本翻译方法。图1是本发明提供的文本翻译方法的流程示意图,如图1所示,该方法包括如下步骤:
48.步骤110、获取待翻译的目标文本,以及目标文本所在区域的区域图像。
49.具体地,目标文本即需要进行翻译的文本,区域图像即目标文本所在区域的图像。此处的目标文本可以是用户直接输入的,也可以是将采集所得的音频进行语音转写后得到的,还可以是通过扫描仪、手机、相机等图像采集设备采集得到图像,并对图像进行ocr文字识别得到的,本发明实施例对此不作具体限定。
50.其中,目标文本可以是用于描述区域图像的文本,即目标文本的语义内容与区域图像所表达的语义内容相关度较高,例如区域图像所表达的语义内容为“有个人穿着蓝色的裤子,蓝色的衬衫,戴着蓝色的帽子,绿色的面具,黑色的眼罩”,该区域图像包含的目标文本为“i'm wearing blue trousers,a blue shirt,a blue hat and a black mask.who am i?”,可以看出目标文本的语义内容与区域图像所表达的语义内容基本一致,即两者的语义内容相关度较高。此外,目标文本的语义内容也可能与区域图像所表达的语义内容相关度较低,例如区域图像所表达的语义内容为“一只老鼠张开嘴露出惊讶的表情”,该区域
图像包含的目标文本为“look at maskman!”,可以看出目标文本的语义内容与区域图像所表达的语义内容差异较大,即两者的语义内容相关度较低。
51.步骤120、对目标文本进行文本翻译,得到以目标语言表达的翻译文本。
52.具体地,在得到目标文本后,可以将目标文本输入至文本翻译模型中,由文本翻译模型对目标文本进行翻译,得到以目标语言表达的翻译文本。
53.需要说明的是,由于目标文本是脱离区域图像的语义内容进行翻译的,且目标文本中的某些分词可能存在一词多译的现象,从而可能导致得到的翻译文本的语义内容与目标文本的真实语义内容存在偏差。例如,目标文本为“i'm wearing a black mask”,在单独对目标文本进行翻译时,由于mask作名字翻译同时具备面具和眼罩的意思,因此得到的翻译文本可能为“我戴着一个黑色的面具”。然而,目标文本对应的区域图像中是有一个人戴着黑色的眼罩,而不是黑色的面具,由此可见,翻译文本“我戴着一个黑色的面具”与区域图像所表达的语义内容存在差异,即对目标文本进行文本翻译后得到的翻译文本需要进行纠正。
54.可选地,在对目标文本进行文本翻译之前,可以预先训练得到文本翻译模型,具体可以通过执行如下步骤实现:首先,收集大量样本文本,通过人工标注确定其对应的样本翻译文本。随即,基于样本文本及其对应的样本翻译文本对初始模型进行训练,从而得到文本翻译模型。
55.步骤130、对区域图像进行语义理解,得到以目标语言表达的图像描述文本。
56.具体地,图像描述文本用于描述区域图像所表达的语义内容。在得到区域图像后,可以将区域图像输入至语义理解模型中,由语义理解模型对区域图像进行语义理解,得到以目标语言表达的图像描述文本。
57.需要说明的是,由于图像描述文本是对区域图像进行语义理解得到的,从而图像描述文本可以理解为是结合区域图像的语义内容得到的,也就是图像描述文本相较于脱离区域图像的语义内容翻译得到的翻译文本,能够更加准确表达区域图像的语义内容。
58.可选地,在对区域图像进行语义理解之前,可以预先训练得到语义理解模型,具体可以通过执行如下步骤实现:首先,收集大量样本图像,通过人工标注确定其对应的样本图像描述文本。随即,基于样本图像及其对应的样本图像描述文本对初始模型进行训练,从而得到语义理解模型。
59.步骤140、基于翻译文本的语义信息,以及图像描述文本的语义信息,确定目标文本的翻译结果。
60.具体地,由于对目标文本进行文本翻译时脱离了区域图像的语义内容,从而导致翻译文本可能无法准确表达目标文本的实际语义内容,此时需要对翻译文本进行校正。
61.对此,在确定翻译文本和图像描述文本之后,基于翻译文本的语义信息,以及图像描述文本的语义信息,可以确定翻译文本与图像描述文本之间的语义相似度。语义相似度越大,表明目标文本的语义内容与图像描述文本的语义内容之间的相关度越高,也即目标文本是用于描述区域图像的概率越高,此时可以基于能够准确描述区域图像语义内容的图像描述文本对翻译文本进行校正,例如可以直接将准确度较高的图像描述文本作为目标文本的翻译结果,也可以将翻译文本与图像描述文本进行匹配,确定翻译文本中的待纠正分词以及图像描述文本中与待纠正分词对应的校正分词,并以校正分词替换翻译文本中的待
纠正分词后,以替换后的翻译文本作为翻译结果。
62.此外,翻译文本与图像描述文本之间的语义相似度越小时,表明目标文本的语义内容与图像描述文本的语义内容之间的相关度越低,也即目标文本与区域图像所表达内容不同的概率越高,此时目标文本的翻译结果不受图像描述文本的约束,即可以直接将翻译文本作为翻译结果。
63.相较于传统方法中脱离区域图像的语义内容单独对目标文本进行文本翻译,本发明实施例提供的方法结合用于描述区域图像语义内容的图像描述文本,确定目标文本的翻译结果,从而在目标文本用于描述区域图像的语义内容时,能够贴合区域图像本身的语义内容确定目标文本的翻译结果,提高了文本翻译的精度。
64.本发明实施例提供的文本翻译方法,对目标文本所在区域的区域图像进行语义理解,从而可以得到贴合区域图像语义内容的图像描述文本,并基于翻译文本的语义信息以及图像描述文本的语义信息,确定目标文本的翻译结果,从而使得翻译结果能够贴合区域图像的语义内容,进而提高了文本翻译精度。
65.基于上述实施例,图2是本发明提供的文本翻译方法中步骤140的实施方式的流程示意图,如图2所示,步骤140包括:
66.步骤141、基于翻译文本的语义信息,以及图像描述文本的语义信息,确定翻译文本与图像描述文本之间的语义相似度;
67.步骤142、在语义相似度大于阈值时,基于图像描述文本,对翻译文本进行纠正,得到目标文本的翻译结果。
68.具体地,在确定翻译文本和图像描述文本之后,基于翻译文本的语义信息,以及图像描述文本的语义信息,可以确定翻译文本与图像描述文本之间的语义相似度。在语义相似度大于阈值时,表明目标文本的语义内容与图像描述文本的语义内容之间的相关度较高,也即目标文本是用于描述区域图像的概率较高,此时可以基于图像描述文本对翻译文本进行纠正,例如可以直接将准确度较高的图像描述文本作为目标文本的翻译结果,也可以将翻译文本与图像描述文本进行匹配,确定翻译文本中的待纠正分词以及图像描述文本中与待纠正分词对应的校正分词,并以校正分词替换翻译文本中的待纠正分词后,以替换后的翻译文本作为翻译结果。
69.可选地,在确定翻译文本与图像描述文本之间的语义相似度时,可以基于翻译文本的语义信息确定翻译文本的语义特征,以及基于图像描述文本的语义信息确定图像描述文本的语义特征,然后计算翻译文本的语义特征与图像描述文本的语义特征之间的距离,并以该距离表征语义相似度,即距离越大,语义相似度越小;距离越小,语义相似度越大。
70.由此可见,本发明实施例基于翻译文本的语义信息与图像描述文本的语义信息,可以准确确定两者之间的语义相似度,并在语义相似度大于阈值时,基于图像描述文本对翻译文本进行纠正,从而可以保证目标文本的翻译结果能够贴合区域图像的语义内容,进而提高翻译精度。
71.基于上述任一实施例,图3是本发明提供的文本翻译方法中步骤142的实施方式的流程示意图,如图3所示,步骤142包括:
72.步骤1421、对图像描述文本与翻译文本进行匹配,确定翻译文本中的待纠正分词以及图像描述文本中与待纠正分词对应的校正分词;
73.步骤1422、以校正分词替换翻译文本中的待纠正分词,得到目标文本的翻译结果。
74.具体地,待纠正分词指翻译文本中存在译文错误的分词,校正分词指待纠正分词对应的正确译文分词。对图像描述文本和翻译文本进行匹,若翻译文本中存在任一分词与图像描述文本中对应分词的表达内容不一致,则表明翻译文本中的对应分词可能存在译文错误,此时可以将翻译文本中的对应分词作为待纠正分词,将图像描述文本中的对应分词作为校正分词,并以校正分词替换翻译文本中的待纠正分词,得到目标文本的翻译结果。
75.例如,翻译文本为“医生戴上了黄色的面罩”,翻译文本对应的图像描述文本为“医生戴上了黄色的口罩”,则翻译文本中的“面罩”为待纠正分词,图像描述文本中的“口罩”为校正分词,并以校正分词“口罩”替换翻译文本中的待纠正分词“面罩”,得到的翻译结果为“医生戴上了黄色的口罩”。
76.可选地,在基于图像描述文本对翻译文本进行纠正时,可以将图像描述文本和翻译文本输入至纠正模型中,由纠正模型对图像描述文本与翻译文本进行匹配,确定翻译文本中的待纠正分词以及图像描述文本中与待纠正分词对应的校正分词,并以校正分词替换翻译文本中的待纠正分词,输出目标文本的翻译结果。其中,纠正模型是基于样本源文本的样本翻译文本、样本源文本所在区域的样本区域图像的样本图像描述文本以及样本源文本对应的样本翻译结果训练得到。
77.可选地,在基于图像描述文本对翻译文本进行纠正时,可以分别对图像描述文本和翻译文本进行实体识别,得到图像描述文本的实体分词以及翻译文本的实体分词,并对两者的实体分词进行匹配,若存在不匹配的实体分词,则表明翻译文本中对应的实体分词可能存在译文错误,此时以翻译文本中对应的实体分词作为待纠正分词,以图像描述文本中对应的实体分词作为校正分词,然后以校正分词替换翻译文本中的待纠正分词,并以替换分词后的翻译文本作为目标文本的翻译结果。
78.由此可见,本发明实施例通过对图像描述文本与翻译文本进行匹配,从而可以准确确定翻译文本中的待纠正分词以及图像描述文本中与待纠正分词对应的校正分词,并以校正分词替换翻译文本中的待纠正分词,从而实现对翻译文本进行纠正,使得得到目标文本的翻译结果能够贴合区域图像的语义内容。
79.基于上述任一实施例,步骤141中确定翻译文本与图像描述文本之间的语义相似度,之后还包括:
80.在语义相似度小于等于阈值时,以翻译文本作为翻译结果。
81.具体地,在确定翻译文本和图像描述文本之后,基于翻译文本的语义信息,以及图像描述文本的语义信息,可以确定翻译文本与图像描述文本之间的语义相似度。在语义相似度小于等于阈值时,表明目标文本的语义内容与图像描述文本的语义内容之间的相关度较低,也即目标文本与区域图像所表达内容不同的概率较高,此时目标文本的翻译结果不受图像描述文本的约束,即可以直接将翻译文本作为翻译结果。
82.由此可见,本发明实施例在语义相似度小于等于阈值时,以翻译文本作为翻译结果,从而可以在目标文本与区域图像所表达内容不同时,准确确定目标文本的翻译结果。
83.基于上述任一实施例,图4是本发明提供的文本翻译方法中步骤110的实施方式的流程示意图之一,如图4所示,步骤110包括:
84.步骤111a、获取包含有目标文本和区域图像的全局图像;
85.步骤112a、对全局图像进行文字识别,得到目标文本;
86.步骤113a、从全局图像中删除目标文本对应的图像,得到区域图像。
87.具体地,全局图像指包含有目标文本信息和区域图像信息的图像,其可以通过扫描元件获取。在得到全局图像后,对全局图像进行文字识别,从而可以得到全局图像中的目标文本。然后从包含有目标文本信息和区域图像信息的全局图像中删除目标文本对应的图像,从而可以得到区域图像。
88.需要说明的是,此处区域图像不包含目标文本的图像,从而可以避免在对区域图像进行语义理解时,目标文本信息对区域图像的语义内容造成的干扰,进而得到能够准确表达区域图像语义内容的图像描述文本。
89.由此可见,本发明实施例先获取包含有目标文本和区域图像的全局图像,然后对全局图像进行文字识别,从而可以准确得到目标文本,并在得到目标文本后,从全局图像中删除目标文本对应的图像,进而能够准确得到区域图像。
90.基于上述任一实施例,图5是本发明提供的文本翻译方法中步骤110的实施方式的流程示意图之二,如图5所示,步骤110包括:
91.步骤111b、基于第一扫描元件,采集目标文本的文本图像;
92.步骤112b、对文本图像进行文字识别,得到目标文本;
93.步骤113b、基于第二扫描元件,采集目标文本所在区域的区域图像。
94.具体地,第一扫描元件用于采集目标文本的文本图像,从而可以对文本图像进行文本识别,准确得到对应的目标文本。第二扫描元件用于采集目标文本所在区域的区域图像,从而可以基于区域图像进行语义理解,准确得到图像描述文本。
95.可以理解的是,第一扫描元件和第二扫描元件可以是位于词典笔笔身上的两个扫描元件,进而用户在对目标文本翻译时,可以通过词典笔上的第一扫描元件和第二扫描元件采集相应的图像,然后将采集得到的图像传输至词典笔中的处理器,该处理器用于执行上述任一实施例所述的文本翻译方法。
96.基于上述任一实施例,步骤140中确定目标文本的翻译结果,之后还包括:展示翻译结果。
97.具体地,在得到目标文本的翻译结果后,可以在词典笔的显示屏上以文本显示的方式展示翻译结果,也可以通过词典笔上的语音播放模块以语音播放的方式展示翻译结果,还可以同时以文本显示和语义播放的方式展示翻译结果,从而用户可以直观快速获取目标文本的翻译结果。
98.基于上述任一实施例,本发明还提供一种文本翻译方法,该方法包括:
99.获取待翻译的目标文本,以及目标文本所在区域的区域图像,然后对目标文本进行文本翻译,得到以目标语言表达的翻译文本,以及将区域图像输入至语义理解模型,由语义理解模型对区域图像进行语义理解,得到以目标语言表达的图像描述文本。
100.接着,基于翻译文本的语义信息,以及图像描述文本的语义信息,确定翻译文本与图像描述文本之间的语义相似度,在语义相似度大于阈值时,对图像描述文本与翻译文本进行匹配,确定翻译文本中的待纠正分词以及图像描述文本中与待纠正分词对应的校正分词,并以校正分词替换翻译文本中的待纠正分词,得到目标文本的翻译结果。在语义相似度小于等于阈值时,以翻译文本作为翻译结果。
101.最后,在得到目标文本的翻译结果后,展示目标文本的翻译结果。
102.其中,在获取待翻译的目标文本,以及目标文本所在区域的区域图像时,可以采用同一扫描元件采集包含有目标文本和区域图像的全局图像,然后对全局图像进行文字识别,得到目标文本,接着从全局图像中删除目标文本对应的图像,得到区域图像。还可以采用第一扫描元件,采集目标文本的文本图像,并对文本图像进行文字识别,得到目标文本,以及采用第二扫描元件采集目标文本所在区域的区域图像。
103.下面对本发明提供的文本翻译装置进行描述,下文描述的文本翻译装置与上文描述的文本翻译方法可相互对应参照。
104.基于上述任一实施例,图6是本发明提供的文本翻译装置的结构示意图,如图6所示,该文本翻译装置包括:
105.数据获取单元610,用于获取待翻译的目标文本,以及所述目标文本所在区域的区域图像;
106.初始翻译单元620,用于对所述目标文本进行文本翻译,得到以目标语言表达的翻译文本;
107.图像描述单元630,用于对所述区域图像进行语义理解,得到以所述目标语言表达的图像描述文本;
108.文本翻译单元640,用于基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果。
109.基于上述任一实施例,所述文本翻译单元640包括:
110.相似度确定单元,用于基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述翻译文本与所述图像描述文本之间的语义相似度;
111.第一翻译单元,用于在所述语义相似度大于阈值时,基于所述图像描述文本,对所述翻译文本进行纠正,得到所述目标文本的翻译结果。
112.基于上述任一实施例,所述第一翻译单元包括:
113.匹配单元,用于对所述图像描述文本与所述翻译文本进行匹配,确定所述翻译文本中的待纠正分词以及所述图像描述文本中与所述待纠正分词对应的校正分词;
114.校正单元,用于以所述校正分词替换所述翻译文本中的待纠正分词,得到所述目标文本的翻译结果。
115.基于上述任一实施例,所述装置还包括:
116.第二翻译单元,用于确定所述翻译文本与所述图像描述文本之间的语义相似度之后,在所述语义相似度小于等于阈值时,以所述翻译文本作为所述翻译结果。
117.基于上述任一实施例,所述数据获取单元610,包括:
118.全局图像获取单元,用于获取包含有所述目标文本和所述区域图像的全局图像;
119.第一识别单元,用于对所述全局图像进行文字识别,得到所述目标文本;
120.图像删除单元,用于从所述全局图像中删除所述目标文本对应的图像,得到所述区域图像。
121.基于上述任一实施例,所述数据获取单元610,包括:
122.第一扫描单元,用于基于第一扫描元件,采集所述目标文本的文本图像;
123.第二识别单元,用于对所述文本图像进行文字识别,得到所述目标文本;
124.第二扫描单元,用于基于第二扫描元件,采集所述目标文本所在区域的区域图像。
125.基于上述任一实施例,所述装置还包括:
126.展示单元,用于确定所述目标文本的翻译结果之后,展示所述翻译结果。
127.图7是本发明提供的电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、存储器(memory)720、通信接口(communications interface)730和通信总线740,其中,处理器710,存储器720,通信接口730通过通信总线740完成相互间的通信。处理器710可以调用存储器720中的逻辑指令,以执行文本翻译方法,该方法包括:获取待翻译的目标文本,以及所述目标文本所在区域的区域图像;对所述目标文本进行文本翻译,得到以目标语言表达的翻译文本;对所述区域图像进行语义理解,得到以所述目标语言表达的图像描述文本;基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果。
128.此外,上述的存储器720中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
129.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的文本翻译方法,该方法包括:获取待翻译的目标文本,以及所述目标文本所在区域的区域图像;对所述目标文本进行文本翻译,得到以目标语言表达的翻译文本;对所述区域图像进行语义理解,得到以所述目标语言表达的图像描述文本;基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果。
130.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的文本翻译方法,该方法包括:获取待翻译的目标文本,以及所述目标文本所在区域的区域图像;对所述目标文本进行文本翻译,得到以目标语言表达的翻译文本;对所述区域图像进行语义理解,得到以所述目标语言表达的图像描述文本;基于所述翻译文本的语义信息,以及所述图像描述文本的语义信息,确定所述目标文本的翻译结果。
131.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
132.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上
述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
133.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1