文本显示方法以及电子设备、存储装置与流程

文档序号:26003192发布日期:2021-07-23 21:20阅读:100来源:国知局
文本显示方法以及电子设备、存储装置与流程

本申请涉及文本处理技术领域,特别是涉及一种文本显示方法以及电子设备、存储装置。



背景技术:

随着信息技术的发展,利用计算机自动识别图像中的文本已经在诸多行业、场景得到了应用。在现实场景中,在识别结束之后,通常需要人工校对识别结果中是否存在错误,比较耗时且效率低下。有鉴于此,如何提高文本校对效率成为极具研究价值的课题。



技术实现要素:

本申请主要解决的技术问题文本是提供一种文本显示方法以及电子设备、存储装置,能够有助于提高文本校对效率。

为了解决上述问题文本,本申请第一方面提供了一种文本显示方法,包括:获取待识别图像;其中,待识别图像中含有原始文本;对待识别图像进行文本识别,得到原始文本对应的识别文本;在显示界面的第一区域,显示识别文本并以第一预设突显格式显示识别文本中的第一目标文本;以及,在显示界面的第二区域,显示原始文本并以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本。

为了解决上述问题文本,本申请第二方面提供了一种电子设备,包括存储器、人机交互电路和处理器,存储器和人机交互电路耦接至处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的文本显示方法。

为了解决上述问题文本,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的文本显示方法。

上述方案,获取待识别图像,且待识别图像中含有原始文本,并对待识别图像进行文本识别,得到原始文本对应的识别文本,从而在显示界面的第一区域,显示识别文本并以第一预设突显格式显示识别文本中的第一目标文本,以及在显示界面的第二区域,显示原始文本并以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本,故此,能够在显示界面的不同区域同时显示原始文本和识别文本,并且以第一预设突显格式显示第一目标文本,与此同时以第二预设突显格式显示与第一目标文本对应的第二目标文本,即能够在显示界面的不同区域同时突显出原始文本和识别文本中相关联的目标文本,从而在文本校对过程中,只需关注显示界面的不同区域所突显的目标文本即可,进而能够有助于帮助用户快速校对识别文本,有助于提高文本校对效率。

附图说明

图1是本申请文本显示方法一实施例的流程示意图;

图2是本申请文本显示方法一实施例的状态示意图;

图3是在先获取第一目标文本的情况下获取第二目标文本的流程示意图;

图4是在先获取第二目标文本的情况下获取第一目标文本的流程示意图;

图5是编辑模式下获取第一目标文本一实施例的流程示意图;

图6是本申请文本显示方法另一实施例的状态示意图;

图7是本申请电子设备一实施例的框架示意图;

图8是本申请存储装置一实施例的框架示意图。

具体实施方式

下面结合说明书附图,对本申请实施例的方案进行详细说明。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。

请参阅图1,图1是本申请文本显示方法一实施例的流程示意图。

具体而言,可以包括如下步骤:

步骤s11:获取待识别图像,其中,待识别图像中含有原始文本。

在一个实施场景中,待识别图像可以是拍摄得到的。例如,可以对诸如书籍、期刊、报纸等印刷制品进行拍摄,得到待识别图像,在此情况下,原始文本可以包括上述印刷制品上所印制的文本;或者,也可以对随堂笔记、读书摘抄、会议记录等手写记录进行拍摄,得到待识别图像,在此情况下,原始文本可以包括上述手写记录中所包含的手写文本。

在另一个实施场景中,本公开实施例具体可以应用于平板电脑等电子设备,用户可以通过触控笔在电子设备的触控屏上书写文字,或者电子设备也可以连接触控板,用户可以通过触控笔在触控板上书写文字。在此情况下,电子设备可以显示一书写区域,并捕获用户在该书写区域的书写轨迹,从而基于书写轨迹得到原始文本,进而在接收到保存指令之后,基于书写区域以及书写区域上的原始文本,得到待识别图像。

步骤s12:对待识别图像进行文本识别,得到原始文本对应的识别文本。

在一个实施场景中,可以先对待识别图像进行文字检测,得到待识别图像中的文本区域,再对文本区域进行文字识别,得到文本区域中原始文本对应的识别文本。也就是说,可以将文本识别分为“文字检测”和“文字识别”两个阶段实现。

在一个具体的实施场景中,为了提高文字检测效率,可以采用文字检测网络对待识别图像进行文字检测,得到待识别图像中的文本区域。文字检测网络可以包括但不限于:fasterr-cnn、textboxes、dmpnet(deepmatchingpriornetwork)、ctpn(connectionisttextproposalnetwork)等等,在此不做限定。

在另一个具体的实施场景中,为了提高文字识别效率,可以采用文字识别网络对文本区域进行文字识别,得到文本区域中原始文本对应的识别文本。文字识别网络可以包括但不限于:cnn(convolutionalneuralnetwork,卷积神经网络)+softmax,cnn+rnn(recurrentneuralnetworks,循环神经网络)+ctc(connectionisttemporalclassifier)等等,在此不做限定。

在另一个实施场景中,为了进一步提高文本识别的效率,可以预先训练一个端到端的文本识别网络,从而可以利用文本识别网络对待识别图像进行识别,得到原始文本对应的识别文本。具体地,端到端的文本识别网络可以包括但不限于:fots(fastorientedtextspotting)等等,在此不做限定。

步骤s13:在显示界面的第一区域,显示识别文本并以第一预设突显格式显示识别文本中的第一目标文本。

在一个实施场景中,原始文本中含有若干原始字符,识别文本中含有分别与若干原始字符对应的识别字符,且待识别图像经文本识别,可以得到若干原始字符分别对应识别字符以及原始字符在待识别图像中的位置坐标。在此情况下,可以基于原始字符的位置坐标,在显示界面的第一区域显示原始字符对应的识别字符。具体地,可以基于识别字符的位置坐标,获取原始字符至待识别图像边缘的距离,从而可以基于该距离,确定原始字符对应的识别字符在第一区域的显示位置,并在该显示位置显示原始字符对应的识别字符。

在一个具体的实施场景中,请结合参阅表1,表1是识别文本显示位置的示意表。如表1所示,在待识别图像中,若第i行原始文本中最后一个原始字符至待识别图像右边缘的距离不小于预设距离,且第i+1行原始文本中第一个原始字符至待识别图像左边缘的距离不小于预设距离,则在第一区域显示时,可以将第i+1行原始文本对应的识别文本缩进预设数量个(如,2个)字符,作为新的段落;若第i行原始文本中最后一个原始字符至待识别图像右边缘的距离不小于预设距离,且第i+1行原始文本中第一个原始字符至待识别图像左边缘的距离小于预设距离,则在第一区域显示时,可以将第i+1行原始文本对应的识别文本作为新的段落,但不做缩进;若第i行原始文本中最后一个原始字符至待识别图像右边缘的距离小于预设距离,且第i+1行原始文本中第一个原始字符至待识别图像左边缘的距离不小于预设距离,则在第一区域显示时,可以将第i+1行原始文本对应的识别文本缩进预设数量个(如,2个)字符,作为新的段落;若第i行原始文本中最后一个原始字符至待识别图像右边缘的距离小于预设距离,且第i+1行原始文本中第一个原始字符至待识别图像左边缘的距离小于预设距离,则在第一区域显示时,可以将第i+1行原始文本对应的识别文本接续在第i行原始文本中最后一个原始字符对应的识别字符之后。

表1识别文本显示位置的示意表

在另一个具体的实施场景中,上述预设距离可以设置为100px、55px等等,在此不做限定。此外,上述预设距离也可以根据实际应用情况进行设置。例如,原始文本、识别文本可以同时显示于电子设备的显示屏上,则在显示屏的屏幕尺寸大于预设尺寸(如,10英寸)的情况下,可以将预设距离设置地稍大一些,如可以设置为100px,反之在显示屏的屏幕尺寸不大于预设尺寸的情况下,可以将预设距离设置地稍小一些,如可以设置为55px。

在又一个具体的实施场景中,请结合参阅图2,图2是本申请文本显示方法一实施例的状态示意图。以前述预设距离设置为100px为例,如图2所示,第二区域中左右两条点划线分别表示待识别图像的左边缘和右边缘。第2行原始文本“t1b上,同时,优化了降噪算法。包括如下:”中最后一个原始字符‘:’至待识别图像右边缘的距离不小于100px,且第3行原始文本“(1)ai智能识别:支持普通话、英文、天津话、河北话、东”中第一个原始字符‘(’至待识别图像左边缘的距离不小于100px,则在第一区域显示时,可以将第3行原始文本作为新的段落,并缩进2个字符。请继续结合参阅图2,第1行原始文本“智能办公本x1在上个月升级全新转写引擎,目前将完全同步”中最后一个原始字符‘步’至待识别图像右边缘的距离小于100px,且第2行原始文本“t1b上,同时,优化了降噪算法。包括如下:”中第一个原始字符‘t’至待识别图像左边缘的距离也小于100px,则在第一区域显示时,可以第2行原始文本“t1b上,同时,优化了降噪算法。包括如下:”对应的识别文本接续在第1行原始文本“智能办公本x1在上个月升级全新转写引擎,目前将完全同步”中最后一个原始字符‘步’对应的识别字符之后。其他情况可以以此类推,在此不再一一举例。

在一个实施场景中,识别文本包含若干第一子文本,且若干第一子文本均以预设分句符号结尾,也就是说,识别文本被预设分句符号划分为若干第一子文本。且第一目标文本属于识别文本所包含的若干第一子文本,即第一目标文本为其中一个第一子文本。

在一个具体的实施场景中,预设分句符号可以包括但不限于:问号(即‘?’)、感叹号(即‘!’)、句号(即‘。’)、逗号(即‘,’)、分号(即‘;’)等等,在此不做限定。需要说明的是,预设分句符号不限于中文状态符号或英文状态符号,例如,中文状态的句号‘。’以及英文状态的句号‘.’均可以视作预设分句符号,其他情况可以以此类推,在此不再一一举例。此外,预设分句符号还可以包括换行符,也就是说,若某一子文本结尾并无标点符号,且本段落在该子文本处结束,也可以将该子文本作为第一子文本。

在另一个具体的实施场景中,请继续结合参阅图2,以第一区域中识别文本“目前将完全同步t1b上,同时,优化了降噪算法。包括如下:”为例,该识别文本中包含第一子文本“目前将完全同步t1b,”,以及第一子文本“同时,”,以及第一子文本“优化了降噪算法。”。此外,虽然子文本“包括如下:”并未以前述问号、感叹号、句号、逗号等标点符号结尾,但是该子文本以换行符结尾,即本段落在该子文本处结束,则也可以将该子文本“包括如下:”作为第一子文本。其他情况可以以此类推,在此不再一一举例。

在又一个具体的实施场景中,可以按照第一子文本在识别文本中由先到后的顺序,将第一子文本作为第一目标文本,并获取原始文本中与第一目标文本对应的第二目标文本,以供用户核对第一目标文本和原始文本中与第一目标文本对应的第二目标文本,并在接收到用户核对完成指令的情况下,自动将下一个第一子文本作为第一目标文本,以此类推,在此不再一一举例。故此,能够自动按照先后顺序,在第一区域突显第一目标文本,并在第二区域突显与第一目标文本对应的第二目标文本,有助于进一步提高文本核对效率及自动化程度。

在又一个具体的实施场景中,第一目标文本也可以是由用户在若干第一子文本中选择得到的。在此基础上,可以基于用户选择的第一目标文本,获取与第一目标文本对应的第二目标文本,具体过程可以参阅下述公开实施例,在此暂不赘述。

在另一个实施场景中,第一预设突显格式可以根据实际应用需要进行设置。例如,第一预设突显格式可以包括但不限于:反色显示、加粗显示、下划线显示等等,在此不做限定。请继续结合参阅图2,如图2所示,第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”可以加粗显示,以突显该第一目标文本;或者,也可以将该第一目标文本反色显示,即可以将该第一目标文本背景色设置为黑色,且文字颜色设置为白色,以突显该第一目标文本;或者,也可以在该第一目标文本下显示下划线,以突显该第一目标文本;或者,也可以在该第一目标文本外围显示方框(如虚线框等),以突显该第一目标文本,在此不做限定。

步骤s14:在显示界面的第二区域,显示原始文本并以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本。

需要说明的是,在实际应用过程中,步骤s13和步骤s14不分先后顺序执行。在一个实施场景中,可以先执行前述步骤s13,如前所述,具体可以基于第一子文本在识别文本中由先到后的顺序,自动获取识别文本中的第一目标文本,或者,也可以基于用户选择,获取识别文本中的第一目标文本的情况下;在获取到第一目标文本的基础上,可以基于第一目标文本,获取原始文本中与第一目标文本对应的第二目标文本,再执行步骤s14。或者,在另一个实施场景中,也可以先获取原始文本中的第二目标文本,在此基础下,可以先执行步骤s14,与此同时,可以基于第二目标文本,获取识别文本中与第二目标文本对应的第一目标文本,再执行前述步骤s13。或者,在又一个实施场景中,在先获取识别文本中第一目标文本的情况下,可以基于第一目标文本,获取原始文本中与第一目标文本对应的第二目标文本,而在先获取原始文本中第二目标文本的情况下,可以基于第二目标文本,获取识别文本中与第二目标文本对应的第一目标文本,并在获取到第一目标文本和第二目标文本的基础上,同时执行步骤s13和步骤s14。实际应用过程中,可以根据实际应用需要设置步骤s13和步骤s14的执行顺序,在此不做限定。

在一个实施场景中,原始文本可以包含若干第二子文本,且若干第二子文本均以预设分句符号结尾,也就是说,原始文本被预设分句符号划分为若干第二子文本。且第二目标文本属于原始文本所包含的若干第二子文本,即第二目标文本为其中一个第二子文本。

在一个具体的实施场景中,预设分句符号可以包括但不限于:问号(即‘?’)、感叹号(即‘!’)、句号(即‘。’)、逗号(即‘,’)、分号(即‘;’)、换行符等等,具体可以参阅前述相关描述,在此不再赘述。

在另一个具体的实施场景中,请继续结合参阅图2,以第二区域中原始文本“目前将完全同步t1b上,同时,优化了降噪算法。包括如下:”为例,经文本识别可以得到原始文本中各个原始字符对应的识别字符,且在各个原始字符对应的识别字符中包含预设分句符号‘,’、‘,’、‘。’以及换行符。在此情况下,可以将上述原始文本划分为第二子文本“目前将完全同步t1b上,”,以及第二子文本“同时,”,以及第二子文本“优化了降噪算法。”,以及第二子文本“包括如下:”。其他情况可以以此类推,在此不再一一举例。需要说明的是,经文本识别不仅可以得到原始字符对应的识别字符,还可以得到原始字符在待识别图像中的位置信息(如,位置坐标)。在此基础上,可以通过第二子文本所包含的原始字符的位置信息,来区分原始文本中的各个第二子文本。例如,待识别图像中位置坐标为(x0,y0)、……、(x1,y0)的原始字符属于第二子文本01,而位置坐标为(x2,y0)、……、(x3,y0)的原始字符属于第二子文本02,以此类推,在此不再一一举例。

在又一个具体的实施场景中,可以按照第二子文本在原始文本中由先到后的顺序,将第二子文本作为第二目标文本,并获取识别文本中与第二目标文本对应的第一目标文本,以供用户核对第一目标文本和第二目标文本,并在接收到用户核对完成指令的情况下,自动将下一个第二子文本作为第二目标文本,以此类推,在此不再一一举例。故此,能够自动按照先后顺序,在第二区域突显第二目标文本,并在第一区域突显与第二目标文本对应的第一目标文本,有助于进一步提高文本核对效率及自动化程度。

在又一个具体的实施场景中,第二目标文本也可以是由用户在若干第二子文本中选择得到的。在此基础上,可以基于用户选择的第二目标文本,获取与第二目标文本对应的第一目标文本,具体过程可以参阅下述公开实施例,在此暂不赘述。

在另一个实施场景中,第二预设突显格式可以根据实际应用需要进行设置。例如,第二预设突显格式可以包括但不限于:高亮显示等,在此不做限定。请继续结合参阅图2,如图2所示,第二目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”可以以灰色底纹高亮显示,以突显该第二目标文本。

在又一个实施场景中,如前所述,可以先获取第一目标文本,再基于第一目标文本,获取原始文本中与第一目标文本对应的第二目标文本;也可以先获取第二目标文本,再基于第二目标文本,获取识别文本中与第二目标文本对应的第一目标文本,无论采用哪一种方式,在得到相互对应的第一目标文本和第二目标文本之后,以第一预设突显格式显示第一目标文本,并以第二预设突显格式显示第二目标文本,故能够在显示界面的不同区域同时突显出原始文本和识别文本中相关联的目标文本,从而在文本校对过程中,只需关注显示界面的不同区域所突显的目标文本即可。请继续结合参阅图2,在第一区域,加粗显示第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”,并在第二区域,高亮显示第二目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”,以在文本校对过程中,只需关注上述两个突显的文本即可。其他情况可以以此类推,在此不再一一举例。

在一个实施场景中,第一区域和第二区域可以在显示界面上下设置。例如,在电子设备竖屏放置时,第一区域和第二区域可以在显示界面上下设置。具体地,可以如图2所示,将第一区域设置于显示界面的下部分,并将第二区域设置于显示界面的上部分;或者,也可以将第一区域设置于显示界面的上部分,并将第二区域设置于显示界面的下部分。

在另一个实施场景中,第一区域和第二区域也可以在显示界面左右设置。例如,在电子设备横屏放置时,第一区域和第二区域可以在显示界面左右设置。具体地,可以将第一区域设置于显示界面的左部分,并将第二区域设置于显示界面的右部分;或者,将第一区域设置于显示界面的右部分,并将第二区域设置于显示界面的左部分,在此不做限定。

请继续结合参阅图2,在存在多张待识别图像的情况下,为了便于用户快速定位到期望显示的待识别图像,显示界面还可以包括一个第三区域,且第三区域可以显示多张待识别图像的缩略图。在此基础上,可以基于用户在第三区域的点击坐标,确定用户期望显示的待识别图像,从而可以在第二区域显示该待识别图像中的原始文本。

请继续结合参阅图2,为了提高用户交互体验,显示界面还可以包括第四区域,且第四区域具体可以显示有若干功能按键。例如,第四区域可以显示有时间(如图2中的“下午6:12”);或者,第四区域可以显示有电量;或者,第四区域可以显示有打印按键,并在接收到用户对该打印按键的触发指令的情况下,将原始文本和/或识别文本发送至打印机进行打印;或者,第四区域也可以显示有导出按键,并在接收到用户对该导出按键的触发指令的情况下,将识别文本导出为预设格式(如,“.doc”格式、“.txt”格式等)的文档。第四区域所显示的功能按键具体可以根据实际应用需要进行设置,在此不做限定。

上述方案,获取待识别图像,且待识别图像中含有原始文本,并对待识别图像进行文本识别,得到原始文本对应的识别文本,从而在显示界面的第一区域,显示识别文本并以第一预设突显格式显示识别文本中的第一目标文本,以及在显示界面的第二区域,显示原始文本并以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本,故此,能够在显示界面的不同区域同时显示原始文本和识别文本,并且以第一预设突显格式显示第一目标文本,与此同时以第二预设突显格式显示与第一目标文本对应的第二目标文本,即能够在显示界面的不同区域同时突显出原始文本和识别文本中相关联的目标文本,从而在文本校对过程中,只需关注显示界面的不同区域所突显的目标文本即可,进而能够有助于帮助用户快速校对识别文本,有助于提高文本校对效率。

请参阅图3,图3是在先获取第一目标文本的情况下获取第二目标文本的流程示意图。本公开实施例中,识别文本包含若干第一子文本,且每一第一子文本包含若干识别字符,第一子文本的具体划分方式可以参阅前述公开实施例中相关描述,在此不再赘述。具体而言,本公开实施例可以包括如下步骤:

步骤s31:获取第一目标文本中的识别字符在原始文本中对应的原始字符的位置信息。

如前所述,本公开实施例中,先在识别文本中获取第一目标文本,再基于第一目标文本,获取原始文本中与第一目标文本对应的第二目标文本。为了便于描述,先说明第一目标文本的获取过程。

在一个实施场景中,可以获取用户在第一区域的第一点击坐标,并将第一点击坐标所在的识别字符作为第一目标字符,在此基础上,可以将第一目标字符所属的第一子文本,作为第一目标文本。上述方式,通过获取用户在第一区域的第一点击坐标,并将第一点击坐标所在的识别字符作为第一目标字符,从而将第一目标字符所属的第一子文本,作为第一目标文本,故仅需用户在第一区域点击即可获取用户点击位置处的第一目标文本,能够有利于提高获取第一目标文本的便利性。

在一个具体的实施场景中,用户在第一区域的第一点击坐标处可以显示编辑光标,编辑光标具体可以以闪烁的形式进行显示。此外,编辑光标也可以设置为不可见,在此不做限定。

在另一个具体的实施场景中,请继续结合参阅图2,用户可以在第一区域所显示的第一子文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”中识别字符“翻”处点击,从而可以获取到该位置处的第一点击坐标。在此基础上,可以获取该第一点击坐标所在的识别文字“翻”,并将该识别文字“翻”所属的第一子文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”,作为第一目标文本。其他情况可以以此类推,在此不再一一举例。

需要说明的是,本公开实施例中,位置信息包含原始字符在待识别图像中的位置坐标,且位置信息是对待识别图像进行文本识别得到的。文本识别的具体方式可以参阅前述公开实施例中相关描述,在此不再赘述。

在一个实施场景中,位置坐标可以包括原始字符至待识别图像左边缘的距离和原始字符至待识别图像上边缘的距离;或者,位置坐标也可以包括原始字符至待识别图像右边缘的距离和原始字符至待识别图像上边缘的距离;或者,位置坐标也可以包括原始字符至待识别图像左边缘的距离和原始字符至待识别图像下边缘的距离;或者,位置坐标也可以包括原始字符至待识别图像下边缘的距离和原始字符至待识别图像右边缘的距离,在此不做限定。

在另一个实施场景中,通过对待识别图像进行文本识别,还可以得到原始字符在待识别图像中的字符尺寸。具体地,字符尺寸可以为包围原始字符的最小包围框的尺寸。例如,最小包围框可以具体为包围原始字符的最小矩形,或者,最小包围框也可以具体为包围原始字符的最小圆形,在此不做限定。

在又一个实施场景中,仍以第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”为例,可以获取到该第一目标文本中各个识别字符在待识别图像中分别对应的原始字符的位置信息。其他情况可以以此类推,在此不再一一举例。

步骤s32:基于对应的原始字符的位置信息,得到第二目标文本。

在一个实施场景中,在获取到对应的原始字符的位置信息之后,即可通过位置信息,获取原始文本中与第一目标文本对应的第二目标文本。仍以第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”为例,通过‘(’、‘2’、‘)’、‘支’……、‘模’、‘式’、‘。’等识别字符所对应的原始字符的位置信息,从而可以将对应于上述位置信息处的原始字符所组成的子文本,作为第二目标文本。在此基础上,可以在待识别图像中对应于上述位置信息处以第二预设突显格式予以显示,如在对应于上述位置信息处高亮显示。

在一个具体的实施场景中,在获取到原始字符的字符尺寸的情况下,对于每一识别字符所对应的原始字符而言,可以在待识别图像中对应于该原始字符的位置信息处且在该原始字符的字符尺寸范围内,以第二预设突显格式予以显示。以前述第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”中的识别字符“翻”为例,该识别字符对应的原始字符的位置信息包括:至待识别图像左边缘第一距离且至待识别图像上边缘第二距离,该原始字符的字符尺寸包括第一宽度和第一高度,则可以以至待识别图像左边缘第一距离且至待识别图像上边缘第二距离的位置为左上顶点,确定一个宽为第一宽度且高为第一高度的矩形,并将该矩形以第二预设突显格式显示,如将该矩形以灰色底纹显示。

在另一个具体的实施场景中,在原始字符的字符尺寸未知的情况下,对于每一识别字符所对应的原始字符而言,可以在待识别图像中对应于该原始字符的位置信息处且在预设尺寸范围内,以第二预设突显格式予以显示。以前述第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”中的识别字符“翻”为例,该识别字符对应的原始字符的位置信息包括:至待识别图像左边缘第一距离且至待识别图像上边缘第二距离,则可以以至待识别图像左边缘第一距离且至待识别图像上边缘第二距离的位置为左上顶点,确定一个宽为预设宽度且高为预设高度的矩形,并将该矩形以第二预设突显格式显示,如将该矩形以灰色底纹显示。

区别于前述实施例,每一第一子文本包含若干识别字符,在此基础上,获取第一目标文本中的识别字符在原始文本中对应的原始字符的位置信息,且位置信息包含原始字符在待识别图像中的位置坐标,而位置信息是对待识别图像进行文本识别得到的,并基于对应的原始字符的位置信息,得到第二目标文本,即根据第一目标文本中识别字符在原始文本中对应的原始字符的位置信息,确定第二目标文本,能够有利于提高获取第二目标文本的准确性。

请参阅图4,图4是在先获取第二目标文本的情况下获取第一目标文本的流程示意图。本公开实施例中,原始文本包含若干第二子文本,且每一第二子文本包含若干原始字符,第二子文本的具体划分方式可以参阅前述公开实施例中相关描述,在此不再赘述。具体而言,本公开实施例可以包括如下步骤:

步骤s41:获取第二目标文本中各个原始字符分别在识别文本中对应的识别字符。

如前所述,本公开实施例中,先在原始文本中获取第二目标文本,再基于第二目标文本,获取识别文本中与第二目标文本对应的第一目标文本。为了便于描述,先说明第二目标文本的获取过程。

在一个实施场景中,可以获取用户在第二区域的第二点击坐标,并将第二点击坐标所在的原始字符作为第二目标字符,在此基础上,可以将第二目标字符所属的第二子文本,作为第二目标文本。上述方式,通过获取用户在第二区域的第二点击坐标,并将第二点击坐标所在的原始字符作为第二目标字符,从而将第二目标字符所属的第二子文本,作为第二目标文本,故仅需用户在第二区域点击即可获取第二目标文本,能够有利于提高获取第二目标文本的便利性。

在一个具体的实施场景中,在文本显示过程中,待识别图像的坐标原点(如待识别图像左上角顶点)与第二区域的原点(如第二区域左上角顶点)之间可能存在一定偏移距离,则在获取到用户在第二区域的第二点击坐标之后,可以基于第二点击坐标和前述偏移距离,得到用户在第二区域的点击位置在待识别图像中的位置坐标,进而可以将位置信息距离该位置坐标最近的原始字符作为第二目标字符。

在另一个具体的实施场景中,如前述公开实施例所述,可以通过第二子文本所包含的原始字符的位置信息,来区分原始文本中的各个第二子文本。例如,待识别图像中位置坐标为(x0,y0)、……、(x1,y0)的原始字符属于第二子文本01,而位置坐标为(x2,y0)、……、(x3,y0)的原始字符属于第二子文本02。在此基础上,可以基于第二目标字符的位置信息以及第二子文本所包含的原始字符的位置信息,确定第二目标字符所属的第二子文本。例如,第二目标字符的位置信息属于位置坐标集合(x0,y0)、……、(x1,y0)内,则可以确定第二目标字符属于第二子文本01。其他情况可以以此类推,在此不再一一举例。

在一个实施场景中,以第二目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”为例,可以获取该第二目标文本经由文本识别所得到的识别字符:‘(’、‘2’、‘)’……、‘模’、‘式’、‘。’。其他情况可以以此类推,在此不再一一举例。

步骤s42:将对应的识别字符所组成的子文本,作为第一目标文本。

在一个实施场景中,仍以第二目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”为例,在得到对应的识别字符之后,即可将这些对应的识别字符所组成的子文本,作为第一目标文本。其他情况可以以此类推,在此不再一一举例。

区别于前述实施例,每一第二子文本均包含若干原始字符,通过获取第二目标文本中各个原始字符分别在识别文本中对应的识别字符,并将对应的识别字符所组成的子文本,作为第一目标文本,能够有利于提高获取第一目标文本的准确性。

请参阅图5,图5是编辑模式下获取第一目标文本一实施例的流程示意图。本公开实施例中,识别文本可以包含若干第一子文本,且若干第一子文本均以预设分句符号结尾,具体可以参阅前述公开实施例中相关描述,在此不再赘述。具体而言,本公开实施例可以包括如下步骤:

步骤s51:在获取到用户对编辑模式的触发指令的情况下,获取用户在第一区域的第三点击坐标,并将编辑光标移动至第三点击坐标处。

在一个实施场景中,显示界面可以设置一个用于触发编辑模式的图标,在检测到用户点击该图标的情况下,可以触发编辑模式。在触发编辑模式的情况下,可以在显示界面的预设位置处显示虚拟键盘,以便于用户利用虚拟键盘对识别文本进行编辑。

在一个具体的实施场景中,请结合参阅图2,如图2所示,可以在第一区域的右上角位置显示用于触发编辑模式的图标。此外,也可以根据实际应用需要在第一区域的左上角、或左下角、或右下角等位置处显示用于触发编辑模式的图标,在此不做限定。

在另一个具体的实施场景中,请结合参阅图6,图6是本申请文本显示方法另一实施例的状态示意图。如图6所示,在触发编辑模式的情况下,可以在显示界面的下侧显示虚拟键盘。此外,也根据实际应用需要,在显示界面的上侧显示虚拟键盘,在此不做限定。

步骤s52:将编辑光标所在的第一子文本,作为第一目标文本。

请继续结合参阅图6,编辑光标(图未示)所在的第一子文本为“非常适合中文夹杂着英文的识别。”,则可以将该第一子文本作为第一目标文本。其他情况可以以此类推,在此不再一一举例。

在一个实施场景中,在获取到第一目标文本之后,可以进一步基于第一目标文本获取原始文本中与第一目标文本对应的第二目标文本,并在显示界面的第一区域,以第一预设突显格式显示识别文本中的第一目标文本,以及在显示界面的第二区域,以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本。具体可以参阅前述公开实施例中相关描述,在此不再赘述。

在一个具体的实施场景中,若原始文本中与第一目标文本对应的第二目标文本未显示在第二区域中,则可以自动滚动第二区域所显示的原始文本,以使得第二目标文本显示在第二区域中。

在另一个具体的实施场景中,在编辑模式下,可以设置编辑光标在显示界面中可见,在此情况下,也可以不以任何突显格式显示第一目标文本。

在另一个实施场景中,若在编辑模式下,删除第一目标文本中的预设分句符号或者将预设分句符号修改为非分句符号,则可以将第一目标文本和第一目标文本之后一个第一子文本组合为新的第一目标文本,并在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本。上述方式,在删除第一目标文本中的预设分句符号或者预设分句符号修改为非分句符号的情况下,将第一目标文本和第一目标文本之后一个第一子文本组合为新的第一目标文本,并在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本,能够随第一目标文本的编辑,同步更新并突显对应的第二目标文本,能够有利于提高文本显示的准确性。

在一个具体的实施场景中,非分句符号可以包括预设分句符号之外的符号。例如,在预设分句符号包括:问号(即‘?’)、感叹号(即‘!’)、句号(即‘。’)、逗号(即‘,’)、分号(即‘;’)的情况下,非分句符号可以包括但不限于:顿号(即‘、’)等等,在此不做限定。

在另一个具体的实施场景中,请继续结合参阅图2,仍以第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”为例,在删除其中的预设分句符号‘。’或者将预设分句符号‘。’修改为非分句符号的情况下,可以将该第一目标文本和该第一目标文本之后一个第一子文本“以随声译—中译英为例,”组合为新的第一目标文本。在此基础上,可以在第二区域中,以第二预设突显格式显示于新的第一目标文本对应的第二目标文本。具体获取与新的第一目标文本对应的第二目标文本的过程,可以参阅前述公开实施例中相关描述,在此不再赘述。其他情况可以以此类推,在此不再一一举例。

在又一个具体的实施场景中,在得到新的第一目标文本之后,也可以在第一区域,以第一预设突显格式显示新的第一目标文本;或者,如前所述,在编辑模式下,可以设置编辑光标在显示界面中可见,在此情况下,也可以不以任何突显格式显示第一目标文本。

在又一个实施场景中,若在编辑模式下,在第一目标文本中插入新的预设分句符号,则可以将第一目标文本分为两个以预设分句符号结尾的第一子文本,并将编辑光标所在的第一子文本作为新的第一目标文本,在此基础上,在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本。上述方式,在第一目标文本中插入新的预设分句符号的情况下,将第一目标文本分为两个以预设分句符号结尾的第一子文本,并将编辑光标所在的第一子文本作为新的第一目标文本,从而在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本,能够随第一目标文本的编辑,同步更新并突显对应的第二目标文本,能够有利于提高文本显示的准确性。

在一个具体的实施场景中,可以以新插入的预设分句符号为界,将第一目标文本分为两个以预设分句符号结尾的第一子文本。请继续结合参阅图2,仍以第一目标文本“(2)支持随声译—中泽英、随声译—英译中两种同声翻译模式。”为例,若在“英译中”之后插入预设分句符号‘,’,则可以以该预设分句符号为界,将第一目标文本分为第一子文本“(2)支持随声译—中泽英、随声译—英译中,”和第一子文本“两种同声翻译模式”。其他情况可以以此类推,在此不再一一举例。

在另一个具体的实施场景中,在得到新的第一目标文本之后,也可以在第一区域,以第一预设突显格式显示新的第一目标文本;或者,如前所述,在编辑模式下,可以设置编辑光标在显示界面中可见,在此情况下,也可以不以任何突显格式显示第一目标文本。

在又一个实施场景中,在编辑结束之后,可以响应于用户在编辑结果的保存指令,退出编辑模式,在此情况下,可以收回虚拟键盘,以便用户继续校对原始文本和识别文本。

区别于前述实施例,在获取到用户对编辑模式的触发指令的情况下,获取用户在第一区域的第三点击坐标,并将编辑光标移动至第三点击坐标处,在此基础上,将编辑光标所在的第一子文本,作为一目标文本,故能够在编辑模式下,可以随着编辑光标的移动,同步更新第一目标文本,有利于提高文本显示的准确性。

请参阅图7,图7是本申请电子设备70一实施例的框架示意图。电子设备70包括存储器71、人机交互电路72和处理器73,存储器71和人机交互电路72耦接至处理器73,存储器71中存储有程序指令,处理器73用于执行程序指令以实现上述任一文本显示方法实施例中的步骤。具体地,电子设备70可以包括但不限于:手机、平板电脑、笔记本电脑等等,在此不做限定。

具体而言,处理器73用于控制其自身以及存储器71、人机交互电路72以实现上述任一文本显示方法实施例中的步骤。处理器73还可以称为cpu(centralprocessingunit,中央处理单元)。处理器73可能是一种集成电路芯片,具有信号的处理能力。处理器73还可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器73可以由集成电路芯片共同实现。

本公开实施例中,处理器73用于获取待识别图像;其中,待识别图像中含有原始文本;处理器73用于对待识别图像进行文本识别,得到原始文本对应的识别文本;处理器73用于控制人机交互电路72在显示界面的第一区域,显示识别文本并以第一预设突显格式显示识别文本中的第一目标文本;以及,处理器73用于控制人机交互电路72在显示界面的第二区域,显示原始文本并以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本。

上述方案,获取待识别图像,且待识别图像中含有原始文本,并对待识别图像进行文本识别,得到原始文本对应的识别文本,从而在显示界面的第一区域,显示识别文本并以第一预设突显格式显示识别文本中的第一目标文本,以及在显示界面的第二区域,显示原始文本并以第二预设突显格式显示原始文本中与第一目标文本对应的第二目标文本,故此,能够在显示界面的不同区域同时显示原始文本和识别文本,并且以第一预设突显格式显示第一目标文本,与此同时以第二预设突显格式显示与第一目标文本对应的第二目标文本,即能够在显示界面的不同区域同时突显出原始文本和识别文本中相关联的目标文本,从而在文本校对过程中,只需关注显示界面的不同区域所突显的目标文本即可,进而能够有助于帮助用户快速校对识别文本,有助于提高文本校对效率。

在一些公开实施例中,识别文本包含若干第一子文本,且若干第一子文本均以预设分句符号结尾,第一目标文本是由用户在若干第一子文本中选择得到的,第二目标文本是基于第一目标文本获取到的。

区别于前述实施例,识别文本包含若干第一子文本,且若干第一子文本均以预设分句符号结尾,第一目标文本是由用户在若干第一子文本中选择得到的,而第二目标文本是基于第一目标文本获取得到的,即在文本显示过程中,用户可以在识别文本所包含的若干第一子文本中选择得到第一目标文本,在此基础上,分别在显示界面的不同区域突显第一目标文本和与第一目标文本对应的第二目标文本,故能够有利于提升用户体验。

在一些公开实施例中,每一第一子文本包含若干识别字符,处理器73用于获取第一目标文本中的识别字符在原始文本中对应的原始字符的位置信息;其中,位置信息包含原始字符在待识别图像中的位置坐标,且位置信息是对待识别图像进行文本识别得到的。处理器73用于基于对应的原始字符的位置信息,得到第二目标文本。

区别于前述实施例,每一第一子文本包含若干识别字符,在此基础上,获取第一目标文本中的识别字符在原始文本中对应的原始字符的位置信息,且位置信息包含原始字符在待识别图像中的位置坐标,而位置信息是对待识别图像进行文本识别得到的,并基于对应的原始字符的位置信息,得到第二目标文本,即根据第一目标文本中识别字符在原始文本中对应的原始字符的位置信息,确定第二目标文本,能够有利于提高获取第二目标文本的准确性。

在一些公开实施例中,处理器73用于获取用户在第一区域的第一点击坐标,并将第一点击坐标所在的识别字符作为第一目标字符;处理器73用于将第一目标字符所属的第一子文本,作为第一目标文本。

区别于前述实施例,通过获取用户在第一区域的第一点击坐标,并将第一点击坐标所在的识别字符作为第一目标字符,从而将第一目标字符所属的第一子文本,作为第一目标文本,故仅需用户在第一区域点击即可获取用户点击位置处的第一目标文本,能够有利于提高获取第一目标文本的便利性。

在一些公开实施例中,原始文本包含若干第二子文本,且若干第二子文本均以预设分句符号结尾,第二目标文本是由用户在若干第二子文本中选择得到的,第一目标文本是基于第二目标文本获取到的。

区别于前述实施例,原始文本包含若干第二子文本,且若干第二子文本均以预设分句符号结尾,第二目标文本是由用户在若干第二子文本中选择得到的,而第一目标文本是基于第二目标文本获取到的,即在文本显示过程中,用户可以在原始文本所包含的若干第二子文本中选择得到第二目标文本,在此基础上,分别在显示界面的不同区域突显第二目标文本和与第二目标文本对应的第一目标文本,故能够有利于提升用户体验。

在一些公开实施例中,每一第二子文本均包含若干原始字符,处理器73用于获取第二目标文本中各个原始字符分别在识别文本中对应的识别字符;处理器73用于将对应的识别字符所组成的子文本,作为第一目标文本。

区别于前述实施例,每一第二子文本均包含若干原始字符,通过获取第二目标文本中各个原始字符分别在识别文本中对应的识别字符,并将对应的识别字符所组成的子文本,作为第一目标文本,能够有利于提高获取第一目标文本的准确性。

在一些公开实施例中,处理器73用于获取用户在第二区域的第二点击坐标,并将第二点击坐标所在的原始字符作为第二目标字符;处理器73用于将第二目标字符所属的第二子文本,作为第二目标文本。

区别于前述实施例,通过获取用户在第二区域的第二点击坐标,并将第二点击坐标所在的原始字符作为第二目标字符,从而将第二目标字符所属的第二子文本,作为第二目标文本,故仅需用户在第二区域点击即可获取第二目标文本,能够有利于提高获取第二目标文本的便利性。

在一些公开实施例中,识别文本包含若干第一子文本,且若干第一子文本均以预设分句符号结尾,处理器73用于在获取到用户对编辑模式的触发指令的情况下,获取用户在第一区域的第三点击坐标,并将编辑光标移动至第三点击坐标处;处理器73用于将编辑光标所在的第一子文本,作为第一目标文本。

区别于前述实施例,在获取到用户对编辑模式的触发指令的情况下,获取用户在第一区域的第三点击坐标,并将编辑光标移动至第三点击坐标处,在此基础上,将编辑光标所在的第一子文本,作为一目标文本,故能够在编辑模式下,可以随着编辑光标的移动,同步更新第一目标文本,有利于提高文本显示的准确性。

在一些公开实施例中,处理器73用于在删除第一目标文本中的预设分句符号或者预设分句符号修改为非分句符号的情况下,将第一目标文本和第一目标文本之后一个第一子文本组合为新的第一目标文本;以及,处理器73用于控制人机交互电路72在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本。

区别于前述实施例,在删除第一目标文本中的预设分句符号或者预设分句符号修改为非分句符号的情况下,将第一目标文本和第一目标文本之后一个第一子文本组合为新的第一目标文本,并在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本,能够随第一目标文本的编辑,同步更新并突显对应的第二目标文本,能够有利于提高文本显示的准确性。

在一些公开实施例中,处理器73用于在第一目标文本中插入新的预设分句符号的情况下,将第一目标文本分为两个以预设分句符号结尾的第一子文本,并将编辑光标所在的第一子文本作为新的第一目标文本;以及,处理器73用于控制人机交互电路72在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本。

区别于前述实施例,在第一目标文本中插入新的预设分句符号的情况下,将第一目标文本分为两个以预设分句符号结尾的第一子文本,并将编辑光标所在的第一子文本作为新的第一目标文本,从而在第二区域,以第二预设突显格式显示原始文本中与新的第一目标文本对应的第二目标文本,能够随第一目标文本的编辑,同步更新并突显对应的第二目标文本,能够有利于提高文本显示的准确性。

请参阅图8,图8是本申请存储装置80一实施例的框架示意图。存储装置80存储有能够被处理器运行的程序指令81,程序指令81用于实现上述任一文本显示方法实施例中的步骤。

上述方案,能够在显示界面的不同区域同时突显出原始文本和识别文本中相关联的目标文本,从而在文本校对过程中,只需关注显示界面的不同区域所突显的目标文本即可,进而能够有助于帮助用户快速校对识别文本,有助于提高文本校对效率。

在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。

上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1