一种信息处理方法、装置及设备与流程

文档序号:21638753发布日期:2020-07-29 02:49阅读:来源:国知局

技术特征:

1.一种信息处理方法,包括:

获取待录入信息对应的电子图像;

将所述电子图像分类为预设的图像类型;

根据所述图像类型对分类后的所述电子图像进行目标检测,以将所述电子图像中所包含的若干目标图像内容识别为所述目标图像内容在计算机系统中对应的信息元素;

将所述信息元素按预设的排版规则,排版生成所述待录入信息对应的数字化信息。

2.如权利要求1所述的方法,当所述图像类型为包含有字符的图像类型时,根据所述图像类型对分类后的所述电子图像进行目标检测,包括:

采用残差神经网络提取所述电子图像中所包含的字符的特征;

根据所述特征和预设的字符特征集,采用长短期记忆网络提取所述电子图像中的字符,以对所述电子图像中所包含的字符完成目标检测。

3.如权利要求2所述的方法,所述方法还包括:通过迁移学习补充所述字符特征集中的样本数据。

4.如权利要求1所述的方法,根据所述图像类型对分类后的所述电子图像进行目标检测,包括:

根据所述图像类型,基于预设的数据集利用mobilenet-ssd对分类后的所述电子图像进行目标检测。

5.如权利要求4所述的方法,所述方法还包括:

根据vocdevkit和/或voc2012数据集格式,构造所述数据集。

6.如权利要求4所述的方法,在目标检测后,所述方法还包括:

将所述若干目标图像内容归类;

将归类后的所述目标图像内容添加到所述数据集。

7.如权利要求6所述的方法,在将归类后的所述目标图像内容添加到所述数据集后,所述方法还包括:基于所述数据集,训练所述mobilenet-ssd。

8.如权利要求1所述的方法,所述方法还包括:将所述数字化信息展示在数字化界面中。

9.如权利要求8所述的方法,所述方法还包括:通过所述数字化界面提供若干处理接口,以通过所述处理接口对所述数字化信息进行所述处理接口对应的处理操作。

10.如权利要求1所述的方法,将所述信息元素按预设的排版规则,排版生成所述待录入信息对应的数字化信息,包括:

生成所述信息元素中的字符元素对应的字符区域对象和生成所述信息元素中的图形元素对应的图形区域对象;

确定所述信息元素需占用的版面参数,所述版面参数包括用于排版所述字符区域对象的坐标值和用于排版所述图形区域对象的坐标值;

按预设的排版规则,根据所述版面参数排版所述字符区域对象和所述图形区域对象,以生成所述待录入信息对应的数字化信息。

11.如权利要求10所述的方法,所述方法还包括:

判断所述字符区域对象与所述图形区域对象是否存在交叉;

若是,则确定所述字符区域对象与所述图形区域对象发生交叉的交叉区域;

分割所述交叉区域,其中分割所述交叉区域的分割线的斜率应满足:所述斜率使得存在交叉的所述字符区域对象和所述图形区域对象之中任意一个距离分割线最近的点到分割线的直线距离最远;

根据分割后的所述交叉区域,调整存在交叉的所述字符区域对象和所述图形区域对象的版面参数。

12.一种信息处理装置,包括:

获取模块,获取待录入信息对应的电子图像;

分类模块,将所述电子图像分类为预设的图像类型;

检测模块,根据所述图像类型对分类后的所述电子图像进行目标检测,以将所述电子图像中所包含的若干目标图像内容识别为所述目标图像内容在计算机系统中对应的信息元素;

排版模块,将所述信息元素按预设的排版规则,排版生成所述待录入信息对应的数字化信息。

13.如权利要求12所述的装置,当所述图像类型为包含有字符的图像类型时,根据所述图像类型对分类后的所述电子图像进行目标检测,包括:

采用残差神经网络提取所述电子图像中所包含的字符的特征;

根据所述特征和预设的字符特征集,采用长短期记忆网络提取所述电子图像中的字符,以对所述电子图像中所包含的字符完成目标检测。

14.如权利要求12所述的装置,根据所述图像类型对分类后的所述电子图像进行目标检测,包括:

根据所述图像类型,基于预设的数据集利用mobilenet-ssd对分类后的所述电子图像进行目标检测。

15.如权利要求14所述的装置,所述装置还包括:

数据集模块,根据vocdevkit和/或voc2012数据集格式,构造所述数据集。

16.如权利要求12所述的装置,所述装置还包括:

展示模块,将所述数字化信息展示在数字化界面中。

17.如权利要求16所述的装置,所述装置还包括:

接口模块,通过所述数字化界面提供若干处理接口,以通过所述处理接口对所述数字化信息进行所述处理接口对应的处理操作。

18.如权利要求12所述的装置,将所述信息元素按预设的排版规则,排版生成所述待录入信息对应的数字化信息,包括:

生成所述信息元素中的字符元素对应的字符区域对象和生成所述信息元素中的图形元素对应的图形区域对象;

确定所述信息元素需占用的版面参数,所述版面参数包括用于排版所述字符区域对象的坐标值和用于排版所述图形区域对象的坐标值;

按预设的排版规则,根据所述版面参数排版所述字符区域对象和所述图形区域对象,以生成所述待录入信息对应的数字化信息。

19.如权利要求18所述的装置,所述装置还包括:分割模块;

所述分割模块用于:

判断所述字符区域对象与所述图形区域对象是否存在交叉;

若是,则确定所述字符区域对象与所述图形区域对象发生交叉的交叉区域;

分割所述交叉区域,其中分割所述交叉区域的分割线的斜率应满足:所述斜率使得存在交叉的所述字符区域对象和所述图形区域对象之中任意一个距离分割线最近的点到分割线的直线距离最远;

根据分割后的所述交叉区域,调整存在交叉的所述字符区域对象和所述图形区域对象的版面参数。

20.一种用于信息处理的电子设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

获取待录入信息对应的电子图像;

将所述电子图像分类为预设的图像类型;

根据所述图像类型对分类后的所述电子图像进行目标检测,以将所述电子图像中所包含的若干目标图像内容识别为所述目标图像内容在计算机系统中对应的信息元素;

将所述信息元素按预设的排版规则,排版生成所述待录入信息对应的数字化信息。


技术总结
本说明书实施例公开了一种信息处理方法、装置及设备。其中信息处理方案,包括:获取待录入信息对应的电子图像;将所述电子图像分类为预设的图像类型;根据所述图像类型对分类后的所述电子图像进行目标检测,以将所述电子图像中所包含的若干目标图像内容识别为所述目标图像内容在计算机系统中对应的信息元素;将所述信息元素按预设的排版规则,排版生成所述待录入信息对应的数字化信息。

技术研发人员:徐达峰
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2020.04.01
技术公布日:2020.07.28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1