字符注册方法、装置、电子设备及存储介质与流程

文档序号:22739228发布日期:2020-10-31 09:20阅读:来源:国知局

技术特征:

1.一种字符注册方法,其特征在于,所述方法包括:

获取待注册字符图像及所述待注册字符图像中包括的字符;

利用预先训练的特征提取网络,提取所述待注册字符图像中字符的深度学习特征,得到待注册字符深度学习特征;

将所述待注册字符深度学习特征添加为所述待注册字符图像中包括的字符的样本字符深度学习特征;

其中,所述样本字符深度学习特征用于与目标字符深度学习特征进行特征差异的计算,所述目标字符深度学习特征为所述特征提取网络提取的待识别字符图像的字符深度学习特征,且最小的特征差异的样本字符深度学习特征所对应的字符为所述待识别字符图像的特征比对字符识别结果。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取待识别字符图像;

利用所述特征提取网络,提取所述待识别字符图像的字符深度学习特征,得到目标字符深度学习特征;

计算所述目标字符深度学习特征与各样本字符深度学习特征的特征差异,其中,所述样本字符深度学习特征是根据所述特征提取网络提取的样本字符图像的字符深度学习特征得到的;

选取与所述目标字符深度学习特征特征差异最小的样本字符深度学习特征所对应的字符,得到所述目标字符深度学习特征的特征比对字符识别结果。

3.根据权利要求1所述的方法,其特征在于,将所述待注册字符深度学习特征添加为所述待注册字符图像中包括的字符的样本字符深度学习特征,包括:

若已经存储有所述待注册字符图像标记的字符,则将所述待注册字符深度学习特征添加为所述待注册字符图像标记的字符的样本字符深度学习特征;

若未存储有所述待注册字符图像标记的字符,则新增并存储所述待注册字符图像标记的字符,将所述待注册字符深度学习特征作为所述待注册字符图像标记的字符的样本字符深度学习特征。

4.根据权利要求2所述的方法,其特征在于,在所述利用所述特征提取网络,提取所述待识别字符图像的字符深度学习特征,得到目标字符深度学习特征之后,所述方法还包括:

利用预先训练的字符分类网络,对所述目标字符深度学习特征进行字符分类,得到所述目标字符深度学习特征的分类字符识别结果及所述分类字符识别结果的置信度;

当所述分类字符识别结果的置信度大于预设置信度阈值时,将所述分类字符识别结果作为所述待识别字符图像的字符识别结果。

5.根据权利要求4所述的方法,其特征在于,所述计算所述目标字符深度学习特征与各样本字符深度学习特征的特征差异,包括:

当所述分类字符识别结果的置信度不大于预设置信度阈值时,计算所述目标字符深度学习特征与各样本字符深度学习特征的特征差异。

6.根据权利要求4或5所述的方法,其特征在于,在所述选取与所述目标字符深度学习特征特征差异最小的样本字符深度学习特征所对应的字符,得到所述目标字符深度学习特征的特征比对字符识别结果之后,所述方法还包括:

当所述分类字符识别结果的置信度不大于预设置信度阈值、且所述特征比对字符识别结果对应的特征差异小于预设差异度阈值时,将所述特征比对字符识别结果作为所述待识别字符图像的字符识别结果。

7.根据权利要求2所述的方法,其特征在于,所述方法还包括:

获取白名单配置消息,其中,所述白名单配置消息表示在白名单中对指定字符的样本字符深度学习特征进行添加或删除;

按照所述白名单配置消息,在所述白名单中添加或删除指定字符的样本字符深度学习特征;

所述计算所述目标字符深度学习特征与各样本字符深度学习特征的特征差异,包括:

计算所述目标字符深度学习特征与所述白名单中的各样本字符深度学习特征的特征差异。

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取待新增的目标字符及所述目标字符的目标字符形式;

生成包含所述目标字符形式的目标字符的图像,得到目标字符图像;

利用预先训练的特征提取网络,提取所述目标字符图像的字符深度学习特征;

新增及存储所述目标字符,并将所述目标字符图像的字符深度学习特征保存为所述目标字符的样本字符深度学习特征。

9.根据权利要求1所述的方法,其特征在于,预先训练特征提取网络的步骤包括:

获取训练样本集及待训练的特征提取网络,其中,所述训练样本集包括多个三元组样本,所述三元组样本包括锚样本图像、正样本图像及负样本图像,同一所述三元组样本中的锚样本图像中的字符与正样本图像中的字符相同,同一所述三元组样本中的锚样本图像中的字符与负样本图像中的字符不同;

在所述训练样本集中选取一三元组样本,将选取的三元组样本的锚样本图像、正样本图像及负样本图像分别输入到特征提取网络中进行特征提取,得到选取的三元组样本中的锚样本图像的字符深度学习特征、正样本图像的字符深度学习特征及负样本图像的字符深度学习特征;

根据选取的三元组样本中的锚样本图像的字符深度学习特征、正样本图像的字符深度学习特征及负样本图像的字符深度学习特征,计算特征提取网络的损失,其中,特征提取网络的损失与第一特征差异正相关,特征提取网络的损失与第二特征差异负相关,所述第一特征差异为选取的锚样本图像的字符深度学习特征与选取的正样本图像的字符深度学习特征的特征差异,所述第二特征差异为选取的锚样本图像的字符深度学习特征与选取的负样本图像的字符深度学习特征的特征差异;

根据特征提取网络的损失调整特征提取网络的参数,在所述训练样本集中选取一三元组样本继续训练,直至满足预设结束条件,得到训练好的特征提取网络。

10.一种字符注册装置,其特征在于,所述装置包括:

注册信息获取模块,用于获取待注册字符图像及所述待注册字符图像中包括的字符;

注册特征提取模块,用于利用预先训练的特征提取网络,提取所述待注册字符图像中字符的深度学习特征,得到待注册字符深度学习特征;

注册特征保存模块,用于将所述待注册字符深度学习特征添加为所述待注册字符图像中包括的字符的样本字符深度学习特征;

其中,所述样本字符深度学习特征用于与目标字符深度学习特征进行特征差异的计算,所述目标字符深度学习特征为所述特征提取网络提取的待识别字符图像的字符深度学习特征,且最小的特征差异的样本字符深度学习特征所对应的字符为所述待识别字符图像的特征比对字符识别结果。

11.一种电子设备,其特征在于,包括处理器及存储器;

所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-9任一所述的字符注册方法。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9任一所述的字符注册方法。


技术总结
本申请实施例提供了字符注册方法、装置、电子设备及存储介质,采用特征比对的方式,选取与目标字符深度学习特征特征差异最小的样本字符深度学习特征所对应的字符,得到特征比对字符识别结果,不用基于分类器的分类,因此在注册新字符时,仅需要提取新字符的深度学习特征,并保存为相应字符的样本字符深度学习特征即可,不用重新进行训练,能够降低新增字符时用户的训练成本。受应用场景的影响小,可以直接利用在线开放平台中的深度学习网络进行字符识别,用户不用上传其应用场景的字符图像对深度学习网络进行再次训练,能够降低用户的训练成本。尤其适合开放平台线上中文字符识别场景,可基于特定场景快速定制,省去用户的训练工作。

技术研发人员:徐博
受保护的技术使用者:上海高德威智能交通系统有限公司
技术研发日:2020.08.03
技术公布日:2020.10.30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1