一种基于清分机的多国纸币序列号字符识别方法

文档序号:8544063阅读:412来源:国知局
一种基于清分机的多国纸币序列号字符识别方法
【技术领域】
[0001] 本发明属于自动识别技术领域,特别地设及一种基于清分机的多国纸币序列号字 符识别方法,在模板训练部分中设及了逻辑回归模型。
【背景技术】
[0002] 字符模板生成是纸币序列号字符识别的重要步骤。纸币序列号识别首先用预训练 的方式产生字符模板,然后通过将输入的字符图像与字符模板进行匹配而得到识别结果。 因此字符模板生成该个步骤对后续识别结果影响较大。
[0003] W往的字符模板生成往往是通过手工调试产生的,调试的方法是首先获得每个字 符的统计矩巧
【主权项】
1. 一种基于清分机的多国纸币序列号字符识别方法,其特征在于,该方法为:首先对 序列号图像I进行分割,获得多个字符的图像,将每个字符的图像的大小归一化为mXn,即 归一化后的字符图像X e Rmx",IT…表示m行η列的实数矩阵;在此基础上,归一化后的字 符图像X按以下步骤进行处理: 步骤1 :首先对此字符图像X进行二值化处理,获得该字符图像X的二值化矩阵 X'e股_,然后将此二值化矩阵V转换为二值化向量i e ITm。其中,二值化处理所使用的 阈值通过双峰法计算得到。 步骤2 :将二值化向量i与模板集W中的各个子模板进行匹配。匹配的方法是将 二值化向量分分别与各个子模板进行点乘,并对点乘获得乘积矩阵的各个元素求和, 得到元素总和r,若i与字符k的匹配子模板W k点乘时,元素总和r取得最大值,即
2' = 1,2,···,_,则k即为识别结果。
2. 根据权利要求1所述的方法,其特征在于,所述步骤2中的模板集W中的各个子模板 通过以下方法得到: (2. 1)输入N个字符图像,获得各个图像的二值化向量。所述二值化向量通过以下 方式得到:首先对输入的每个字符图像进行二值化处理,获得该字符图像的二值化矩阵 之,户H·!,然后将此二值化矩阵X'』转换为二值化向量七eE?。其中,二值 化处理所使用的阈值通过双峰法计算得到。将这N个字符图像的二值化向量作为训练集X 中的元素,组成训练集X,即1 = _丨无,毛,…,4}。 (2. 2)根据训练集X,得到任一字符c的预匹配模板W。为:W。= argmaxl ( Θ ) 其中:
,Yj为真实标记值,为〇或1,字符 C的标记值为1,其它字符的标记值为O ;Xj为训练集X中的第j个元素,即Z7 =七,函数
应用梯度下降法进行迭代即可求解出最优参数W。,每次迭代中,参数Θ根据下式进行 更新直至收敛:
(3)对字符C的预匹配模板W。进行定点化操作,得到字符C的预匹配模板W /,具体方 式如下: ffcF= (ff c-min (Wc)). / (max (Wc) -min (Wc)) * (2P-1) 其中./是点除操作,P是定点化时模板w。中每个元素所需转化成的整数位数。
【专利摘要】本发明实施例公开了一种基于清分机的多国纸币序列号字符识别方法,对序列号图像进行分割,获得多个字符的图像,将每个字符的图像的大小归一化,在此基础上,对归一化后的字符图像x按以下步骤处理:对x进行二值化处理,获得字符图像的二值化矩阵x′,并将其转换为二值化向量其中,二值化处理所使用的阈值通过双峰法计算得到。然后通过对训练集X训练,产生模板集W各个子模板的结果。最后将此模板W与字符图像进行匹配,获得识别结果。
【IPC分类】G06K9-62
【公开号】CN104866867
【申请号】CN201510253055
【发明人】于慧敏, 施成燕, 李天豪
【申请人】浙江大学
【公开日】2015年8月26日
【申请日】2015年5月15日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1