本发明涉及一种基于图像特征信息的数字识别方法,属于数字识别领域。
背景技术:
:由于图像获取装置能够比较快速而且方便的获取图像的特点,图像处理技术在实际的生产应用中有较多的用处,尤其是烟叶的打叶复烤领域,比如现场流量的监控,原料质量的监控,成品的检验等,而且往往还能在生产环境比较恶劣,要求实时分析的工艺段具备较强的优势;有些时候,不仅要对生产的实际状况进行监控,而且还需要把监控的结果与相对应的工位或者标识进行关联,因此图像中的数字识别是图像处理以及应用中的重要一环;在以往的图像的数字识别中有根据图像的色彩直方分布图的相似性进行识别的,如周秀芝的专利申请号为201510456753.8的专利,
专利名称:为:一种梯度图像和相似性特征加权的数字识别方法;基于图像面积以及基础数字模板建模数据的有模型识别,如苏州大学申请的专利号为201310246733.9的专利,
专利名称:为:基于图像协方差特征的手写体数字识别方法及装置;在以往的图像识别的过程中,由于实际的生产现场情况复杂多变,上述方法在实际的应用过程中一般会遇到如下的问题:(1)外界光线的变化对图像颜色分布等的影响,外界环境的变化会影响颜色分布的变化,降低识别的精度;(2)识别数字位置的不固定性对提取特征的影响;识别位置的不同会影响其图像相似性的计算;因为在铺叶台的数字位置信息会发生平移;一种新的可应用的数字识别方法必须要保证能够适用于不同的外界环境的变化,不同位置的平移以及旋转等的变化,不同数字大小的识别,局部相似性识别。如何准确并简单的从可移动,外界光在不断的变化,位置平移以及旋转的环境中准确的识别出图像中相应的数字信息为本发明的研究内容。技术实现要素:本发明的目的在于提供一种基于图像特征信息的数字识别方法,以解决上述问题。本发明采用了如下技术方案:一种基于图像特征信息的数字识别方法,其特征在于,包括如下步骤:步骤一、获取标识数字的图像;步骤二、对步骤一中获取的图像进行标准差滤波;步骤三、对步骤二中滤波后的图像进行二值化处理;步骤四、求解数字的连通区域;步骤五、提取数字的长度、宽度、面积和离心率特征;步骤六、提取测试图像中的数字图像;步骤七、构造相似度函数;步骤八、获取测试图片数字的特征;步骤九、计算测试图片中数字与标识数字图像的相似度;步骤十、若步骤九中的相似度小于阈值p,则说明图像中没有数字;若步骤九中的相似度大于阈值p,则识别图像中的数字。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:其中,步骤一中,标识数字为数字1~8。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:其中,步骤三中,二值化的过程如下:计算图像灰度处理的阈值t,t的计算方法为:按图像的灰度特性,将图像分成背景和目标两部分,背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,假定一张图片共有n个像素,其中灰度值小于阈值t的像素数为n1,大于等于阈值t的像素数为n2,(n1+n2=n),w1和w2表示这两种像素各自的比重,w1=n1/n(1)w2=n2/n(2)再假定,所有灰度值小于阈值t的像素的平均值和方差分别为μ1和σ1,所有灰度值大于等于阈值t的像素的平均值和方差分别为μ2和σ2,于是,可以得到类间差异P,t值为使得P取得最大值的数据;t值得求解可以使用非线性规划与遗传算法;P=w1w2(μ1-μ2)2(3)以求解的t值作为阈值,进行对图像矩阵J二值化处理;得到二值化矩阵Img。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:其中,步骤四中,连通区域的寻找方法为:根据二值化矩阵Img,来判别每个像素坐标点周围是否有相同灰度的数据分布,具体的而言就是遍历标记图像,按标记图像的像素值索引标记集合,找到标记集合中代表当前集合最小的值赋值给原图像当前位置的像素得到烟叶每个格子区域图像的连通关系,可以按照四连通寻找区域或者八连通寻找;得出每个连通区域的序号num矩阵;以及每个连通区域的类型。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:对每个连通区域所在的像素位置来计算该连通区域所包含的像素点,像素的总个数为像素面积。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:其中,对每个连通区域num=i,寻找包含每个连通区域num=i,i=1:max(num)的最小外接矩形;矩形的长a,宽b,即为每个连通区域的长,宽。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:对每个连通区域num,寻找包含每个连通区域num=(i),i=1:max(num)的拟合椭圆曲线;椭圆的长轴c,短轴为d,椭圆的焦距为f,并求出每个连通区域的离心率e。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:步骤六中,对测试图片进行颜色分割,分割出数字所在的区域。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:构造相似性度量函数:sim(i)=abs(corr(KQ(i,:),,KQ1,))sqrt((KQ1-KQ(i,:))*(KQ1-KQ(i,:),))+erro---(13)]]>i=1~8;corr表示的是相关系数,erro是一个设定的很小的数字,取erro<0.000000005;sqrt为平方根;sum为求和,abs为绝对值。进一步,本发明的基于图像特征信息的数字识别方法,还可以具有这样的特征:阈值p设为0.5%。发明的有益效果本发明在方法上解决了在传统的数字识别的过程中外界的环境变化,测试的位置变化等因素对数字的识别带来的影响;本发明在应用上采用图像数字的不变特征,解决了数字识别的稳定性与精准度,为实际生产中数字的识别,以及数字的识别与工艺,原料质量的关联,图像处理应用打下了良好的基础。附图说明图1是烟叶的空白皮带标识数字图;图2是标识数字图像的标准偏差滤波图;图3是准偏差滤波二值化处理图;图4是连通区域数字分布坐标图;图5是连通区域最小外接矩形图;图6是测试图片原始图;图7是测试图片数字区域分割图;图8是测试数字位置发生了偏移原始图;图9是测试数字外界光线背景发生了变化原始图;图10是测试数字位置发生旋转并且外界光源同时变化图;图11是一种基于图像特征信息的数字识别方法流程图。具体实施方式以下结合附图来说明本发明的具体实施方式。实施例1:如图11所示,基于图像特征信息的数字识别方法的步骤包括:步骤101、首先在静止的状态获取基准数字1-8的单幅图像,数字如图1所示。步骤102、对获取的图像数据进行标准差滤波,在计算图像的局部颜色标准差时,在对输入图像I执行标准差滤波时,设置参数为指定邻域的s维单位矩阵,s为奇数的自然数,滤波后的图像数据命名为Ji,i=1...8;步骤103、二值化处理,具体包括以下步骤:步骤103a:计算图像灰度处理的阈值t,t的计算方法为:按图像的灰度特性,将图像分成背景和目标两部分。背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。假定一张图片共有n个像素,其中灰度值小于阈值t的像素数为n1,大于等于阈值t的像素数为n2,(n1+n2=n)。w1和w2表示这两种像素各自的比重。w1=n1/n(1)w2=n2/n(2)再假定,所有灰度值小于阈值t的像素的平均值和方差分别为μ1和σ1,所有灰度值大于等于阈值t的像素的平均值和方差分别为μ2和σ2。于是,可以得到类间差异P,t值为使得P取得最大值的数据;t值的求解可以使用非线性规划与遗传算法;P=w1w2(μ1-μ2)2(3)获取图像的滤波矩阵J;(以数字8为例,下同)对获取的图像数据进行标准差滤波,在计算图像的局部颜色标准差时,在对输入图像I执行标准差滤波时,设置参数为指定邻域的s维单位矩阵,s为奇数的自然数,在本实施方式中,选取s=9;滤波后的图像数据命名为Ji,i=1...8;得到如图2所示的图形。根据式(3)求得阈值t为0.2275;步骤103b、对J进行二值化处理:根据求解的t值作为阈值,进行对图像矩阵J二值化处理;得到二值化矩阵Img,得到的图像如图3所示。步骤104、求解数字的连通区域,具体包括如下步骤:步骤104a:对图像数据进行归一化处理,实现图像矩阵的归一化操作。所谓归一化就是使矩阵的每个元素的值都在0和1之间。步骤104b、求得连通区域的信息如下:连通区域的个数为1;连通区域的坐标图见图4。对Img的连通区域进行标记,包含了标记了Img中每个连通区域的类别标签,这些标签的值为1、2、num(num表示连通区域的个数)。连通区域的寻找方法为根据二值化矩阵Img,来判别每个像素坐标点周围是否有相同灰度的数据分布,具体的而言就是遍历标记图像,按标记图像的像素值索引标记集合,找到标记集合中代表当前集合最小的值赋值给原图像当前位置的像素得到烟叶每个格子区域图像的连通关系,可以按照4连通寻找区域或者8连通寻找;得出每个连通区域的序号num矩阵;以及每个连通区域的类型。步骤105和步骤106、提取数字的长宽度特征的方法如下:获取像素的最小外接矩阵:对每个连通区域num=i,寻找包含每个连通区域num=i,i=1:max(num)的最小外接矩形;矩形的长a,宽b,即为每个连通区域的长,宽;寻找最小矩形的方法如下:寻找所有num=i,i=1:max(num)的二维像素坐标;第一维数据的最小值a1,最大值a2,以及第二维数据的最小值b1,最大值b2,x=a1;x=a2;y=b1;y=b2;四条直线所确定的区域即为最小矩形;矩形的长a,宽b计算方式如下:a=max(a2-a1,b2-b1)(4)b=min(a2-a1,b2-b1)(5)如图5所示,计算的到长a=127;b=65。步骤107:对每个连通区域所在的像素位置来计算该连通区域所包含的像素点,像素的总个数为像素面积Area;获取图像的面积为4627像素。步骤108、提取数字的离心率特征:求得椭圆的拟合曲线,方法如下:对每个连通区域num,寻找包含每个连通区域num=(i),i=1:max(num)的拟合椭圆曲线;椭圆的长轴c,短轴为d,椭圆的焦距为f,椭圆的离心率e使用式6进行计算。e=fc=c2-d2c---(6)]]>拟合椭圆曲线的方法如下:首先寻找每个连通区域的坐标点;根据这些坐标点列出椭圆的代数基本形式:Ax2+Bxy+Cy2+Dx+Ey+F=0(7)c=2-2FA+C-B2+(A-CF)2---(8)]]>d=2-2FA+C+B2+(A-CF)2---(9)]]>运用包含但不限于遗传算法,蚁群算法,最小二乘等拟合出曲线方程;计算椭圆离心率为0.8819。步骤201(图11中未显示):根据求解i=1~8单幅图像数字中的,长,宽,区域面积,以及离心率构建特征矩阵KQ,形成不同数据的特征表标识;KQ=[a,b,Area,f];(10)表1图像数字1~8的KQ步骤109、获取测试图片的图像数据;本实施方式中的测试图像如图6所示。步骤109a:对测试图片的数据进行颜色分割,分割出数字所在的区域,分割后的图像如图7所示。步骤109b、求取测试图像的图像数字特征数据KQ1,结果见表2;表2实施例1中测试图像的KQ1像素长度像素宽度区域面积离心率1317736190.82462步骤109c、对已知的数据的特征标识矩阵KQ以及测试图像特征数据KQ1进行归一化,归一化的计算方法为:KQij,=KQij-KQ(xj)max(KQj)-min(KQj)---(11)]]>KQ1ij,=KQ1ij-KQ(xj)max(KQj)-min(KQj)---(12)]]>归一化特征矩阵KQ,见表3,表3中从上到下依次对应数字1到8的归一化特征矩阵KQ。表3归一化特征矩阵KQ0.6666670010.11111110.7388750.40074200.7323940.6325860.5288030.3333330.9718310.739978010.7887320.9109970.46474700.563380.6447220.49810.6666670.6760560.3585880.7171250.6111110.53521110.658166归一化特征矩阵KQ1,见表4:表4归一化特征矩阵KQ10.8333330.7042250.6292750.465422步骤111:获取测试图片的相似度数据,并判断图中有无数字:构造相似性度量函数:sim(i)=abs(corr(KQ(i,:),,KQ1,))sqrt((KQ1-KQ(i,:))*(KQ1-KQ(i,:),))+erro---(13)]]>i=1:8;corr表示的是相关系数,erro是一个设定的很小的数字,取erro<0.000000005;sqrt为平方根;sum为求和,abs为绝对值;表5本实施方式中的待测数字与基准数字的相似度数字标识12345678相似度0.2996060.2320270.6859070.5562132.6291660.7812310.0134830.499124步骤112,如果最大相似度max(sim)<P,则进入步骤114,测试图片中没有数字;步骤113,如果max(sim)≥P,则进入步骤115,求解测试图像数字特征:此时与数字标识特征相似度最大的特征所对应的数据即为测试图像的数字识别结果;阈值P的选择为0.5%。本实施方式中,求得识别的测试图片的数据为数字5。实施例2在测试数字位置发生了偏移的情况下,对比现有两种数字识别方法,即色彩分布识别方法与数字面积识别方法与本发明方法对数字识别的效果。如图8所示,其中文件23-29表征的是测试图像与数据模板图像在原位置,相机扫描的图片;30-36表征的是测试图片位置发生偏移并产生了旋转拍摄的图片。表6现有两种数字识别方与本发明的方法对比准确度对比,结果如表7所示。表7各种数字识别方法在数字位置发生了偏移的情况下准确度的对比表方法名称色彩分布识别数字面积识别本方法识别原位置测试准确度85.714%42.857%100%位置变化后测试准确度28.571%42.857%85.714%实施例3在外界光线背景发生了变化的情况下,对比现有两种数字识别方法与本发明方法对数字识别的效果。如图9所示,文件37-44表征的是测试图像的位置发生了平移,测试样本的外界光线发生了较大程度的变化,主要是指外界光线变强。表8光线变化时现有两种数字识别方与本发明的方法对比准确度对比结果如表9所示:表9各种数字识别方法在背景光线发生变化的情况下识别的准确率。方法名称色彩分布识别数字面积识别本方法识别背景光线发生变化测试准确度12.500%0%100%实施例4在测试数字位置发生旋转并且外界光源同时变化的情况下,对比现有两种数字识别方法与本发明方法对数字识别的效果。如图10所示,其中文件45-56表征的是测试图像的位置发生了旋转,测试样本的外界光线发生了较大程度的变化,主要是指外界光线变强。各方法对各图的检测结果如表10所示。表10数字位置发生旋转并且外界光源同时变化时各识别方法的对比4)准确度对比,见表11。表11准确度对比当前第1页1 2 3