1.一种图像内文字识别方法,其特征在于,所述方法包括:
步骤a:获取包含文字的原始图像数据集及标签集,对所述原始图像数据集进行局部亮化处理得到标准图像数据集;
步骤b:将所述标准图像数据集进行仿射变换生成特征候选区域集;
步骤c:基于具有初始内部参数的卷积操作和池化操作从所述特征候选区域集中提取到特征矩阵集,并根据所述特征矩阵集进行激活操作后预测出文字集;
步骤d:将所述文字集与所述标签集进行相同比对,若所述文字集与所述标签集的相同准确率小于预设阈值,则调整所述卷积操作和所述池化操作的内部参数,并返回步骤c重新预测,若所述文字集与所述标签集的相同准确率大于所述预设阈值,则输出所述卷积操作和所述池化操作此时的内部参数作为最佳内部参数;
步骤e:接收用户输入的图像,将用户输入的所述图像执行所述仿射变换,并执行具有所述最佳内部参数的卷积操作和池化操作后,通过所述激活操作识别出所述图像中的文字并输出。
2.如权利要求1所述的图像内文字识别方法,其特征在于,所述标签集包括标签文字集和标签位置集;
所述标签文字集记录所述原始图像数据集内图像的文字;
所述标签位置集记录所述原始图像数据集内图像的文字在所述图像内的坐标位置。
3.如权利要求2所述的图像内文字识别方法,其特征在于,所述局部亮化处理包括:
根据所述标签位置集从所述原始图像数据集中找到文字图像区域g(x,y);
根据所述文字图像区域g(x,y)计算得到亮度线性增强函数e(x,y);
根据亮度线性增强函数e(x,y)增强所述文字图像区域g(x,y)的亮度,完成所述局部亮化处理。
4.如权利要求3中所述的图像内文字识别方法,其特征在于,所述根据所述亮度线性增强函数e(x,y)增强所述文字图像区域g(x,y)的亮度,包括利用下述公式计算增强后的文字图像区域:
其中,f(x,y)为增强后的文字图像区域,n为所述文字图像区域的亮度平均值,(x1,y1)为所述文字图像区域左下方坐标,n1为所述文字图像区域左下方坐标的亮度值,(x4,y4)为所述文字图像区域右上方坐标,n4为所述文字图像区域右上方坐标的亮度值。
5.如权利要求1所述的图像内文字识别方法,其特征在于,所述卷积操作和池化操作,包括:
预先构建卷积模板并确定卷积步长;
根据所述卷积步长,将所述卷积模板与所述特征候选区域集进行计算得到卷积操作后的卷积矩阵集,完成所述卷积操作;
选择所述卷积矩阵集中矩阵的最大值或平均值替代所述卷积矩阵集,完成所述池化操作。
6.一种图像内文字识别装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的图像内文字识别程序,所述图像内文字识别程序被所述处理器执行时实现如下步骤:
步骤a:获取包含文字的原始图像数据集及标签集,对所述原始图像数据集进行局部亮化处理得到标准图像数据集;
步骤b:将所述标准图像数据集进行仿射变换生成特征候选区域集;
步骤c:基于具有初始内部参数的卷积操作和池化操作从所述特征候选区域集中提取到特征矩阵集,并根据所述特征矩阵集进行激活操作后预测出文字集;
步骤d:将所述文字集与所述标签集进行相同比对,若所述文字集与所述标签集的相同准确率小于预设阈值,则调整所述卷积操作和所述池化操作的内部参数,并返回步骤c重新预测,若所述文字集与所述标签集的相同准确率大于所述预设阈值,则输出所述卷积操作和所述池化操作此时的内部参数作为最佳内部参数;
步骤e:接收用户输入的图像,将用户输入的所述图像执行所述仿射变换,并执行具有所述最佳内部参数的卷积操作和池化操作后,通过所述激活操作识别出所述图像中的文字并输出。
7.如权利要求6所述的图像内文字识别装置,其特征在于,所述标签集包括标签文字集和标签位置集;
所述标签文字集记录所述原始图像数据集内图像的文字;
所述标签位置集记录所述原始图像数据集内图像的文字在所述图像内的坐标位置。
8.如权利要求7所述的图像内文字识别装置,其特征在于,所述局部亮化处理包括:
根据所述标签位置集从所述原始图像数据集中找到文字图像区域g(x,y);
根据所述文字图像区域g(x,y)计算得到亮度线性增强函数e(x,y);
根据亮度线性增强函数e(x,y)增强所述文字图像区域g(x,y)的亮度,完成所述局部亮化处理。
9.如权利要求8中所述的图像内文字识别装置,其特征在于,所述根据所述亮度线性增强函数e(x,y)增强所述文字图像区域g(x,y)的亮度,包括利用下述公式计算增强后的文字图像区域:
其中,f(x,y)为增强后的文字图像区域,n为所述文字图像区域的亮度平均值,(x1,y1)为所述文字图像区域左下方坐标,n1为所述文字图像区域左下方坐标的亮度值,(x4,y4)为所述文字图像区域右上方坐标,n4为所述文字图像区域右上方坐标的亮度值。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像内文字识别程序,所述图像内文字识别程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的图像内文字识别方法的步骤。