一种基于深度学习的字轮式水表读数的识别方法及装置

文档序号：35525051发布日期：2023-09-21 02:57阅读：来源：国知局

技术特征：

1.一种基于深度学习的字轮式水表读数识别方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法，其特征在于，所述数字区域检测模型是基于unet深度学习网络提出的，用于提取图像显示的数字区域，其训练过程使用均方差损失函数，数学表达式为：

3.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法，其特征在于，将所述数字区域位置图像输入基于矫正分割算法的网络模型,对所述数字区域位置图像进行矫正和分割，具体步骤如下：

4.根据权利要求3所述的基于深度学习的字轮式水表读数识别方法，其特征在于,所述矫正算法的数学表达式为：

5.根据权利要求3所述的基于深度学习的字轮式水表读数识别方法，其特征在于，所述新的四边形区域的顶点坐标计算公式如下：

6.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法，其特征在于,所述数字识别模型是基于卷积神经网络搭建的，网络包括三个结构相同的块，每个块包括两个使用3×3卷积核的卷积操作和一个最大池化操作，卷积核的数量递增。

7.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法，其特征在于，所述数字识别模型，其训练过程的损失函数采用交叉熵损失函数，数学表达式为：

8.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法，其特征在于，所述数字区域检测模型和所述数字识别模型的训练过程均采用adam优化器来更新网络权重。

9.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法，其特征在于，所述数字识别模型的全连接层利用提取出的特征信息进行数据分类，所述全连接层用到的激活函数为softmax，所述softmax激活函数的数学方程式如下：

10.一种基于深度学习的字轮式水表读数识别装置，其特征在于，包括：

技术总结
本发明涉及计算机视觉技术领域，提出了一种基于深度学习的字轮式水表读数识别方法及装置，包括：获取字轮式水表图像，通过数字区域检测模型得到所述字轮式水表图像中的数字区域位置图像；将所述数字区域位置图像输入基于矫正分割算法的网络模型进行矫正和分割得到目标区域的裁剪图像；将所述目标区域的裁剪图像通过仿射变换后输入数字识别模型，产生一个10×Q的矩阵作为模型的输出。本发明提出的水表读数检测模型无需字符切割即可识别读数，实现了对字轮式水表读数的端到端的识别，提高了水表读数识别精度，另外，本发明提供的网络模型体积很小，便于在移动设备上部署，为水表数据的读取和复核提供更便捷的方式。

技术研发人员：赵顺毅,卢庆鑫,栾小丽,刘飞,倪雨青
受保护的技术使用者：江南大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2