技术特征:
技术总结
本发明公开了一种基于深卷积神经网络的自然场景图像文本检测方法,该方法具体包括以下步骤:制作数据集,将所有图片按照VOC格式制作成数据集,文件夹Annotation用于存放xml文件,每一个xml文件对应一张图像,并且每个xml文件中存放的是标记的各个目标的位置和类别信息。将自然图像通过ResNet网络从底层像素点获取更多的高级特征,然后利用BLSTM层提取字符序列的上下文特征,找到检测文本的边界框,有效地提高了文本检测的效果。本发明的有益效果:本发明使用自动学习,结合上下文特征替换人工定义的特征;本发明避免字符分割问题,实现端到端的无约束字符检测。提高了检测效率和精度,实现了对自然场景图像的文本检测。
技术研发人员:李孝杰;伍贤宇;史沧红;吴锡;何嘉
受保护的技术使用者:成都信息工程大学
技术研发日:2019.07.19
技术公布日:2019.11.08