基于多分类文本检测的医疗票据识别的方法

文档序号:40737309发布日期:2025-01-21 11:27阅读:来源:国知局

技术特征:

1.基于多分类文本检测的医疗票据识别的方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s1中,通过扫描实体医疗票据收集医疗票据图像数据的具体步骤为:

3.根据权利要求1所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s2中,对票据图像数据进行预处理的具体步骤为:

4.根据权利要求3所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s3.2中,将彩色图像转换成灰度图像具体表达式为:

5.根据权利要求1所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s3中,对票据图像中的关键信息进行标注的具体步骤为:

6.根据权利要求1所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s4中,基于dbnet框架,设计并构建适用于医疗票据的多分类文本检测模型的具体步骤为:

7.根据权利要求6所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s5.4中,设置交叉熵损失函数的具体表达式为:

8.根据权利要求6所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s5.5中,实现训练流程具体流程表达式为:

9.根据权利要求1所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s5中,针对文本识别中的干扰因素,增强crnn特征提取网络,并引入transformer结构的具体步骤为:

10.根据权利要求1所述的基于多分类文本检测的医疗票据识别的方法,其特征在于:所述s6.3中,引入transformer模块来捕捉长距离依赖关系的具体表达式为:


技术总结
本发明涉及图像处理与识别技术领域,具体地说,涉及基于多分类文本检测的医疗票据识别的方法。其包括以下步骤:S1、通过扫描实体医疗票据收集医疗票据图像数据;S2、对票据图像数据进行预处理;S3、对票据图像中的关键信息进行标注;S4、基于DBNet框架,设计并构建适用于医疗票据的多分类文本检测模型;S5、针对文本识别中的干扰因素,增强CRNN特征提取网络,并引入Transformer结构。通过DBNet框架结合了文本检测和识别的优势,能够在检测的同时进行分类,提高了检测效率。支持多分类任务,可以一次性检测出票据上的多种不同类型的信息。引入Transformer结构可以更好地捕捉文本中的长距离依赖关系,这对于理解复杂的文本结构非常重要。

技术研发人员:朱波,张凤祥,邱兰,刘子瑜
受保护的技术使用者:昆明理工大学
技术研发日:
技术公布日:2025/1/20
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1