手写文本识别方法及系统与流程

文档序号：29945856发布日期：2022-05-07 16:07阅读：76来源：国知局

1.本技术涉及图像处理技术领域，特别是涉及一种手写文本识别方法及系统。

背景技术：

2.处方是指由注册的执业医师和执业助理医师在诊疗活动中为患者开具的、由取得药学专业技术职务任职资格的药学专业技术人员审核、调配、核对，并作为患者用药凭证的医疗文书。处方包括医疗机构病区用药医嘱单。
3.目前，还存在着大量手写处方的情况，因手写处方风格的多样性，而且每个医生的样本量少，总体风格偏差较大，使得手写处方识别变成一个非常难得问题。而基于深度学习的手写文本识别模型通常需要大量的训练数据来让模型学习。在实际场景中，样本收集难，且无法对样本进行大量的标注。因此，现有技术中对于手写处方的识别存在因收集手写样本难以及标注难进而导致无法准确识别的情况的问题。

技术实现要素：

4.基于此，有必要针对上述技术问题，提供一种能够解决因收集手写样本难以及标注难进而导致无法准确识别的手写文本识别方法及系统。
5.本发明技术方案如下：
6.一种手写文本识别方法，所述方法包括：
7.步骤s100：获取样本数据，并根据样本数据生成样本适应集和样本验证集；
8.步骤s200：根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；
9.步骤s300：根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；
10.步骤s400：根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型；
11.步骤s500：获取待识别样本，将所述待识别样本输入所述更新后手写识别模型，得到实际输出结果。
12.具体地，步骤s300：根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；具体包括：
13.步骤s310：根据所述临时识别模型进行推理并获取与所述样本适应集对应的推理验证集；
14.步骤s320：根据所述推理验证集与所述样本验证集获取平均ctc损失。
15.具体地，所述内循环中具有预设特定数量的样本适应循环；
16.步骤s200：根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；具体包括：
17.步骤s210：根据所述初始手写识别模型生成多个适应循环识别模型，各所述适应
循环识别模型与所述初始手写识别模型的参数的形状一样，但是参数值不一样；
18.步骤s220：将所述样本适应集分别放入各所述适应循环识别模型中，并分别获取单次ctc损失，根据各所述单次ctc损失对所述初始手写识别模型进行更新，并获取所述临时识别模型。
19.具体地，步骤s400：根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型，具体包括：
20.步骤s410：根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成原始识别模型；
21.步骤s420：获取手写样本数据，并根据所述手写样本数据对所述原始识别模型进行调整，并在调整后生成更新后手写识别模型。
22.具体地，一种手写文本识别系统，所述系统包括：
23.样本获取模块，用于获取样本数据，并根据样本数据生成样本适应集和样本验证集；
24.内循环模块，用于根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；
25.外循环模块，用于根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；
26.模型更新模块，用于根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型；
27.样本识别模块，用于获取待识别样本，将所述待识别样本输入所述更新后手写识别模型，得到实际输出结果。
28.具体地，所述外循环模块还用于：
29.根据所述临时识别模型进行推理并获取与所述样本适应集对应的推理验证集；根据所述推理验证集与所述样本验证集获取平均ctc损失。
30.具体地，所述内循环模块还用于：
31.根据所述初始手写识别模型生成多个适应循环识别模型，各所述适应循环识别模型与所述初始手写识别模型的参数的形状一样，但是参数值不一样；将所述样本适应集分别放入各所述适应循环识别模型中，并分别获取单次ctc损失，根据各所述单次ctc损失对所述初始手写识别模型进行更新，并获取所述临时识别模型；
32.所述系统还包括模型调整模块，所述模型调整模块用于：
33.根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成原始识别模型；获取手写样本数据，并根据所述手写样本数据对所述原始识别模型进行调整，并在调整后生成更新后手写识别模型。
34.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述手写文本识别方法所述的步骤。
35.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述手写文本识别方法所述的步骤。
36.本发明实现技术效果如下：
37.上述手写文本识别方法及系统，依次通过获取样本数据，并根据样本数据生成样
本适应集和样本验证集；根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型；获取待识别样本，将所述待识别样本输入所述更新后手写识别模型，得到实际输出结果，实现通过少量样本就可以学习到医生的手写风格，然后快速适配手写风格，这样在每种风格样本量不是很大的情况下也能提升模型的准确率，而且对各种风格比较敏感，使得模型适应能力强。很好的解决了收集手写样本难，标注难得情况。
附图说明
38.图1为一个实施例中手写文本识别方法的流程示意图；
39.图2为一个实施例中手写文本识别系统的结构框图；
40.图3为一个实施例中计算机设备的内部结构图。
具体实施方式
41.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
42.在一个实施例中，如图1所示，提供了一种手写文本识别方法，所述方法包括：
43.步骤s100：获取样本数据，并根据样本数据生成样本适应集和样本验证集；
44.具体地：
45.手写识别模型采用卷积神经网络+注意力机制作为编码器抽取手写处方特征e，再把特征放入一个3层的双向gru进行解码，得到识别的每个字。
46.在训练阶段分为三个循环，每一次迭代分为内循环、样本适应循环和外循环三部分，其中，在循环之前，先获取样本数据，从训练集中按照比例采集一定数量的样本适应集和样本验证集。采样过程中，确保每次采样的样本适应集和样本验证集都不一样，直到把整个训练集都采样完。
47.步骤s200：根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；
48.用样本适应集去训练所述初始手写识别模型，可以学习到新的书写风格，产生一个临时的模型，进而获取所述临时识别模型。
49.步骤s300：根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；
50.步骤s400：根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型；
51.步骤s500：获取待识别样本，将所述待识别样本输入所述更新后手写识别模型，得到实际输出结果。
52.在一个实施例中，步骤s300：根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；具体包括：
53.步骤s310：根据所述临时识别模型进行推理并获取与所述样本适应集对应的推理
验证集；
54.步骤s320：根据所述推理验证集与所述样本验证集获取平均ctc损失。
55.进一步地，外循环是用临时识别模型去推理此批次下的样本验证集，得到样本验证集的每个样本的平均损失。
56.推理也即根据内循环得到的多个临时识别模型的平均损失，把平均损失反向传播，得到每个参数的梯度，再通过adam优化器去更新参数。平均损失也就是内循环所有临时识别模型的损失之和再除以模型个数。
57.在一个实施例中，所述内循环中具有预设特定数量的样本适应循环；
58.步骤s200：根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；具体包括：
59.步骤s210：根据所述初始手写识别模型生成多个适应循环识别模型，各所述适应循环识别模型与所述初始手写识别模型的参数的形状一样，但是参数值不一样；
60.步骤s220：将所述样本适应集分别放入各所述适应循环识别模型中，并分别获取单次ctc损失，根据各所述单次ctc损失对所述初始手写识别模型进行更新，并获取所述临时识别模型。
61.进一步地，为了加强模型的风格适应能力，内循环内有一定数量的样本适应循环。具体地，样本适应循环每次更新模型的样本都是一样的，也即同一批样本放入不同的适应循环识别模型多次，也即样本适应集分别放入各所述适应循环识别模型中。
62.进一步地，所述每个适应循环识别模型，参数的形状都一样，但是参数值不一样，因为每个适应循环识别模型的参数都是随机初始化的，所以不一样，因此可以学习到不同的特征，也即各所述适应循环识别模型与所述初始手写识别模型的参数的形状一样，但是参数值不一样。
63.这样通过设置样本适应，让模型更好的学习到细微的多样的风格特征，增强模型对少量样本、新鲜样本的的记忆能力。
64.在一个实施例中，步骤s400：根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型，具体包括：
65.步骤s410：根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成原始识别模型；
66.步骤s420：获取手写样本数据，并根据所述手写样本数据对所述原始识别模型进行调整，并在调整后生成更新后手写识别模型。
67.进一步地说，本实施例中，所述原始识别模型为生成所述更新后手写识别模型之前的一个中间模型，也即所述原始识别模型为一个不作为正式使用的模型，其需要经过基于所述手写样本数据的调整后，从而进行更新，以生成所述更新后手写识别模型。
68.进一步地，在推理阶段，训练好的模型，即为原始识别模型先在少量某个医生的手写样本数据中微调一次，然后再进行预测。也即，所述手写样本数据为某个医生的手写样本数据，利用根据所述手写样本数据对所述原始识别模型进行调整，并在调整后生成更新后手写识别模型，实现正式使用之前的微调，提升准确率。
69.综上所述，本发明依次通过获取样本数据，并根据样本数据生成样本适应集和样本验证集；根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；根
据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型；获取待识别样本，将所述待识别样本输入所述更新后手写识别模型，得到实际输出结果，实现通过少量样本就可以学习到医生的手写风格，然后快速适配手写风格，这样在每种风格样本量不是很大的情况下也能提升模型的准确率，而且对各种风格比较敏感，使得模型适应能力强，很好的解决了收集手写样本难，标注难得情况。
70.在一个实施例中，如图2所示，一种手写文本识别系统，所述系统包括：
71.样本获取模块，用于获取样本数据，并根据样本数据生成样本适应集和样本验证集；
72.内循环模块，用于根据所述样本适应集和初始手写识别模型进行内循环，并生成临时识别模型；
73.外循环模块，用于根据所述临时识别模型和所述样本验证集进行外循环，并获取平均ctc损失；
74.模型更新模块，用于根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成更新后手写识别模型；
75.样本识别模块，用于获取待识别样本，将所述待识别样本输入所述更新后手写识别模型，得到实际输出结果。
76.在一个实施例中，所述外循环模块还用于：
77.根据所述临时识别模型进行推理并获取与所述样本适应集对应的推理验证集；根据所述推理验证集与所述样本验证集获取平均ctc损失。
78.在一个实施例中，所述内循环模块还用于：
79.根据所述初始手写识别模型生成多个适应循环识别模型，各所述适应循环识别模型与所述初始手写识别模型的参数的形状一样，但是参数值不一样；将所述样本适应集分别放入各所述适应循环识别模型中，并分别获取单次ctc损失，根据各所述单次ctc损失对所述初始手写识别模型进行更新，并获取所述临时识别模型；
80.在一个实施例中，所述系统还包括模型调整模块，所述模型调整模块用于：
81.根据所述平均ctc损失对所述初始手写识别模型进行更新，并生成原始识别模型；获取手写样本数据，并根据所述手写样本数据对所述原始识别模型进行调整，并在调整后生成更新后手写识别模型。
82.在一个实施例中，如图3所示，一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述手写文本识别方法所述的步骤。
83.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述手写文本识别方法所述的步骤。
84.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom
(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
85.以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
86.以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾祥云朱姬渊
技术所有人：上海易康源医疗健康科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。