文本结构化处理方法、处理装置、电子设备以及存储介质与流程

文档序号：27309647发布日期：2021-11-09 21:51阅读：来源：国知局

技术特征：
1.一种文本结构化处理方法，包括：对文本图像进行文本检测，得到与所述文本图像对应的至少一个文本检测框的类别信息，其中，所述类别信息包括关键字类别或数值类别；确定与所述至少一个文本检测框中的目标文本检测框对应的文本图像，其中，所述目标文本检测框是所述类别信息为所述数值类别的文本检测框；对与所述目标文本检测框对应的文本图像进行文本识别，得到与所述目标文本检测框对应的文本图像的文本识别结果；对所述文本识别结果进行文本分类，得到与所述文本识别结果对应的语义类别结果；以及生成文本结构化结果，其中，所述文本结构化结果包括与所述关键字类别对应的值和与所述数值类别对应的值，与所述关键字类别对应的值包括所述语义类别结果，与所述数值类别对应的值包括所述文本识别结果。2.根据权利要求1所述的方法，其中，所述对所述文本识别结果进行文本分类，得到与所述文本识别结果对应的语义类别结果，包括：利用文本分类模型处理与所述文本识别结果，得到与所述文本识别结果对应的语义类别结果。3.根据权利要求2所述的方法，其中，所述文本分类模型包括深度学习模型。4.根据权利要求1～3中任一项所述的方法，其中，所述对文本图像进行文本检测，得到与所述文本图像对应的至少一个文本检测框的类别信息，包括：对所述文本图像进行文本检测，得到与所述文本图像对应的至少一个文本检测框的类别信息和位置信息；其中，所述确定与所述至少一个文本检测框中的目标文本检测框对应的文本图像，包括：根据与所述至少一个文本检测框中的目标文本检测框对应的位置信息，从所述文本图像中提取出与所述目标文本检测框对应的文本图像。5.根据权利要求4所述的方法，其中，所述根据与所述至少一个文本检测框中的目标文本检测框对应的位置信息，从所述文本图像中提取出与所述目标文本检测框对应的文本图像，包括：利用仿射变换将与所述至少一个文本检测框中的目标文本检测框对应的位置信息转换为目标位置信息；以及根据所述目标位置信息，从所述文本图像中提取出与所述目标文本检测框对应的文本图像。6.根据权利要求1～5中任一项所述的方法，其中，所述对文本图像进行文本检测，得到与所述文本图像对应的至少一个文本检测框的类别信息，包括：利用文本检测模型处理所述文本图像，得到与所述文本图像对应的至少一个文本检测框的类别信息。7.根据权利要求1～6中任一项所述的方法，其中，所述对与所述目标文本检测框对应的文本图像进行文本识别，得到与所述目标文本检测框对应的文本图像的文本识别结果，包括：
利用文本识别模型处理与所述目标文本检测框对应的文本图像，得到与所述目标文本检测框对应的文本图像的文本识别结果。8.根据权利要求1～7中任一项所述的方法，还包括：利用数据预处理得到所述文本图像，其中，所述数据预处理包括以下至少一项：降噪处理、倾斜校正处理和锐化处理。9.根据权利要求1～8中任一项所述的方法，其中，所述文本图像包括医疗文本图像。10.一种文本结构化处理装置，包括：文本检测模块，用于对文本图像进行文本检测，得到与所述文本图像对应的至少一个文本检测框的类别信息，其中，所述类别信息包括关键字类别或数值类别；确定模块，用于确定与所述至少一个文本检测框中的目标文本检测框对应的文本图像，其中，所述目标文本检测框是所述类别信息为所述数值类别的文本检测框；文本识别模块，用于对与所述目标文本检测框对应的文本图像进行文本识别，得到与所述目标文本检测框对应的文本图像的文本识别结果；文本分类模块，用于所述文本识别结果进行文本分类，得到与所述文本识别结果对应的语义类别结果；以及生成模块，用于生成文本结构化结果，其中，所述文本结构化结果包括与所述关键字类别对应的值和与所述数值类别对应的值，与所述关键字类别对应的值包括所述语义类别结果，与所述数值类别对应的值包括所述文本识别结果。11.根据权利要求10所述的装置，其中，所述文本分类模块，包括：第一获得子模块，用于利用文本分类模型处理与所述文本识别结果，得到与所述文本识别结果对应的语义类别结果。12.根据权利要求11所述的装置，其中，所述文本分类模型包括深度学习模型。13.根据权利要求10～12中任一项所述的装置，其中，所述文本检测模块，包括：第二获得子模块，用于对所述文本图像进行文本检测，得到与所述文本图像对应的至少一个文本检测框的类别信息和位置信息；其中，所述确定模块，包括：提取子模块，用于根据与所述至少一个文本检测框中的目标文本检测框对应的位置信息，从所述文本图像中提取出与所述目标文本检测框对应的文本图像。14.根据权利要求13所述的装置，其中，提取子模块，包括：转换单元，用于利用仿射变换将与所述至少一个文本检测框中的目标文本检测框对应的位置信息转换为目标位置信息；以及提取单元，根据所述目标位置信息，从所述文本图像中提取出与所述目标文本检测框对应的文本图像。15.根据权利要求10～14中任一项所述的装置，其中，所述文本检测模块，包括：第三获得子模块，用于利用文本检测模型处理所述文本图像，得到与所述文本图像对应的至少一个文本检测框的类别信息。16.根据权利要求10～15中任一项所述的装置，其中，所述文本识别模块，包括：第四获得子模块，用于利用文本识别模型处理与所述目标文本检测框对应的文本图像，得到与所述目标文本检测框对应的文本图像的文本识别结果。
17.根据权利要求10～16中任一项所述的装置，还包括：获得模块，用于利用数据预处理得到所述文本图像，其中，所述数据预处理包括以下至少一项：降噪处理、倾斜校正处理和锐化处理。18.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1～9中任一项所述的方法。19.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1～9中任一项所述的方法。20.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1～9中任一项所述的方法。

技术总结
本公开提供了一种文本结构化处理方法、处理装置、电子设备以及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域，可应用于OCR光学字符识别等场景。具体实现方案为：对文本图像进行文本检测，得到与文本图像对应的至少一个文本检测框的类别信息，其中，类别信息包括关键字类别或数值类别；确定与至少一个文本检测框中的目标文本检测框对应的文本图像；对与目标文本检测框对应的文本图像进行文本识别，得到与目标文本检测框对应的文本图像的文本识别结果；对文本识别结果进行文本分类，得到与文本识别结果对应的语义类别结果；生成文本结构化结果，其中，文本结构化结果包括与关键字类别对应的值和与数值类别对应的值。别对应的值。别对应的值。

技术研发人员：于海鹏梁思远李煜林钦夏孟姚锟
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：2021.08.11
技术公布日：2021/11/8

完整全部详细技术资料下载

当前第2页1 2