文档的处理方法及装置、存储介质和电子设备与流程

文档序号：34927254发布日期：2023-07-28 05:28阅读：33来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本技术涉及人工智能，具体而言，涉及一种文档的处理方法及装置、存储介质和电子设备。

背景技术：

1、在处理大量档案的各种行业中，文档数字化已经成为一种普遍做法。在尝试自动化文档处理时，文档分类是一项需要面对的任务，但是文档之间类内的高变异性和类间的低变异性使这成为一个具有挑战性的问题。

2、而且，目前随着深度学习的兴起，使用深度神经网络用于处理文档分类任务展现出了高效的分类性能。但是即使是采用最简单的卷积神经网络用于处理该任务也需要消耗较长的时间和巨大的计算资源，从而会导致对文档进行识别的效率较低。

3、针对相关技术中对文档进行识别的效率较低的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本技术的主要目的在于提供一种文档的处理方法及装置、存储介质和电子设备，以解决相关技术中对文档进行识别的效率较低的问题。

2、为了实现上述目的，根据本技术的一个方面，提供了一种文档的处理方法。该方法包括：获取目标文档，其中，所述目标文档为待识别的文档；将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息，其中，所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型，所述第一神经网络模型用于对文档中的图像进行识别处理，所述第二神经网络模型用于对文档中的文本进行识别处理，所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。

3、进一步地，所述目标识别模型通过以下方式得到：获取n个样本文档，其中，n为正整数；对每个样本文档中的文本和图像进行标注处理，得到n个标注处理后的样本文档；依据所述n个标注处理后的样本文档，得到用于模型训练的训练集；基于所述第一神经网络模型和所述第二神经网络模型，构建第一识别模型；采用所述训练集对所述第一识别模型进行学习训练，得到所述目标识别模型。

4、进一步地，采用所述训练集对所述第一识别模型进行学习训练，得到所述目标识别模型包括：采用所述训练集和迁移学习的方法对所述第一识别模型进行学习训练，得到第二识别模型；利用交叉熵损失函数确定模型训练的损失值，其中，所述交叉熵损失函数；依据所述损失值，对所述第二识别模型的参数进行更新处理，得到所述目标识别模型。

5、进一步地，在利用交叉熵损失函数确定模型训练的损失值之前，所述方法还包括：通过所述第一神经网络模型对所述n个样本文档中的图像进行特征提取处理，得到第一分类结果；通过所述第二神经网络模型对所述n个样本文档中的文本进行特征提取处理，得到第二类结果；基于所述第一分类结果和所述第二类结果，结合预设方法，得到第三分类结果；依据所述第三分类结果，确定所述交叉熵损失函数。

6、进一步地，在依据所述损失值，对所述第二识别模型的参数进行更新处理，得到所述目标识别模型之后，所述方法还包括：获取模型训练的训练时长；从数据集中获取用于测试模型的测试集，其中，所述数据集中至少包括所述n个样本文档；利用所述测试集，计算所述目标识别模型的准确程度；依据所述训练时长和所述准确程度，确定对所述目标识别模型进行测试的测试结果。

7、进一步地，依据所述n个标注处理后的样本文档，得到用于模型训练的训练集包括：依据所述n个标注处理后的样本文档，得到数据集；按照预设比例，将所述数据集划分为所述训练集和用于测试模型的测试集。

8、进一步地，所述目标识别模型中至少包括所述第一神经网络模型和所述第二神经网络模型，将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息包括：通过所述第一神经网络模型识别所述目标文档中的图像的类别，得到第一识别结果；通过所述第二神经网络模型识别所述目标文档中的文本的类别，得到第二识别结果；依据所述第一识别结果和所述第二识别结果，得到所述目标文档中的所述文本信息和所述图像信息。

9、进一步地，在将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息之后，所述方法还包括：获取所述目标文档中的所述文本信息和所述图像信息；基于所述文本信息和所述图像信息，对所述目标文档的格式进行转换，得到目标格式的所述目标文档。

10、为了实现上述目的，根据本技术的另一方面，提供了一种文档的处理装置。该装置包括：第一获取单元，用于获取目标文档，其中，所述目标文档为待识别的文档；第一处理单元，用于将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息，其中，所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型，所述第一神经网络模型用于对文档中的图像进行识别处理，所述第二神经网络模型用于对文档中的文本进行识别处理，所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。

11、进一步地，所述目标识别模型通过以下方式得到：第二获取单元，用于获取n个样本文档，其中，n为正整数；第二处理单元，用于对每个样本文档中的文本和图像进行标注处理，得到n个标注处理后的样本文档；第一确定单元，用于依据所述n个标注处理后的样本文档，得到用于模型训练的训练集；第一构建单元，用于基于所述第一神经网络模型和所述第二神经网络模型，构建第一识别模型；第一训练单元，用于采用所述训练集对所述第一识别模型进行学习训练，得到所述目标识别模型。

12、进一步地，所述第一训练单元包括：第一训练模块，用于采用所述训练集和迁移学习的装置对所述第一识别模型进行学习训练，得到第二识别模型；第一确定模块，用于利用交叉熵损失函数确定模型训练的损失值，其中，所述交叉熵损失函数；第一处理模块，用于依据所述损失值，对所述第二识别模型的参数进行更新处理，得到所述目标识别模型。

13、进一步地，所述装置还包括：第三处理单元，用于在利用交叉熵损失函数确定模型训练的损失值之前，通过所述第一神经网络模型对所述n个样本文档中的图像进行特征提取处理，得到第一分类结果；第四处理单元，用于通过所述第二神经网络模型对所述n个样本文档中的文本进行特征提取处理，得到第二类结果；第二确定单元，用于基于所述第一分类结果和所述第二类结果，结合预设装置，得到第三分类结果；第三确定单元，用于依据所述第三分类结果，确定所述交叉熵损失函数。

14、进一步地，所述装置还包括：第三获取单元，用于在依据所述损失值，对所述第二识别模型的参数进行更新处理，得到所述目标识别模型之后，获取模型训练的训练时长；第四获取单元，用于从数据集中获取用于测试模型的测试集，其中，所述数据集中至少包括所述n个样本文档；第一计算单元，用于利用所述测试集，计算所述目标识别模型的准确程度；第四确定单元，用于依据所述训练时长和所述准确程度，确定对所述目标识别模型进行测试的测试结果。

15、进一步地，所述第一确定单元包括：第二确定模块，用于依据所述n个标注处理后的样本文档，得到数据集；第一划分模块，用于按照预设比例，将所述数据集划分为所述训练集和用于测试模型的测试集。

16、进一步地，所述目标识别模型中至少包括所述第一神经网络模型和所述第二神经网络模型，所述第一处理单元包括：第一识别模块，用于通过所述第一神经网络模型识别所述目标文档中的图像的类别，得到第一识别结果；第二识别模块，用于通过所述第二神经网络模型识别所述目标文档中的文本的类别，得到第二识别结果；第三确定模块，用于依据所述第一识别结果和所述第二识别结果，得到所述目标文档中的所述文本信息和所述图像信息。

17、进一步地，所述装置还包括：第五获取单元，用于在将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息之后，获取所述目标文档中的所述文本信息和所述图像信息；第一转换单元，用于基于所述文本信息和所述图像信息，对所述目标文档的格式进行转换，得到目标格式的所述目标文档。

18、为了实现上述目的，根据本技术的另一方面，提供了一种计算机可读存储介质，所述存储介质存储程序，其中，所述程序执行上述的任意一项所述的文档的处理方法。

19、为了实现上述目的，根据本技术的另一方面，提供了一种电子设备，所述电子设备包括一个或多个处理器和存储器，所述存储器用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现上述的任意一项所述的文档的处理方法。

20、通过本技术，采用以下步骤：获取目标文档，其中，目标文档为待识别的文档；将目标文档输入目标识别模型进行识别处理，输出目标文档中的文本信息和图像信息，其中，目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型，第一神经网络模型用于对文档中的图像进行识别处理，第二神经网络模型用于对文档中的文本进行识别处理，第一神经网络模型为具有深度可分离卷积结构的神经网络模型，解决了相关技术中对文档进行识别的效率较低的问题。通过获取目标文档，并将目标文档输入基于用于对文档中的图像进行识别处理的第一神经网络模型和用于对文档中的文本进行识别处理的第二神经网络模型构建的目标识别模型进行识别处理，输出目标文档中的文本信息和图像信息，进而达到了提升对文档进行识别的效率的效果。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张海轩
技术所有人：中国工商银行股份有限公司
我是此专利的发明人

上一篇：一种密封环、控制阀、样本收集容器及内窥镜的制作方法
上一篇：一种可调式手机框体钻孔夹持工装的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。