文档处理方法、文档处理装置、设备及存储介质与流程

文档序号：35339209发布日期：2023-09-07 04:55阅读：47来源：国知局

本申请涉及智能医疗领域，尤其涉及一种目标深度学习模型的文档处理方法、文档处理装置、计算机设备及计算机可读存储介质。

背景技术：

1、电子病历是用电子设备保存、管理、传输和重现的数字化的病人医疗记录。在对医院的emr文档进行数据处理前，需要确认每个emr文档的类型。临床试验最终提交的数据是以文档形式体现的，而在整个临床试验过程中环节很多，相应产生的文档数量、种类也非常繁复。因此，有必要对电子病历以及临床试验文档进行分类处理。

2、由于文档中的主题词能够代表文档的类别，因此现有的处理方法通常是先确定文档的主题词，进而基于文档的主题词对文档进行分类。由于确定文档的主题词以及分类的任务都是分开来做的，因此需要针对不同任务训练不同的模型，使得文档的处理效率降低且维护成本增加。

技术实现思路

1、本申请提供了一种基于目标深度学习模型的文档处理方法、文档处理装置、计算机设备及计算机可读存储介质，旨在通过目标深度学习模型同时实现获取文档的主题词以及分类结果，提高文档的处理效率。尤其对于医疗领域中电子病历或临床实验的文档，能够有效的提高电子病历或临床实验的文档的处理效率以及降低人工成本。

2、为实现上述目的，本申请提供一种基于目标深度学习模型的文档处理方法，所述方法包括：

3、获取所述目标深度学习模型以及待分类的文档，其中，所述目标深度学习模型由目标lstm模型以及目标mlp模型构成；

4、对所述文档进行特征提取操作，得到对应的目标特征向量；

5、通过所述目标lstm模型对所述目标特征向量进行分析，得到所述文档的主题词，以及通过所述目标mlp模型对所述目标特征向量进行分析，得到所述文档的分类结果。

6、为实现上述目的，本申请还提供文档处理装置，所述文档处理装置包括：

7、获取模块，所述获取模块用于获取目标学习模型以及待分类的文档，其中，所述目标深度学习模型由目标lstm模型以及目标mlp模型构成；

8、特征提取模块，所述特征提取模块用于对所述文档进行特征提取操作，得到对应的目标特征向量；

9、文档处理模块，所述文档处理模块用于通过所述目标lstm模型对所述目标特征向量进行分析，得到所述文档的主题词，以及通过所述目标mlp模型对所述目标特征向量进行分析，得到所述文档的分类结果。

10、此外，为实现上述目的，本申请还提供一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器，用于存储计算机程序；所述处理器，用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的基于目标深度学习模型的文档处理方法的步骤。

11、此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的基于目标深度学习模型的文档处理方法的步骤。

12、本申请实施例公开的基于目标深度学习模型的文档处理方法、文档处理装置、计算机设备及计算机可读存储介质，能够通过目标深度学习模型对电子病历或临床实验等待分类文档进行分析，其中，目标深度学习模型包括目标lstm模型以及目标mlp模型。在对电子病历或临床实验等待分类文档进行特征提取后，可通过目标lstm模型对目标特征向量进行分析，得到电子病历或临床实验文档的主题词，以及通过目标mlp模型对目标特征向量进行分析，得到电子病历或临床实验文档的分类结果。如此，可通过一个深度学习模型同时实现得到电子病历或临床实验文档的主题词以及分类结果，提高了电子病历或临床实验文档的处理效率。此外，由于目标深度学习模型利用了主题词和文档分类的重叠影响，因此能够使得基于目标深度学习模型得到的分类结果更加精准。尤其对于医疗领域中电子病历或临床实验的文档，能够有效的提高电子病历或临床实验的文档的处理效率以及降低人工成本。

技术特征：

1.一种基于目标深度学习模型的文档处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的文档处理方法，其特征在于，所述获取所述目标深度学习模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述目标损失值包括第一损失值，所述基于所述第一特征向量以及第二特征向量，确定所述初始深度学习模型的目标损失值，包括：

4.根据权利要求3所述的方法，其特征在于，所述目标损失值还包括第二损失值，所述初始深度学习模型包括初始lstm模型，所述对所述目标样本进行特征提取操作，得到对应的第一特征向量之后，还包括：

5.根据权利要求4所述的方法，其特征在于，所述目标损失值还包括第三损失值，所述初始深度学习模型包括初始mlp模型，所述对所述目标样本进行特征提取操作，得到对应的第一特征向量之后，还包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述第一特征向量以及第二特征向量，确定所述初始深度学习模型的目标损失值，包括：

7.根据权利要求2所述的方法，其特征在于，所述对所述目标样本、所述正负样本集合进行特征提取操作，得到对应的第一特征向量以及第二特征向量之前，包括：

8.一种文档处理装置，其特征在于，所述文档处理装置包括：

9.一种计算机设备，其特征在于，包括：存储器和处理器；其中，所述存储器与所述处理器连接，用于存储程序所述处理器用于通过运行所述存储器中存储的程序，实现如权利要求1-7中任一项所述的基于目标深度学习模型的文档处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1-7中任一项所述的基于目标深度学习模型的文档处理方法的步骤。

技术总结
本发明实施例提供一种基于目标深度学习模型的文档处理方法、装置、设备及存储介质。方法包括：获取所述目标深度学习模型以及待分类的文档，其中，所述目标深度学习模型由目标LSTM模型以及目标MLP模型构成；对所述文档进行特征提取操作，得到对应的目标特征向量；通过所述目标LSTM模型对所述目标特征向量进行分析，得到所述文档的主题词，以及通过所述目标MLP模型对所述目标特征向量进行分析，得到所述文档的分类结果。本申请实施例旨在通过目标深度学习模型同时实现获取文档的主题词以及分类结果，提高文档的处理效率。尤其对于医疗领域中电子病历或临床实验的文档，能够有效的提高电子病历或临床实验的文档的处理效率以及降低人工成本。

技术研发人员：舒畅,陈又新
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：舒畅陈又新
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。