文本去噪方法、文本去噪装置、设备及存储介质与流程

文档序号：38751412发布日期：2024-07-24 22:55阅读：52来源：国知局

本申请涉及医疗科技，尤其涉及一种文本去噪方法、文本去噪装置、计算机设备及计算机可读存储介质。

背景技术：

1、随着科技的快速发展，医疗文本中存在大量过去是正确的，然而现在认证是错误的信息，例如“手机电脑辐射可以造成脑瘤”、“每天喝8杯水对身体有益”，该医学常识在现代医学理论中已经不适用，因此，有必要对医疗文本中的错误信息或冗余信息等进行噪声去除。

2、当前对医疗文本进行噪声去除主要是通过自然语言处理技术，然而其存在以下缺点：一是训练数据不足，由于医疗文本中噪声种类繁多，因此需要大量的训练数据来训练模型，进而实现医疗文本的去除；二是模型的复杂性较高，需要大量的计算资源和时间来训练和优化模型。因此，导致医疗文档的噪声去除效果较差，且效率较慢。

技术实现思路

1、本申请提供了一种文本去噪方法、文本去噪装置、计算机设备及计算机可读存储介质，旨在对医疗文本中的噪声进行去除，且提升去噪的效率以及准确性。

2、为实现上述目的，本申请提供一种文本去噪方法，所述方法包括：

3、获取待去噪的目标文本；

4、基于所述目标文本确定对应的目标向量表示，以及基于所述目标向量表示确定对应的第一张量；

5、将去噪模型中的第二张量与所述第一张量进行拼接，得到目标输入张量；

6、通过所述去噪模型对所述目标输入张量进行分析，得到所述目标文本的噪声部分，并基于所述噪声部分对所述目标文本进行去噪。

7、为实现上述目的，本申请还提供一种文本去噪装置，包括：

8、获取模块，所述获取模块用于获取待去噪的目标文本；

9、确定模块，所述确定模块用于基于所述目标文本确定对应的目标向量表示，以及基于所述目标向量表示确定对应的第一张量；

10、拼接模块，所述拼接模块用于将去噪模型中的第二张量与所述第一张量进行拼接，得到目标输入张量；

11、分析模块，所述分析模块用于通过所述去噪模型对所述目标输入张量进行分析，得到所述目标文本的噪声部分，并基于所述噪声部分对所述目标文本进行去噪。

12、此外，为实现上述目的，本申请还提供一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器，用于存储计算机程序；所述处理器，用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的文本去噪方法的步骤。

13、此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的文本去噪方法的步骤。

14、本申请实施例公开的文本去噪方法、文本去噪装置、计算机设备及计算机可读存储介质，能够获取待去噪的目标文本，并基于目标文本确定对应的目标向量表示，以及基于目标向量表示确定对应的第一张量。进一步的，可将去噪模型中的第二张量与第一张量进行拼接，从而得到目标输入张量。如此，可通过去噪模型对目标输入张量进行分析，得到目标文本的噪声部分，进而基于噪声部分对目标文本进行去噪。本申请实施例通过将去噪模型中的张量与目标文本的张量进行拼接，使得拼接后的目标输入张量能够不但能够保持目标文本的输入特征，而且也能够添加了去噪模型的特征。如此，能够提升去噪模型对目标文本的理解能力，使得去噪模型基于目标输入张量分析得到的去噪结果更加的精准。此外，由于去噪模型复杂度较低，不需要大量的计算资源和时间来训练和优化模型，因此提升了基于去噪模型实现文本去噪的效率。

技术特征：

1.一种文本去噪方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定所述目标文本对应的目标向量表示包括：

3.根据权利要求1所述的方法，其特征在于，基于所述目标向量表示确定对应的第一张量，包括：

4.根据权利要求1所述的方法，其特征在于，所述将去噪模型中的第二张量与所述第一张量进行拼接，得到目标输入张量，包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述图结构对所述图神经网络模型进行训练，得到所述去噪模型之后，包括：

7.根据权利要求5所述的方法，其特征在于，所述去噪模型包括全连接层，所述通过所述去噪模型对所述目标输入张量进行分析，得到所述目标文本的噪声部分，包括：

8.一种文本去噪装置，其特征在于，所述文本去噪装置包括：

9.一种计算机设备，其特征在于，包括：存储器和处理器；其中，所述存储器与所述处理器连接，用于存储程序所述处理器用于通过运行所述存储器中存储的程序，实现如权利要求1-7中任一项所述的文本去噪方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1-7中任一项所述的文本去噪方法的步骤。

技术总结
本发明实施例提供一种文本去噪方法、装置、设备及存储介质。方法包括：获取待去噪的目标文本；基于所述目标文本确定对应的目标向量表示，以及基于所述目标向量表示确定对应的第一张量；将去噪模型中的第二张量与所述第一张量进行拼接，得到目标输入张量；通过所述去噪模型对所述目标输入张量进行分析，得到所述目标文本的噪声部分，并基于所述噪声部分对所述目标文本进行去噪。本申请实施例旨在对医疗文本中的噪声进行去除，且提升去噪的效率以及准确性。

技术研发人员：刘羲,高一飞,舒畅,陈又新
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：
技术公布日：2024/7/23

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘羲,高一飞,舒畅,陈又新
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。