文本分类方法、深度学习模型的训练方法及装置与流程

文档序号：34589852发布日期：2023-06-28 16:45阅读：60来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及计算机、数据处理，尤其涉及人工智能、深度学习，具体涉及一种文本分类方法、深度学习模型的训练方法、装置、设备、存储介质以及程序产品。

背景技术：

1、随着人工智能技术的发展，深度学习作为人工智能领域的一种机器学习方法，可以应用于生产、生活的各个方面，例如深度学习模型可以处理文本信息。

技术实现思路

1、本公开提供了一种文本分类方法、深度学习模型的训练方法、装置、设备、存储介质以及程序产品。

2、根据本公开的一方面，提供了一种文本分类方法，包括：响应于接收到查询文本，确定查询文本的初始分类结果；根据初始分类结果与查询文本，确定融合向量；以及根据融合向量，得到查询文本的目标分类结果。

3、根据本公开的另一方面，提供了一种深度学习模型的训练方法，包括：将文本样本输入初始深度学习模型的第一网络，得到文本样本的初始分类结果；根据初始分类结果与文本样本，确定融合向量；将融合向量输入初始深度学习模型的第二网络，得到文本样本的目标分类结果，其中，初始分类结果包括目标分类结果；根据目标分类结果和损失函数，确定反馈数值；以及根据反馈数值，调整初始深度学习模型的模型参数，得到目标深度学习模型。

4、根据本公开的另一方面，提供了一种文本分类装置，包括：初始分类结果第一确定模块，用于响应于接收到查询文本，确定查询文本的初始分类结果；融合向量第一确定模块，用于根据初始分类结果与查询文本，确定融合向量；以及目标分类结果第一确定模块，用于根据融合向量，得到查询文本的目标分类结果。

5、根据本公开的另一方面，提供了一种深度学习模型训练装置，包括：初始分类结果第二确定模块，用于将文本样本输入初始深度学习模型的第一网络，得到文本样本的初始分类结果；融合向量第二确定模块，用于根据初始分类结果与文本样本，确定融合向量；目标分类结果第二确定模块，用于将融合向量输入初始深度学习模型的第二网络，得到文本样本的目标分类结果，其中，初始分类结果包括目标分类结果；反馈数值确定模块，用于根据目标分类结果和损失函数，确定反馈数值；以及目标深度学习模型确定模块，用于根据反馈数值，调整初始深度学习模型的模型参数，得到目标深度学习模型。

6、根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器和与至少一个处理器通信连接的存储器。其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本公开实施例的方法。

7、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行本公开实施例的方法。

8、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，计算机程序存储于可读存储介质和电子设备其中至少之一上，计算机程序存储于可读存储介质和电子设备其中至少之一上，计算机程序在被处理器执行时实现本公开实施例的方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种文本分类方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求2所述的方法，其中，所述初始分类结果包括正类别、负类别以及中性类别；所述根据所述查询文本的分类结果，从检索库中确定与所述查询文本匹配的展示内容包括：

4.根据权利要求3所述的方法，其中，所述展示所述展示内容包括：

5.一种深度学习模型训练方法，包括：

6.根据权利要求5所述的方法，其中，所述损失函数包括第一损失函数和第二损失函数；所述反馈数值与第一反馈数值、第二反馈数值相关；所述根据所述目标分类结果和损失函数，确定反馈数值包括：

7.根据权利要求5或6中所述的方法，其中，所述初始分类结果包括正类别、负类别以及中性类别。

8.一种文本分类装置，包括：

9.根据权利要求8所述的装置，其中，还包括：

10.根据权利要求9所述的装置，其中，所述初始分类结果包括正类别、负类别以及中性类别；所述展示内容确定模块包括：

11.根据权利要求10所述的装置，其中，所述展示模块包括：

12.一种深度学习模型的训练装置，包括：

13.根据权利要求12所述的装置，其中，所述损失函数包括第一损失函数和第二损失函数；所述反馈数值与第一反馈数值、第二反馈数值相关；所述反馈数值确定模块包括：

14.根据权利要求12或13所述的装置，其中，所述初始分类结果包括正类别、负类别以及中性类别。

15.一种电子设备，包括：

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-4中任一项所述的方法或者5-7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序存储于可读存储介质和电子设备其中至少之一上，所述计算机程序在被处理器执行时实现根据权利要求1-4中任一项所述的方法或者5-7中任一项所述的方法。

技术总结
本公开提供了一种文本分类方法、深度学习模型的训练方法，涉及计算机技术领域、数据处理技术领域，尤其涉及人工智能、深度学习技术领域。具体实现方案为：响应于接收到查询文本，确定查询文本的初始分类结果；根据初始分类结果与查询文本，确定融合向量；以及根据融合向量，得到查询文本的目标分类结果。

技术研发人员：李明琦
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李明琦
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

上一篇：逆变器的不均匀光照下的最大功率点识别方法与流程
上一篇：基于微流道的航空发动机滑油在线分选装置

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。