层级标签文本分类方法、系统、设备及存储介质与流程

文档序号：34090334发布日期：2023-05-07 02:26阅读：来源：国知局

技术特征：

1.一种层级标签文本分类方法，其特征在于，所述方法包括的步骤如下：

2.根据权利要求1所述的一种层级标签文本分类方法，其特征在于：所述序列生成模型采用seq2seq的结构，包括编码器和解码器。

3.根据权利要求1所述的一种层级标签文本分类方法，其特征在于：对序列生成模型进行预训练的流程如下：

4.根据权利要求2所述的一种层级标签文本分类方法，其特征在于，采用序列生成的方式提取多粒度的文本特征向量的流程如下：

5.根据权利要求4所述的一种层级标签文本分类方法，其特征在于，采用注意力机制对多粒度的文本特征向量和预测的上一层级标签进行编码，以获取含有上一层级标签信息的编码向量的流程如下：

6.根据权利要求2所述的一种层级标签文本分类方法，其特征在于，采用时间序列网络对含有上一层级标签信息的编码向量进行解码，以预测下一层级标签，并且对上一层级标签进行迭代更新的流程如下：

7.根据权利要求6所述的一种层级标签文本分类方法，其特征在于，利用掩码操作控制所有层级标签的生成的流程如下：

8.一种层级标签文本分类系统，其特征在于，所述系统包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于：所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述一种层级标签文本分类方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-7中任一项所述一种层级标签文本分类方法。

技术总结
本发明提供了层级标签文本分类方法、系统、设备及存储介质，涉及自然语言处理领域，所述方法步骤为：基于层级标签分类任务构建序列生成模型，对序列生成模型进行预训练；将文本数据输入预训练的序列生成模型，并且采用序列生成的方式提取多粒度的文本特征向量；采用注意力机制对多粒度的文本特征向量和预测的上一层级标签进行编码，获取含有上一层级标签信息的编码向量；采用时间序列网络对含有上一层级标签信息的编码向量进行解码，预测下一层级标签向量；利用掩码操作控制所有层级标签的生成。本发明有效解决了传统层级标签分类任务中没有充分利用层级标签之间的关联性以及粗粒度标签对细粒度标签的限制性，导致层级标签分类性能差的问题。

技术研发人员：请求不公布姓名
受保护的技术使用者：成都数之联科技股份有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

当前第2页1 2