文本分类方法及装置、存储介质、电子装置与流程

文档序号：24529970发布日期：2021-04-02 10:08阅读：来源：国知局

技术特征：

1.一种文本分类方法，其特征在于，包括：

获取文本数据中的词向量矩阵，对所述词向量矩阵进行多个感受野的卷积处理，以得到多个卷积层；

对所述多个卷积层通过残差进行叠加连接，以得到所述多个卷积层的目标卷积层，其中，所述残差用于表示所述多个卷积层中的每一卷积层的残差值；

提取所述目标卷积层的目标特征，将所述目标特征输入到目标逻辑函数中，得到函数输出结果，根据所述函数输出结果确定所述文本数据的类别。

2.根据权利要求1所述的方法，其特征在于，获取文本数据中的词向量矩阵，包括：

从所述文本数据中获取所有词的词向量，得到不同词对应的不同词向量，其中，所述词向量用于唯一标识所述文本数据中的词；

将所述不同词向量聚合在一个矩阵中，得到所述词向量矩阵。

3.根据权利要求1所述的方法，其特征在于，对所述词向量矩阵进行多个感受野的卷积处理，以得到多个卷积层之后，所述方法还包括：

获取预设的激活函数；

通过所述激活函数对所述多个卷积层进行激活；

对激活后的多个卷积层中不符合预设条件的卷积层进行丢弃处理。

4.根据权利要求1所述的方法，其特征在于，对所述多个卷积层通过残差进行叠加连接，以得到所述卷积层的目标卷积层，包括：

确定所述多个卷积层中每一个卷积层与标准卷积层的残差值，得到多个残差，其中，每一个卷积层对应一个标准卷积层；

获取所述多个残差中小于预设阈值的残差对应的多个卷积层，将小于预设阈值的残差对应的多个卷积层进行叠加连接，以得到所述卷积层的目标卷积层。

5.根据权利要求1所述的方法，其特征在于，对所述多个卷积层通过残差进行叠加连接，以得到所述卷积层的目标卷积层之后，所述方法还包括：

对所述目标卷积层进行归一化处理，并将归一化后的目标卷积层存储在目标存储位置中；

根据所述目标存储位置中目标卷积层的数量确定所述文本数据进行迭代卷积的次数。

6.根据权利要求1所述的方法，其特征在于，根据所述函数输出结果确定所述文本数据的类别，包括：

从所述函数输出结果中获取所述文本数据对应不同类别的多个概率值；

将所述多个概率值中最大的概率值所对应的类别作为所述文本数据的类别。

7.一种文本分类装置，其特征在于，包括：

获取模块，用于获取文本数据中的词向量矩阵，对所述词向量矩阵进行多个感受野的卷积处理，以得到多个卷积层；

连接模块，用于对所述多个卷积层通过残差进行叠加连接，以得到所述多个卷积层的目标卷积层，其中，所述残差用于表示所述多个卷积层中的每一卷积层的残差值；

提取模块，用于提取所述目标卷积层的目标特征，将所述目标特征输入到目标逻辑函数中，得到函数输出结果，根据所述函数输出结果确定所述文本数据的类别。

8.根据权利要求7所述的装置，其特征在于，所述获取模块，还用于从所述文本数据中获取所有词的词向量，得到不同词对应的不同词向量，其中，所述词向量用于唯一标识所述文本数据中的词；将所述不同词向量聚合在一个矩阵中，得到所述词向量矩阵。

9.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至6任一项中所述的方法。

10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的方法。

技术总结
本发明公开了一种文本分类方法及装置、存储介质、电子装置，其中，上述方法包括：获取文本数据中的词向量矩阵，对词向量矩阵进行多个感受野的卷积处理，以得到多个卷积层；对多个卷积层通过残差进行叠加连接，以得到多个卷积层的目标卷积层，残差用于表示多个卷积层中的每一卷积层的残差值；提取目标卷积层的目标特征，将目标特征输入到目标逻辑函数中，得到函数输出结果，根据函数输出结果确定文本数据的类别，即通过获取文本数据的目标卷积层对应目标特征的概率值，进而确定不同概率值对应的文本数据类别，解决了相关技术中，对短文本分类的准确率太低以及预测速度过慢等问题，提高了文本分类模型的训练速度以及分类准确率。

技术研发人员：韩俊明
受保护的技术使用者：青岛海尔科技有限公司;海尔智家股份有限公司
技术研发日：2020.12.23
技术公布日：2021.04.02

完整全部详细技术资料下载

当前第2页1 2