文本分类方法、装置、电子设备及存储介质与流程

文档序号:30663607发布日期:2022-07-06 02:16阅读:82来源:国知局
文本分类方法、装置、电子设备及存储介质与流程

1.本发明涉及人工智能领域,尤其涉及一种文本分类方法、装置、电子设备及存储介质。


背景技术:

2.文本分类是自然语言处理领域的一个重要课题,文本分类可广泛应用于搜索引擎、智能问答、知识检索、对话系统等多场景。
3.当前,主流的做法是采用文本分类模型对文本进行分类,而文本分类模型的训练过程通常是:将携带标签的样本输入模型,通过最小化标签与预测值之间的差值来优化文本分类模型。然而,这种方式未考虑样本之间的关联性,使得模型分类准确性不高。因此,亟需一种文本分类方法,以提高文本分类的准确性。


技术实现要素:

4.鉴于以上内容,有必要提供一种文本分类方法、装置、电子设备及存储介质,旨在提高文本分类的准确性。
5.本发明提供的文本分类方法,包括以下步骤:
6.获取每个领域对应的携带文本类别信息的样本集,根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对;
7.根据所述正样本对与负样本对的相似度差异确定目标损失函数,通过最小化所述目标损失函数以训练每个领域对应的初始分类模型,得到每个领域对应的文本分类模型;
8.接收待分类文本,识别所述待分类文本对应的目标领域,判断所述目标领域对应的样本集在文本类别上的分布是否均衡,若判断为否,计算所述目标领域的每个文本类别对应的权重;
9.将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在所述目标领域的每个文本类别的预测值,基于所述预测值及所述权重确定所述待分类文本在所述目标领域的每个文本类别的目标值,基于所述目标值确定所述待分类文本对应的目标文本类别。
10.可选的,所述根据所述正样本对与负样本对的相似度差异确定目标损失函数,包括:
11.选择一个领域的样本集,将选择的样本集输入初始分类模型的编码网络执行编码处理,得到所述选择的样本集中每个样本的编码向量;
12.基于所述编码向量计算所述选择的样本集对应的每个正样本对的第一相似度值和每个负样本对的第二相似度值;
13.基于所述第一相似度值及第二相似度值的差值确定所述选择的样本集对应的第一损失函数;
14.将所述编码向量输入所述初始分类模型的分类网络执行分类处理,得到所述选择
的样本集中每个样本在对应领域的每个文本类别的概率值,基于所述概率值确定所述选择的样本集对应的第二损失函数;
15.基于所述第一损失函数及第二损失函数确定所述选择的样本集对应的目标损失函数。
16.可选的,所述识别所述待分类文本对应的目标领域,包括:
17.对所述待分类文本执行分词处理,得到词语集合;
18.将所述词语集合中的每个词语分别与每个领域对应的词语库进行匹配,得到每个领域对应的匹配词集合;
19.将匹配词集合中匹配词数量最多的领域作为所述待分类文本对应的目标领域。
20.可选的,所述根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对,包括:
21.将每个样本集中各个样本分别与其相同文本类别的样本两两组合,得到每个样本集对应的多个正样本对;
22.将每个样本集中各个样本分别与其不同文本类别的样本两两组合,得到每个样本集对应的多个负样本对。
23.可选的,所述判断所述目标领域对应的样本集在文本类别上的分布是否均衡,包括:
24.统计所述目标领域对应的样本集在每个文本类别的样本数量;
25.基于所述样本数量计算所述目标领域对应的样本平均值;
26.基于所述样本数量及样本平均值计算所述目标领域对应的样本集的方差;
27.根据所述方差确定所述目标领域对应的样本集在文本类别上的分布是否均衡。
28.可选的,在所述判断所述目标领域对应的样本集在文本类别上的分布是否均衡之后,所述方法还包括:
29.若判断为是,将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在每个文本类别的预测值,基于所述预测值确定所述待分类文本对应的目标文本类别。
30.可选的,所述第一损失函数为:
[0031][0032]
其中,l为选择的样本集对应的第一损失函数,si为选择的样本集对应的第i个负样本对的第二相似度值,sj为选择的样本集对应的第j个正样本对的第一相似度值,m为选择的样本集中负样本对的总数量,n为选择的样本集中正样本对的总数量。
[0033]
为了解决上述问题,本发明还提供一种文本分类装置,所述装置包括:
[0034]
拆分模块,用于获取每个领域对应的携带文本类别信息的样本集,根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对;
[0035]
训练模块,用于根据所述正样本对与负样本对的相似度差异确定目标损失函数,通过最小化所述目标损失函数以训练每个领域对应的初始分类模型,得到每个领域对应的文本分类模型;
[0036]
判断模块,用于接收待分类文本,识别所述待分类文本对应的目标领域,判断所述目标领域对应的样本集在文本类别上的分布是否均衡,若判断为否,计算所述目标领域的每个文本类别对应的权重;
[0037]
分类模块,用于将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在所述目标领域的每个文本类别的预测值,基于所述预测值及所述权重确定所述待分类文本在所述目标领域的每个文本类别的目标值,基于所述目标值确定所述待分类文本对应的目标文本类别。
[0038]
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
[0039]
至少一个处理器;以及,
[0040]
与所述至少一个处理器通信连接的存储器;其中,
[0041]
所述存储器存储有可被所述至少一个处理器执行的文本分类程序,所述文本分类程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述文本分类方法。
[0042]
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有文本分类程序,所述文本分类程序可被一个或者多个处理器执行,以实现上述文本分类方法。
[0043]
相较现有技术,本发明首先将每个领域对应的样本集拆分为多个正样本对和多个负样本对;接着,根据正样本对与负样本对的相似度差异确定目标损失函数,通过最小化目标损失函数训练出每个领域对应的文本分类模型;然后,识别待分类文本对应的目标领域,判断目标领域对应的样本集在文本类别上的分布是否均衡,若判断为否,计算目标领域的每个文本类别对应的权重;最后,将待分类文本输入目标领域对应的文本分类模型,基于文本分类模型输出的预测值及所述权重确定待分类文本对应的目标文本类别。本发明根据正样本对与负样本对的相似度差异确定目标损失函数,从而模型可学习正样本对之间的相似性及负样本对之间的不相似性,加深了样本之间的交互,提高了模型的分类准确性。因此,本发明提高了文本分类的准确性。
附图说明
[0044]
图1为本发明一实施例提供的文本分类方法的流程示意图;
[0045]
图2为本发明一实施例提供的文本分类装置的模块示意图;
[0046]
图3为本发明一实施例提供的实现文本分类方法的电子设备的结构示意图。
[0047]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0048]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0049]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深
度学习等几大方向。
[0050]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0051]
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
[0052]
本发明提供一种文本分类方法。参照图1所示,为本发明一实施例提供的文本分类方法的流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。
[0053]
本实施例中,文本分类方法包括以下步骤s1-s4:
[0054]
s1、获取每个领域对应的携带文本类别信息的样本集,根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对。
[0055]
本实施例中,预先为每个领域收集了对应的样本集,所述领域可以包括医疗、体育、金融、教育、旅游等,所述样本集中的样本携带文本类别信息标签,例如,医疗领域的文本类别包括内科、外科、急诊科、健身科、脑科等文本类别。
[0056]
所述根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对,包括以下步骤a11-a12:
[0057]
a11、将每个样本集中各个样本分别与其相同文本类别的样本两两组合,得到每个样本集对应的多个正样本对;
[0058]
例如,对于医疗领域,若内科、外科、急诊科、健身科、脑科文本类别的样本分别有500、1000、1200、1500及1600个,则其正样本对的数量
[0059]
a12、将每个样本集中各个样本分别与其不同文本类别的样本两两组合,得到每个样本集对应的多个负样本对。
[0060]
对于医疗领域中内科文本类别的样本1,其可以与外科、急诊科、健身科、脑科文本类别对应的5300个样本(其中,5300=1000+1200+1500+1600)中的任一个样本组合,形成一个负样本对,则样本1对应的负样本对数量为医疗领域对应的负样本对的数量医疗领域对应的负样本对的数量
[0061]
s2、根据所述正样本对与负样本对的相似度差异确定目标损失函数,通过最小化所述目标损失函数以训练每个领域对应的初始分类模型,得到每个领域对应的文本分类模型。
[0062]
正样本对为相同文本类别的两个样本,负样本对为不相同文本类别的两个样本,本实施例将增大正样本对与负样本对之间的相似度距离作为第一目标构建第一损失函数,将减少每个样本的预测值与标签值的差值作为第二目标构建第二损失函数,基于第一、第
二损失函数确定目标损失函数,并通过最小化目标损失函数的的方式训练模型,从而模型可学习正样本对之间的相似性及负样本对之间的不相似性,加深了样本之间的交互,同时也拉近预测值与标签值之间的距离,使得训练好的文本分类模型更加准确。
[0063]
所述根据所述正样本对与负样本对的相似度差异确定目标损失函数,包括以下步骤b11-b15:
[0064]
b11、选择一个领域的样本集,将选择的样本集输入初始分类模型的编码网络执行编码处理,得到所述选择的样本集中每个样本的编码向量;
[0065]
本实施例中,所述初始分类模型可以是transformer模型,初始分类模型包括编码网络及分类网络,编码网络用于对输入文本进行编码(包括字符编码、位置编码、语义编码),得到输入文本的编码向量。
[0066]
b12、基于所述编码向量计算所述选择的样本集对应的每个正样本对的第一相似度值和每个负样本对的第二相似度值;
[0067]
本实施例中,可采用余弦相似度、曼哈顿距离、欧几里得距离、明示距离算法计算正样本对中两个样本之间的第一相似度值,及负样本对中两个样本之间的第二相似度值。
[0068]
b13、基于所述第一相似度值及第二相似度值的差值确定所述选择的样本集对应的第一损失函数;
[0069]
所述第一损失函数为:
[0070][0071]
其中,l为选择的样本集对应的第一损失函数,si为选择的样本集对应的第i个负样本对的第二相似度值,sj为选择的样本集对应的第j个正样本对的第一相似度值,m为选择的样本集中负样本对的总数量,n为选择的样本集中正样本对的总数量。
[0072]
第一损失函数的最外层log(1+x)是函数max(x)的平滑函数,当l下降时,会使si减小、sj增大,从而实现了,样本集对应的任一个负样本对的第二相似度值小于任一个正样本对的第一相似度值,即:拉大了负样本对与正样本对的相似度值之间的距离。
[0073]
b14、将所述编码向量输入所述初始分类模型的分类网络执行分类处理,得到所述选择的样本集中每个样本在对应领域的每个文本类别的概率值,基于所述概率值确定所述选择的样本集对应的第二损失函数;
[0074]
所述分类网络用于预测输入样本在对应领域的每个文本类别的概率值,根据输入样本的标签可以确定其在每个文本类别的真实值,基于预测概率值与真实值确定选择的样本集对应的第二损失函数。
[0075]
所述第二损失函数为:
[0076][0077]
其中,y为选择的样本对应的第二损失函数,为选择的样本集中第i个样本在对应领域的第j个文本类别的真实值,为选择的样本集中第i个样本在对应领域的第j个文
本类别的预测概率值,a为选择的样本集中样本的总数量,b为选择的样本集对应领域的文本类别的总数量。
[0078]
b15、基于所述第一损失函数及第二损失函数确定所述选择的样本集对应的目标损失函数。
[0079]
本实施例中,对第一及第二损失函数求和,得到目标损失函数。在其他实施例中,也可以分别为第一损失函数及第二损失函数设置对应的权值,加权求和确定目标损失函数。
[0080]
s3、接收待分类文本,识别所述待分类文本对应的目标领域,判断所述目标领域对应的样本集在文本类别上的分布是否均衡,若判断为否,计算所述目标领域的每个文本类别对应的权重。
[0081]
本实施例中,采用步骤s1-s2为每个领域训练了对应的文本分类模型,然而,因各个领域的样本分布情况不同,文本分类模型的分类准确性不同,对于在各个文本类别的样本分布均衡的领域,其文本分类模型的分类准确性较高,对于在文本类别分布不均衡的领域,其文本分类模型的分类准确性不高。
[0082]
为提高样本分布不均衡领域的文本分类准确性,本实施例为该领域的每个文本类别设置一个权重参数,并采用powell法求解权重参数的最优值,将模型在每个文本类别的输出值与对应的权重参数的值的乘积作为输入文本在每个文本类别的目标值,解决了该领域的模型文本分类不准确的问题。powell法是按步迭代,寻找参数的最优值以使损失达到最小值的求解参数值方法,采用powell法求解参数值是现有技术,在此不再赘述。
[0083]
所述识别所述待分类文本对应的目标领域,包括以下步骤c11-c13:
[0084]
c11、对所述待分类文本执行分词处理,得到词语集合;
[0085]
本实施例中,可采用正向最大匹配法、逆向最大匹配法或最少切分法对待分类文本执行分词处理。
[0086]
c12、将所述词语集合中的每个词语分别与每个领域对应的词语库进行匹配,得到每个领域对应的匹配词集合;
[0087]
本实施例中,预先为每个领域配置了对应的词语库。
[0088]
c13、将匹配词集合中匹配词数量最多的领域作为所述待分类文本对应的目标领域。
[0089]
例如,若医疗领域对应的匹配词集合中匹配词最多,则将医疗作为待分类文本对应的目标领域。
[0090]
所述判断所述目标领域对应的样本集在文本类别上的分布是否均衡,包括以下步骤d11-d14:
[0091]
d11、统计所述目标领域对应的样本集在每个文本类别的样本数量;
[0092]
具体的,根据样本的标签信息可统计每个文本类别的样本数量。
[0093]
d12、基于所述样本数量计算所述目标领域对应的样本平均值;
[0094]
d13、基于所述样本数量及样本平均值计算所述目标领域对应的样本集的方差;
[0095]
d14、根据所述方差确定所述目标领域对应的样本集在文本类别上的分布是否均衡。
[0096]
本实施例中,若所述方差小于预先确定的方差阈值,则所述目标领域对应的样本
集在文本类别上的分布均衡;若所述方差大于所述方差阈值,则所述目标领域对应的样本集在文本类别上的分布不均衡。
[0097]
s4、将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在所述目标领域的每个文本类别的预测值,基于所述预测值及所述权重确定所述待分类文本在所述目标领域的每个文本类别的目标值,基于所述目标值确定所述待分类文本对应的目标文本类别。
[0098]
本实施例中,将每个文本类别的预测值与对应权重的乘积作为待分类文本在每个文本类别的目标值,将目标值最大的文本类别作为待分类文本对应的目标文本类别。
[0099]
在所述判断所述目标领域对应的样本集在文本类别上的分布是否均衡之后,所述方法还包括:
[0100]
若判断为是,将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在每个文本类别的预测值,基于所述预测值确定所述待分类文本对应的目标文本类别。
[0101]
由上述实施例可知,本发明提出的文本分类方法,首先,将每个领域对应的样本集拆分为多个正样本对和多个负样本对;接着,根据正样本对与负样本对的相似度差异确定目标损失函数,通过最小化目标损失函数训练出每个领域对应的文本分类模型;然后,识别待分类文本对应的目标领域,判断目标领域对应的样本集在文本类别上的分布是否均衡,若判断为否,计算目标领域的每个文本类别对应的权重;最后,将待分类文本输入目标领域对应的文本分类模型,基于文本分类模型输出的预测值及所述权重确定待分类文本对应的目标文本类别。本发明根据正样本对与负样本对的相似度差异确定目标损失函数,从而模型可学习正样本对之间的相似性及负样本对之间的不相似性,加深了样本之间的交互,提高了模型的分类准确性。因此,本发明提高了文本分类的准确性。
[0102]
如图2所示,为本发明一实施例提供的文本分类装置的模块示意图。
[0103]
本发明所述文本分类装置100可以安装于电子设备中。根据实现的功能,所述文本分类装置100可以包括拆分模块110、训练模块120、判断模块130及分类模块140。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0104]
在本实施例中,关于各模块/单元的功能如下:
[0105]
拆分模块110,用于获取每个领域对应的携带文本类别信息的样本集,根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对。
[0106]
所述根据所述文本类别信息将每个样本集拆分为多个正样本对和多个负样本对,包括以下步骤a21-a22:
[0107]
a21、将每个样本集中各个样本分别与其相同文本类别的样本两两组合,得到每个样本集对应的多个正样本对;
[0108]
a22、将每个样本集中各个样本分别与其不同文本类别的样本两两组合,得到每个样本集对应的多个负样本对。
[0109]
训练模块120,用于根据所述正样本对与负样本对的相似度差异确定目标损失函数,通过最小化所述目标损失函数以训练每个领域对应的初始分类模型,得到每个领域对应的文本分类模型。
[0110]
所述根据所述正样本对与负样本对的相似度差异确定目标损失函数,包括以下步骤b21-b25:
[0111]
b21、选择一个领域的样本集,将选择的样本集输入初始分类模型的编码网络执行编码处理,得到所述选择的样本集中每个样本的编码向量;
[0112]
b22、基于所述编码向量计算所述选择的样本集对应的每个正样本对的第一相似度值和每个负样本对的第二相似度值;
[0113]
b23、基于所述第一相似度值及第二相似度值的差值确定所述选择的样本集对应的第一损失函数;
[0114]
所述第一损失函数为:
[0115][0116]
其中,l为选择的样本集对应的第一损失函数,si为选择的样本集对应的第i个负样本对的第二相似度值,sj为选择的样本集对应的第j个正样本对的第一相似度值,m为选择的样本集中负样本对的总数量,n为选择的样本集中正样本对的总数量。
[0117]
b24、将所述编码向量输入所述初始分类模型的分类网络执行分类处理,得到所述选择的样本集中每个样本在对应领域的每个文本类别的概率值,基于所述概率值确定所述选择的样本集对应的第二损失函数;
[0118]
b25、基于所述第一损失函数及第二损失函数确定所述选择的样本集对应的目标损失函数。
[0119]
判断模块130,用于接收待分类文本,识别所述待分类文本对应的目标领域,判断所述目标领域对应的样本集在文本类别上的分布是否均衡,若判断为否,计算所述目标领域的每个文本类别对应的权重。
[0120]
所述识别所述待分类文本对应的目标领域,包括以下步骤c21-c23:
[0121]
c21、对所述待分类文本执行分词处理,得到词语集合;
[0122]
c22、将所述词语集合中的每个词语分别与每个领域对应的词语库进行匹配,得到每个领域对应的匹配词集合;
[0123]
c23、将匹配词集合中匹配词数量最多的领域作为所述待分类文本对应的目标领域。
[0124]
所述判断所述目标领域对应的样本集在文本类别上的分布是否均衡,包括以下步骤d21-d24:
[0125]
d21、统计所述目标领域对应的样本集在每个文本类别的样本数量;
[0126]
d22、基于所述样本数量计算所述目标领域对应的样本平均值;
[0127]
d23、基于所述样本数量及样本平均值计算所述目标领域对应的样本集的方差;
[0128]
d24、根据所述方差确定所述目标领域对应的样本集在文本类别上的分布是否均衡。
[0129]
分类模块140,用于将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在所述目标领域的每个文本类别的预测值,基于所述预测值及所述权重确定所述待分类文本在所述目标领域的每个文本类别的目标值,基于所述目标值确定所述
待分类文本对应的目标文本类别。
[0130]
在所述判断所述目标领域对应的样本集在文本类别上的分布是否均衡之后,所述分类模块140还用于:
[0131]
若判断为是,将所述待分类文本输入所述目标领域对应的文本分类模型,得到所述待分类文本在每个文本类别的预测值,基于所述预测值确定所述待分类文本对应的目标文本类别。
[0132]
如图3所示,为本发明一实施例提供的实现文本分类方法的电子设备的结构示意图。
[0133]
所述电子设备1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子设备1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
[0134]
在本实施例中,电子设备1包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,该存储器11中存储有文本分类程序10,所述文本分类程序10可被所述处理器12执行。图3仅示出了具有组件11-13以及文本分类程序10的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0135]
其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子设备1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子设备1的内部存储单元,例如该电子设备1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子设备1的操作系统和各类应用软件,例如存储本发明一实施例中的文本分类程序10的代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
[0136]
处理器12在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行文本分类程序10等。
[0137]
网络接口13可包括无线网络接口或有线网络接口,该网络接口13用于在所述电子设备1与客户端(图中未画出)之间建立通信连接。
[0138]
可选的,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选的,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器
也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
[0139]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0140]
所述电子设备1中的所述存储器11存储的文本分类程序10是多个指令的组合,在所述处理器12中运行时,可以实现上述文本分类方法。
[0141]
具体地,所述处理器12对上述文本分类程序10的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0142]
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是非易失性的,也可以是非易失性的。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
[0143]
所述计算机可读存储介质上存储有文本分类程序10,所述文本分类程序10可被一个或者多个处理器执行,以实现上述文本分类方法。
[0144]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0145]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0146]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0147]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0148]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0149]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0150]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
[0151]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照
较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1