文本的分类的方法、存储介质及计算装置与流程

文档序号:29029467发布日期:2022-02-24 11:37阅读:93来源:国知局
文本的分类的方法、存储介质及计算装置与流程

1.本公开涉及文本检测领域,具体而言涉及一种不良文本的检测的方法、存储介质及计算装置。


背景技术:

2.基于文本的不良网站检测一般是通过提取文本、分词、对经分词的文本使用tf-idf算法提取关键词并且得到关键词权重来得到文本的特征。之后,使用机器学习的分类模型判别文本的良莠。
3.tf-idf算法对相似词分别计算得分,由于每个词词频较低,造成挖掘到的特征的表征不够准确。而且,词典中的词的数量较大,会造成高维稀疏特征。因此,标准tf-idf关键词表征文本的方法具有天然的高维和稀疏的特性。当训练文本较少时,这种方法可能会存在特征覆盖不足的问题。如果为了覆盖更为完整的词的范围而利用大量的训练文本,则会带来更为稀疏的特征。
4.在基于特征来判断文本是否为不良文本时,与特征相似的词对文章分类的贡献无法获取。
5.而且,标准tfidf算法依赖于词的出现频率,对文本的上下文信息缺乏足够的利用。
6.因此,存在对标准tfidf算法进行改进的需求,以克服上述缺陷,更加适用于不良网站检测的场景。


技术实现要素:

7.根据本公开的第一方面,提供了一种用于计算针对不良文本的词典的方法,该词典被用于文本的分类,包括:对不良文本进行分词,并基于分词结果得到由词构成的第一文本;将第一文本中的至少部分词替换为该词的同义词集合,以得到包括同义词集合的第二文本;计算第二文本中的每个同义词集合的特征值;将第二文本划分为多个窗口,并计算每个窗口的特征值;对每个同义词集合的特征值以及包含该同义词集合的窗口的特征值的均值进行加权平均,以得到每个同义词集合的经修正的特征值;确定词典,其中,该词典包括第二文本中的同义词集合以及每个同义词集合的经修正的特征值。
8.根据本公开的第二方面,提供了一种用于训练文本的分类预测模型的方法,包括:获取多个样本,其中,样本为不良文本;利用根据本公开的第一方面所述的方法计算的词典,获得该多个样本的特征向量;以及利用该多个样本的特征向量来训练分类器,以得到分类预测模型;其中,获得该多个样本的特征向量包括对该多个样本中的每一个执行以下步骤:利用词典,构建样本的特征向量,其中,该样本的特征向量的维数等于词典中包括的同义词集合的数量,该样本的特征向量包括词典中的同义词集合和与该同义词集合对应的特征值;对于词典中的每一个同义词集合,判断该样本中是否包括该同义词集合的词;如果该样本中包括该同义词集合的词,则该样本的特征向量中与该同义词集合对应的特征值为词
典中与该同义词集合对应的特征值;如果该样本中不包括该同义词集合的词,则该样本的特征向量中与该同义词集合对应的特征值为零。
9.根据本公开的第三方面,提供了一种用于文本的分类的方法,包括:利用根据本公开的第一方面所述的方法计算的词典,获得待预测的文本的特征向量;以及利用根据第二方面所述的方法所获得的分类预测模型,基于待预测的文本的特征向量来预测待预测的文本为不良文本的概率;其中,获得待预测的文本的特征向量包括以下步骤:利用词典,构建待预测的文本的特征向量,其中,待预测的文本的特征向量的维数等于词典中包括的同义词集合的数量,待预测的文本的特征向量包括词典中的同义词集合和与该同义词集合对应的特征值;对于词典中的每一个同义词集合,判断待预测的文本中是否包括该同义词集合的词;如果待预测的文本中包括该同义词集合的词,则待预测的文本的特征向量中与该同义词集合对应的特征值为词典中与该同义词集合对应的特征值;如果待预测的文本中不包括该同义词集合的词,则待预测的文本的特征向量中与该同义词集合对应的特征值为零。
10.根据本公开的第四方面,提供了一种用于计算针对不良文本的词典的非瞬态计算机可读存储介质,其上存储有程序,当该程序由计算机执行时,使得该计算机执行根据本公开的第一方面的方法。
11.根据本公开的第五方面,提供了一种用于训练文本的分类预测模型的非瞬态计算机可读存储介质,其上存储有程序,当该程序由计算机执行时,使得该计算机执行根据本公开的第二方面的方法。
12.根据本公开的第六方面,提供了一种用于文本的预测的非瞬态计算机可读存储介质,其上存储有程序,当该程序由计算机执行时,使得该计算机执行根据本公开的第三方面的方法。
13.根据本公开的第七方面,提供了一种用于计算针对不良文本的词典的计算装置,包括存储器和处理器,存储器与处理器通信耦合,该存储器中存储有程序,该程序当由处理器执行时,使得该处理器执行根据本公开的第一方面的方法。
14.根据本公开的第八方面,提供了一种用于训练文本的分类预测模型的计算装置,包括存储器和处理器,存储器与处理器通信耦合,该存储器中存储有程序,该程序当由处理器执行时,使得该处理器执行根据本公开的第二方面的方法。
15.根据本公开的第九方面,提供了一种用于文本的预测的计算装置,包括存储器和处理器,存储器与处理器通信耦合,该存储器中存储有程序,该程序当由处理器执行时,使得该处理器执行根据本公开的第三方面的方法。
16.本公开能够对文本的特征进行更为充分的挖掘,利用同义词集合和上下文对文本的特征进行修正,以实现对文本更为准确的表征,从而有利于文本的分类。
17.通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得更为清楚。
附图说明
18.构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
19.参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
20.图1是根据本公开的实施例的针对不良文本的词典的计算方法的示意图。
21.图2是根据本公开的实施例的用于计算针对不良文本的词典的方法的流程图。
22.图3是根据本公开的实施例的用于训练文本的分类预测模型的方法的流程图。
23.图4是可以用于实现根据本公开的实施例的方法的示例性计算设备的示意图。
24.为了便于理解,在附图等中所示的各结构的位置、尺寸及范围等有时不表示实际的位置、尺寸及范围等。因此,本公开并不限于附图等所公开的位置、尺寸及范围等。
具体实施方式
25.下面将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
26.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。也就是说,本文中的结构及方法是以示例性的方式示出,来说明本公开中的结构和方法的不同实施例。然而,本领域技术人员将会理解,它们仅仅说明可以用来实施的本公开的示例性方式,而不是穷尽的方式。此外,附图不必按比例绘制,一些特征可能被放大以示出具体组件的细节。
27.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
28.不良网站的检测可以通过对网站的文本内容的检测来实现。首先需要获得网站的文本内容。例如,可以使用selenium获取网页源码,然后可以从网页源码提取文本。在获取网站的文本之后,可以对文本进行处理,获得与不良内容有关的特征。
29.图1是根据本公开的实施例的针对不良文本的词典的计算方法的示意图。针对不良文本的词典可以被用于获取不良文本的特征,从而可以被用于文本的分类。如图1所示,获得词典可以包括对文本进行分词、将文本中的词替换为同义词集合、计算同义词集合的特征值、利用滑动窗口对同义词集合的特征值进行修正等,以下将结合图2中所示的流程图详述。
30.图2是根据本公开的实施例的用于计算针对不良文本的词典的方法的流程图。
31.在s201处,可以对不良文本进行分词,并基于分词结果得到由词构成的第一文本。
32.如图1中所示,对文本进行分词,以得到由词k1、k2、
……
、k
p
等构成的第一文本。在根据本公开的实施例中,在进行分词之后,可以从分词结果中剔除停用词,并且保留其余的词作为有效词,以使得第一文本中仅包括有效词。停用词可以包括例如“的”、“了”等对于分析文本的特征而言无用的词。
33.在s202处,可以将第一文本中的至少部分词替换为该词的同义词集合,以得到包括同义词集合的第二文本。
34.词的同义词集合可以是指与该词的语义相同和/或相似的词,并且可以不限于该第一文本中所包括的词。例如,可以利用fasttext等构建同义词集合。如图1中所示,可以将第一文本中的词k1、k2、
……
、k
p
等替换为相应的同义词集合a1、a2、
……
、aj等,以得到包括同义词集合a1、a2、
……
、aj等的第二文本。在根据本公开的实施例中,可以不用将第一文本中所包括的所有词均替换为相应的同义词集合,而是仅将第一文本中的与不良信息有关的词
替换为该词的同义词集合。例如,在替换之前,可以基于已知不良信息样本来判断第一文本中的词是否为与不良信息有关的词,如果该词与不良信息有关,则将该词替换为相应的同义词集合,否则不进行同义词集合的替换。
35.在s203处,可以计算第二文本中的每个同义词集合的特征值。这里的特征值可以是指tf-idf值。
36.tf-idf算法是一种针对关键词的统计分析方法,tf-idf可以表示词在语料库中的重要程度。针对词的标准tf-idf算法如下:
37.tfidf
(i,j)
=tf
(i,j)
*idfj,
38.其中,tfidf
(i,j)
为词i在文本j中的tf-idf值;tf
(i,j)
为词i在文本j中的tf值,可以表示词频;idfj为词i的idf值,可以表示逆向文件频率。
[0039][0040]
其中,n
(i,j)
为词i在文本j中出现的次数,为文本j中所有有效词出现的次数之和。
[0041][0042]
其中,|d|为语料库中文本的数量,|{j:ti∈dj}|为语料库中包含词i的文本的数量,∈为微小值。
[0043]
在根据本公开的实施例中,可以对标准tf-idf算法进行改进,以用于计算同义词集合的tf-idf值。同义词集合的tf-idf值的计算方法如下:
[0044][0045]
其中,为文本j中同义词集合a
l
的tf-idf值,为文本j中同义词集合a
l
的tf值,为同义词集合a
l
的idf值;
[0046][0047]
其中,n
(i,j)
为词i在文本j中出现的次数,为有效词在文本j中的出现次数之和,为同义词集合a
l
中的词的tf值之和;
[0048][0049]
其中,|d|为语料库中文本的数量,|{j:ti∈dj}|为语料库中包含词i的文本的数量,为语料库中包含同义词集合a
l
中的词的文本的数量之和,∈为微小值。
[0050]
通过如上所述的针对同义词集合的tf-idf算法,可以得到如图1中所示的表示同
义词的特征的向量{(a1,v
a1
),(a2,v
a2
),...,(am,v
am
)},其中v
ak
为与同义词集合ak对应的tf-idf值。该向量包括文本中的同义词集合及与同义词集合对应的tf-idf值。
[0051]
在s204处,可以将第二文本划分为多个窗口,并计算每个窗口的特征值。
[0052]
窗口的长度可以按需要进行选择。在根据本公开的实施例中,窗口的长度可以是固定的,例如,如图1中所示,将每两个同义词集合划分为一个窗口。在根据本公开的其他实施例中,窗口的长度也可以不是固定的。
[0053]
每个窗口的特征值可以是每个窗口的tf-idf值,其算法类似于上文所述的标准tf-idf算法,可以将每个窗口看作一个词,利用标准tf-idf算法计算得到的tf-idf值即为该窗口的tf-idf值。从而,可以得到如图1中所示的表示窗口的特征的向量{(s1,v
s1
),(s2,v
s2
),...,(s
t
,v
st
)},其中v
sk
为与窗口sk对应的tf-idf值。该向量包括文本中的窗口及与窗口对应的tf-idf值。
[0054]
在s205处,可以对每个同义词集合的特征值以及包含该同义词集合的窗口的特征值的均值进行加权平均,以得到每个同义词集合的经修正的特征值。例如,文本j中同义词集合a
l
的经修正的tf-idf值的算法如下:
[0055][0056]
其中,为文本j中同义词集合a
l
的经修正的tf-idf值;为文本j中同义词集合a
l
的tf-idf值;为文本j中包含同义词集合a
l
的窗口的tf-idf值的均值;α为修正系数,其范围为0<α≤1,例如,可以取α=0.8。
[0057]
在s206处,可以确定词典,该词典包括第二文本中的同义词集合以及每个同义词集合的经修正的特征值。
[0058]
在根据本公开的实施例中,可以将第二文本中的同义词集合的经修正的特征值从高到低进行排序,词典仅包括特征值的排序在前n位的同义词集合及该同义词集合的经修正的统计特征值,其中,n为不小于2的整数。
[0059]
例如,如图1中所示,可以截取特征值的排序在前l位的同义词集合,得到词典{(a1,v’a1
),(a2,v’a2
),...,(a
l
,v’al
)},其中v’ak
为与同义词集合ak对应的经修正的tf-idf值。
[0060]
图3是根据本公开的实施例的用于训练文本的分类预测模型的方法的流程图。
[0061]
在s301处,可以获取多个样本,其中,样本为不良文本。
[0062]
在s302处,可以利用如前文所述的词典,获得多个样本的特征向量。其中,获得多个样本的特征向量可以包括对多个样本中的每一个执行以下步骤:
[0063]
利用词典,构建样本的特征向量,其中,样本的特征向量的维数等于该词典中包括的同义词集合的数量,样本的特征向量包括词典中的同义词集合和与该同义词集合对应的特征值;
[0064]
对于该词典中的每一个同义词集合,判断样本中是否包括该同义词集合中的词;
[0065]
如果样本中包括该同义词集合的词,则样本的特征向量中与该同义词集合对应的特征值为该词典中与该同义词集合对应的特征值;
[0066]
如果样本中不包括该同义词集合的词,则样本的特征向量中与该同义词集合对应的特征值为零。
[0067]
例如,可以利用图1中的字典来获取多个样本的特征向量。图1中的字典{(a1,v’a1
),(a2,v’a2
),

,(a
l
,v’al
)}的维数为l,则不良文本的特征向量为l维向量。例如,对于多个样本中的样本x,可以构建l维向量{(a1,x1),(a2,x2),

,(a
l
,x
l
)}。如果样本x中包括同义词集合ak中的词,则xk=v’ak
;否则,xk=0。依此类推,可以得到样本x的特征向量{(a1,x1),(a2,x2),

,(a
l
,x
l
)}。
[0068]
在s303处,可以利用多个样本的特征向量来训练分类器,以得到分类预测模型。在根据本公开的实施例中,分类器可以是svm分类器。在根据本公开的其他实施例中,也可以使用其他分类器,例如xgboost、前馈神经网络等。
[0069]
在得到经训练的针对文本的分类预测模型之后,可以对待预测的文本进行分类,判断待预测的文本是否属于不良文本。
[0070]
可以利用如上文所述的词典来获得待预测的文本的特征向量。具体步骤可以类似于上文所述的构建样本的特征向量的步骤。例如,可以利用图1中的字典来获得待预测的文本的特征向量。图1中的字典{(a1,v’a1
),(a2,v’a2
),

,(a
l
,v’al
)}的维数为l,则待预测的文本的特征向量为l维向量。例如,对于待预测的文本y,可以构建l维向量{(a1,y1),(a2,y2),

,(a
l
,y
l
)}。如果待预测的文本y中包括同义词集合ak中的词,则yk=v’ak
;否则,yk=0。依此类推,可以得到待预测的文本y的特征向量{(a1,y1),(a2,y2),

,(a
l
,y
l
)}。
[0071]
可以利用如上文所述进行训练的分类预测模型,基于待预测的文本的特征向量来计算该待预测的文本为不良文本的概率。
[0072]
在计算得到待预测的文本为不良文本的概率之后,可以对该待预测的文本进行分类。在根据本公开的实施例中,可以判断该待预测的文本为不良文本的概率是否大于阈值;如果该待预测的文本为不良文本的概率大于阈值,则判断该待预测的文本为不良文本。例如,阈值可以为0.8,如果该待预测的文本为不良文本的概率大于0.8,则判断该待预测的文本为不良文本。
[0073]
图4示出了可以用于实现根据本公开的实施例的方法的示例性计算设备。如图4所示,计算设备400可以包括一个或多个处理器402。一个或多个处理器402可以是任何种类的处理器,并且可以包括但不限于一个或多个通用处理器或专用处理器(诸如专用处理芯片)。
[0074]
计算设备400还可以包括或被连接至非暂态存储设备404,该非暂态存储设备404可以是任何非暂态的并且可以实现数据存储的存储设备,并且可以包括但不限于盘驱动器、光存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁性介质、压缩盘或任何其他光学介质、缓存存储器和/或任何其他存储芯片或模块、和/或计算机可以从其中读取数据、指令和/或代码的其他任何介质。
[0075]
处理器402和/或存储设备404可以经由一个或多个接口与总线406连接或通信。总线406可以包括但不限于,工业标准架构(industry standard architecture,isa)总线、微通道架构(micro channel architecture,mca)总线、增强isa(eisa)总线、视频电子标准协会(vesa)局部总线、以及外设组件互连(pci)总线等。
[0076]
i/o设备408可以是使得用户能够与计算设备400交互的任何设备。i/o设备408的
示例可以包括但不限于键盘、触控板、鼠标、操纵杆或其它指示设备、麦克风、扬声器以及显示器等。
[0077]
计算设备400还可包括网络接口410。网络接口410可以是能够启用与外部装置和/或网络通信的任何种类的设备或系统,并且可以包括但不限于调制解调器、网络卡、红外线通信设备、无线通信设备和/或芯片集(诸如蓝牙tm设备、wifi设备、wimax设备、蜂窝通信设施等)。
[0078]
i/o设备408和/或网络接口410也可以经由总线406与处理器402和/或存储设备404通信地耦合。
[0079]
可单独地或以任何组合方式来使用前述实施方案的各个方面、实施方案、具体实施或特征。可由软件、硬件或硬件与软件的组合来实现前述实施方案的各个方面。
[0080]
例如,前述实施方案可体现为计算机可读介质上的计算机可读代码。计算机可读介质为可存储数据的任何数据存储设备,数据其后可由计算机系统读取。计算机可读介质的示例包括只读存储器、随机存取存储器、cd-rom、dvd、磁带、硬盘驱动器、固态驱动器和光学数据存储设备。计算机可读介质还可分布在网络耦接的计算机系统中使得计算机可读代码以分布式方式来存储和执行。
[0081]
例如,前述实施方案可采用硬件电路的形式。硬件电路可以包括组合式逻辑电路、时钟存储设备(诸如软盘、触发器、锁存器等)、有限状态机、诸如静态随机存取存储器或嵌入式动态随机存取存储器的存储器、定制设计电路、可编程逻辑阵列等的任意组合。
[0082]
在一个实施方案中,可以通过用诸如verilog或vhdl的硬件描述语言(hdl)编码和设计一个或多个集成电路或者结合使用离散电路来实现根据本公开的硬件电路。
[0083]
本公开可以在兼顾覆盖更多文本信息并利用上下文信息的条件下实现特征的降维,对不良信息文本进行更准确的理解和表征;并且,可以利用改进的特征来训练分类器模型,从而实现对待预测文本的更为准确的分类。
[0084]
综上所述,根据本公开的第一方面,提供了一种用于计算针对不良文本的词典的方法,该词典被用于文本的分类,包括:对不良文本进行分词,并基于分词结果得到由词构成的第一文本;将第一文本中的至少部分词替换为该词的同义词集合,以得到包括同义词集合的第二文本;计算第二文本中的每个同义词集合的特征值;将第二文本划分为多个窗口,并计算每个窗口的特征值;对每个同义词集合的特征值以及包含该同义词集合的窗口的特征值的均值进行加权平均,以得到每个同义词集合的经修正的特征值;确定词典,其中,该词典包括第二文本中的同义词集合以及每个同义词集合的经修正的特征值。
[0085]
在一些实施例中,基于分词结果得到由词构成的第一文本还包括:从分词结果中剔除停用词并保留其余的词作为有效词,以使得第一文本中仅包括有效词。
[0086]
在一些实施例中,特征值为tf-idf值;其中,同义词集合的tf-idf值的计算方法如下:
[0087][0088]
其中,为文本j中同义词集合al的tf-idf值,为文本j中同义词集合al的tf值,为同义词集合al的idf值;
[0089][0090]
其中,n(i,j)为词i在文本j中出现的次数,为有效词在文本j中的出现次数之和,为同义词集合al中的词的tf值之和;
[0091][0092]
其中,|d|为语料库中文本的数量,|{j:ti∈dj}|为语料库中包含词i的文本的数量,为语料库中包含同义词集合al中的词的文本的数量之和,∈为微小值。
[0093]
在一些实施例中,将第一文本中的至少部分词替换为该词的同义词集合包括:仅将第一文本中的与不良信息有关的词替换为该词的同义词集合,其中,在替换之前,基于已知不良信息样本来判断第一文本中的词是否为与不良信息有关的词。
[0094]
在一些实施例中,该方法还包括:将第二文本中的同义词集合的经修正的特征值从高到低进行排序,词典仅包括特征值的排序在前n位的同义词集合及该同义词集合的经修正的统计特征值,其中,n为不小于2的整数。
[0095]
根据本公开的第二方面,提供了一种用于训练文本的分类预测模型的方法,包括:获取多个样本,其中,样本为不良文本;利用根据本公开的第一方面所述的方法计算的词典,获得该多个样本的特征向量;以及利用该多个样本的特征向量来训练分类器,以得到分类预测模型;其中,获得该多个样本的特征向量包括对该多个样本中的每一个执行以下步骤:利用词典,构建样本的特征向量,其中,该样本的特征向量的维数等于词典中包括的同义词集合的数量,该样本的特征向量包括词典中的同义词集合和与该同义词集合对应的特征值;对于词典中的每一个同义词集合,判断该样本中是否包括该同义词集合的词;如果该样本中包括该同义词集合的词,则该样本的特征向量中与该同义词集合对应的特征值为词典中与该同义词集合对应的特征值;如果该样本中不包括该同义词集合的词,则该样本的特征向量中与该同义词集合对应的特征值为零。
[0096]
在一些实施例中,分类器为svm分类器。
[0097]
根据本公开的第三方面,提供了一种用于文本的分类的方法,包括:利用根据本公开的第一方面所述的方法计算的词典,获得待预测的文本的特征向量;以及利用根据第二方面所述的方法所获得的分类预测模型,基于待预测的文本的特征向量来预测待预测的文本为不良文本的概率;其中,获得待预测的文本的特征向量包括以下步骤:利用词典,构建待预测的文本的特征向量,其中,待预测的文本的特征向量的维数等于词典中包括的同义词集合的数量,待预测的文本的特征向量包括词典中的同义词集合和与该同义词集合对应的特征值;对于词典中的每一个同义词集合,判断待预测的文本中是否包括该同义词集合的词;如果待预测的文本中包括该同义词集合的词,则待预测的文本的特征向量中与该同义词集合对应的特征值为词典中与该同义词集合对应的特征值;如果待预测的文本中不包括该同义词集合的词,则待预测的文本的特征向量中与该同义词集合对应的特征值为零。
[0098]
在一些实施例中,该方法还包括:判断待预测的文本为不良文本的概率是否大于
阈值;如果待预测的文本为不良文本的概率大于阈值,则判断待预测的文本为不良文本。
[0099]
根据本公开的第四方面,提供了一种用于计算针对不良文本的词典的非瞬态计算机可读存储介质,其上存储有程序,当该程序由计算机执行时,使得该计算机执行根据本公开的第一方面的方法。
[0100]
根据本公开的第五方面,提供了一种用于训练文本的分类预测模型的非瞬态计算机可读存储介质,其上存储有程序,当该程序由计算机执行时,使得该计算机执行根据本公开的第二方面的方法。
[0101]
根据本公开的第六方面,提供了一种用于文本的预测的非瞬态计算机可读存储介质,其上存储有程序,当该程序由计算机执行时,使得该计算机执行根据本公开的第三方面的方法。
[0102]
根据本公开的第七方面,提供了一种用于计算针对不良文本的词典的计算装置,包括存储器和处理器,存储器与处理器通信耦合,该存储器中存储有程序,该程序当由处理器执行时,使得该处理器执行根据本公开的第一方面的方法。
[0103]
根据本公开的第八方面,提供了一种用于训练文本的分类预测模型的计算装置,包括存储器和处理器,存储器与处理器通信耦合,该存储器中存储有程序,该程序当由处理器执行时,使得该处理器执行根据本公开的第二方面的方法。
[0104]
根据本公开的第九方面,提供了一种用于文本的预测的计算装置,包括存储器和处理器,存储器与处理器通信耦合,该存储器中存储有程序,该程序当由处理器执行时,使得该处理器执行根据本公开的第三方面的方法。
[0105]
虽然已通过示例详细展示了本公开的一些具体实施例,但是本领域技术人员应当理解,上述示例仅意图是说明性的而不限制本公开的范围。应该认识到的是,前述方法中的一些步骤不一定按照图示的顺序执行,而是它们可以被同时、以不同顺序或以重叠方式执行。此外,本领域技术人员可以根据需要增加一些步骤或省略一些步骤。前述系统中的一些部件不是必须按照图示的布置,本领域技术人员可以根据需要增加一些部件或省略一些部件。本领域技术人员应该理解,上述实施例可以在不脱离本公开的范围和实质的情况下被修改。本公开的范围是通过所附的权利要求限定的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1