工单类别识别方法、装置、计算机设备和存储介质与流程

文档序号:28216245发布日期:2021-12-28 22:14阅读:92来源:国知局
工单类别识别方法、装置、计算机设备和存储介质与流程

1.本技术涉及人工智能的技术领域,特别涉及一种工单类别识别方法、装置、计算机设备和存储介质。


背景技术:

2.对于金融公司和互联网公司来说,随着上线的产品越来越多,客户在使用过程中遇到的问题会反馈给客服人员,客服人员会根据问题进行解答,客服人员在遇到解决不了的问题时会将问题生成工单数据,发送至后端的异常团队,异常团队需要人工来判断工单数据该报送至哪个部门来进行处理,由于产品条线比较多,相应的工单数据量也较多,通过人工来判断工单数据需要报送给哪个部门会比较耗费人力,同时效率较低。因此,为了提高效率,在工单上设置不同的字符编号,通过识别字符编号完成工单的分类,但这种方式虽然提高了分类效率,但是在确定对应的字符编号时的准确性较低。


技术实现要素:

3.本技术的主要目的为提供一种工单类别识别方法、装置、计算机设备和存储介质,旨在解决工单数据分类的准确性较低的技术问题。
4.为实现上述目的,本技术提供了一种工单类别识别方法,其特征在于,包括以下步骤:
5.获取工单数据;
6.对所述工单数据进行分词处理,并基于分词处理后的结果提取所述工单数据对应的特征词;
7.根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵;其中,各个类别的所述特征词表包括有对应类别的若干训练特征词,每个类别分别与一个所述特征词表对应,各个所述特征词表分别和一个似然概率矩阵对应;
8.根据各个所述特征矩阵和各个所述特征词表对应的所述似然概率矩阵构造各个类别对应的命中矩阵;
9.根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率;
10.对所述概率进行降序排序,将所述工单数据发送至所述概率排序在前预设个数的类别所对应的部门。
11.进一步地,所述根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵的步骤,包括:
12.在各个类别中,检测各个所述特征词是否存在于对应的特征词表中;
13.若所述特征词全部存在于对应的特征词表中,从所述特征词表中获取各个所述特征词所对应的训练特征词的下标;其中,所述特征词表中的训练特征词的下标与对应的似然概率矩阵的一列对应;
14.根据所述下标从对应的所述似然概率矩阵中获取第一列矩阵;
15.将各个所述特征词获取的第一列矩阵形成对应类别的特征矩阵。
16.进一步地,所述检测各个所述特征词是否存在于对应的特征词表中的步骤之后,包括:
17.若所有的所述特征词中有特征词未存在于对应的所述特征词表中,为未存在于对应的所述特征词表中的特征词获取一个预设概率,并为存在特征词表中的特征词从对应的似然概率矩阵获取第二列矩阵;
18.根据所述预设概率和所述第二列矩阵构建特征矩阵。
19.进一步地,所述检测各个所述特征词是否存在于对应的特征词表中的步骤之后,包括:
20.若所述工单数据的所有特征词均不存在于对应的所述特征词表中,从先验概率矩阵中根据先验概率获取与所述特征词个数相同的先验概率;其中,所述先验概率矩阵根据对应的所述特征词表计算得到;
21.为每个不存在于特征词表中的所述特征词赋予一个获取到的先验概率;
22.根据所述先验概率构建特征矩阵。
23.进一步地,所述检测各个所述特征词是否存在于对应的特征词表中的步骤之后,包括:
24.若所有的所述特征词中有特征词未存在于对应的所述特征词表中,计算未存在所述特征词表的所述特征词与对应的所述特征词表中的各个训练特征词的相似度;
25.选择相似度最高的训练特征词作为特征词的目标词,获取目标词的下标;
26.根据目标词的下标从对应的似然概率矩阵中获取列矩阵;
27.将各个所述特征词获取的列矩阵形成对应的类别的特征矩阵。
28.进一步地,所述根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率的步骤,包括:
29.将所述命中矩阵与对应的先验概率矩阵的和作为目标矩阵计算所述工单数据属于对应类别的概率;其中,所述先验概率矩阵根据对应的所述特征词表计算得到。
30.进一步地,所述根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵的步骤之前,包括:
31.获取若干训练工单数据,
32.通过预设的特征词提取算法从若干训练工单数据中提取各个类别的训练特征词,根据所述训练特征词构建各个类别的特征词表。
33.本技术还提供一种工单识别装置,包括:
34.第一获取单元,用于获取工单数据;
35.第一提取单元,用于对所述工单数据进行分词处理,并基于分词处理后的结果提取所述工单数据对应的特征词;
36.构建单元,用于根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵;其中,各个类别的所述特征词表包括有对应类别的若干训练特征词,每个类别分别与一个所述特征词表对应,各个所述特征词表分别和一个似然概率矩阵对应;
37.构造单元,用于根据各个所述特征矩阵和各个所述特征词表对应的所述似然概率
矩阵构造各个类别对应的命中矩阵;
38.计算单元,用于根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率;
39.发送单元,用于对所述概率进行降序排序,将所述工单数据发送至所述概率排序在前预设个数的类别所对应的部门。本技术还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的工单类别识别方法的步骤。
40.本技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的工单类别识别方法的步骤。
41.本技术提供的工单类别识别方法、装置、计算机设备和存储介质,通过大量工单数据进行训练,构造训练特征词表以及对应的似然概率矩阵,当接收到新的工单数据,根据预先训练的似然概率矩阵构建特征矩阵,再根据特征矩阵构建相应类别的命中矩阵,从而根据命中矩阵计算得到分类概率,根据分类概率去对应匹配度最高的部门,能够更加准确的对工单数据进行分类,以供后续进行处理,同时提高工单数据整体的流转效率,提高用户体验,提高后端异常运营团队效率和节约人力。
附图说明
42.图1是本技术一实施例中工单类别识别方法步骤示意图;
43.图2是本技术一实施例中工单类别识别方法步骤示意图;
44.图3是本技术一实施例中工单识别装置结构框图;
45.图4为本技术一实施例的计算机设备的结构示意框图。
46.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
47.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
48.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
49.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
50.参照图1,本技术一实施例提供了一种工单类别识别方法,包括以下步骤:
51.步骤s1,获取工单数据;
52.步骤s2,对所述工单数据进行分词处理,并基于分词处理后的结果提取所述工单数据对应的特征词;
53.步骤s3,根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵;其中,各个类别的所述特征词表包括有对应类别的若干训练特征词,每个类别分别与一个所述特征词表对应,各个所述特征词表分别和一个似然概率矩阵对应;
54.步骤s4,根据各个所述特征矩阵和各个所述特征词表对应的所述似然概率矩阵构造各个类别对应的命中矩阵;
55.步骤s5,根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率;
56.步骤s6,对所述概率进行降序排序,将所述工单数据发送至所述概率排序在前预设个数的类别所对应的部门。
57.本实施例中,如上述步骤s1所述,工单数据可以直接从业务系统中获得,也可以通过扫描纸质文件获取,工单数据中记录有需要解决的问题,由于不同的问题通常是由不同的部门进行处理,因此需要对工单数据进行分类,确定其由哪个部门进行处理,如设置有30个部门,则就有30个类别。
58.如上述步骤s2所述,对获取到的工单数据进行分词处理;比如一个工单数据的描述为:盛娟反馈彩虹发起汇享问题0711,分词处理之后得到一个数据集:盛娟反馈彩虹发起汇享问题0711。具体的,可采用结巴分词、hanlp等方式进行分词处理,删除工单数据中的停用词,人类语言包含很多停用词,如功能词、介词等,与其他词相比,功能词没有什么实际含义,最普遍的功能词是限定词“the”、“a”、“an”、“that”、和“those”等,这些词在文本中帮助描述名词和表达概念,如地点或数量。介词如:“over”,“under”,“above”等表示两个词的相对位置。删除停用词之后的分词结果作为特征词,如盛娟彩虹发起汇享0711。
59.如上述步骤s3

s5所述,每个类别预先设置有特征词表,特征词表中包括有多个训练特征词,如每个特征词表中包括4000个训练特征词,这些训练特征词是从大量的训练工单数据中提取出来的,这些训练工单数据已确定由哪个部门进行处理,即有具体的类别,从同一类别的训练工单数据中提取出4000个训练特征词,每一个特征词表都构建有一个先验概率矩阵和一个似然概率矩阵,如属于同一部门的有500条训练工单数据,总共的工单数据为18000条,那么部门1的先验概率为p(c)=500/18000,求得训练工单数据所属每个部门的先验概率,然后根据各个先验概率计算似然概率,即求朴素贝叶斯概率中的p(w|c),其中c代表部门,w代表训练特征词,可以理解为某个训练特征词在某个部门中的概率,根据前述可知共设置有30个部门,每个部门的训练特征词包括有4000个,则最终的似然概率矩阵为30*4000的矩阵。假设部门c1有500条训练工单数据,分词后得到:
[0060] w1w2w3

wn训练工单数据1101

1训练工单数据2111
…1………………
训练工单数据500010
…1[0061]
上面这个矩阵中,如果训练特征词w1出现在训练工单数据1中,则在(训练工单数据1,w1)的地方填1,否则填0,那么表示特征词w1出现在类别c1的概率,其中,n(w1)指特征词w1的在所有工单数据的总个数,其余同理。
[0062]
同理可得p(w1|c1)

p(w
n
|c1)的所有值,即求出了似然概率矩阵的第一行数据,依
次求出30行数据,即构造出了似然概率矩阵。
[0063]
从似然概率矩阵中构造出工单数据在每个类别的特征矩阵,将似然概率矩阵与特征矩阵相乘,得到命中矩阵,每个类别构造有一个命中矩阵,根据命中矩阵即可求得工单数据在每个类别的概率。
[0064]
如上述步骤s6所述,根据概率的大小进行降序排列,获取概率在前预设个数的概率所对应的类别,每个类别对应一个部门,将工单数据发送至这些部门,部门收到工单数据后会相应地给出解决方案,本实施例中工单数据发送了不止一个部门,当有的部门无法给出解决方案时,可以根据自己的经验将工单数数据转发给其他部门进行处理。
[0065]
本实施例中,通过大量工单数据进行训练,构造训练特征词表以及对应的似然概率矩阵,当接收到新的工单数据,根据预先训练的似然概率矩阵构建特征矩阵,从而最终计算得到分类概率,系统自动给出匹配度最高的部门,供后续进行处理,提高工单数据整体的流转效率,提高用户体验,提高后端异常运营团队效率和节约人力。
[0066]
在一实施例中,所述根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵的步骤s3,包括:
[0067]
步骤s31,在各个类别中,检测各个所述特征词是否存在于对应的特征词表中;
[0068]
步骤s32,若所述特征词全部存在于对应的特征词表中,从所述特征词表中获取各个所述特征词所对应的训练特征词的下标;其中,所述特征词表中的训练特征词的下标与对应的似然概率矩阵的一列对应;
[0069]
步骤s33,根据所述下标从对应的所述似然概率矩阵中获取第一列矩阵;
[0070]
步骤s34,将各个所述特征词获取的第一列矩阵形成对应类别的特征矩阵。
[0071]
本实施例中,参见图2,每个类别的特征词表具有多个训练特征词,工单数据的特征词可能存在于特征词表中,也可能不存于特征词表中,当存在于特征词表中时,特征词对应的训练特征词具有一个下标,这个下标对应似然概率矩阵中的某一列,这一列代表该特征词出现在对应类别的概率。如工单数据的特征词有三个,这三个特征词在特征词表a中的训练特征词对应的下标为(10,300,500),从似然概率矩阵中抽取第10列、第300列和第500列的第一列矩阵,形成一个3*4000的特征矩阵,每个类别会得到一个特征矩阵。
[0072]
在一实施例中,所述检测各个所述特征词是否存在于对应的特征词表中的步骤s31之后,包括:
[0073]
步骤s311,若所有的所述特征词中有特征词未存在于对应的所述特征词表中,为未存在于对应的所述特征词表中的特征词获取一个预设概率,并为存在特征词表中的特征词从对应的似然概率矩阵获取第二列矩阵;
[0074]
步骤s312,根据所述预设概率和所述第二列矩阵构建特征矩阵。
[0075]
本实施例中,特征词具有多个,同时类别也具有多个,多个特征词中会存在部分特征词未在于某一个特征词表中,而部分特征词存在于对应特征词表中,当出现这种情况时,为每个未存在特征词表中的特征词赋予一个预设概率,这个预设概率是一个最常见的概率值,并不影响结果最终结果,并为存在与特征词表中的特征词在对应的似然概率矩阵中获取对应的第二列矩阵,即根据训练特征词的下标获取,根据获取到的预设概率和第二列矩阵构建对应类别的特征矩阵。
[0076]
在一实施例中,所述检测各个所述特征词是否存在于对应的特征词表中的步骤
s31之后,包括:
[0077]
步骤s31a,若所述工单数据的所有特征词均不存在于对应的所述特征词表中,从先验概率矩阵中根据先验概率获取与所述特征词个数相同的先验概率;其中,所述先验概率矩阵根据对应的所述特征词表计算得到;
[0078]
步骤s31b,为每个不存在于特征词表中的所述特征词赋予一个获取到的先验概率;
[0079]
步骤s31c,根据所述先验概率构建特征矩阵。
[0080]
本实施例中,当工单数据中的所有特征词均不存在于特征词表中时,训练特征词表中的每个训练特征词均计算有一个先验概率,根据特征词的个数获取先验概率,如具有3个特征词,则从先验概率矩阵中抽取3个先验概率,这3个先验概率是该特征词表所有的先验概率的概率值排名前3的先验概率,为每个特征词分配一个先验概率,可采用随机分配的方式,根据分配的先验概率构造一个特征矩阵。
[0081]
在一实施例中,所述检测各个所述特征词是否存在于对应的特征词表中的步骤s31之后,包括:
[0082]
步骤s31a,若所有的所述特征词中有特征词未存在于对应的所述特征词表中,计算未存在所述特征词表的所述特征词与对应的所述特征词表中的各个训练特征词的相似度;
[0083]
步骤s31b,选择相似度最高的训练特征词作为特征词的目标词,获取目标词的下标;
[0084]
步骤s31c,根据目标词的下标从对应的似然概率矩阵中获取列矩阵;
[0085]
步骤s31d,将各个所述特征词获取的列矩阵形成对应的类别的特征矩阵。
[0086]
本实施例中,当有特征词未存在特征词表中时,计算未存在特征词表的所述特征词与对应的特征词表中的各个训练特征词的相似度,具体的,可计算余弦相似度、欧几里得距离,通过相似度找到特征词的目标词,根据目标词的下标去获取列矩阵,从而构建特征矩阵。在另一实施例中,将相似度与预设的相似度阈值进行比较,若相似度大于相似度阈值时,从中选择相似度最高的训练特征词作为目标词,若所有相似度均不大于相似度阈值,则为未存在于特征词表的特征词赋予预设概率。
[0087]
在一实施例中,所述根据各个所述特征矩阵和各个所述特征词表对应的所述似然概率矩阵构造各个类别对应的命中矩阵的步骤,包括:
[0088]
将各个类别的似然概率矩阵分别与对应的特征矩阵相乘得到各个类别的命中矩阵。
[0089]
本实施例中,构造有工单数据对于每个类别的特征矩阵[0,1,1,0,0],将每个类别的似然概率矩阵*特征矩阵得到一个新矩阵,这个矩阵就是命中矩阵,如一个类别的似然概率矩阵如下所示地一个6*5的矩阵:
[0090]
[

9,

9,

9,

9,

9]
[0091]
[

9,

8,

9,

9,

9]
[0092]
[

9,

9,

8,

9,

9]
[0093]
[

9,

9,

9,

9,

9]
[0094]
[

9,

9,

9,

9,

9]
[0095]
[

9,

9,

9,

9,

9]
[0096]
将特征矩阵进行转置,再将两个矩阵相乘就会得到一个6*1的矩阵,即为命中矩阵:
[0097]
[(

9*0)+(

9*1)+(

9*1)+(

9*0)+(

9*0)]
[0098]
[(

9*0)+(

8*1)+(

9*1)+(

9*0)+(

9*0)]
[0099]
[(

9*0)+(

9*1)+(

8*1)+(

9*0)+(

9*0)]
[0100]
[(

9*0)+(

9*1)+(

9*1)+(

9*0)+(

9*0)]
[0101]
[(

9*0)+(

9*1)+(

9*1)+(

9*0)+(

9*0)]
[0102]
[(

9*0)+(

9*1)+(

9*1)+(

9*0)+(

9*0)]
[0103]
在一实施例中,根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率的步骤,包括:
[0104]
将所述命中矩阵与对应的先验概率矩阵的和作为目标矩阵计算所述工单数据属于对应类别的概率;其中,所述先验概率矩阵根据对应的所述特征词表计算得到。
[0105]
本实施例中,每个命中矩阵会加上对应的先验概率矩阵得到目标矩阵,每个类别会得到一个目标矩阵,计算目标矩阵即可求得最终的分类概率。本实施例通过引用先验概率矩阵,相当于为每个命中矩阵赋予一个先验概率矩阵对应的权重。
[0106]
在一实施例中,所述根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵的步骤之前,包括:
[0107]
获取若干训练工单数据,
[0108]
通过预设的特征词提取算法从若干训练工单数据中提取各个类别的训练特征词,根据所述训练特征词构建各个类别的特征词表。
[0109]
本实施例中,我们在计算似然概率矩阵的时候,通过预设的特征词提取算法,具体的,引入了tf

idf计算方法,在“杨顺珍反馈安增益赎回问题”这个语句,通过分词可以得到“杨顺珍”“反馈”“安增益”“赎回”“问题”五个特征词,但是这五个特征词的关键程度并不是一致的。因为“杨顺珍”为人名,相对而言,在该场景下,人名“杨顺珍”和“问题”并不重要,“安增益”、“赎回”的重要性较高,也就是说,在特征词排序上面,"安增益"和"赎回"应该排在"杨顺珍"和“问题”的前面。如果某个词比较少见,但是它在这篇文章中多次出现,那么它很可能就反映了这篇文章的特性,正是我们所需要的特征词。tf

idf就是在词频的基础上,要对每个词分配一个"重要性"权重。最常见的词("的"、"是"、"在")给予最小的权重,较常见的词("中国")给予较小的权重,较少见的词("安增益"、"赎回")给予较大的权重。这个权重叫做"逆文档频率"(inverse document frequency,缩写为idf),它的大小与一个词的常见程度成反比。本实施例通过tf

idf能够提取到重要程度较高的训练特征词,使得后续构建的似然概率矩阵能够更加准确。
[0110]
参见图3,本技术一实施例提供一种工单识别装置,包括:
[0111]
第一获取单元10,用于获取工单数据;
[0112]
第一提取单元20,用于对所述工单数据进行分词处理,并基于分词处理后的结果提取所述工单数据对应的特征词;
[0113]
构建单元30,用于根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵;其中,各个类别的所述特征词表包括有对应类别的若干训练
特征词,每个类别分别与一个所述特征词表对应,各个所述特征词表分别和一个似然概率矩阵对应;
[0114]
构造单元40,用于根据各个所述特征矩阵和各个所述特征词表对应的所述似然概率矩阵构造各个类别对应的命中矩阵;
[0115]
计算单元50,用于根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率;
[0116]
发送单元60,用于对所述概率进行降序排序,将所述工单数据发送至所述概率排序在前预设个数的类别所对应的部门。
[0117]
在一实施例中,所述构建单元30,包括:
[0118]
检测子单元,用于在各个类别中,检测各个所述特征词是否存在于对应的特征词表中;
[0119]
第一获取子单元,用于若所述特征词全部存在于对应的特征词表中,从所述特征词表中获取各个所述特征词所对应的训练特征词的下标;其中,所述特征词表中的训练特征词的下标与对应的似然概率矩阵的一列对应;
[0120]
第二获取子单元,用于根据所述下标从对应的所述似然概率矩阵中获取第一列矩阵;
[0121]
形成子单元,用于将各个所述特征词获取的第一列矩阵形成对应类别的特征矩阵。
[0122]
在一实施例中,所述构建单元30,包括:
[0123]
第三获取子单元,用于若所有的所述特征词中有特征词未存在于对应的所述特征词表中,为未存在于对应的所述特征词表中的特征词获取一个预设概率,并为存在特征词表中的特征词从对应的似然概率矩阵获取第二列矩阵;
[0124]
第一构建子单元,用于根据所述预设概率和所述第二列矩阵构建特征矩阵。
[0125]
在一实施例中,所述构建单元30,包括:
[0126]
第四获取子单元,用于若所述工单数据的所有特征词均不存在于对应的所述特征词表中,从先验概率矩阵中根据先验概率获取与所述特征词个数相同的先验概率;其中,所述先验概率矩阵根据对应的所述特征词表计算得到;赋予子单元,用于为每个不存在于特征词表中的所述特征词赋予一个获取到的先验概率;
[0127]
第二构建子单元,用于根据所述先验概率构建特征矩阵。
[0128]
在一实施例中,所述构建单元30,包括:
[0129]
第一计算子单元,用于若所有的所述特征词中有特征词未存在于对应的所述特征词表中,计算未存在所述特征词表的所述特征词与对应的所述特征词表中的各个训练特征词的相似度;
[0130]
第五获取子单元,用于选择相似度最高的训练特征词作为特征词的目标词,获取目标词的下标;
[0131]
第六获取子单元,用于根据目标词的下标从对应的似然概率矩阵中获取列矩阵;
[0132]
形成子单元,用于将各个所述特征词获取的列矩阵形成对应的类别的特征矩阵。
[0133]
在一实施例中,所述计算单元50,包括:
[0134]
第二计算子单元,用于将所述命中矩阵与对应的先验概率矩阵的和作为目标矩阵
计算所述工单数据属于对应类别的概率;其中,所述先验概率矩阵根据对应的所述特征词表计算得到。
[0135]
在一实施例中,所述工单识别装置,包括:
[0136]
第二获取单元,用于获取若干训练工单数据,
[0137]
第二提取单元,用于通过预设的特征词提取算法从若干训练工单数据中提取各个类别的训练特征词,根据所述训练特征词构建各个类别的特征词表。
[0138]
在本实施例中,上述各个单元、子单元的具体实现请参照上述方法实施例中所述,在此不再进行赘述。
[0139]
参照图4,本技术实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种工单类别识别方法。
[0140]
本领域技术人员可以理解,图4中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定。
[0141]
本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种工单类别识别方法。
[0142]
综上所述,为本技术实施例中提供的工单类别识别方法、装置、计算机设备和存储介质,获取工单数据;对所述工单数据进行分词处理,并基于分词处理后的结果提取所述工单数据对应的特征词;根据各个类别所对应的特征词表和所述特征词构建所述工单数据对应各个类别的特征矩阵;其中,各个类别的所述特征词表包括有对应类别的若干训练特征词,每个类别分别与一个所述特征词表对应,各个所述特征词表分别和一个似然概率矩阵对应;根据各个所述特征矩阵和各个所述特征词表对应的所述似然概率矩阵构造各个类别对应的命中矩阵;根据各个类别的命中矩阵计算所述工单数据属于对应类别的概率;对所述概率进行降序排序,将所述工单数据发送至所述概率排序在前预设个数的类别所对应的部门。本技术通过大量工单数据进行训练,构造训练特征词表以及对应的似然概率矩阵,当接收到新的工单数据,根据预先训练的似然概率矩阵构建特征矩阵,从而最终计算得到分类概率,系统自动给出匹配度最高的部门,供后续进行处理,提高工单数据整体的流转效率,提高用户体验,提高后端异常运营团队效率和节约人力。
[0143]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram通过多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增
强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0144]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0145]
以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1