本技术涉及自然语言处理,更具体的说,是涉及一种技能类别分析方法、装置、设备及可读存储介质。
背景技术:
1、在人机交互过程中,机器在接收到用户输入信息之后,需要利用自然语言处理技术对用户输入信息进行解析,确定用户的技能意图,从而给予相应反馈。在人机交互的实际场景中,用户输入信息存在表达模糊的情况,这种情况下,用户输入信息可能产生多种对应不同技能类别的技能意图,机器需要从多种对应不同技能类别的技能意图中确定出用户的实际技能意图,以给予准确的回复。比如,用户输入信息为“播放一下万疆”,其可能产生的技能意图有对应音乐类别的“播放音乐万疆”和对应影视类别的“播放视频万疆”,机器需要从中确定用户的实际技能意图。
2、在现有技术中,是对用户输入信息进行技能类别分析,得到用户输入信息属于每个技能类别的概率,根据概率排序,从用户输入信息可能产生的多种对应不同技能类别的技能意图中确定出用户的实际技能意图,但是现有的对用户输入信息进行技能类别分析的方式,得到的用户输入信息属于每个技能类别的概率无法准确表征用户输入信息可能属于该技能类别的程度,这将导致最终确定出的用户的实际技能意图准确度较低。
3、因此,如何提供一种技能类别分析方法,以能够准确确定用户输入信息可能属于某个技能类别的程度,进而使机器能够从用户输入信息可能产生的多种对应不同技能类别的技能意图中准确确定出用户的实际技能意图,成为本领域技术人员亟待解决的技术问题。
技术实现思路
1、鉴于上述问题,本技术提出了一种技能类别分析方法、装置、设备及可读存储介质。具体方案如下:
2、一种技能类别分析方法,所述方法包括:
3、获取用户输入信息;
4、将所述用户输入信息输入技能类别分析模型,所述技能类别分析模型输出所述用户输入信息属于每个技能类别的概率;
5、其中,所述技能类别分析模型是利用训练数据对应的各个技能类别的技能意图分类结果训练得到的,所述训练数据对应的每个技能类别的技能意图分类结果表示所述训练数据属于该技能类别包括的各个技能意图的概率以及所述训练数据不属于该技能类别的概率;
6、基于所述用户输入信息属于各个技能类别的概率,确定所述用户输入信息所属技能类别。
7、可选地,所述技能类别分析模型的训练方式,包括:
8、将所述训练数据输入所述技能类别分析模型,得到所述训练数据属于每个技能类别的第一概率;
9、针对每个技能类别,基于所述训练数据对应的所述技能类别的技能意图分类结果,计算所述训练数据不属于所述技能类别的概率;
10、将所述训练数据不属于所述技能类别的概率,作为所述训练数据属于每个技能类别的第一概率的惩罚项,计算所述训练数据属于每个技能类别的第二概率;
11、以所述训练数据属于各个所述技能类别的第二概率,趋近于所述训练数据属于各个所述技能类别的标签为训练目标训练得到所述技能类别分析模型。
12、可选地,所述基于所述训练数据对应的所述技能类别的技能意图分类结果,计算所述训练数据不属于所述技能类别的概率,包括:
13、利用所述训练数据对应的所述技能类别的技能意图分类结果,计算所述训练数据属于所述技能类别的概率;
14、利用所述训练数据属于所述技能类别的概率,计算所述训练数据不属于所述技能类别的概率。
15、可选地,所述利用所述训练数据对应的所述技能类别的技能意图分类结果,计算所述训练数据属于所述技能类别的概率,包括:
16、利用所述训练数据属于所述技能类别包括的各个技能意图的概率中的最大概率,以及所述训练数据不属于所述技能类别的概率,计算所述训练数据属于所述技能类别的概率。
17、一种技能类别分析方法,其特征在于,所述方法包括:
18、获取用户输入信息;
19、获取所述用户输入信息对应的各个技能类别的技能意图分类结果,所述用户输入信息对应的每个技能类别的技能意图分类结果表示所述用户输入信息属于该技能类别包括的各个技能意图的概率以及所述用户输入信息不属于该技能类别的概率;
20、将所述用户输入信息输入技能类别分析模型,得到所述用户输入信息属于每个技能类别的第一概率;
21、利用所述用户输入信息对应的各个技能类别的技能意图分类结果对所述用户输入信息属于每个技能类别的第一概率进行调整,得到所述用户输入信息属于每个技能类别的概率;
22、基于所述用户输入信息属于各个技能类别的概率,确定所述用户输入信息所属技能类别。
23、可选地,所述利用所述用户输入信息对应的各个技能类别的技能意图分类结果对所述用户输入信息属于每个技能类别的第一概率进行调整,得到所述用户输入信息属于每个技能类别的概率,包括:
24、针对每个技能类别,利用所述用户输入信息对应的所述技能类别的技能意图分类结果,计算所述用户输入信息属于所述技能类别的第二概率;
25、针对每个技能类别,利用所述用户输入信息属于所述技能类别的第二概率对所述用户输入信息属于所述技能类别的第一概率进行调整,得到所述用户输入信息属于所述技能类别的概率。
26、可选地,所述利用所述用户输入信息对应的所述技能类别的技能意图分类结果,计算所述用户输入信息属于所述技能类别的第二概率,包括:
27、利用所述用户输入信息属于所述技能类别包括的各个技能意图的概率中的最大概率,以及所述用户输入信息不属于所述技能类别的概率,计算所述用户输入信息属于所述技能类别的第二概率。
28、一种技能类别分析装置,所述装置包括:
29、第一获取单元,用于获取用户输入信息;
30、计算单元,用于将所述用户输入信息输入技能类别分析模型,所述技能类别分析模型输出所述用户输入信息属于每个技能类别的概率;其中,所述技能类别分析模型是利用训练数据对应的各个技能类别的技能意图分类结果训练得到的,所述训练数据对应的每个技能类别的技能意图分类结果表示所述训练数据属于该技能类别包括的各个技能意图的概率以及所述训练数据不属于该技能类别的概率;
31、第一确定单元,用于基于所述用户输入信息属于各个技能类别的概率,确定所述用户输入信息所属技能类别。
32、可选地,所述装置还包括:技能类别分析模型训练单元,所述技能类别分析模型训练单元,包括:
33、训练数据第一处理单元,用于将所述训练数据输入所述技能类别分析模型,得到所述训练数据属于每个技能类别的第一概率;
34、训练数据第二处理单元,用于针对每个技能类别,基于所述训练数据对应的所述技能类别的技能意图分类结果,计算所述训练数据不属于所述技能类别的概率;
35、训练数据第三处理单元,用于将所述训练数据不属于所述技能类别的概率,作为所述训练数据属于每个技能类别的第一概率的惩罚项,计算所述训练数据属于每个技能类别的第二概率;
36、训练单元,用于以所述训练数据属于各个所述技能类别的第二概率,趋近于所述训练数据属于各个所述技能类别的标签为训练目标训练得到所述技能类别分析模型。
37、可选地,所述训练数据第二处理单元,包括:
38、训练数据属于技能类别的概率计算单元,用于利用所述训练数据对应的所述技能类别的技能意图分类结果,计算所述训练数据属于所述技能类别的概率;
39、训练数据不属于技能类别的概率计算单元,用于利用所述训练数据属于所述技能类别的概率,计算所述训练数据不属于所述技能类别的概率。
40、可选地,所述训练数据属于技能类别的概率计算单元,具体用于:
41、利用所述训练数据属于所述技能类别包括的各个技能意图的概率中的最大概率,以及所述训练数据不属于所述技能类别的概率,计算所述训练数据属于所述技能类别的概率。
42、一种技能类别分析装置,所述装置包括:
43、第二获取单元,用于获取用户输入信息;
44、技能意图分类结果获取单元,用于获取所述用户输入信息对应的各个技能类别的技能意图分类结果,所述用户输入信息对应的每个技能类别的技能意图分类结果表示所述用户输入信息属于该技能类别包括的各个技能意图的概率以及所述用户输入信息不属于该技能类别的概率;
45、技能类别分析单元,用于将所述用户输入信息输入技能类别分析模型,得到所述用户输入信息属于每个技能类别的第一概率;
46、调整单元,用于利用所述用户输入信息对应的各个技能类别的技能意图分类结果对所述用户输入信息属于每个技能类别的第一概率进行调整,得到所述用户输入信息属于每个技能类别的概率;
47、第二确定单元,用于基于所述用户输入信息属于各个技能类别的概率,确定所述用户输入信息所属技能类别。
48、可选地,所述调整单元,包括:
49、用户输入信息属于技能类别的概率计算单元,用于针对每个技能类别,利用所述用户输入信息对应的所述技能类别的技能意图分类结果,计算所述用户输入信息属于所述技能类别的第二概率;
50、调整子单元,用于针对每个技能类别,利用所述用户输入信息属于所述技能类别的第二概率对所述用户输入信息属于所述技能类别的第一概率进行调整,得到所述用户输入信息属于所述技能类别的概率。
51、可选地,所述用户输入信息属于技能类别的概率计算单元,具体用于:
52、利用所述用户输入信息属于所述技能类别包括的各个技能意图的概率中的最大概率,以及所述用户输入信息不属于所述技能类别的概率,计算所述用户输入信息属于所述技能类别的第二概率。
53、一种技能类别分析设备,包括存储器和处理器;
54、所述存储器,用于存储程序;
55、所述处理器,用于执行所述程序,实现如上所述的技能类别分析方法的各个步骤。
56、一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的技能类别分析方法的各个步骤。
57、借由上述技术方案,本技术公开了一种技能类别分析方法、装置、设备及可读存储介质,在利用技能类别分析模型确定用户输入信息属于每个技能类别的概率时,可以利用训练数据对应的各个技能类别的技能意图分类结果作为先验信息提升技能类别分析模型输出概率的准确度,或者,利用用户输入信息对应的各个技能类别的技能意图分类结果作为辅助信息对技能类别分析模型输出概率进行调优,使得得到的用户输入信息属于每个技能类别的概率能够准确表征用户输入信息可能属于某个技能类别的程度,因此,基于上述概率可以准确确定用户输入信息所属技能类别,进而能够从用户输入信息可能产生的多种对应不同技能类别的技能意图中准确确定出用户的实际技能意图。