
1.本发明涉及意图识别领域,更具体而言,涉及一种用于意图识别的方法以及相应的系统、计算机设备和计算机可读存储介质。
背景技术:2.目前,已经存在多种意图查询方法,如基于词典和模板的规则分类以及基于分类模型的意图识别。这些方法存在一些问题。例如,基于词典和模板的规则分类涉及词典和模板的构建,通常需要相关领域的专业人士在了解该领域的业务的基础上完成词典和模板的构建,需要耗费大量的人力和时间。基于分类模型的意图识别涉及对文本和意图类型进行标记,依赖大量的数据和标记对,很难扩展新的意图类别,并且无法保证准确率,用户体验较差。
3.因此,存在对能解决或缓解上述问题中至少之一的方案的需要。
技术实现要素:4.本发明的目的在于提供一种能够解决或缓解上述问题中至少之一的方案。
5.具体地,根据本发明的第一方面,提供一种用于意图识别的方法,其包括:
6.接收来自用户的查询请求,所述查询请求由输入文本表示;
7.响应于所述查询请求,执行以下处理步骤:
8.分词获取步骤,包括:对所述输入文本进行解析以得到与所述输入文本对应的至少一个目标分词以及每个所述目标分词具有或指示的类型;
9.判断步骤,包括:判断对于所述查询请求,在已配置意图类别中是否存在一个匹配的已配置意图类别,其中每个已配置意图类别具有一个或多个槽位以及一个查询意图,每个槽位与预定的类型相对应;
10.意图类别识别步骤,包括:
11.在所述判断步骤的判断结果为肯定的情况下,确定所述匹配的已配置意图类别为所述查询请求的目标查询意图类别;
12.在所述判断结果为否定的情况下,添加一个由与所述输入文本对应的新意图文本表示的新的已配置意图类别,并将所述新的已配置意图类别作为所述查询请求的目标查询意图类别,所述新意图文本至少由所述至少一个目标分词中的每个具有或指示的类型组成,
13.其中对于所述新的已配置意图类别,
14.该新的已配置意图类别的查询意图由所述至少一个目标分
15.词中的一个目标分词具有或指示的类型限定,所述至少一个目标分词中另外的至少部分目标分词中具有类型的每个目标分词限
16.定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,或者
17.所述至少一个目标分词中的至少部分目标分词中具有类型的每个目标分词限定
与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,该新的已配置意图类别的查询意图基于所述输入文本、所述至少一个目标分词和/或该新的已配置意图类别的槽位确定;
18.意图确定步骤,包括:对于所述目标查询意图类别的、在所述至少一个目标分词中具有对应类型的目标分词的每个槽位,在该槽位中填入所述至少一个目标分词中的具有的类型与该槽位对应的目标分词,以确定所述查询请求的目标查询意图。
19.根据本发明的第二方面,提供一种用于意图识别的系统,其包括处理器,所述处理器被配置为执行计算机指令以:
20.接收来自用户的查询请求,所述查询请求由输入文本表示;
21.响应于所述查询请求,执行以下处理步骤:
22.分词获取步骤,包括:对所述输入文本进行解析以得到与所述输入文本对应的至少一个目标分词以及每个所述目标分词具有或指示的类型;
23.判断步骤,包括:判断对于所述查询请求,在已配置意图类别中是否存在一个匹配的已配置意图类别,其中每个已配置意图类别具有一个或多个槽位以及一个查询意图,每个槽位与预定的类型相对应;
24.意图类别识别步骤,包括:
25.在所述判断步骤的判断结果为肯定的情况下,确定所述匹配的已配置意图类别为所述查询请求的目标查询意图类别;
26.在所述判断结果为否定的情况下,添加一个由与所述输入文本对应的新意图文本表示的新的已配置意图类别,并将所述新的已配置意图类别作为所述查询请求的目标查询意图类别,所述新意图文本至少由所述至少一个目标分词中的每个具有或指示的类型组成,
27.其中对于所述新的已配置意图类别,
28.该新的已配置意图类别的查询意图由所述至少一个目标分
29.词中的一个目标分词具有或指示的类型限定,所述至少一个目标分词中另外的至少部分目标分词中具有类型的每个目标分词限
30.定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,或者
31.所述至少一个目标分词中的至少部分目标分词中具有类型的每个目标分词限定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,该新的已配置意图类别的查询意图基于所述输入文本、所述至少一个目标分词和/或该新的已配置意图类别的槽位确定;
32.意图确定步骤,包括:对于所述目标查询意图类别的、在所述至少一个目标分词中具有对应类型的目标分词的每个槽位,在该槽位中填入所述至少一个目标分词中的具有的类型与该槽位对应的目标分词,以确定所述查询请求的目标查询意图。
33.根据本发明的第三方面,提供一种计算机设备,其包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令在由所述处理器执行时导致上述的方法被执行。
34.根据本发明的第四方面,提供一种非暂时性计算机可读存储介质,其上存储有计算机指令,所述计算机指令在由处理器执行时导致上述的方法被执行。
35.利用本发明的方案,对于在已有的已配置意图类别中没有匹配的意图类别的查询
请求,可以实时添加相应的新的已配置意图类别,由此实时完成对输入文本的意图识别。如此,有利于扩展新的意图类别,改进用户体验,降低对人工构建词典和模板以及标记数据的依赖。另外,通过对新的已配置意图类别的实时配置,本发明的方法支持动态配置,有助于从口语化的表达中提取出用户的意图。此外,本发明有助于实现个性化配置。
附图说明
36.以示例的方式参考以下附图描述本发明的非限制性且非穷举性实施例,其中:
37.图1是示意性示出根据本发明一实施例的用于意图识别的方法的流程图;
38.图2是示意性示出根据本发明一实施例的用于判断是否存在一个匹配的已配置意图类别的判断步骤的流程图;
39.图3是示意性示出根据本发明一实施例的分词获取步骤的流程图。
具体实施方式
40.为了使本发明的上述以及其他特征和优点更加清楚,下面结合附图进一步描述本发明。应当理解,本文给出的具体实施例是出于向本领域技术人员解释的目的,仅是示例性的,而非限制性的。
41.图1示意性示出根据本发明一实施例的用于意图识别的方法100。方法100可以包括步骤s110和步骤s120。
42.在步骤s110,接收来自用户的查询请求,所述查询请求可由输入文本表示。输入文本可以是各种可能的用户输入文本,如来自用户的口语化的表达和省略化的表达。
43.在步骤s120,响应于所述查询请求,执行处理步骤。处理步骤可以包括分词获取步骤(步骤s122)、判断步骤(步骤s124)、意图类别识别步骤(步骤s126)和意图确定步骤(步骤s128)。
44.在步骤s122,对所述输入文本进行解析以得到与所述输入文本对应的至少一个目标分词以及每个所述目标分词具有或指示的类型。对于任一领域,每个词汇或分词具有的类型可以是预先定义或确定的,另外可能涉及的词汇或分词类型可以是预先定义或确定的,每个这样的词汇或分词类型具有由一个相应的词汇描述或指示的类型名称。当得到的某个目标分词描述或指示了某个预先定义的词汇或分词类型的类型名称时,可以认为该目标分词指示该类型。例如,在涉及天气查询的一个实施例中,可以设置类型“天气”,分词“晴天”、“阴天”可以被认为具有“天气”这一类型,而分词“天气”可以被认为指示“天气”这一类型。作为一个示例而非排他地,当得到的某个目标分词为要查询的指标(如,天气)时,可能会出现该目标分词指示类型的情形。例如,对于要查询的某个指标(如,天气),通常存在若干可能的指标状况(如,晴天、阴天等),表示这些可能的指标状况的分词或词汇(如,“晴天”、“阴天”等)可以被归为同一种类型,而该类型的名称可以由表示该指标的分词或词汇(如,“天气”)指示。根据情况,单个目标分词可以是单字或词。本文中,术语“分词”和“词汇”可以互换使用。
45.步骤s122可以利用各种可能的技术实现,例如可以利用现有的各种文本解析和分词标注相关的技术实现。例如,可以使用lstm+crf模型序列标注算法将输入文本拆分成多个分词以得到所述输入文本的分词结果,并根据意图查询所针对的领域的可用数据库(如
领域词典)由所述分词结果确定目标分词和标注目标分词具有或指示的类型。
46.例如,对于意图查询所涉及或针对的某个领域,可以存在预先建立的可用的数据库如领域词典,该领域词典可以包括与该领域相关联的各种词汇如单字或词,如对于该领域的意图查询而言可能有用或有意义的各种词汇,包括例如但不限于与该领域相关联的专业词汇。另外,领域词典中包括的至少部分词汇中的每个词汇可以具有对应的预先定义的类型,或指示预先定义的类型;在前者的情况下,该词汇被划入或被指定属于该预先定义的类型,在后者的情况下,该词汇本身表示该预先定义的类型,即,该词汇描述或指示了该预先定义的类型的类型名称。例如,领域词典中可以包括指示各种可能的词汇或分词类型以及每个类型与具有该类型的词汇之间的对应关系的信息。就类型划分或描述而言,不同的领域中的情况可以是不同的。
47.这里,“目标分词”可以包括或基于由输入文本得到的分词中对于意图查询所针对的领域而言可能有用或有意义的分词,例如可以结合意图查询所针对的领域确定。由输入文本得到的分词中对于意图查询所针对的领域而言没有用或没有意义的分词可以被舍弃。由输入文本得到的分词结果可以包括形成所述输入文本的至少一个分词。根据情况,所述至少一个目标分词可以源自所述至少一个分词中的全部或部分分词。下文将进一步描述。
48.在步骤s124,判断对于所述查询请求,在已配置意图类别中是否存在一个匹配的已配置意图类别。步骤s124的判断可以基于在步骤s122获取的目标分词。已配置意图类别可以是预先配置好的,每个已配置意图类别可以具有一个或多个槽位,每个槽位可以对应于预定的分词类型。例如,对于任一具体领域,可以根据对于该领域而言可能被查询的意图预先配置一个或多个意图类别,每个已配置意图类别可以具有一个或多个槽位并具有一个查询意图,每个已配置意图类别具有的槽位、查询意图及每个槽位对应的分词类型可以是预先配置好和预先确定的。该查询意图可以由表示待查询指标或意图的指标词或意图词表示。本文中,术语“指标”和“意图”可以互换使用。在一个实施例中,每个已配置意图类别可以由一个相应的意图文本表示,该意图文本可以由该已配置意图类别具有的一个或多个槽位中的每个所对应的分词类型以及表示该已配置意图类别的查询意图的指标词或意图词形成。例如,对于已配置意图类别“组织公司产品销量”,“组织”、“公司”和“产品”限定其槽位、分别对应于分词类型“组织”、“公司”和“产品”,“销量”限定其查询意图、表示待查询指标或意图为“销量”、同时也指示分词类型“销量”。再如,对于已配置意图类别“城市时间天气”,“城市”和“时间”限定其槽位、分别对应于分词类型“城市”和“时间”,“天气”限定其查询意图、表示待查询指标或意图为“天气”、同时也指示分词类型“天气”。
49.在步骤s124之后,执行步骤s126。步骤s126的执行取决于步骤s124的判断结果。
50.在步骤s124的判断结果为肯定的情况下,步骤s126可以包括:确定所述匹配的已配置意图类别为所述查询请求的目标查询意图类别。
51.在步骤s124的判断结果为否定的情况下,步骤s126可以包括:基于所述输入文本添加一个新的已配置意图类别,并将所述新的已配置意图类别作为所述查询请求的目标查询意图类别。该新的已配置意图类别可以具有一个或多个槽位,每个槽位可以对应于预定的分词类型。
52.在一个实施例中,所述新的已配置意图类别由一个添加的新意图文本表示,所述新意图文本基于所述至少一个目标分词。更具体地,该新意图文本可基于所述至少一个目
标分词中的每个所具有或指示的类型,例如,至少由所述至少一个目标分词中的每个所具有或指示的类型组成。根据情况,除所述至少一个目标分词中的每个所具有或指示的类型之外,该新添加的意图文本可以包括其他组成部分以例如限定补充的槽位(如,缺省槽位)和/或限定查询意图,或不包括其他组成部分。
53.根据一种可能的情形,在步骤s122中得到的所述至少一个目标分词中的一个目标分词指示或具有的类型(如,天气)对应于待查询指标或意图(如,“天气”),此时该新的已配置意图类别的查询意图可以由所述至少一个目标分词中的这一个目标分词具有或指示的类型限定,所述至少一个目标分词中另外的全部或部分目标分词中具有类型的每个目标分词限定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位。
54.根据另一种可能的情形,没有可用的指示待查询指标或意图的信息——例如在步骤s122中得到的所述至少一个目标分词中没有目标分词具有或指示的类型对应于或指示待查询指标或意图,此时所述至少一个目标分词中的全部或部分目标分词中具有类型的每个目标分词可以限定与该目标分词的类型相对应的、该新的已配置意图类别的一个槽位,该新的已配置意图类别的查询意图可以基于输入文本、由输入文本得到的分词结果、由输入文本得到的目标分词、该新的已配置意图类别的槽位和/或可选的其他可能的信息预测或以其他可能的方式确定,所述其他可能的信息可以包括例如但不限于限定该新的已配置意图类别的槽位的目标分词等。例如,在该新的已配置意图类别具有“城市”和“时间”槽位的情况下,可以据此预测该新的已配置意图类别的多种可能的查询意图,然后选择其中之一或基于可选的其他信息确定其中之一为该新的已配置意图类别的查询意图。
55.根据情况,意图查询所针对的领域可以是预定确定的,或者可以根据输入文本、由输入文本得到的分词结果和/或目标分词预测。在后者的情况下,例如,根据分词结果所包括的分词,可以确定意图查询可能针对的一个或多个领域,此时可以预测其中一个为目标领域。
56.在步骤s126之后,执行步骤s128。在步骤s128,对于所述目标查询意图类别的、在所述至少一个目标分词中具有对应类型的目标分词的每个槽位,在该槽位中填入所述至少一个目标分词中的具有的类型与该槽位对应的目标分词,以确定所述查询请求的目标查询意图。换言之,在确定了目标查询意图类别的情况下,基于该目标查询意图类别限定的查询意图,通过对该目标查询意图类别进行必要的槽位信息填写,可以确定具体的目标查询意图。一旦确定了目标查询意图,就清楚了用户通过查询请求旨在问什么、应该怎么回答、需要提供怎样的反馈/响应/查询结果等。
57.利用本发明的方法,在判断步骤s124的判断结果为否定的情况下,通过如上所述执行意图类别识别步骤和意图确定步骤,确定的目标查询意图可以为输入文本的至少部分或其至少部分的修正或变体形式。对于无法识别匹配的已配置意图类别的用户查询请求如个性化口语表达,可以通过添加相应的新意图类别来实现个性化配置。
58.在确定了目标查询意图类别的情况下,若对于该目标查询意图类别的某个或某些槽位,得到的所述至少一个目标分词中没有具有对应类型的目标分词,可以根据缺省设置对这样的槽位进行信息填写。如此,可实现在查询请求缺乏某些信息的情况下通过对查询请求例如但不限于以某种常规或约定俗成的方式进行完善和补充来形成相对完整的查询表达,进而提供反馈和响应,有助于从省略化的表达中提取出用户的意图。这样的缺省设置
可以根据情况合适地自定义或以其他方式进行。例如,对于有时间槽的目标查询意图类别,可以为其设置为接收到查询请求的当天或某具体时间段的缺省时间。再如,对于有城市槽的目标查询意图类别,可以为其设置为查询请求发起方所在的城市的缺省城市。
59.在已配置意图类别中引入数学表达式是可能的,例如当已配置意图类别的查询指标或意图需要通过某种计算来确定的情况下。例如,对于查询指标为涉及产品的“7月销量预实差”的已配置意图类别,可以配置用于计算7月的预算销量(a)与实际销量(b)之差(c)的减法计算块。例如,该预算销量(a)、实际销量(b)和预实差(c)可以各自被配置为该已配置意图类别的一个槽位,并且被配置为具有该计算块所指示的关系。如此,对于复杂的涉及计算的查询请求,可以省略后续例如手动计算的麻烦。
60.本发明的方法可以可选地包括在步骤s128之后执行结果提供步骤。在结果提供步骤中,可以提供响应于所确定的目标查询意图的查询结果。该查询结果可以通过基于目标查询意图在可用的数据库中进行检索和查询来获得,这可以通过各种合适的技术如现有技术的信息检索和搜索相关的技术实现,在此不做赘述。
61.本发明的方法可以可选地包括在步骤s128之前重复执行判断步骤和意图类别识别步骤一次或多次。
62.本发明的方法还可以包括本地存储和/或远程存储添加的新的已配置意图类别,例如存储在接收到查询请求的接收方如计算机本地和/或存储在远程数据库中。如此,该新的已配置意图类别可以被本地和/或远程访问和调用。
63.根据情况,已有的已配置意图类别及其相关信息可以各种可能的方式获取,包括例如但不限于通过自动读取相关的在线数据库获取、从本地直接获取和/或依靠同步通知自动获取。另外,已有的已配置意图类别及其相关信息可以根据情况更新。
64.下面,结合图2和3对本发明的处理步骤作进一步示例性描述。
65.结合图3,在一个实施例中,步骤s122包括步骤s1221和步骤s1222。
66.在步骤s1221,利用分词解析技术对接收的表示查询请求的所述输入文本进行解析以得到所述输入文本的分词结果。分词结果可以包括形成所述输入文本的至少一个分词。
67.在步骤s1222,基于可用的信息由所述分词结果得到所述至少一个目标分词。这里,所述可用的信息可以包括与意图查询所针对的目标领域相关联的词汇如专业词汇等,包括例如但不限于与所述目标领域相关联的有关指标和意图配置的专业词汇。所述可用的信息,包括与目标领域相关联的有关指标和意图配置的专业词汇,可以各种可能的方式获取,包括例如但不限于通过自动读取相关的在线数据库获取、从本地直接获取和/或依靠同步通知自动获取。另外,所述可用的信息可以根据情况更新。有关指标的专业词汇可以包括对于该目标领域的意图查询而言可能被查询的各种指标所对应的词汇。对于每个这样的指标,领域词典中可以存在相应的指示该指标的专业词汇,如“天气”、“销量”、“火车票”等,取决于具体的目标领域。有关意图配置的专业词汇可以被广义地理解为针对目标领域的意图配置中可能涉及的各种可能词汇,包括例如但不限于表示该目标领域的每个已配置意图类别的查询意图及其槽位各自对应的分词类型的词汇及这样的分词类型各自可能囊括的词汇。
68.对于由输入文本解析得到的分词结果中包括的每个分词,可以根据意图查询所针
对的目标领域、更具体地根据该目标领域的可用数据库(如领域词典)判断该分词对于该领域的意图查询而言是否可能有用或有意义,从而确定是舍弃该分词还是由该分词确定相应的目标分词。例如,若对于分词结果包括的某个分词,相关的领域词典中存在相同或相似的词汇,可以由该分词确定相应的目标分词,该目标分词可以被确定为该领域词典中的该相同或相似的词汇;反之,该分词可以被舍弃。再如,若对于分词结果包括的某个分词,在领域词典中找到的与其相同或相似的词汇可以划入领域词典中包括的词汇类型中之一,可以由该分词确定一个相应的目标分词,该目标分词可以被确定为该领域词典中的该相同或相似的词汇;反之,该分词可以被舍弃。这里,“相似”可以为各种可能的相似情形,包括例如但不限于字面上的相似、意思上的相似等。在存在这样的相似情形的情况下,涉及的分词可以被修正为领域词典中包括的词汇如专业词汇。在根据可用的信息判断分词结果包括的某个分词对于目标领域的意图查询而言没有用或没有意义的情况下,可以舍弃该分词,以便在后续确定目标分词时不再考虑该分词。例如,若在涉及天气查询的情况下得到的分词结果包括分词“苹果手机”,可以直接舍弃该分词。
69.在一个实施例中,每个已配置意图类别由一个相应的意图文本表示,并具有一个相应的通过训练好的模型由所述意图文本生成的已配置意图类别向量表达以及一个相应的设定阈值。可以使用各种可由文本生成相应的向量的模型,包括现有技术中已知的,如word2vec、bert、bilstm、cnn模型等。对于这样的模型,其训练可以采用各种可能的训练手段,包括现有技术中已知的。一般来说,在训练模型时,所使用的训练集越大越好,并且相应地,训练集所包括的实例和文本越多越好。在训练集包括多种类别的样本的情况下,各类别的样本的数量应尽量保持均匀分布。另外,可以将带有样本标签y0的样本训练数据x输入到建立的模型f,由采用初始化的随机参数的该模型得出该样本训练数据的预测标签y1,然后通过最小化样本标签y0与预测标签y1之间的差异进行反向求导来修正参数,由此对模型进行训练。对于经训练的模型,可以根据情况以类似的方式进一步进行训练,以进一步修正模型的参数。通过这样的模型由文本生成相应的向量表达的方式可以是已知的,这里不作赘述。以使用bert模型为例,例如对输入到该模型的文本,可以获取该文本的每个字符的输出向量,然后将获取的每个字符的输出向量求和取平均值以得到该文本的整体向量表达。可以从例如但不限于bert模型的倒数第二层的输出获取每个字符的输出向量。bert模型最后一层的向量和模型输出第一个字符cls分类标签向量偏向具体任务,采用倒数第二层的向量输出有利于较好地学习到输入到该模型的文本的深层语义信息和依存信息。在向量化的情况下,例如通过bert模型向量化的情况下,每个已配置意图类别都会在向量空间中由一个向量表示,表现为一个点(类似于笛卡尔坐标中的点)。不同的已配置意图类别在向量空间中对应于不同的点。即使相关性很大的两个已配置意图类别,在向量空间中也不会是相同的点。另外,向量化的每个已配置意图类别可以具有一个相应的设定阈值,用于该已配置意图类别的向量表达与另一向量表达的相似度判断。通常,该阈值可以位于[0,1]的区间。
[0070]
在该实施例的情况下,步骤s124可以包括步骤s1241、步骤s1242、步骤s1243和步骤s1244,如图2所示。
[0071]
在步骤s1241,通过所述模型由与所述输入文本对应的目标文本生成一个查询请求向量表达。这里,目标文本可由所述至少一个目标分词确定。例如,目标文本可由所述至少一个目标分词中的每个所具有或指示的分词类型组成。根据情况,目标文本可能与输入
文本相同或不同。例如,对于一个特定的由输入文本“北京明天晴天吗”表示的查询请求,可以得到目标分词“北京”、“明天”、“晴天”,并确定这些目标分词具有的分词类型分别是“城市”、“时间”和“天气”,此时与该输入文本对应的目标文本可以是“城市时间天气”。再如,对于一个特定的由输入文本“北京明天天气”表示的查询请求,可以得到目标分词“北京”、“明天”以及“天气”,并确定其中的“北京”和“明天”分别具有分词类型“城市”和“时间”,其中的“天气”指示分词类型“天气”,此时与该输入文本对应的目标文本可以是“城市时间天气”。简言之,就确定与输入文本相应的目标文本而言时,对于具有分词类型的目标分词,该目标分词具有的类型组成该目标文本的一部分,对于指示分词类型的目标分词,该目标分词本身,即该目标分词的原词,组成该目标文本的一部分。
[0072]
在步骤s1242,计算所述查询请求向量表达与每个已配置意图类别的已配置意图类别向量表达的相似度。已配置意图类别可以不止一个,查询请求向量表达可以与所有已有的已配置意图类别向量表达分别进行相似度的计算。所述相似度可以包括例如但不限于余弦相似度。
[0073]
在步骤s1243,确定与所述查询请求向量表达具有最大相似度的已配置意图类别向量表达所对应的已配置意图类别为感兴趣已配置意图类别。
[0074]
在步骤s1244,仅在所述查询请求向量表达与所述感兴趣已配置意图类别的已配置意图类别向量表达的相似度大于所述感兴趣已配置意图类别的设定阈值的情况下,确定所述感兴趣已配置意图类别为所述匹配的已配置意图类别。在确定所述感兴趣已配置意图类别为所述匹配的已配置意图类别的情况下,即判断出对于所述查询请求,在已配置意图类别中存在一个匹配的已配置意图类别。
[0075]
如果查询请求向量表达与感兴趣已配置意图类别的已配置意图类别向量表达的相似度小于所述感兴趣已配置意图类别的设定阈值,可以认为在已有的已配置意图类别中不存在匹配的已配置意图类别。在此情况下,根据本发明,直接添加一个新的意图类别作为已配置意图类别。如前文所述,新的已配置意图类别可以由添加的新意图文本描述表示。可以如上所述的方式通过模型由该新意图文本生成该新的已配置意图类别的向量表达,并为该新的已配置意图类别设置一个相应的设定阈值,由此实现对新的已配置意图类别的后台配置。有关该新的已配置意图类别的其他方面,可以参考前文所述。
[0076]
作为一个示例,在一个实施例中,存在已有的已配置意图类别1“逆势上扬的公司”(含义:利润同比>1的公司)、已配置意图类别2“预实零差的产品”(含义:产品预计销量与实际销量之差为零),它们分别具有通过经训练的bert模型生成的已配置意图类别向量表达y1、已配置意图类别向量表达y2,并分别具有相应的阈值f1、f2。假设针对由特定输入文本“逆势上扬的产品”表示的某查询请求,判断步骤s124的判断结果为否定。根据本发明的方法,可以据此认为通过该查询请求要查询的意图不在已有的已配置意图类别中,需要添加新的意图类别。此时,可以如上所述相应地执行意图类别识别步骤和意图确定步骤,实现添加新的已配置意图类别和确定目标查询意图。
[0077]
特别地,例如可以根据由输入文本得到的目标分词“逆势上扬”和“产品”,预测该查询请求要查询的意图可能为1)逆势上扬的产品,然后将可能性1)作为要查询的意图,并相应地添加新的已配置意图类别3“逆势上扬的产品”(含义:销量同比>1的产品),通过模型生成其向量表达y3,并为其设置阈值f3=0.9。并且,可以针对该新的已配置意图类别进行
后台配置和将其同步到模型中,由此实现意图实时添加,而无需重新训练模型。
[0078]
之后,若接收到用户查询请求“逆势上扬的产品”,可以如图2所示地执行如下步骤。
[0079]
在步骤s1241,将与输入文本“逆势上扬的产品”对应的目标文本输入所述bert模型以由该模型生成一个查询请求向量表达x。
[0080]
在步骤s1242,计算查询请求向量表达x分别与y1、y2、y3的余弦距离s1、s2、s3,例如s1=0.2、s2=0.45、s3=0.92。
[0081]
在步骤s1243,确定s1、s2、s3中的最大者s3,并确定与查询请求向量表达x具有该最大相似度s3的已配置意图类别向量表达y3所对应的已配置意图类别3为感兴趣已配置意图类别。
[0082]
在步骤s1244,确定s3大于相应的阈值f3。据此,可确定已配置意图类别3为该查询请求的目标查询意图类别。然后,可以如上所述相应地执行意图类别识别步骤和意图确定步骤,确定该查询请求的目标查询意图。
[0083]
利用本发明的方案,对于在已有的已配置意图类别中没有匹配的意图类别的查询请求,可以实时添加相应的新的已配置意图类别,由此实时完成对输入文本的意图识别。另外,通过对新的已配置意图类别的实时配置,本发明的方法支持动态配置,有助于从口语化的表达中提取出用户的意图。此外,本发明有助于实现个性化配置。
[0084]
本发明可以实现为一种用于意图识别的系统,该系统包括处理器,该处理器被配置为执行计算机指令以执行本发明的方法的部分或全部步骤。
[0085]
本发明的方案适用于各种可能的领域,包括例如但不限于:查询天气、查询车票、查询销量等。
[0086]
在一个实施例中,提供了一种计算机设备,其包括存储器和处理器,所述存储器上存储有可由处理器执行的计算机指令,所述计算机指令在由所述处理器执行时指示所述处理器执行本发明的用于意图识别的方法的各步骤。该计算机设备可以广义地为服务器、终端,或任何其他具有必要的计算和/或处理能力的电子设备。在一个实施例中,该计算机设备可包括通过系统总线连接的处理器、存储器、网络接口、通信接口等。该计算机设备的处理器可用于提供必要的计算、处理和/或控制能力。该计算机设备的存储器可包括非易失性存储介质和内存储器。该非易失性存储介质中或上可存储有操作系统、计算机程序等。该内存储器可为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口和通信接口可用于与外部的设备通过网络连接和通信。该计算机程序被处理器执行时执行本发明的用于意图识别的方法的步骤。
[0087]
本发明可以实现为一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在由处理器执行时导致本发明的方法的步骤被执行。在一个实施例中,所述计算机程序被分布在网络耦合的多个计算机设备或处理器上,以使得所述计算机程序由一个或多个计算机设备或处理器以分布式方式存储、访问和执行。单个方法步骤/操作,或者两个或更多个方法步骤/操作,可以由单个计算机设备或处理器或由两个或更多个计算机设备或处理器执行。一个或多个方法步骤/操作可以由一个或多个计算机设备或处理器执行,并且一个或多个其他方法步骤/操作可以由一个或多个其他计算机设备或处理器执行。一个或多个计算机设备或处理器可以执行单个方法步骤/操作,或执行两个或更多个方法步骤/操
作。
[0088]
本领域普通技术人员可以理解,本发明的用于意图识别的方法的全部或部分步骤可以通过计算机程序来指示相关的硬件如计算机设备或处理器完成,所述的计算机程序可存储于非暂时性计算机可读存储介质中,该计算机程序被执行时导致本发明的用于意图识别的方法的步骤被执行。根据情况,本文中对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器的示例包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)、闪存、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘等。易失性存储器的示例包括随机存取存储器(ram)、外部高速缓冲存储器等。
[0089]
以上描述的各技术特征可以任意地组合。尽管未对这些技术特征的所有可能组合进行描述,但这些技术特征的任何组合都应当被认为由本说明书涵盖,只要这样的组合不存在矛盾。
[0090]
尽管结合实施例对本发明进行了描述,但本领域技术人员应理解,上文的描述和附图仅是示例性而非限制性的,本发明不限于所公开的实施例。在不偏离本发明的精神的情况下,各种改型和变体是可能的。