基于人工智能的用户意图识别方法和装置与流程

文档序号：17588081发布日期：2019-05-03 21:30阅读：498来源：国知局

本公开内容属于信息处理领域，尤其涉及一种基于人工智能的用户意图识别方法、装置以及一种相应的计算机可读存储介质。

背景技术：

人工智能(artificialintelligence)，英文缩写为ai。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着自然语言理解技术(nlp)的不断发展，意图识别在越来越多的领域发挥着重要的作用，诸如智能客服之类的对话产品。用户意图识别是从用户的输入理解用户的需求，例如：“肚子饿了”、“吃饭了吧”，意图为“想吃饭”。传统的用户意图识别方法是首先获取用户输入的对话文本，然后对文本进行分词，再分别计算文本中每个词的词向量，最后将词向量输入预先训练好的传统模型来判断当前的用户意图。这种方法需要大量的语料数据来训练，并且没有区分场景，仅从文字角度对用户意图进行识别。然而，相同或相似的对话文本在不同场景下可能表现不同的用户意图，例如：当老板询问工作情况时，同样说“吃饭了吧”，意图更加适合分类为“婉拒”而不是“想吃饭”。

技术实现要素：

本公开的实施例提供了一种基于人工智能的用户意图识别方法、装置以及一种相应的计算机可读存储介质以解决上述问题或其它潜在问题。

本公开的实施例的第一方面提出了一种基于人工智能的用户意图识别方法，所述用户意图识别方法包括以下步骤：

a.使用文本识别算法从与用户的对话中提取关于所述用户的文本信息，并确定与所述对话相对应的行业场景；

b.获取与所述对话相关的细分行业信息；以及

c.根据所述文本信息和所述细分行业信息进行意图识别，以获取所述用户的预测意图。

本公开的实施例的第二方面提出了一种基于人工智能的用户意图识别装置，所述用户意图识别装置包括：

处理器；以及

存储器，其用于存储指令，当所述指令被执行时使得所述处理器执行以下步骤：

a.使用文本识别算法从与用户的对话中提取关于所述用户的文本信息，并确定与所述对话相对应的行业场景；

b.获取与所述对话相关的细分行业信息；以及

c.根据所述文本信息和所述细分行业信息进行意图识别，以获取所述用户的预测意图。

本公开的实施例的第三方面提出了一种计算机可读存储介质，包括计算机可执行指令，所述计算机可执行指令在装置中运行时使得所述装置执行根据本发公开的实施例的第一方面所述的基于人工智能的用户意图识别方法。

本公开的实施例的第四方面提出了一种自动业务处理系统，包括：根据本公开的实施例的第二方面所述的用户意图识别装置，或包含用于实现本公开的实施例的第一方面所述的用户意图识别方法的用户意图识别装置；以及业务处理装置，所述业务处理装置用于根据所述用户意图识别装置识别出的用户的预测意图来处理与所述用户相关的业务。

依据本公开的实施例的基于人工智能的用户意图识别方法、装置以及相应的计算机可读存储介质和自动业务处理系统，使得能够解决传统的用户意图识别方法在不同场景下对用户真实意图识别的正确率缺失问题，通过结合行业特征信息进行意图分类，有效地提高用户意图识别的正确率，并且通过细分化行业场景，针对不同的行业场景仅需少量的语料数据来训练不同的意图识别模型以识别用户意图。

附图说明

结合附图并参考以下详细说明，本公开的各实施例的特征、优点及其他方面将变得更加明显，在此以示例性而非限制性的方式示出了本公开的若干实施例，在附图中：

图1是本公开的实施例可以应用于其中的示例性环境100的示意架构图；

图2示出了根据本公开的实施例的基于人工智能的用户意图识别方法200的流程图；

图3示出了根据本公开的实施例的基于人工智能的用户意图识别装置300的示意图；以及

图4示出了包括根据本公开的实施例的基于人工智能的用户意图识别装置的自动业务处理系统400的示意图。

具体实施方式

以下参考附图详细描述本公开的各个示例性实施例。附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意，流程图或框图中的每一个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意，在有些作为备选的实现中，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每一个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以使用专用硬件与计算机指令的组合来实现。

本文所使用的术语“包括”、“包含”及类似术语是开放性的术语，即“包括/包含但不限于”，表示还可以包括其他内容。术语“基于”是“至少部分地基于"。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”等等。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当视为说明书的一部分。对于附图中的各单元之间的连线，仅仅是为了便于说明，其表示至少连线两端的单元是相互通信的，并非旨在限制未连线的单元之间无法通信。

为了便于描述，下面对本公开内容中出现的一些术语进行说明，应当理解，本申请所使用的术语应解释为具有与其在本申请说明书的上下文及有关领域中的意义一致的意义。

本公开内容中的术语“用户”是指为满足生产、生活消费而需要购买和使用机构提供的产品或是接受机构提供的服务的客户群体。

本公开内容中的术语“员工”是指机构中用于向用户提供服务(例如，与用户进行交互式对话等)的群体。

本公开内容中的行业场景是指机构向用户提供服务的不同类型的业务场景。

如前所述，传统的用户意图识别方法需要大量的语料数据来训练，并且没有区分场景，仅从文字角度对用户意图进行识别，在不同场景下对用户真实意图识别的正确率缺失。为了解决此类问题，本公开的实施例提供了改进的用户意图识别方法，使得通过结合行业特征信息进行意图分类，有效地提高用户意图识别的正确率。

图1示出了本公开内容的实施例可以应用于其中的示例性环境100的示意架构图。

示例性环境100包括机构(例如，互联网金融公司等)的员工101-103、业务处理平台110。员工101-103可以通过有线或无线方式连接到业务处理平台110。业务处理平台110可以处理与用户相关的各种业务(例如，催收业务、出借端客服业务、借款端客服业务、移动客服业务等)。在示例性环境100中，业务处理平台110连接到网络111(例如，有线或无线通信网络)，并且网络111经由通信链路112(例如，有线或无线链路)与机构所服务的用户121-123相连接。业务处理平台110可以提供例如语音处理模块、电子邮件处理模块、短消息处理模块等对话处理模块，使得机构的员工101-103能够通过这些模块，经由网络111与机构所服务的用户121-123进行交互式对话(例如，语音、电子邮件、短消息等)。以催收业务为例，当用户121-123中的用户未能按时偿还机构的产品(例如，金融产品等)时，机构可以处理与该产品相关联的催收业务。出于控制成本的目的，机构多以对话(例如，语音、邮件、短消息等)催收为主，其中，使机构的员工101-103中的员工能够经由网络111与该用户进行交互式对话以进行催收。应当理解，图1中示出的员工和用户的数量仅是示意而非限制，其可以是任意数量。

图2示出了根据本公开的实施例的基于自然语言处理的用户意图识别方法200的流程图。方法200可以由图1的业务处理平台110执行。如流程图所示，方法200包括以下步骤：

步骤201：使用文本识别算法从与用户的对话中提取关于该用户的文本信息，并确定与该对话相对应的行业场景。在该步骤中，可以使用文本识别算法从与该用户交互的短消息、电子邮件或语音会话中的至少一个提取关于该用户的文本信息。以语音会话为例，可以通过例如自动语音识别(asr，automaticspeechrecognition)技术将与用户的交互式语音会话转换为文本信息。此外，在该步骤中，可以通过例如在对话中携带的场景信息来确定与该对话相对应的行业场景，或者可以通过从其它方式(例如，从业务平台处接收)接收到的场景信息中确定与该对话相对应的行业场景，或者可以根据从对话中提取的与行业相关的关键词来确定与该对话相对应的行业场景，等等。在一些实施例中，该文本信息可以包括单句，使得可以通过对整体句子而不是分词的判断来识别相关用户意图。

步骤202：获取与该对话相关的细分行业信息。在该步骤中，针对所确定的行业场景，获取与该对话相关的细分行业信息，使得后续可以通过结合行业特征信息进行意图分类。

步骤203：根据该文本信息和该细分行业信息进行意图识别，以获取该用户的预测意图。在该步骤中，通过结合行业特征信息进行意图分类，可以有效地提高用户意图识别的正确率。

在一些实施例中，步骤202可以包括：获取该用户的用户信息、与该对话相对应的历史业务信息、该用户的历史对话信息中的一个或多个。例如，细分行业信息可以包括：该用户的用户信息、与该对话相对应的历史业务信息、该用户的历史对话信息中的一个或多个。例如，用户信息可以包括但不限于年龄、性别、地域、所在城市、星座、性格、学历、家庭结构、婚姻状况、兴趣爱好、收入、职业信息、征信信息等。例如，与该对话相对应的历史业务信息可以包括但不限于申请业务类型、业务使用情况等。例如，该用户的历史对话信息可以包括但不限于对话时长、对话时间段、对话接通率、对话语气和语态、答复内容等。

在一些实施例中，步骤203可以包括：基于该行业场景，确定用于该文本信息和该细分行业信息的第一意图识别模型，其中，该第一意图识别模型使用与该行业场景相关联的已标注类别的历史文本信息和历史细分行业信息来生成；根据该文本信息和该细分行业信息，使用该第一意图识别模型来生成该用户的第一意图识别结果；以及基于该第一意图识别结果来生成该用户的预测意图。在该步骤中，可以针对不同行业场景，确定用于该文本信息和该细分行业信息的第一意图识别模型，由于细分化行业场景，对于每个行业场景来说，所需识别的用户意图类别大为减少，仅需少量的语料数据来训练意图识别模型。细分行业信息可由各行业系统存储的信息提供，例如对于催收行业，储存了借款人相应的借款信息、案件信息等，譬如当细分行业信息为多次承诺未归还借款、所在公司倒闭等等时，而对于用户回复中的文本信息“明天就将归还当期借款”，该句的意图就不再是字面上“愿意归还”的意图，将被识别为“拖延归还”的意图。

在一些实施例中，方法200还可以包括：使用该文本识别算法从该对话中提取与该文本信息相关的上下文内容。在该步骤中，还可以从对话中提取与文本信息相关的上下文内容(例如，上文和/或下文内容)，以便更准确地判断用户意图。

在一些实施例中，方法200还可以包括以下步骤：基于该行业场景，确定用于该文本信息和该上下文内容的第二意图识别模型，其中，该第二意图识别模型使用与该行业场景相关联的已标注类别的历史文本信息和历史上下文内容来生成；基于该行业场景，确定用于该文本信息、该上下文内容和该细分行业信息的第三意图识别模型，其中，该第三意图识别模型使用与该行业场景相关联的已标注类别的历史文本信息、历史上下文内容和历史细分行业信息来生成；根据该文本信息和该上下文内容，使用该第二意图识别模型来生成该用户的第二意图识别结果；根据该文本信息、该上下文内容和该细分行业信息，使用该第三意图识别模型来生成该用户的第三意图识别结果；并且基于该第一意图识别结果来生成该用户的预测意图可以包括：基于该第一意图识别结果、该第二意图识别结果和该第三意图识别结果来生成该用户的预测意图。在该步骤中，针对每个行业场景，可以通过多个意图识别模型来综合地判断用户意图，从而有效地提高用户意图识别的正确率。

在一些实施例中，基于该第一意图识别结果、该第二意图识别结果和该第三意图识别结果来生成该用户的预测意图可以包括：根据该行业场景，确定分别用于该第一意图识别模型、该第二意图识别模型和该第三意图识别模型的第一权重、第二权重和第三权重；以及根据该第一权重、该第二权重和该第三权重，基于该第一意图识别结果、该第二意图识别结果和该第三意图识别结果来生成该用户的预测意图。在该步骤中，考虑到不同场景下，多个意图识别模型所起的效果可能不同，可以为多个意图识别模型确定相应的多个权重，使得通过例如加权组合的方式来综合地判断用户意图，从而有效地在不同场景下提高用户意图识别的正确率。在一些示例中，该多个权重可以例如通过机器学习方法(例如，线性回归等)来训练生成。

根据图2所描述的实施例，与传统的用户意图识别方法相比，提供了改进的用户意图识别方法，使得能够解决在不同场景下对用户真实意图识别的正确率缺失问题，通过结合行业特征信息进行意图分类，有效地提高用户意图识别的正确率，并且通过细分化行业场景，针对不同的行业场景仅需少量的语料数据来训练不同的意图识别模型以识别用户意图。

图3示出了根据本公开的实施例的基于人工智能的用户意图识别装置300的示意图。装置300可以包括：存储器301和耦合到存储器301的处理器302。存储器301用于存储指令，当该指令被执行时使得处理器302来执行本文所描述的方法(如图2的方法200)中的一个或多个动作或步骤。

存储器301可以包括易失性存储器和非易失性存储器，诸如rom(readonlymemory)、ram(randomaccessmemory)、移动盘、磁盘、光盘和u盘等。处理器302可以是中央处理器(cpu)、微控制器、专用集成电路(asic)、数字信号处理器(dsp)、现场可编程门阵列(fpga)或其它可编程逻辑器件、或是被配置为实现本公开的实施例的一个或多个集成电路等。

图4示出了包括根据本公开的实施例的基于人工智能的用户意图识别装置的自动业务处理系统400的示意图。如图4所示，自动业务处理系统400包括用户意图识别装置401和业务处理装置402。例如，用户意图识别装置401可以包括用于实现如图2的用户意图识别方法200的模块，或者用户意图识别装置401可以是如图3所示的基于人工智能的用户意图识别装置300。业务处理装置402可以根据用户意图识别装置401识别出的用户的预测意图来(自动)处理与该用户相关的业务。例如，在诸如催收业务的行业场景中，基于机构(例如，互联网金融机构等)的员工(即，催员)与用户(即，被催人员)之间的交谈，可以采用如本文所描述的方法和装置对用户的语句进行意图分类(例如，确定用户是否有还款能力和/或还款意愿，诸如用户具有还款能力及还款意愿、有还款意愿但没有还款能力、有还款能力但没有还款意愿、没有还款能力也没有还款意愿等类别或其它各种类型的意图类别)，然后对这些意图类别建立对应的应答方式(例如，可以建立一个知识库，对员工进行培训)，使得员工知道遇到相关类别的对话文本时该如何作答来处理催收业务。此外，还可以对用户的意图进行分类统计，以此为基础实现可以在这个基础上做智能催收机器人等。类似地，自动业务处理系统400还可以应用于销售业务、客服业务等场景。

另外或替代地，上述方法能够通过计算机程序产品，即计算机可读存储介质来实现。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开内容的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

一般而言，本公开的各种示例实施例可以在硬件或专用电路、软件、固件、逻辑，或其任何组合中实施。某些方面可以在硬件中实施，而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。当本公开的实施例的各方面图示或描述为框图、流程图或使用某些其他图形表示时，将理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备，或其某些组合中实施。

应当注意，尽管在上文的详细描述中提及了装置的若干模块或单元，但是这种划分仅仅是示例性而非强制性的。实际上，根据本公开的实施例，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

以上所述仅为本公开的实施例可选实施例，并不用于限制本公开的实施例，对于本领域的技术人员来说，本公开的实施例可以有各种更改和变化。凡在本公开的实施例的精神和原则之内，所作的任何修改、等效替换、改进等，均应包含在本公开的实施例的保护范围之内。

虽然已经参考若干具体实施例描述了本公开的实施例，但是应该理解，本公开的实施例并不限于所公开的具体实施例。本公开的实施例旨在涵盖在所附权利要求的精神和范围内所包括的各种修改和等同布置。所附权利要求的范围符合最宽泛的解释，从而包含所有这样的修改及等同结构和功能。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张穹
技术所有人：上海点融信息科技有限责任公司
我是此专利的发明人

上一篇：一种自适应喷头的制作方法
上一篇：开合结构及具有该开合结构的电子装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。