对话方法、记录介质以及对话系统的制作方法

文档序号：10687047阅读：829来源：国知局

对话方法、记录介质以及对话系统的制作方法
【专利摘要】本公开提供能够缩短对话系统与用户的对话时间并且能够缩短对话系统的处理时间的对话方法、记录介质以及对话系统。含义网络存储部(111)将为了执行针对用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储，自然语言处理器(102)取得表示用户的言语内容的言语信息，从多个节点中确定与言语信息对应的第1节点，会话生成部(121)从与所确定的第1节点相关联的多个第2节点中，基于与多个第2节点分别相对应的权重值，选择一个第2节点，生成与所选择的一个第2节点对应的应答文。
【专利说明】
对话方法、记录介质以及对话系统
技术领域
[0001]本公开涉及对用户的言语进行应答的对话系统中的对话方法、对用户的言语进行应答的对话程序以及对用户的言语进行应答的对话系统。
【背景技术】
[0002]近些年，提出了通过生成表达用户的喜好的模型，高效地进行系统与用户的对答的技术方案。
[0003]例如，专利文献I所公开的声音对话系统中，针对成为识别对象的关键字，记录将它们包含于应答文中的情况下所使用的替代语、表示应答文的种类的应答类型、以及选择替代语和应答类型的条件，基于选择替代语和应答类型的条件，决定针对识别出的关键字的替代语和应答文模板，将替代语插入所决定的应答文模板，由此生成应答文。
[0004]另外，专利文献2所公开的以往的声音理解系统具备:知识提取部，其接收电子节目指南(EPG)的信息，处理EPG信息，形成节目数据库；声音识别部，接收口述请求，将口述请求翻译为包括多个词汇(单词)的一系列的文本信息；自然语言处理器，其接收一系列的文本信息，处理词汇以便解释口述请求的语义内容；以及会话控制部，其为了判断是否输入了足够数量的关键字槽位(slot)而分析任务框架(task frame)，为了对空的槽位进行输入而向用户询问追加的信息。
[0005]现有技术文献
[0006]专利文献I:日本特开2008-39928号公报
[0007]专利文献2:日本特开2000-250575号公报

【发明内容】

[0008]发明要解决的问题
[0009]但是，在以往的声音理解系统中，向用户直接询问要输入到任务框架的槽位值，针对从用户得到的回答进行再次确认而决定槽位值。因此，系统与用户的对话时间长，并且，系统的处理时间长。
[0010]本公开为了解决上述的问题而提出，目的在于提供能够缩短对话系统与用户的对话时间，并且能够缩短对话系统的处理时间的对话方法、对话程序以及对话系统。
[0011]解决问题的技术方案
[0012]本公开的一个方面所涉及的对话方法，是对用户的言语进行应答的对话系统中使用的对话方法，将为了执行针对所述用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储，取得表示所述用户的言语内容的言语信息，从所述多个节点中确定与所述言语信息对应的第I节点，从与所确定的所述第I节点相关联的多个第2节点中，基于与所述多个第2节点分别相对应的权重值，选择一个第2节点，生成与所选择的所述一个第2节点对应的应答文。
[0013]根据该构成，将为了执行针对用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储。取得表示用户的言语内容的言语信息。从多个节点中确定与言语信息对应的第I节点。从与所确定的第I节点相关联的多个第2节点中，基于与多个第2节点分别相对应的权重值，选择一个第2节点。然后，生成与所选择的一个第2节点对应的应答文。
[0014]因此，无需生成用于使用户从多个第2节点中选择一个第2节点的询问文，而是生成对应于基于与多个第2节点分别相对应的权重值选择的一个第2节点的应答文，因此，能够缩短对话系统与用户的对话时间，并且能够缩短对话系统的处理时间。
[0015]另外，在上述的对话方法中，所述权重值也可以表示所述多个第2节点过去被所述用户选择的概率。
[0016]根据该构成，权重值表示多个第2节点过去被用户选择的概率，因此，能够简单地算出权重值。
[0017]另外，在上述的对话方法中，也可以选择所述多个第2节点中的所述概率比预定值大的第2节点。
[0018]根据该构成，由于选择多个第2节点中的概率比预定值大的第2节点，因此，能够简单地选择一个第2节点。
[0019]另外，在上述的对话方法中，也可以在所述多个第2节点中不存在所述概率比预定值大的第2节点的情况下，生成用于使所述用户选择所述多个第2节点中的任意一个的应答文。
[0020]根据该构成，在多个第2节点中不存在概率比预定值大的第2节点的情况下，生成用于使用户选择多个第2节点的任意一个的应答文，因此，即便在无法选择一个第2节点的情况下，也能够使用户进行选择。
[0021]另外，在上述的对话方法中，也可以取得表示所述用户对所述应答文的回答的信息，根据所述用户的回答是否是选择所述多个第2节点中的一个第2节点的回答，更新所述权重值。
[0022]根据该构成，取得表示用户对应答文的回答的信息。根据用户的回答是否是选择多个第2节点中的一个第2节点的回答，更新权重值。
[0023]因此，每当用户利用系统时，权重值被更新，因此，能够选择与用户的利用状况相应的一个第2节点。
[0024]另外，在上述的对话方法中，也可以是:所述权重值同如下组合相对应，该组合为:与多个第I节点中的一个第I节点相关联的多个第2节点中的一个第2节点和与所述多个第I节点中的其他第I节点相关联的多个第2节点的各个的组合，判断是否确定了所述一个第2节点，在确定了所述一个第2节点的情况下，基于同所述一个第2节点和与所述其他第I节点相关联的多个第2节点的各个的组合相对应的权重值，从与所述其他第I节点相关联的所述多个第2节点中选择一个第2节点。
[0025]根据该构成，权重值同与多个第I节点中的I个第I节点相关联的多个第2节点中的一个第2节点和、与多个第I节点中的其他第I节点相关联的多个第2节点的各个的组合相对应。判断是否确定了一个第2节点。在确定了一个第2节点的情况下，基于对应于一个第2节点和与其他第I节点相关联的多个第2节点的各个的组合的权重值，从与其他第I节点相关联的多个第2节点中选择一个第2节点。
[0026]因此，能够选择与如下组合对应的一个第2节点，上述组合是:与多个第I节点中的一个第I节点相关联的多个第2节点中的一个第2节点和与多个第I节点中的其他第I节点相关联的多个第2节点的各个的组合。
[0027]本公开的其他方面的对话程序是对用户的言语进行应答的对话程序，使计算机作为下述各部发挥功能:存储部，将为了执行针对所述用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储;取得部，取得表示所述用户的言语内容的言语信息;确定部，从所述多个节点中确定与所述言语信息对应的第I节点；选择部，从与所述确定部所确定的所述第I节点相关联的多个第2节点中，基于与所述多个第2节点分别相对应的权重值，选择一个第2节点；以及生成部，生成与所述选择部所选择的所述一个第2节点对应的应答文。
[0028]根据该构成，将用于执行针对用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储。取得表示用户的言语内容的言语信息。从多个节点中确定与言语信息对应的第I节点。从与所确定的第I节点相关联的多个第2节点中，基于与多个第2节点分别相对应的权重值，选择一个第2节点。然后，生成与所选择的一个第2节点对应的应答文。
[0029]因此，无需生成用于使用户从多个第2节点中选择一个第2节点的询问文，而是生成对应于基于与多个第2节点分别相对应的权重值选择出的一个第2节点的应答文，因此，能够缩短对话系统与用户的对话时间，并且能够缩短对话系统的处理时间。
[0030]本公开的其他方面的对话系统是对用户的言语进行应答的对话系统，具备:存储部，将为了执行针对所述用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储;取得部，取得表示所述用户的言语内容的言语信息；确定部，从所述多个节点中确定与所述言语信息对应的第I节点；选择部，从与所述确定部所确定的所述第I节点相关联的多个第2节点中，基于与所述多个第2节点分别相对应的权重值，选择一个第2节点；以及生成部，生成与所述选择部所选择的所述一个第2节点对应的应答文。
[0031]根据该构成，将为了执行针对用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储。取得表示用户的言语内容的言语信息。从多个节点中确定与言语信息对应的第I节点。从与所确定的第I节点相关联的多个第2节点中，基于与多个第2节点的各个相对应的权重值，选择一个第2节点。然后，生成与所选择的一个第2节点对应的应答文。
[0032]因此，无需生成用于使用户从多个第2节点中选择I个第2节点的询问文，而是生成对应于基于与多个第2节点的各个相对应的权重值选择的一个第2节点的应答文，因此，能够缩短对话系统与用户的对话时间，并且能够缩短对话系统的处理时间。
[0033]发明的效果
[0034]根据本公开，能够缩短对话系统与用户的对话时间，并且能够缩短对话系统的处理时间。
【附图说明】
[0035]图1是用于说明本实施方式中的声音对话系统的概要的图。
[0036]图2是示出本实施方式中的声音对话系统的构成的图。
[0037]图3是示出判断条件表的一例的图。
[0038]图4是用于对本实施方式中的声音对话系统的声音对话处理进行说明的流程图。
[0039]图5是用于对本实施方式中的声音对话系统的权重值更新处理进行说明的流程图。
[0040]图6是用于说明本实施方式中的声音对话系统的声音对话处理与以往的声音对话系统的声音对话处理的差异的图。
[0041]图7是示出本实施方式的变形例中的声音对话系统的含义网络的一例的图。
[0042]图8是用于对本实施方式的变形例中的声音对话系统的声音对话处理进行说明的流程图。
[0043]图9A是示出以往例的声音对话系统中使用的对话方法的对话文的一例的图。
[0044]图9B是示出本公开所涉及的声音对话系统中使用的对话方法的对话文的一例的图。
[0045]标号说明
[0046]101声音识别部；102自然语言处理器；103存储器；104会话管理部；105声音合成部；111含义网络存储部；112权重值管理表存储部；113判断条件表存储部；121会话生成部；122权重值更新部;131句子解析部;132存储器访问部
【具体实施方式】
[0047]以下，参照附图对本发明的实施方式进行说明。此外，以下的实施方式是将本发明具体化的一个例子，不限定本发明的技术范围。
[0048]图1是用于说明本实施方式中的声音对话系统的概要的图。
[0049]图1所示的例子示出在销售饮料时使用的含义网络的一例。图1所示的含义网络包含为了执行针对用户的言语生成应答文的任务所需要的多个节点。多个节点分别相关联。对于相关联的两个节点，赋予表示两个节点的关系性的关系信息。关系信息包含:表示一方的节点相对于另一方的节点为下位概念的关系的信息、表示一方的节点是为了执行另一方的节点所含的概念涉及的任务所必需的项目的信息、表示一方的节点是对另一方的节点所含的概念涉及的任务任意地设定的项目的信息、以及表示一方的节点是另一方的节点的值的信息。
[0050]例如，对于表示“咖啡”的节点11与表示“饮料”的节点12，建立对应有表示如下内容的关系信息，该内容为:表示“咖啡”的节点11相对于表示“饮料”的节点12为下位概念(是一种饮料的关系)。此外，表示“咖啡”的节点11也被称为域(domain)。
[0051]另外，对于表示“大小”的节点14与表示“饮料”的节点12，建立对应有表示如下内容的关系信息，该内容为:表示“大小”的节点14相对于表示“饮料”的节点12为必须的项目。对于表示“数量”的节点15与表示“饮料”的节点12，建立对应有表示如下内容的关系信息，该内容为:表示“数量”的节点15相对于表示“饮料”的节点12为任意设定的项目，是在用户进行通知的情况下确定的节点。
[0052]另外，对于表示“糖”的节点17与表示“咖啡”的节点11，建立对应有表示如下内容的关系信息，该内容为:表示“糖”的节点17相对于表示“咖啡”的节点11是为了执行任务而必须的项目。对于表示“温度”的节点18与表示“咖啡”的节点11，建立对应有表示如下内容的关系信息，该内容为:表示“温度”的节点18相对于表示“咖啡”的节点11是为了执行任务而必须的项目。表示“糖”的节点17以及表示“温度”的节点18被称为必须槽位，或者被简称为槽位。
[0053]对于表示“热”的节点19与表示“温度”的节点18，建立对应有表示如下内容的关系信息，该内容为:表示“热”的节点19是表示“温度”的节点18的值。对于表示“7令”的节点20与表示“温度”的节点18，建立对应有表示如下内容的关系信息，该内容为:表示“7令”的节点20是表示“温度”的节点18的值。表示“热”的节点19以及表示“7令”的节点20是相对于表示“温度”的节点18而选择其任一方的节点。表示“热”的节点19以及表示“7令”的节点20被称为槽位值。
[0054]在用户购入饮料时，在选择了咖啡的情况下，是否需要砂糖、是热还是冷，这是必须要决定的，在未决定这些的情况下，无法执行提供饮料时针对用户的言语生成应答文的任务。即，温度是为了达成任务而必须的节点(槽位)，系统需要决定槽位值(该情况下为冷或热)。
[0055]在以往的系统中，关于咖啡的温度，系统向用户询问选择热以及冷中的哪一个，通过声音识别来判断用户的回答。在用户选择了热的情况下，系统再次询问热的可以吗，通过声音识别来判断用户的回答，决定咖啡的温度。
[0056]与此相对，在本公开的系统中，关于咖啡的温度，不是系统向用户询问选择热以及冷中的哪一个，而是根据过去多个用户选择了热以及冷中的哪一个而分别赋予权重值，根据权重值，询问选择热或选择冷。例如，在过去，冷以60 %的概率被选择，热以40 %的概率被选择的情况下，系统向用户询问是否选择冷，通过声音识别来判断用户的回答，决定咖啡的温度。在该情况下，与以往的系统相比，无需再次确认温度，能够缩短系统与用户的对话时间，并且能够缩短系统的处理时间。
[0057]另外，如果能够生成内容具体且正确的询问，则容易从用户获得为了执行任务所需的信息。例如，在用户点了咖啡的情况下，通过系统询问“热咖啡可以吧? ”，能够将用户的回答限定为“是”或“不是”等肯定的表达或否定的表达。
[0058]另外，作为其他的事例，例如，考虑用户点了指定“芝士汉堡套餐”的套餐菜单的情况。此时，在系统向用户询问套餐菜单中的饮料种类的情况下，基于概率，例如进行“可乐还是橙汁?”这一择一性的询问。由此，容易将用户的回答引导为“可乐。”或“橙汁。”等包含系统能够受理的内容的回答。即，系统通过进行择一性的询问，促使用户不进行预想外的回答。由此，用户使用系统能够受理的表达的可能性比应用了以往技术的情况高，能够从用户更可靠地获得信息。
[0059]图2是表示本实施方式中的声音对话系统的构成的图。声音对话系统具备声音识别部101、自然语言处理器102、存储器103、会话管理部104以及声音合成部105。
[0060]存储器103具备含义网络存储部111、权重值管理表存储部112以及判断条件表存储部113。
[0061 ]含义网络存储部111预先存储连接了多个节点的含义网络。含义网络存储部111将为了执行针对用户的言语生成应答文的任务而需要的多个节点分别相关联地存储。
[0062]权重值管理表存储部112将含义网络所含的槽位值与权重值相对应地存储。
[0063]判断条件表存储部113将能够选择的槽位值的数量、选择槽位值的条件、满足条件时得到的槽位值、表示应答文的模板相对应地存储。
[0064]声音识别部101将由麦克风(未图示)取得的输入声音转换成文本信息。声音识别部1I识别用户的言语而转换为文本信息。
[0065]自然语言处理器102取得表示用户的言语内容的言语信息(文本信息)。自然语言处理器102从多个节点中确定与言语信息对应的第I节点(槽位)。自然语言处理器102分析由声音识别部101输出的一系列的文本信息，理解语义内容以及用户的言语的意图。自然语言处理器102例如使用语言理解用数据库(未图示)所存储的语言理解用知识来理解言语内容。自然语言处理器102从文本信息提取具有含义的词汇。自然语言处理器102在含义网络存储部111所存储的含义网络内进行检索，在含义网络内存在所提取的词汇的情况下，从含义网络提取与由所提取的词汇确定的任务相关的槽位以及槽位所相对应的多个槽位值。
[0066]自然语言处理器102具备句子解析部131以及存储器访问部132。句子解析部131进行从文本化的用户的言语内容提取词汇的处理。存储器访问部132对于由句子解析部131提取的词汇，在存储器103所保存的含义网络内进行检索，提取槽位等，将所提取的槽位输出给会话管理部104(会话生成部121)。
[0067]此外，存储器访问部132也可以具备会话管理部104。自然语言处理器102也可以从文本化的用户的言语内容提取词汇，并输出给会话管理部104的存储器访问部，会话管理部104的存储器访问部从含义网络提取槽位等。
[0068]会话管理部104具备会话生成部121以及权重值更新部122。会话生成部121从与由自然语言处理器102确定的第I节点(槽位)相关联的多个第2节点(槽位值)中，基于与多个第2节点的各个节点相对应的权重值，选择一个第2节点。此外，权重值表示多个第2节点过去被用户选择的概率。会话生成部121从多个第2节点中，选择概率比预定值大的第2节点。会话生成部121生成与所选择的一个第2节点(槽位值)对应的应答文。会话生成部121在多个第2节点中不存在概率比预定值大的第2节点的情况下，生成用于使用户选择多个第2节点的某一个的应答文。
[0069]会话生成部121从权重值管理表取得与由自然语言处理器102提取的多个槽位值的各个槽位值相对应的权重值，基于所取得的权重值，决定I个槽位值。会话生成部121生成与所决定的槽位值对应的应答文。此时，会话生成部121参照判断条件表存储部113所存储的判断条件表，对某槽位判断是否满足与能够选择的槽位值的数量对应的判断条件。在满足判断条件的情况下，会话生成部121将槽位值插入预先准备的应答文的模板，生成应答文。
[0070]图3是示出判断条件表的一例的图。
[0071]如图3所示，判断条件表将能够选择的槽位值的数量、选择槽位值的条件、满足条件时得到的槽位值、表示应答文的模板建立对应。
[0072]例如，会话生成部121在能够选择的槽位值为“VI”以及“V2”这两个、VI比50%大、V2比50%小的情况下，选择V1作为槽位值。另外，会话生成部121在能够选择的槽位值为“ V1 ”以及“V2”这两个、Vl比50%小、V2比50%大的情况下，选择V2作为槽位值。另外，在选择了 Vl作为槽位值的情况下，会话生成部121生成“想要VI吗？(Do you want νι?)”这一应答文。另一方面，在选择了V2作为槽位值的情况下，会话生成部121生成“想要V2吗？(Do you want V2?)”这一应答文。
[0073]另外，会话生成部121在能够选择的槽位值为“V1”以及“v2”这两个、V1以及^为50%的情况下，选择Vl以及V2作为槽位值。另外，在选择了Vi以及V2作为槽位值的情况下，会话生成部121生成“VI或V2怎么样？(How about vi or V2?)”这一应答文。
[0074]另外，会话生成部121在能够选择的槽位值为“V1”、“v2”、...、“vx”多个、某一个槽位值Vi比50%大的情况下，选择Vi作为槽位值。另外，在选择了Vi作为槽位值的情况下，会话生成部121生成“想要Vi吗？(Do you want Vi?)”这一应答文。
[0075]另外，会话生成部121在能够选择的槽位值为“V1”、“v2”、...、“vx”多个、某一个槽位值Vi比40 %大、与槽位值Vi不同的某一个槽位值Vj比40 %大的情况下，选择Vi以及Vj作为槽位值。并且，在选择了V1以及W作为槽位值的情况下，会话生成部121生成“^或^怎么样？(How about Vi or Vj?)”这一应答文。
[0076]另外，会话生成部121在能够选择的槽位值为“V1”、“v2”、...、“vx”多个、任何槽位值V1都比40%小的情况下，不选择槽位值。另外，在不选择槽位值的情况下，会话生成部121生成“想要哪个XX(槽位名)？(What XX(slot name)do you want?)”这一应答文。
[0077]另外，自然语言处理器102取得表示用户对应答文的回答的文本信息。自然语言处理器102判断文本信息例如为“是”等肯定的回答、或者回答信息例如为“不是”等否定的回答。自然语言处理器102向权重值更新部122输出表示用户的回答是否为肯定的回答信息。权重值更新部122根据用户的回答是否为从多个第2节点中选择一个第2节点的回答，更新权重值。即，在回答信息为肯定的回答的情况下，权重值更新部122重新计算与能够选择的多个槽位值相对应的概率并进行更新。另一方面，在回答信息为否定的回答的情况下，会话生成部121生成用于使用户选择多个槽值的某一个的应答文。
[0078]声音合成部105将由会话管理部104生成的应答文转换为声音。由声音合成部105转换后的声音被从扬声器(未图不)输出。
[0079]此外，在图2所示的声音对话系统中，一个装置也可以具备声音识别部101、自然语言处理器102、存储器103、会话管理部104以及声音合成部105。另外，声音识别部101、自然语言处理器102、存储器103、会话管理部104以及声音合成部105也可以分散于多个装置。例如，终端装置也可以具备声音识别部101以及声音合成部105，经由网络以能够进行通信的方式与终端装置连接的服务器也可以具备自然语言处理器102、存储器103以及会话管理部104。
[0080]接下来，对本实施方式中的声音对话系统的声音对话处理进行说明。
[0081]图4是用于对本实施方式中的声音对话系统的声音对话处理进行说明的流程图。
[0082]首先，在步骤SI中，自然语言处理器102从表示用户的言语内容的言语信息取得词汇。
[0083]接着，在步骤S2中，自然语言处理器102在含义网络存储部111所存储的含义网络内进行检索，基于与各节点间相对应的关系信息，从含义网络提取与由所提取的词汇确定的任务相关的节点(槽位以及槽位值)。
[0084]接着，在步骤S3中，会话生成部121决定为了执行任务而需要输入值的槽位。
[0085]接着，在步骤S4中，会话生成部121从权重值管理表取得与所决定的槽位相对应的多个槽位值的权重值。
[0086]接着，在步骤S5中，会话生成部121参照判断条件表存储部113所存储的判断条件表，判断是否存在满足判断条件的权重值。在此，在判断为存在满足判断条件的权重值的情况下(在步骤S5中:是)，在步骤S6中，会话生成部121将槽位值决定为与满足判断条件的权重值对应的槽位值。
[0087]接着，在步骤S7中，会话生成部121使用所决定的槽位值来生成确认应答文。确认应答文是向用户确认所决定的槽位值是否可以的应答文。
[0088]另一方面，在判断为满足判断条件的权重值不存在的情况下(在步骤S5中:否)，在步骤S8中，会话生成部121生成请求应答文。请求应答文是向用户请求从多个能够选择的槽位值中选择所期望的槽位值的应答文。
[0089]接下来，对本实施方式中的声音对话系统的权重值更新处理进行说明。
[0090]图5是用于说明本实施方式中的声音对话系统的权重值更新处理的流程图。
[0091 ]首先，在步骤S11中，权重值更新部122确认由会话生成部121生成的应答文所含的槽位值。
[0092]接着，在步骤S12中，权重值更新部122从自然语言处理器102取得表示用户对应答文的回答是否为肯定的回答信息。
[0093]接着，在步骤S13中，权重值更新部122判断回答信息是否为肯定的回答。在此，在判断为回答信息不为肯定的回答的情况下(在步骤S13中:否)，在步骤S14中，权重值更新部122取得新的槽位值。此时，在能够选择的槽位值为两个的情况下，权重值更新部122取得未向用户提示的槽位值作为新的槽位值。另外，在能够选择的槽位值为三个以上的情况下，权重值更新部122取得由用户选择的槽位值作为新的槽位值。
[0094]另一方面，在判断为回答信息为肯定的回答的情况下(在步骤S13中:是)，在步骤SI5中，权重值更新部122重新计算权重值。
[0095]在此，对权重值的计算方法进行说明。首先，在由权重值更新部122计算权重值之前的权重值管理表中，保存权重值的初始值。可以对某槽位选择X个槽位值￥1、V2、…、Vx，用户的人数为η人，选择了各槽位值的用户的人数设为犯、犯、...、NX时，各槽位值的权重值(概率)用犯/n、N2/n、…、Nx/n来表示。此时，向用户的人数η以及选择了各槽位值的用户的人数见、他、"_具代入任意的数。例如，也可以基于过去的统计数据，设定人数见、他、"_具。另外，权重值的初始值也可以全部设定为相同值，例如，在能够选择两个槽位值的情况下，各槽位值的权重值(概率)的初始值也可以分别设定为50 %。
[0096]另外，在通过权重值更新部122对权重值重新进行计算的情况下，权重值更新部122在用户的人数η上加上I，并且在所选择的槽位值的人数Nx上加上I，对能够选择的所有的槽位值的权重值重新进行计算。例如，在选择了槽位值V2的情况下，各槽位值Vl、V2、…、Vx的权重值(概率)成为Ni/(η+1)、(Ν2+Ι)/(η+1)、…、Nx/(n+1)。
[0097]接着，在步骤S16中，权重值更新部122将重新计算出的权重值存储于权重值管理表存储部112，更新权重值管理表的权重值。
[0098]图6是用于说明本实施方式中的声音对话系统的声音对话处理与以往的声音对话系统的声音对话处理的差异的图。图6示出在汉堡店、用户点汉堡套餐时的声音对话处理的一例。
[0099]首先，用户对声音对话系统，说出为“请给我汉堡套餐。”。
[0100]在以往的声音对话系统中，从用户的言语提取“汉堡套餐”这一词汇，确定与所提取的词汇对应的任务框架。该情况下，确定出提供汉堡套餐的任务框架。接着，以往的声音对话系统确定执行所确定的任务框架所需的槽位，向用户询问选择与所确定的槽位对应的多个槽位值中的哪个槽位值。在图6所示的例子中，槽位为饮料，槽位值为可乐、茶、橙汁等。以往的声音对话系统生成“饮料要什么?”这一应答文405而进行声音输出。对此，用户回答为“要可乐。”。进而，以往的声音对话系统为了确认由用户说出的内容，生成“饮料要可乐就行吗?”这一应答文而进行声音输出。然后，用户回答为“是。”。当从用户取得肯定的回答时，以往的声音对话系统设定任务框架的槽位值，执行任务框架。此时，在向任务框架内的所有必须槽位输入了值的情况下，执行与任务框架对应的任务。在未向所有必须槽位输入值的情况下，对用户进行敦促值的输入之类的询问等。
[0101]另一方面，在本实施方式中的声音对话系统中，从用户的言语提取“汉堡套餐”这一词汇，从含义网络提取与由提取的词汇确定的任务相关的节点(域、槽位以及槽位值)。在图6所示的例子中，域400为“汉堡套餐”，槽位401为“饮料”，槽位值402、403、404为“可乐”、“茶”以及“橙汁”等。
[0102]接着，本实施方式的声音对话系统中，决定为了执行任务而需要输入值的槽位。在此，所决定的槽位为饮料。接着，本实施方式中的声音对话系统从权重值管理表取得与所决定的槽位相对应的多个槽位值的权重值。在图6所示的例子中，作为槽位值的可乐的权重值为60%，作为槽位值的茶的权重值为20%，作为槽位值的橙汁的权重值为5%。
[0103]接着，本实施方式中的声音对话系统判断是否存在满足判断条件的权重值。该情况下，由于可乐的权重值为60%，因此，本实施方式中的声音对话系统判断为存在满足判断条件的权重值。接着，本实施方式中的声音对话系统将槽位值决定为“可乐”。然后，本实施方式中的声音对话系统生成“要可乐吗?”这一应答文406而输出声音。对此，用户回答为“是。”。当从用户取得肯定的回答时，本实施方式中的声音对话系统执行在提供汉堡套餐时针对用户的言语生成应答文的任务。
[0104]如上所述，在以往的系统中，系统向用户询问选择哪种饮料，通过声音识别判断用户的回答。在用户选择了可乐的情况下，以往的系统再次询问可乐可以吗，通过声音识别判断用户的回答，决定饮料。
[0105]与此相对，在本公开的系统中，系统不向用户询问选择哪种饮料，而是根据过去用户选择了哪种饮料而对各个饮料赋予权重值，根据权重值，询问是否选择可乐。例如，在过去可乐以60%的概率被选择的情况下，本公开的系统向用户确认饮料可以为可乐吗。然后，本公开的系统通过声音识别判断用户的回答，如果从用户得到肯定的回答，则将饮料决定为可乐。
[0106]该情况下，本公开的系统与以往的系统相比，无需再次确认饮料，能够缩短系统与用户的对话时间，并且能够缩短系统的处理时间。
[0107]接下来，对本实施方式中的声音对话系统的变形例进行说明。
[0108]图7是表示本实施方式的变形例中的声音对话系统的含义网络的一例的图。图7所示的含义网络示出在检索餐厅时使用的含义网络的一例。
[0109]在图7中，表示“餐厅”的节点21与表示“地域(area)”的节点22和表示“种类(type)”的节点23相链接。表示“地域”的节点22以及表示“种类(type)”的节点23是必须的槽位。表示“地域”的节点22与表示“北”的节点24和表示“南”的节点25相链接。表示“北”的节点24以及表示“南”的节点25是表示“地域”的节点(槽位)22的槽位值。另外，表示“种类”的节点23与表示“印度餐”的节点26、表示“中餐”的节点27、表示“美餐”的节点28相链接。表示“印度餐”的节点26、表示“中餐”的节点27以及表示“美餐”的节点28是表示“种类”的节点(槽位)23的槽位值。
[0110]进一步，在图7所示的变形例中，不同的槽位的槽位值相链接，表示“北”的节点(槽位值)24与表示“印度餐”的节点(槽位值)26、表示“中餐”的节点(槽位值)27、表示“美餐”的节点(槽位值)28链接。对于表示“北”的节点24与表示“印度餐”的节点26的连接，赋予例如30%的权重值。另外，对于表示“北”的节点24与表示“中餐”的节点27的连接，赋予例如60%的权重值。进一步，对于表示“北”的节点24与表示“美餐”的节点(槽位值)28的连接，赋予例如10%的权重值。也即是，在过去，选择了北的地域后，选择了印度餐的概率为30%，选择了北的地域后，选择了中餐的概率为60%，选择了北的地域后选择了美餐的概率为10%。
[0111]在本公开的系统中，在用户说出“搜索位于城镇的北部的餐厅。(I’mlooking fora restaurant at the north part of town.)”的情况下，向用户确认是否选择中餐店，通过声音识别判断用户的回答，决定餐厅。
[0112]权重值管理表存储部112使权重值与如下组合相对应地进行存储，该组合为与多个第I节点中的一个第I节点相关联的多个第2节点中的一个第2节点和与所述多个第I节点中的其他的第I节点相关联的多个第2节点各自的组合。在此，第I节点为槽位，第2节点为槽位值。
[0113]自然语言处理器102判断是否确定了一个第2节点。会话生成部121在确定了一个第2节点的情况下，基于同一个第2节点和与其他的第I节点相关联的多个第2节点各自的组合相对应的权重值，从与其他的第I节点相关联的多个第2节点中选择一个第2节点。
[0114]接下来，对本实施方式的变形例中的声音对话系统的声音对话处理进行说明。
[0115]图8是用于说明本实施方式的变形例中的声音对话系统的声音对话处理的流程图。
[0116]步骤S21以及步骤S22的处理与图4所示的步骤SI以及步骤S2的处理相同，因此省略说明。
[0117]接着，在步骤S23中，自然语言处理器102判断含义网络内的任意的槽位是否被确定。例如，在图7所示的例子中，从用户的言语内容确定了表示“地域”的槽位。在此，在判断为任意的槽位被确定的情况下(在步骤S23中:是)，在步骤S24中，自然语言处理器102选择所确定的槽位。
[0118]接着，在步骤S25中，自然语言处理器102选择与所确定的槽位链接的下一槽位。例如，在图7所示的例子中，与表示“地域”的槽位链接的表示“种类”的槽位会被选择。
[0119]接着，在步骤S26中，会话生成部121从权重值管理表取得与所确定的槽位的槽位值和所选择的下一槽位的多个槽位值相对应的权重值。此外，权重值管理表使权重值与如下组合相对应地进行存储，该组合为与多个槽位中的一个槽位相关联的多个槽位值中的一个槽位值和与多个槽位中的其他的槽位相关联的多个槽位值各自的组合。
[0120]接着，在步骤S27中，会话生成部121参照判断条件表存储部113所存储的判断条件表，判断是否存在满足判断条件的权重值。在此，在判断为存在满足判断条件的权重值的情况下(在步骤S27中:是)，在步骤S28中，会话生成部121将槽位值决定为与满足判断条件的权重值对应的槽位值。例如，在图7所示的例子中，会决定表示“中餐”的槽位值。
[0121]接着，在步骤S29中，会话生成部121使用所决定的槽位值来生成确认应答文。确认应答文是向用户确认所决定的槽位值可以吗的应答文。例如，在图7所示的例子中，会生成“中餐店如何？(How about a Chinese restaurant?)”这一确认应答文。
[0122]另一方面，在判断为未确定任意的槽位的情况下(在步骤S23中:否)，或者，在判断为不存在满足判断条件的权重值的情况下(在步骤S270中:否)，在步骤S30中，会话生成部121生成请求应答文。请求应答文是向用户请求从多个能够选择的槽位值中选择所期望的槽位值的应答文。例如，在图7所示的例子中，在用户说出“搜索餐厅。”的情况下，声音对话系统需要决定表示“地域”以及“种类”的槽位。因此，会话生成部121生成用于选择“地域”以及“种类”中的哪一个的槽位的槽位值的请求应答文。例如，会话生成部121生成“北部和南部中的哪一个? ”这一请求应答文、或“选择印度餐、中餐以及美餐中的哪个?”这一请求应答文。
[0123]此外，在步骤23中，在判断为未确定任意的槽位的情况下，也可以结束声音对话处理。
[0124]另外，本实施方式中的权重值表示能够选择的槽位值各自在过去被用户选择的概率，但本公开并不特别限定于此，也可以对能够选择的槽位值分别赋予值。例如，权重值更新部122也可以在由用户选择了槽位值的情况下，对所选择的槽位值的权重值加I。
[0125]另外，声音对话系统也可以对槽位值设定任意的权重值。例如，通过使销售店特别想销售的商品的槽位值的权重值比其他的商品的槽位值的权重值高，能够向用户推荐特别想销售的商品。
[0126]另外，声音对话系统也可以根据时期(季节)设定任意的权重值。对于所参照的频度根据时期不同而较大地变化的槽位，也可以在该时期到来时，考虑时期的影响而将到当前为止由更新处理更新着的权重值设定为任意的值。另外，也可以预先准备与各个时期对应的权重值的信息，在该时期到来时，将所有的槽位的权重值变更为任意的值。此时，变更后的值也可以在该时期经过之前不是固定的，也可以在进行了设定之后应用权重值的更新处理。
[0127]另外，在本实施方式中，使用从用户的声音转换得到的文本信息，但本公开不特别限定于此，也可以使用通过键盘或触摸面板等输入设备直接输入的文本信息。
[0128]另外，本实施方式的声音对话系统也可以具备确定说话的用户的讲话者确定部。在该情况下，权重值管理表按各个所确定的用户而将槽位值与权重值相对应地存储。由此，能够生成与各个用户对应的应答文，能够进一步缩短系统与用户的对话时间。
[0129]另外，在本实施方式的声音对话系统中，也可以设定更新权重值的期间或次数。该情况下，声音对话系统也可以在从开始权重值的更新经过了预定的期间的情况下，停止权重值的更新。另外，声音对话系统也可以在权重值的更新次数达到了预定的次数的情况下，停止权重值的更新。随着权重值的更新次数的增加，权重值有可能收敛于(趋近于)某一定的值。于是，通过设定更新权重值的期间或次数，能够减轻声音对话系统的处理负担。
[0130]另外，由于还存在仅在预定的季节或预定的期间销售的商品等，因此本实施方式的声音对话系统也可以设定仅在预定的季节或预定的期间能够选择的槽位值，仅在预定的季节或预定的期间更新权重值。
[0131]为了定量地确认本发明的效果，进行了模拟实验。图9A和图9B是示出在两个分别不同的条件下执行的对话例的图。图9A和图9B—起示出在汉堡店的同一状况下，店员与顾客之间所进行的对话的一例。
[0132]在图9A所示的对话例中，通过以往的声音对话系统使用的询问方法(条件)生成店员侧的询问文，对此进行顾客侧的应答。在图9B所示的对话例中，通过本公开中的声音对话系统使用的询问方法(条件)生成店员侧的询问文，对此进行顾客侧的应答。以下，一边比较这两个询问方法(条件)一边进行说明。
[0133]在图9A和图9B中，“要配菜沙拉或炸薯条吗？(Would you like side salad orFrench fries?)”(会话文 1001)和“要炸薯条？(Would you like French fries?)”(会话文2001)相对应。此时，当会话文2001所示的内容作为询问从声音对话系统输出时，存在作为“副餐(meal side)”点“炸薯条(french fries)”的概率为阈值以上这一判断。顾客对此的言语，分别为会话文1002的“炸薯条(french fries)"和会话文2002的“是(Yes)”，询问与回答都是图9B所示的例子短，效率高。另外，同样地，在与会话文1005“想要大、小还是中？(Would you like large, small or medium?)”对应的会话文2005中，基于点“中(medium)”的概率高这一统计，从会话文1005向“要中号的吗？(Would you like medium?)”这一效率高的问法变更，顾客对此的回答，相对于在以往例中会话文1006的“中(medium)”，在本公开中的声音对话系统的例子中，成为会话文2006的“是(Yes)”，应答内容变短。
[0134]另一方面，相对于以往例子的会话文1007的“要哪种餐饮？(What kind of mealdrink would you like?)”，在本公开的声音对话系统的例子中，会话文2007的“要可乐吗？(Would you like coke?)”作为建议型的询问被输出，相对于以往例为短的询问。但是，顾客对此的应答，相对于在以往例中会话文1008的“高维C橙汁(H1-orange lavaburst)”，在本公开的声音对话系统的例子中，成为会话文2008的“不，要高维C橙汁(N0.H1-orangelavaburst)”这一回答，本公开的声音对话系统的例子，会话文会部分地变长。在不存在多个期待的概率特别高的选项的情况下，如会话文1003和会话文2003、会话文1004和会话文2004那样，询问与回答不存在太大的差异。由图9A和图9B中所示的会话例受理的点餐的内容分别为点餐受理内容1010和点餐内容2010，为完全相同的结果。
[0135]当计数如此进行的两个对话的总文字数时，分别成为91字(英文330字)(1009)和73字(英文273字)(2009)，可知:通过本公开的声音对话系统使用的询问方法(条件)生成店员侧的询问文时，会话的文字数少，即会话短。在此，使用文字数对两者进行了比较，但通过对文字数乘以预定的系数，能够推定会话所需的时间。如上所述，在顾客针对店铺侧的建议型的询问的回答为否定的情况下，会话所需的时间会部分地变长，但仅在能够期待顾客针对店铺侧的建议型的询问的回答为肯定的概率高的情况下，进行是/否类型的询问，这样可以说:与以往例的询问相比，输出建议型的询问的情况下会话所需的时间变长的情况很少发生(低概率)。
[0136]与该一例同样地，对100例的下单进行模拟后，对于总文字数，利用以往的方法为28746文字，利用本公开的方法为26168文字。在本公开的方法中，总计的对话的长度与以往例相比削减了 11.4%，确认了本公开的声音对话系统中的对话方法的效果显著。
[0137]产业上的可利用性
[0138]本公开的对话方法、对话程序以及对话系统能够缩短对话系统与用户的对话时间，并且能够缩短对话系统的处理时间，作为对用户的言语进行应答的对话系统中的对话方法、对用户的言语进行应答的对话程序以及针对用户的言语进行应答的对话系统是有用的。
【主权项】
1.一种对话方法，是对用户的言语进行应答的对话系统中使用的对话方法，将为了执行针对所述用户的言语生成应答文的任务所需要的多个节点分别关联地进行存储，取得表示所述用户的言语内容的言语信息，从所述多个节点中确定与所述言语信息对应的第I节点，从与所确定的所述第I节点相关联的多个第2节点中，基于与所述多个第2节点分别相对应的权重值，选择一个第2节点，生成与所选择的所述一个第2节点对应的应答文。2.根据权利要求1所述的对话方法，所述权重值表示所述多个第2节点过去被所述用户选择的概率。3.根据权利要求2所述的对话方法，选择所述多个第2节点中的所述概率比预定值大的第2节点。4.根据权利要求2或3所述的对话方法，在所述多个第2节点中不存在所述概率比预定值大的第2节点的情况下，生成用于使所述用户选择所述多个第2节点中的任意一个的应答文。5.根据权利要求1至4中任意一项所述的声音对话方法，取得表示所述用户对所述应答文的回答的信息，根据所述用户的回答是否是选择所述多个第2节点中的一个第2节点的回答，更新所述权重值。6.根据权利要求1至5中任意一项所述的对话方法，所述权重值同如下组合相对应，该组合为:与多个第I节点中的一个第I节点相关联的多个第2节点中的一个第2节点和与所述多个第I节点中的其他第I节点相关联的多个第2节点的各个的组合，判断是否确定了所述一个第2节点，在确定了所述一个第2节点的情况下，基于同所述一个第2节点和与所述其他第I节点相关联的多个第2节点的各个的组合相对应的权重值，从与所述其他第I节点相关联的所述多个第2节点中选择一个第2节点。7.—种记录介质，是记录了对用户的言语进行应答的对话程序的记录介质，使计算机作为下述各部发挥功能: 存储部，将为了执行针对所述用户的言语生成应答文的任务所需要的多个节点分别关联地进彳丁存储；取得部，取得表示所述用户的言语内容的言语信息；确定部，从所述多个节点中确定与所述言语信息对应的第I节点；选择部，从与所述确定部所确定的所述第I节点相关联的多个第2节点中，基于与所述多个第2节点分别相对应的权重值，选择一个第2节点；以及生成部，生成与所述选择部所选择的所述一个第2节点对应的应答文。8.一种对话系统，对用户的言语进行应答，具备: 存储部，将为了执行针对所述用户的言语生成应答文的任务所需要的多个节点分别关联地进彳丁存储；取得部，取得表示所述用户的言语内容的言语信息；确定部，从所述多个节点中确定与所述言语信息对应的第I节点；选择部，从与所述确定部所确定的所述第I节点相关联的多个第2节点中，基于与所述多个第2节点分别相对应的权重值，选择一个第2节点；以及生成部，生成与所述选择部所选择的所述一个第2节点对应的应答文。
【文档编号】G06F17/27GK106055547SQ201610172808
【公开日】2016年10月26日
【申请日】2016年3月24日公开号201610172808.7, CN 106055547 A, CN 106055547A, CN 201610172808, CN-A-106055547, CN106055547 A, CN106055547A, CN201610172808, CN201610172808.7
【发明人】V·高桥, 远藤充
【申请人】松下知识产权经营株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：V·高桥;远藤充;
技术所有人：松下知识产权经营株式会社;
我是此专利的发明人

上一篇：一种电力输变电设备故障数据的可视化分析方法
上一篇：基于Lucene的光盘库全文检索系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。