对话交互方法、装置、存储介质及电子设备与流程

文档序号：23396423发布日期：2020-12-22 14:04阅读：177来源：国知局

本申请涉及计算机技术领域，尤其涉及一种对话交互方法、装置、存储介质及电子设备。

背景技术：

随着人工智能技术的发展，人机对话也随之在智能家居、智能导航、智能助理等领域得到了发展。人机对话过程主要包括：用户利用自然语言与对话模型进行交互，对话模型解析来自用户的自然语言输入后提供相应输出。在相关技术中，首先可通过大量的样本数据训练得到人机对话的对话模型，但在后续使用该对话模型的过程中，可能会存在不能识别用户输入的语音数据的情况，通常可通过人工标记的方式对用户与对话模型对话交互的内容进行处理后得到新的样本数据，再利用新的样本数据对该对话模型进行优化训练，而由人工标记的方式得到新的样本数据会造成较高的人工成本。

技术实现要素：

本申请实施例提供了一种对话交互方法、装置、存储介质及电子设备，可以解决相关技术中获取用于对人机对话中对话模型进行优化训练的样本数据的人工成本较高的问题。所述技术方案如下：

第一方面，本申请实施例提供了一种对话交互方法，所述方法包括：

根据第一交互结果分析第一用户的交互满意度；其中，所述第一交互结果为预设对话模型对所述第一用户输入的语音数据输出的交互结果；

在所述交互满意度小于或等于预设阈值时，向服务器发送所述语音数据，并接收由所述服务器发送的与所述语音数据对应的交互指令；

将所述交互指令与所述语音数据作为样本数据对所述预设对话模型进行优化训练。

第二方面，本申请实施例提供了一种对话交互装置，所述装置包括：

分析模块，用于根据第一交互结果分析第一用户的交互满意度；其中，所述第一交互结果为预设对话模型对所述第一用户输入的语音数据输出的交互结果；

处理模块，用于在所述交互满意度小于或等于预设阈值时，向服务器发送所述语音数据，并接收由所述服务器发送的与所述语音数据对应的交互指令；

训练模块，用于将所述交互指令与所述语音数据作为样本数据对所述预设对话模型进行优化训练。

第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。

第四方面，本申请实施例提供一种电子设备，包括：处理器、存储器、显示屏；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

本申请一些实施例提供的技术方案带来的有益效果至少包括：

本申请实施例的方案在执行时，电子设备根据第一交互结果分析第一用户的交互满意度，第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果，在交互满意度小于或等于预设阈值时，向服务器发送语音数据，并接收由服务器发送的与语音数据对应的交互指令，将交互指令与语音数据作为样本数据对预设对话模型进行优化训练，通过服务器搜索语音数据对应的答案数据的方式，获取用于优化训练预设对话模型的新样本数据，从而减少人工参与的工作量，并使得对预设对话模型进行优化训练的过程更加智能化。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种对话交互的系统架构示意图；

图2是本申请实施例提供的一种对话交互方法的流程示意图；

图3是本申请实施例提供的一种对话交互方法的另一流程示意图；

图4是本申请实施例提供的一种对话交互装置的结构示意图；

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施例方式作进一步地详细描述。

下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施例方式作进一步地详细描述。

请参见图1，其示出了本申请实施例提供的一种对话交互的系统架构示意图，包括用户101、终端设备102和服务器103。终端设备102内置有可用于人机对话的预设对话模型，终端设备102可基于预设对话模型与用户101进行对话交互，终端设备102也可向服务器103发送与用户对话交互相关的查询数据，对应地，服务器103可在对终端设备102发送的查询数据进行查询/搜索后，将查询结果发送给终端设备102。

终端设备102可以是具有扬声器的各种电子设备，终端设备102内置有原始训练好的预设对话模型，使得用户102可与终端设备102进行对话交互；终端设备102包括但不限于智能音箱、智能手机、平板电脑、便携式计算机和台式计算机等具备智能语音功能的电子设备。终端设备102可以是硬件，也可以是软件。当终端设备102为软件时，可以是安装于上述所列举的电子设备中，其可以实现呈多个软件或软件模块，也可以实现成单个软件或软件模块，在此不作具体限定。当终端设备102为硬件时，其上还可以安装有显示设备，显示设备显示可以是各种能实现显示功能的设备，如：显示设备可以是阴极射线管显示器(cathoderaytubedisplay，简称cr)、发光二极管显示器(light-emittingdiodedisplay，简称led)、电子墨水屏、液晶显示屏(liquidcrystaldisplay，简称lcd)、等离子显示面板(plasmadisplaypanel，简称pdp)等。终端设备102还可与服务器103进行数据通信交互，终端设备102可向服务器103查询数据，并接收服务器103发送的查询结果数据，服务器103也可向终端设备102发送查询结果数据，并接收终端设备102发送的查询数据。

服务器103可以是硬件，也可以是软件。当服务器103为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器103为软件时，可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块，在此不做具体限定。

应理解，图1中的用户、终端设备和服务器的数目仅是示意性的。根据现实需要，可以是任意数量的用户、终端设备和服务器。

下面将结合附图2至图3，对本申请实施例提供的对话交互方法进行详细介绍。

请参见图2，为本申请实施例提供了一种对话交互方法的流程示意图。本实施例以一种对话交互方法应用于电子设备(终端)来举例说明，该对话交互方法可以包括以下步骤：

s201，根据第一交互结果分析第一用户的交互满意度。

其中，第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果，也即预设对话模型生成的对话内容数据。第一用户是指首次向预设对话模型输入该语音数据的用户。“第一”是对后续向预设对话模型输入相同的语音数据的用户做出区分。相应地，第二用户是指再次向预设对话模型输入与该语音数据相似或相同的语音数据的用户。交互满意度是指用户对预设对话模型针对用户的语音数据的回答内容的满意程度，交互满意度是终端对预设对话模型的回答内容作出的预测估计，不是用户实际的满意度。

一般的，终端可利用预设的样本数据训练得到预设对话模型，并基于训练好的预设对话模型可与第一用户进行实时对话交互，预设的样本数据是可训练得到现有的预设对话模型的样本数据，样本数据是已知对话输入和输出的文本数据，且样本数据的数据量越大，可训练得到的预设对话模型进行人机对话交互的准确度越高。在第一用户向终端输入语音数据后，终端可利用现有的预设对话模型可对第一用户输入的语音数据做出相应的回答。也即得到与第一用户输入的语音数据对应的第一交互结果。同时，终端会获取预设对话模型针对第一用户输入的语音数据输出的第一交互结果，并对该第一交互结果进行语义分析得到第一交互结果对应的语义信息，确定该语义信息与预设语义的相似度，基于该相似度可进一步确定第一用户的交互满意度，也即预测用户对此次对话交互过程是否满意。

s202，在交互满意度小于或等于预设阈值时，向服务器发送语音数据，并接收由服务器发送的与语音数据对应的交互指令。

其中，预设阈值是用于判定用户对交互结果是否满意的标准，也即在确定用户对交互结果满意的情况下，用户的交互满意度需要满足的交互满意度的最低下限值。语音数据是指第一用户输入终端的对话语音数据。交互指令是指用于分析和/或解答该语音数据的交互数据。

一般的，终端在确定第一用户的交互满意度小于或等于预设阈值时，表明第一用户对当前的交互结果不满意，则终端会对第一用户输入的语音数据进行分析得到与该语音数据对应的关键词和/或关键字，基于该关键词和/或关键字可生成与该语音数据对应的第一查询数据，并将该第一查询数据发送给服务器。该第一查询数据是基于第一用户输入的语音数据生成的包含该语音数据关键信息的文本数据。该第一查询数据可指示服务器通过互联网在预设网站上搜索与第一查询数据相关的答案数据。预设网站是指可以提供搜索服务或社区服务的网站。预设网站可以由用户任意设置，也可以是服务器默认的网站。服务器在接收到终端发送的第一查询数据后，可通过互联网在预设网站上搜索与该第一查询数据对应的答案数据，并从搜索到的多个答案数据中选取与第一查询数据匹配度最高或置信度最高的答案数据作为与第一用户输入的语音数据对应的交互指令，以及将该交互指令发送给终端以使终端能获取该交互指令。

举例说明：第一用户与内置有预设对话模型的终端进行对话交互，第一用户向终端输入语音数据“帮我打开‘小度’”(第一用户输入的语音数据)。终端基于现有的预设对话模型对该语音数据进行分析后，不能识别到第一用户输入的语音数据对应的指令，则对应返回给第一用户包含有“对不起，没懂主人的意思”的语音数据(也即第一交互结果)。同时，终端将对返回给第一用户的语音数据进行语义分析，得到第一交互结果对应的语义信息为包含“对不起、没”等关键字和/或关键词的否定语义，而预设语义为包含“不、不能、没、没找到”等关键词和/或关键字的否定语义。基于分析第一交互结果对应的语义信息与预设语义的相似度为80％，进而基于该相似度确定第一用户的交互满意度也对应为20％，而交互满意度的预设阈值为60％，则可确定第一用户对第一交互结果不满意。进一步的，终端在确定第一用户对第一交互结果不满意时，可分析第一用户输入的语音数据“帮我打开‘小度’”得到“打开、小度”等关键词，基于该关键词可对应生成用于查询第一用户输入的语音数据的文本数据“‘打开小度’是什么意思”(第一查询数据)。并将该第一查询数据发送给服务器，服务器则可基于该第一查询数据在预设的网站上搜索与第一查询数据对应的答案数据，基于所搜索到的各个答案数据对应的置信度选取置信度最高的答案数据“打开百度应用程序”，并将该答案数据作为针对第一用户输入的语音数据“帮我打开‘小度’”的交互指令。

s203，将交互指令与语音数据作为样本数据对预设对话模型进行优化训练。

其中，样本数据是用于训练可实现人机对话的对话模型的数据，可以是文本和/或语音形式的样本数据，样本数据中包括用户角度和对话模型角度的对话数据。预设对话模型是指可与用户进行人机对话交互的模型，可基于预设对话算法由大量的样本数据训练得到，用户可与内置有预设对话模型的终端进行实时对话交互。

一般的，服务器在预设网站上搜索到与第一用户输入的语音数据匹配的答案数据后，会将该答案数据作为与该语音数据对应的交互指令，并将该交互指令发送给终端。终端在接收到该交互指令后，会将该交互指令与该语音数据进行关联后作为样本数据存储到数据库中，以实现对用于训练预设对话模型的样本数据进行扩充和更新。后续可基于该样本数据对预设对话模型进行优化训练得到优化后的预设对话模型，优化后的预设对话模型在下一次遇到与第一用户输入的语音数据相似的语音数据时，会基于上一次服务器搜索到的与第一用户输入的语音数据对应的交互指令做出相应的回答和/或执行相应的处理操作。

由上述内容可知，本方案提供的对话交互方法，电子设备根据第一交互结果分析第一用户的交互满意度，第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果，在交互满意度小于或等于预设阈值时，向服务器发送语音数据，并接收由服务器发送的与语音数据对应的交互指令，将交互指令与语音数据作为样本数据对预设对话模型进行优化训练，通过服务器搜索语音数据对应的答案数据的方式，获取用于优化训练预设对话模型的新样本数据，从而减少人工参与的工作量，并使得对预设对话模型进行优化训练的过程更加智能化。

请参见图3，为本申请实施例提供了一种对话交互方法的另一流程示意图。本实施例以一种对话交互方法应用于电子设备(终端)中来举例说明。该对话交互方法可以包括以下步骤：

s301，获取第一交互结果。

其中，第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果，也即预设对话模型生成的对话内容数据。第一交互结果可以是文本数据，也可以是语音数据。

一般的，终端可利用预设的样本数据训练得到预设对话模型，并基于训练好的预设对话模型可与第一用户进行实时对话交互。在第一用户向终端输入语音数据后，终端可利用现有的预设对话模型可对第一用户输入的语音数据做出相应的回答。也即得到与第一用户输入的语音数据对应的第一交互结果。终端可基于到该第一交互结果分析用户对此次对话交互过程是否满意。

s302，对第一交互结果进行语义分析得到与第一交互结果对应的第一语义信息。

其中，第一语义信息是指第一交互结果包含的语义。也即终端基于现有的预设对话模型与第一用户进行对话交互时，针对第一用户输入的语音数据做出相应回答的语义信息。

一般的，语义分析可根据句子的句法结构和句子中每个实词的词义推导出来能够反映这个句子意义的某种形式化表示，将人类能够理解的自然语言转化为计算机能够理解的形式语言。第一交互结果可以是语音数据，也可以是文本数据。若第一交互结果为语音数据，则对该第一交互结果进行文本转化后得到对应的文本数据，并对该文本数据进行语义分析得到与第一交互结果对应的语义信息。

s303，基于第一语义信息确定第一用户的交互满意度。

其中，第一用户是指首次向预设对话模型输入该语音数据的用户。“第一”是对后续向预设对话模型输入相同的语音数据的用户做出区分。相应地，第二用户是指再次向预设对话模型输入与该语音数据相似或相同的语音数据的用户。交互满意度是指用户对预设对话模型针对用户的语音数据的回答内容的满意程度，交互满意度是终端基于预设对话模型的回答内容对用户的满意度作出的预测估计，不是用户实际的满意度。

一般的，终端通过对第一交互结果进行语义分析处理后，可得到与该第一交互结果对应的第一语义信息。对该第一语义信息进一步分析则可确定第一用户的交互满意度。终端内设有预设语义，预设语义通常是包含否定意义的语义，通过分析第一语义信息与预设语义的相似度，可预测得到与该相似度对应的交互满意度，也即第一用户的交互满意度。通常，用户的交互满意度与语义的相似度呈负相关，语义的相似度越高，用户的交互满意度越低。

举例说明：在分析第一语义信息与预设语义的相似度为0％～20％时，对应的交互满意度为80％～100％；在分析第一语义信息与预设语义的相似度为21％～50％时，对应的交互满意度为60％～79％；在分析第一语义信息与预设语义的相似度为51％～80％时，对应的交互满意度为20％～59％；在分析第一语义信息与预设语义的相似度为81％～100％时，对应的交互满意度为0％～19％。

s304，在交互满意度小于或等于预设阈值时，分析语音数据得到与语音数据对应的关键词和/或关键字。

其中，预设阈值是用于判定用户对交互结果是否满意的标准。也即在确定用户对交互结果满意的情况下，用户的交互满意度需要满足的交互满意度的最低下限值。此处的语音数据是指第一用户输入终端的对话语音数据，也即在第一用户的交互满意度小于或等于预设阈值时第一用户输入的语音数据。

一般的，在第一用户的交互满意度小于或等于预设阈值时，则可确定第一用户对此次对话交互过程不满意，终端可分析第一用户输入的语音数据得到对应的关键词和/或关键字，该关键词和/或关键字能提炼并反映第一用户输入的语音数据的重点内容，基于该关键词和/或关键字可生成与第一用户输入的语音数据对应的查询数据。

s305，基于关键词和/或关键字生成与语音数据对应的第一查询数据，并将第一查询数据发送给服务器，及接收由服务器发送的与语音数据对应的交互指令。

其中，语音数据是指第一用户输入终端的对话语音数据，也即在第一用户的交互满意度小于或等于预设阈值时第一用户输入的语音数据；第一查询数据是指终端基于第一用户输入的语音数据生成的查询数据，该第一查询数据可指示服务器通过互联网在预设网站上搜索与第一查询数据相关的答案数据；交互指令是指用于分析和/或解答该语音数据的交互数据。

一般的，终端在确定第一用户的交互满意度小于或等于预设阈值时，表明第一用户对当前的交互结果不满意，则终端会对第一用户输入的语音数据进行分析得到与该语音数据对应的关键词和/或关键字。基于该关键词和/或关键字可生成与该语音数据对应的第一查询数据，并将该第一查询数据发送给服务器。该第一查询数据是基于第一用户输入的语音数据生成的包含该语音数据关键信息的文本数据。该第一查询数据可指示服务器通过互联网在预设网站上搜索与第一查询数据相关的答案数据。预设网站是指可以提供搜索服务或社区服务的网站。预设网站可以由用户任意设置，也可以是服务器默认的网站。服务器在接收到终端发送的第一查询数据后，可通过互联网在预设网站上搜索与该第一查询数据对应的答案数据，并从搜索到的多个答案数据中选取与第一查询数据匹配度最高或置信度最高的答案数据作为与第一用户输入的语音数据对应的交互指令，以及将该交互指令发送给终端以使终端能获取该交互指令。

s306，将交互指令与语音数据作为样本数据对预设对话模型进行优化训练。

具体地，可参见上述s203步骤，此处不再赘述。

s307，采用优化后的预设对话模型对第二用户输入的语音数据进行分析，输出第二交互结果。

其中，第二用户是指再次向优化后的预设对话模型输入与第一用户输入的语音数据相同或相似的语音数据的用户。第二用户可以是第二次向优化后的预设对话模型输入与第一次相同或相似的语音数据的第一用户，也可以是向优化后的预设对话模型输入的与第一用户输入的语音数据相似或相同的语音数据，且与第一用户不同的用户。第二用户输入的语音数据是指与第一用户向优化后的预设对话模型输入的语音数据相同或相似的语音数据。第二交互结果是指优化后的预设对话模型对第二用户输入的语音数据输出的交互结果。也即优化后的预设对话模型针对第二用户输入的语音数据对应生成的对话内容数据。第二交互结果可以是文本数据，也可以是语音数据。

一般的，终端在基于上述s301～s306步骤对预设对话模型进行优化训练后，可基于优化后的预设对话模型与新的用户进行对话交互，或与第一用户进行新的对话交互，将与优化后的预设对话模型进行交互的用户称为第二用户，在基于优化后的预设对话模型进行对话交互时，可能会遇到与第一用户输入的语音数据相同或相似的语音数据，优化后的预设对话模型会对第二用户输入的语音数据进行分析并输出与该语音数据对应的第二交互结果，第二交互结果是基于服务器通过互联网在预设网站上搜索到的与第一用户输入的语音数据对应的交互指令，对应生成的用于回应第二用户输入的语音数据的对话内容数据，可更加智能化地优化预设对话模型，无需认为参与即可提升预设模型识别用户指令的准确度。若在预测到用户对该对话内容数据仍是不满意，则终端可向服务器发送第二用户当前输入的语音数据，使服务器能在预设网站上发布该语音数据对应的提问数据，通过类似众筹答案的方式以征集其他网友针对该提问数据的答案数据。

s308，对第二交互结果进行语义分析得到与第二交互结果对应的第二语义信息。

其中，第二语义信息是指第二交互结果包含的语义。也即终端基于优化后的预设对话模型与第二用户进行对话交互时，针对第二用户输入的语音数据做出相应回答的语义信息。

一般的，语义分析可根据句子的句法结构和句子中每个实词的词义推导出来能够反映这个句子意义的某种形式化表示，将人类能够理解的自然语言转化为计算机能够理解的形式语言。第二交互结果可以是语音数据，也可以是文本数据。若第二交互结果为语音数据，则对该第二交互结果进行文本转化后得到对应的文本数据，并对该文本数据进行语义分析得到与第二交互结果对应的语义信息。

s309，基于第二语义信息确定第二用户的交互满意度。

其中，第二用户的交互满意度是指第二用户对优化后的对话模型此次对话交互的满意程度，交互满意度是终端基于预设对话模型的回答内容对用户的满意度作出的预测估计，不是用户实际的满意度。

一般的，终端通过对第二交互结果进行语义分析处理后，可得到与该第二交互结果对应的第二语义信息，对该第二语义信息进一步分析则可预测得到第二用户的交互满意度。终端内设有预设语义，预设语义通常是包含否定意义的语义，通过分析第二语义信息与预设语义的相似度，可预测与该相似度对应的交互满意度，也即第二用户的交互满意度。通常，用户的交互满意度与语义的相似度呈负相关，语义的相似度越高，用户的交互满意度越低。

s310，在第二用户的交互满意度小于或等于预设阈值时，向服务器发送第二查询数据，并接收由服务器发送的目标查询结果。

其中，第二查询数据是指基于第二用户输入的语音数据对应的关键词和/或关键字生成的查询数据，第二查询数据也即用于指示服务器在预设网站上发布的提问数据，以使服务器能在预设网站上征集其他网友针对该提问数据的答案数据。目标查询结果为服务器在预设网站上查询的与第二查询数据对应的查询结果，也即服务器从发布的提问数据中选取/查询的与第二查询数据最匹配的答案数据作为的查询结果。第二查询数据对应多个查询结果，不同的查询结果对应的置信度不同，目标查询结果为所述多个查询结果中置信度最高的查询结果，置信度由多个用户基于预设网站输入，置信度也即其他的网站用户对该提问数据的支持率/点赞率等，预设网站是指可以提供搜索服务或社区服务的网站，可以由用户任意设置，也可以是服务器默认的网站。

一般的，终端在确定第二用户的交互满意度小于或等于预设阈值时，表明第二用户对当前的交互结果不满意，则终端会对第二用户输入的语音数据进行分析得到与该语音数据对应的关键词和/或关键字，基于该关键词和/或关键字可生成与该语音数据对应的第二查询数据，也即用于指示服务器在预设网站上发布的提问数据，终端会将该第二查询数据发送给服务器，以使服务器能在预设网站上征集其他网友针对该提问数据的答案数据，预设网站可以由用户任意设置，也可以是服务器默认的网站；由于，服务器在预设网站上以主动发布提问数据的方式寻求对应的答案数据，故服务器需要一定的等待时间等待其他的网站用户对该提问数据进行回答，服务器可基于预设时间间隔查询所发布的提问数据对应的答案数据，且该提问数据可能会对应有多个答案数据，也即服务器会查询到多个查询结果，不同的查询结果对应的置信度不同，故服务器每次都会从能查询到的查询结果中选取置信度最高的查询结果作为目标查询结果，并将查询得到的目标查询结果发送给终端，终端在接收到服务器发送的目标查询结果后，会将该目标查询结果及第二用户输入的语音数据作为新的样本数据对优化后的预设对话模型进行再次优化训练处理。

举例说明：第一用户与内置有预设对话模型的终端进行对话交互，第一用户向终端输入语音数据“帮我打开‘小度’”(第一用户输入的语音数据)。终端基于现有的预设对话模型对该语音数据进行分析后，不能识别到第一用户输入的语音数据对应的指令，则对应返回给第一用户包含有“对不起，没懂主人的意思”的语音数据(也即第一交互结果)。同时，终端将对返回给第一用户的语音数据进行语义分析，得到第一交互结果对应的语义信息为包含“对不起、没”等关键字和/或关键词的否定语义，而预设语义为包含“不、不能、没、没找到”等关键词和/或关键字的否定语义。基于分析第一交互结果对应的语义信息与预设语义的相似度为80％，进而基于该相似度确定第一用户的交互满意度对应为20％，而交互满意度的预设阈值为60％，则可确定第一用户对第一交互结果不满意。进一步的，终端在确定第一用户对第一交互结果不满意时，可分析第一用户输入的语音数据“帮我打开‘小度’”得到“打开、小度”等关键词，基于该关键词可对应生成用于查询第一用户输入的语音数据的文本数据“‘打开小度’是什么意思”(第一查询数据)。并将该第一查询数据发送给服务器，服务器则可基于该第一查询数据在预设的网站上搜索与第一查询数据对应的答案数据，基于所搜索到的各个答案数据对应的置信度选取置信度最高的答案数据“打开百度应用程序”，并将该答案数据作为针对第一用户输入的语音数据“帮我打开‘小度’”的交互指令，终端会将该交互指令与第一用户输入的语音数据进行关联后作为样本数据对现有的预设对话模型进行优化训练，得到优先后的预设对话模型。

在第二用户向优化后的预设对话模型输入语音数据“用‘小度’导航”，该语音数据与第一用户输入的语音数据相似，但终端基于优化后的预设对话模型对该语音数据进行分析后，仍然不能识别到第二用户输入的语音数据对应的指令，则对应返回给第二用户包含有“抱歉，没找到可以导航的‘小度’”的语音数据(也即第二交互结果)。同时，终端将对第二交互结果进行语义分析得到与第二交互结果对应的语义信息包含“抱歉、没”等关键字和/或关键词的否定语义，计算该语义与预设语义的相似度为80％，进而基于该相似度确定第二用户的交互满意度对应为20％，而交互满意度的预设阈值为60％，则可确定第二用户对第二交互结果不满意。进一步的，终端在确定第二用户对第二交互结果不满意时，可分析第二用户输入的语音数据“用‘小度’导航”得到“小度、导航”等关键词，基于该关键词可对应生成用于查询第二用户输入的语音数据的文本数据“‘小度导航’是用什么导航？怎么用小度导航？”(第二查询数据)，也即用于指示服务器在预设网站上发布的提问数据。终端会将该第二查询数据发送给服务器，服务器可将提问数据“‘小度导航’是用什么导航？怎么用小度导航？”发布在预设网站上，等待其他的网站用户来回答该问题；服务器会按照每隔三天的时间间隔，在预设网站上查询所发布的提问数据对应的答案数据，服务器查询到有10个对应该提问数据的答案数据(查询结果)。10个查询结果的置信度都不相同，置信度也即其他的网站用户对该提问数据的支持率/点赞率等，服务器会从这10个查询结果中选取置信度最高的的查询结果“‘小度导航’是利用百度地图进行导航，打开百度地图后，可在对应的搜索栏输入目的地，百度地图会根据您当前的位置为您规划到达目的地的导航路线”作为目标查询结果，并将该目标查询结果发送给终端，终端会将该目标查询结果与第二用户输入的语音数据进行关联后作为新的样本数据对优化后的预设对话模型进行再次优化训练。

s311，将目标查询结果与语音数据作为样本数据对优化后的预设对话模型进行优化训练。

一般的，在终端接收到由服务器发送的目标查询结果后，会将该目标查询结果与第二用户输入的语音数据进行关联后作为新的样本数据存储到数据库中，以实现对用于训练预设对话模型的样本数据进行扩充和更新；并可基于该新的样本数据对优化后的预设对话模型进行再次优化处理，使再次优化后的预设对话模型再次识别到与第二用户输入的语音数据相似或相同的语音数据时，能基于目标查询结果做出相应的回答和/或执行相应的处理操作。

由上述内容可知，本方案提供的对话交互方法，电子设备获取第一交互结果，对第一交互结果进行语义分析得到与第一交互结果对应的第一语义信息，基于第一语义信息确定第一用户的交互满意度，在交互满意度小于或等于预设阈值时，分析语音数据得到与语音数据对应的关键词和/或关键字，基于关键词和/或关键字生成与语音数据对应的第一查询数据，并将第一查询数据发送给服务器，及接收由服务器发送的与语音数据对应的交互指令，将交互指令与语音数据作为样本数据对预设对话模型进行优化训练，采用优化后的预设对话模型对第二用户输入的语音数据进行分析，输出第二交互结果，对第二交互结果进行语义分析得到与第二交互结果对应的第二语义信息，基于第二语义信息确定第二用户的交互满意度，在第二用户的交互满意度小于或等于预设阈值时，向服务器发送第二查询数据，并接收由服务器发送的目标查询结果，将目标查询结果与语音数据作为样本数据对优化后的预设对话模型进行优化训练，通过此种方式对用于训练预设对话模型的样本数据进行更新和/或扩充，使预设对话模型能基于与用户的对话交互过程进行不断学习和优化，提高预设对话模型的学习能力和人机对话准确率。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参见图4，其示出了本申请一个示例性实施例提供的对话交互装置的结构示意图，以下简称装置4。装置4可以通过软件、硬件或者两者的结合实现成为电子设备的全部或一部分。装置4包括：

分析模块401，用于根据第一交互结果分析第一用户的交互满意度；其中，所述第一交互结果为预设对话模型对所述第一用户输入的语音数据输出的交互结果；

处理模块402，用于在所述交互满意度小于或等于预设阈值时，向服务器发送所述语音数据，并接收由所述服务器发送的与所述语音数据对应的交互指令；

训练模块403，用于将所述交互指令与所述语音数据作为样本数据对所述预设对话模型进行优化训练。

可选地，所述分析模块401，包括：

获取单元，用于获取所述第一交互结果；

第一分析单元，用于对所述第一交互结果进行语义分析得到与所述第一交互结果对应的第一语义信息；

第一确定单元，用于基于所述第一语义信息确定所述第一用户的交互满意度。

可选地，所述处理模块402，包括：

第二分析单元，用于分析所述语音数据得到与所述语音数据对应的关键词和/或关键字；

第一处理单元，用于基于所述关键词和/或关键字生成与所述语音数据对应的第一查询数据，并将所述第一查询数据发送给所述服务器。

可选地，所述训练模块403，还包括：

第二处理单元，用于采用优化后的预设对话模型对第二用户输入的所述语音数据进行分析，输出第二交互结果；

第三分析单元，用于根据所述第二交互结果分析所述第二用户的交互满意度；

第三处理单元，用于在所述第二用户的交互满意度小于或等于所述预设阈值时，向服务器发送第二查询数据，并接收由所述服务器发送的目标查询结果；其中，所述目标查询结果为所述服务器在预设网站上查询的与所述第二查询数据对应的查询结果；所述第二查询数据根据所述语音数据对应的关键词和/或关键字得到；

训练单元，用于将所述目标查询结果与所述语音数据作为样本数据对所述优化后的预设对话模型进行优化训练。

可选地，所述训练模块403，还包括：

第四分析单元，用于对所述第二交互结果进行语义分析得到与所述第二交互结果对应的第二语义信息；

第二确定单元，用于基于所述第二语义信息确定所述第二用户的所述交互满意度。

需要说明的是，上述实施例提供的对话交互装置在执行对话交互方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的对话交互装置与对话交互方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本申请实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述的方法步骤，具体执行过程可以参见图2～图3所示实施例的具体说明，在此不进行赘述。

本申请还提供了一种电子设备，包括处理器、存储器和显示屏；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

请参见图5，为本申请实施例提供了一种电子设备的结构示意图。如图5所示，所述电子设备500可以包括：至少一个处理器501，至少一个网络接口504，用户接口503，存储器505，至少一个通信总线502。

其中，通信总线502用于实现这些组件之间的连接通信。

其中，用户接口503可以包括显示屏(display)、摄像头(camera)，可选用户接口503还可以包括标准的有线接口、无线接口。

其中，网络接口504可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。

其中，处理器501可以包括一个或者多个处理核心。处理器501利用各种借口和线路连接整个电子设备500内的各个部分，通过运行或执行存储在存储器505内的指令、程序、代码集或指令集，以及调用存储在存储器505内的数据，执行电子设备500的各种功能和处理数据。可选的，处理器501可以采用数字信号处理(digitalsignalprocessing，dsp)、现场可编程门阵列(field-programmablegatearray，fpga)、可编程逻辑阵列(programmablelogicarray，pla)中的至少一种硬件形式来实现。处理器501可集成中央处理器(centralprocessingunit，cpu)、图像处理器(graphicsprocessingunit，gpu)和调制解调器等中的一种或几种的组合。其中，cpu主要处理操作系统、用户界面和应用程序等；gpu用于负责显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器501中，单独通过一块芯片进行实现。

其中，存储器505可以包括随机存储器(randomaccessmemory，ram)，也可以包括只读存储器(read-onlymemory)。可选的，该存储器505包括非瞬时性计算机可读介质(non-transitorycomputer-readablestoragemedium)。存储器505可用于存储指令、程序、代码、代码集或指令集。存储器505可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器505可选的还可以是至少一个位于远离前述处理器501的存储装置。如图5所示，作为一种计算机存储介质的存储器505中可以包括操作系统、网络通信模块、用户接口模块以及对话交互应用程序。

在图5所示的电子设备500中，用户接口503主要用于为用户提供输入的接口，获取用户输入的数据；而处理器501可以用于调用存储器505中存储的对话交互应用程序，并具体执行以下操作：

根据第一交互结果分析第一用户的交互满意度；其中，所述第一交互结果为预设对话模型对所述第一用户输入的语音数据输出的交互结果；

在所述交互满意度小于或等于预设阈值时，向服务器发送所述语音数据，并接收由所述服务器发送的与所述语音数据对应的交互指令；

将所述交互指令与所述语音数据作为样本数据对所述预设对话模型进行优化训练。

在一个实施例中，所述处理器501在执行根据第一交互结果分析第一用户的交互满意度时，具体执行以下操作：

获取所述第一交互结果；

对所述第一交互结果进行语义分析得到与所述第一交互结果对应的第一语义信息；

基于所述第一语义信息确定所述第一用户的交互满意度。

在一个实施例中，所述处理器501在执行向服务器发送所述语音数据时，还执行以下操作：

分析所述语音数据得到与所述语音数据对应的关键词和/或关键字；

基于所述关键词和/或关键字生成与所述语音数据对应的第一查询数据，并将所述第一查询数据发送给所述服务器。

在一个实施例中，所述处理器501在执行将所述交互指令与所述语音数据作为样本数据对所述预设对话模型进行优化训练之后，还执行以下操作：

采用优化后的预设对话模型对第二用户输入的所述语音数据进行分析，输出第二交互结果；

根据所述第二交互结果分析所述第二用户的交互满意度；

在所述第二用户的交互满意度小于或等于所述预设阈值时，向服务器发送第二查询数据，并接收由所述服务器发送的目标查询结果；其中，所述目标查询结果为所述服务器在预设网站上查询的与所述第二查询数据对应的查询结果；所述第二查询数据根据所述语音数据对应的关键词和/或关键字得到；

将所述目标查询结果与所述语音数据作为样本数据对所述优化后的预设对话模型进行优化训练。

在一个实施例中，所述处理器501在执行根据所述第二交互结果分析所述第二用户的交互满意度时，还执行以下操作：

对所述第二交互结果进行语义分析得到与所述第二交互结果对应的第二语义信息；

基于所述第二语义信息确定所述第二用户的所述交互满意度。

在本申请实施例中，电子设备根据第一交互结果分析第一用户的交互满意度，第一交互结果为预设对话模型对第一用户输入的语音数据输出的交互结果，在交互满意度小于或等于预设阈值时，向服务器发送语音数据，并接收由服务器发送的与语音数据对应的交互指令，将交互指令与语音数据作为样本数据对预设对话模型进行优化训练，通过服务器搜索语音数据对应的答案数据的方式，获取用于优化训练预设对话模型的新样本数据，从而减少人工参与的工作量，并使得对预设对话模型进行优化训练的过程更加智能化。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。

以上介绍仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨振宇
技术所有人：深圳市欢太科技有限公司;OPPO广东移动通信有限公司
我是此专利的发明人

上一篇：一种三角拉丝机的制作方法
上一篇：通过对时序时间相关性建模的会话表示学习方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。