本公开涉及机器人智能交互技术领域,具体涉及一种多情景对话切换方法及装置。
背景技术:
基于人工智能技术的客服机器人的应用越来越广泛,智能客服机器人可以24小时全天候的快速且智能的响应用户的问题,以预制语音、电子合成语音或文字的方式与用户进行沟通,虽然智能客服机器人的发展非常迅速,但是目前客服机器人的智能客服的服务依然面对着“不可预见”的挑战,例如,由于智能客服机器人是根据预定场景中的对话进行用户的应答,所以对一些用户的非常规问题中出现了不同场景的主题,机器人客服往往难以给出令用户满意的答复。而用户有紧急的问题需要尽快需要正确的答复时,机器人客服无法及时的切换场景,从而严重影响用户体验。
技术实现要素:
本公开提供一种多情景对话切换方法及装置,通过在知识库中进行分类得到场景类别构建应答模型,计算会话消息数据的分类置信度,按分类置信度选择场景,从而达到快速切换场景的效果,优化了用户体验。
为了实现上述目的,根据本公开的一方面,提供一种多情景对话切换方法,所述方法包括以下步骤:
步骤1,机器人客服接收到来自用户客户端的会话消息数据;
步骤2,将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度;
步骤3,按分类置信度切换到知识库中的场景;
步骤4,按照场景选择知识库中的应答消息数据;
步骤5,将应答消息数据推送给用户客户端。
进一步地,在步骤1中,所述会话消息数据的形式包括以下至少一种:自然语言文字组成的语句、数据链接、语音,如果是数据链接、语音则将数据链接、语音转换为文本形式的语句作为会话消息数据,所述机器人客服包括用户客户端、知识库。
进一步地,在步骤2中,所述将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度的方法包括以下步骤:
令会话消息数据的文本s,知识库中的应答消息数据的语句文本为si,i=1…n,n为知识库中的应答消息数据数量,则通过s与si之间的语义距离来计算文本的内容相似度,将s与si之间的分类置信度定义为:dist(s,si)=1-sim(s,si),其中,sim(s,si)表示s与si的相似度,
其中,mi,j,表示搭配j在标注为义项i的知识库中的期望平均值,
其中:freq为主题词word在s出现的频率,freqi,j表示主题词wordj在si出现的频率;
其中,sim(s,si)∈[0,1],故s与si的分类置信度的取值范围为区间[0,1]之间,分类置信度越小,表明分类置信度越高,类型越相似。
其中,所述知识库包括多个场景分类,每个场景分类包括多个应答消息数据的语句文本。
其中,抽取s的主题词word与si的主题词wordj的方法为lda、textrank、gibbslda任意一种主题词抽取方法。
进一步地,在步骤3中,按分类置信度切换到知识库中的场景的方法为,如果当前的场景为知识库中分类置信度最小的应答消息数据所属的场景则不进行切换,否则选取并切换到知识库中分类置信度最小的应答消息数据所属的场景。
进一步地,在步骤4中,按照场景选择知识库中的应答消息数据的方法为,选择并返回知识库中分类置信度最小的应答消息数据,或按照现有的场景中的对话进行用户的应答方法进行返回应答消息数据。
本发明还提供了一种多情景对话切换装置,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
会话读取单元,用于机器人客服接收到来自用户客户端的会话消息数据;
置信度计算单元,用于将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度;
场景切换单元,用于按分类置信度切换到知识库中的场景;
应答消息单元,用于按照场景选择知识库中的应答消息数据;
消息推送单元,用于将应答消息数据推送给用户客户端。
本公开的有益效果为:本发明提供一种多情景对话切换方法及装置,能够实现快速的场景切换,优化了用户体验,在用户有紧急的问题需要尽快需要正确的答复时,机器人客服能够快速及时的切换场景,提升了切换场景的准确率、使得场景切换和智能应答更加稳定,且无需对现有的客服机器人系统大规模的改造,只需在现有的架构中升级,代码可重用性高。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为一种多情景对话切换方法的流程图;
图2所示为一种多情景对话切换装置图。
具体实施方式
以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本公开的一种多情景对话切换方法的流程图,下面结合图1来阐述根据本公开的实施方式的一种多情景对话切换方法。
本公开提出一种多情景对话切换方法,具体包括以下步骤:
步骤1,机器人客服接收到来自用户客户端的会话消息数据;
步骤2,将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度;
步骤3,按分类置信度切换到知识库中的场景;
步骤4,按照场景选择知识库中的应答消息数据;
步骤5,将应答消息数据推送给用户客户端。
进一步地,在步骤1中,所述会话消息数据的形式包括以下至少一种:自然语言文字组成的语句、数据链接、语音,如果是数据链接、语音则将数据链接、语音转换为文本形式的语句作为会话消息数据,所述机器人客服包括用户客户端、知识库。
进一步地,在步骤2中,所述将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度的方法包括以下步骤:
令会话消息数据的文本s,知识库中的应答消息数据的语句文本为si,i=1…n,n为知识库中的应答消息数据数量,则通过s与si之间的语义距离来计算文本的内容相似度,将s与si之间的分类置信度定义为:dist(s,si)=1-sim(s,si),其中,sim(s,si)表示s与si的相似度,
其中,mi,j,表示搭配j在标注为义项i的知识库中的期望平均值,
其中:freq为主题词word在s出现的频率,freqi,j表示主题词wordj在si出现的频率;
其中,sim(s,si)∈[0,1],故s与si的分类置信度的取值范围为区间[0,1]之间,分类置信度越小,表明分类置信度越高,类型越相似。
其中,所述知识库包括多个场景分类,每个场景分类包括多个应答消息数据的语句文本。
其中,抽取s的主题词word与si的主题词wordj的方法为lda、textrank、gibbslda任意一种主题词抽取方法。
进一步地,在步骤3中,按分类置信度切换到知识库中的场景的方法为,如果当前的场景为知识库中分类置信度最小的应答消息数据所属的场景则不进行切换,否则选取并切换到知识库中分类置信度最小的应答消息数据所属的场景。
进一步地,在步骤4中,按照场景选择知识库中的应答消息数据的方法为,选择并返回知识库中分类置信度最小的应答消息数据,或按照现有的场景中的对话进行用户的应答方法进行返回应答消息数据。
随机输入1500次场景切换语句,在知识库(5600个句子)中进行场景切换,为样例说明,其中有15次是场景切换错误的(占1%)。
本公开的实施例提供的一种多情景对话切换装置,如图2所示为本公开的一种多情景对话切换装置图,该实施例的一种多情景对话切换装置包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种多情景对话切换装置实施例中的步骤。
所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
会话读取单元,用于机器人客服接收到来自用户客户端的会话消息数据;
置信度计算单元,用于将会话消息数据依次遍历知识库中的应答消息数据计算得到各个场景的分类置信度;
场景切换单元,用于按分类置信度切换到知识库中的场景;
应答消息单元,用于按照场景选择知识库中的应答消息数据;
消息推送单元,用于将应答消息数据推送给用户客户端
所述一种多情景对话切换装置可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述一种多情景对话切换装置,可运行的装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是一种多情景对话切换装置的示例,并不构成对一种多情景对话切换装置的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种多情景对话切换装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种多情景对话切换装置运行装置的控制中心,利用各种接口和线路连接整个一种多情景对话切换装置可运行装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种多情景对话切换装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。