在线客服助手的构建方法与流程

文档序号：23132441发布日期：2020-12-01 13:06阅读：来源：国知局

技术特征：

1.一种在线客服助手的构建方法，其特征在于，包括以下步骤：

s1、会话场景分类：将企业在预定周期内的原始客服服务文本数据进行收集后形成单通会话的会话集合，将所述会话集合过滤得到业务问题，并保留出现在所述单通会话中访客问题中的前n个业务问题，而后将保留的业务问题按照共现业务词的方式进行分类后，得到多个会话场景；其中，n为大于0并不小于5的整数；所述会话场景中包含的业务问题称为锚点问题；

s2、构建频繁话术通路库：在单通会话中所述锚点问题出现之后的所有客服语句中筛选出对应于所述锚点问题的所有话术句，而后将所有话术句按照会话逻辑进行排序后，将排序后的话术句以及对应于每个话术句的历史访客会话特征共同保存形成频繁话术通路库；其中，所述历史访客会话特征指与话术句紧邻的之前时刻的访客问题；

s3、构建单轮问答库：将同一场景下的所有单通会话中前一句为访客句子，后一句为客服句子的问答组合作为初选问题答案对进行保存，并在所述初选问题答案对中选取最优的一问对应一答的最优问答对形成所述单轮问答库；

s4、构建在线客服助手：判断访客问题与锚点问题的相似度，当所述相似度大于预设的相似阈值时，利用所述频繁话术通路库中的第一个话术句对访客问题进行应答；当所述相似度小于相似阈值或经所述频繁话术通路库中的话术句进行应答后的访客问题不符合应答的会话句的历史访客会话特征时，由所述单轮问答库内寻找与访客问题相似度大于相似阈值的问题对应的客服句子对访客问题进行应答；且在所述单轮问答库内不存在与访客问题相似度大于相似阈值的问题时，将访客问题转由人工客服进行答复。

2.如权利要求1所述的在线客服助手的构建方法，其特征在于，所述原始客服服务文本数据指人工客服与访客间的对话文本数据；所述单通会话指从访客与人工客服的会话建立开支至访客结束离开的会话记录。

3.如权利要求1所述的在线客服助手的构建方法，其特征在于，s1中将所述会话集合过滤得到业务问题具体包括：

业务词的抽取：在所述会话集合中利用textrank、词语信息熵、词频词性以及词语自由度联合抽取得到业务词；

业务问题的获取：利用所述业务词对访客问题进行过滤得到业务问题。

4.如权利要求3所述的在线客服助手的构建方法，其特征在于，s1中将保留的业务问题按照共现业务词的方式进行分类后，得到多个会话场景具体包括：

通过业务词共现的方式将具有共现业务词的业务问题归入同个类别，作为业务问题的粗分类；

粗分类后将同类别下的业务问题进行bert+birch聚类，得到分别包含不同业务问题的多个簇；

保留包含业务问题数量大于预定的阈值的簇，其余簇丢弃；

将保留的簇内的业务问题所属的单通会话以簇为单位集合后，即得到多个所述会话场景。

5.如权利要求1所述的在线客服助手的构建方法，其特征在于，s2中在单通会话中所述锚点问题出现之后的所有客服语句中筛选出对应于所述锚点问题的所有话术句的方法具体为：

s1-1、对同一所述会话场景下的所有单通会话中的锚点问题之后出现的所有客服话语进行分词、去停用词后，使用bert+birch聚类，得到多个初选话术句簇；

s1-2、根据初选话术句簇的簇内熵值阈值对句子个数大于m的初选话术句簇进行过滤，保留句子个数大于m且熵值小于熵值阈值的初选话术句簇，作为话术句簇；其中，m为不小于3的整数；

s1-3、选取每个所述话术句簇内熵值最接近相应话术句簇内的熵值均值的句子作为候选客服话术句，并将所述话术句簇内的其他句子作为所述候选客服话术句的相似话术句。

6.如权利要求1所述的在线客服助手的构建方法，其特征在于，s3中问答组合中的访客句子还包括将当前访客句子和紧邻的访客句子拼接而成的句子；且所述初选问题答案对具体包括以下三种情况：

a、一个问题对应一个答案；

b、一个问题对应多个答案；以及

c、多个问题对应一个答案。

7.如权利要求6所述的在线客服助手的构建方法，其特征在于，由所述初选问题答案对中选取最优的一问对应一答的最优问答对形成所述单轮问答库的过程中，还形成了标准问题-相似问题库；所述标准问题-相似问题库内保存多个标准问题，且每个标准问题都对应多个相似问题；所述最优问答对、标准问题，以及标准问题对应的相似问题均由对所述初选问题答案对进行聚类、信息熵、问题与答案相似性以及句子长度的过滤得到。

8.如权利要求7所述的在线客服助手的构建方法，其特征在于，所述单轮问答库和标准问题-相似问题库的构建方法具体为：

当所述初选问题答案对为多个问题对应一个答案或一个问题对应多个答案时，由所述初选问题答案对过滤得到最优问答对和标准问题-相似问题问答对的方法为：

s2-1、将多个问题或答案进行bert+birch聚类，若能够聚类则得到初选问题簇或初选答案簇，并转至s2-2；若不能够聚类，则转至s2-5；

s2-2、求取每个所述初选问题簇或初选答案簇内所有句子的平均信息熵，将所述初选问题簇或初选答案簇内的所有句子与所述平均信息熵求取bert向量相似度，过滤出同时满足所述bert向量相似度大于相似度阈值、平均信息熵低于平均信息熵阈值，且簇内句子个数大于预定数量的初选问题簇或初选答案簇作为问题簇或答案簇；

s2-3、当得到的问题簇或答案簇仅为1个时，将所述问题簇或答案簇作为最优问题簇或最优答案簇；当得到的问题簇或答案簇的个数大于2个时，根据下述公式1计算，并将得分最高的问题簇或答案簇作为优选问题簇或优选答案簇；

其中，h是簇内句子的平均信息熵，s是簇内句子与答案句或问题句的平均相似度，n是簇内句子的个数，score为最终得分；

s2-4、在优选问题簇或优选答案簇中选取熵值最小的句子作为标准问题或标准答案，除标准问题或标准答案外的其他问题或答案作为相似问题或相似答案，将标准问题或标准答案，以及相似问题或相似答案保存形成所述标准问题-相似问题库；

s2-5、求取所有单个问题或答案的信息熵，将每个问题或答案与求得的信息熵求取bert向量相似度，过滤出同时满足bert向量相似度大于相似度阈值、信息熵大于信息熵阈值，且单个问题或答案的字符数大于预定数量的问题，作为初选问题或初选答案；

s2-6、根据下述公式2计算，并将得分最高的初选问题或初选答案作为优选问题或优选答案，其他初选问题或初选答案舍弃；

其中，h是信息熵，s是bert向量相似度，l是单个问题或答案的字符数，score1为最终得分；

当所述初选问题答案对为一个问题对应一个答案时，由所述初选问题答案对过滤得到最优问答对、标准问题，以及标准问题对应的相似问题的方法为：过滤出同时满足bert向量相似度大于相似度阈值、问题或答案的字符数大于预定数量的问题或答案，作为优选问答对。

9.如权利要求1所述的在线客服助手的构建方法，其特征在于，s4中根据访客问题的字符数目与锚点问题的字符数目差距判断访客问题与锚点问题的相似度；其中，所述相似阈值根据访客问题的字符数目作动态设定。

技术总结
本发明公开了一种在线客服助手的构建方法，包括：通过企业在预定周期内的原始客服服务文本数据的处理进行会话场景分类；基于各个会话场景构建保存锚点问题和对应答案的频繁话术通路库；将同一场景下的所有单通会话中前一句为访客句子，后一句为客服句子的问答组合作为初选问题答案对进行保存，构建单轮问答库；利用频繁话术通路库以及单轮问答库构建在线客服助手。其基于客服历史服务数据的获取，构建了一种能够在无监督的状态下，准确的与访客进行多轮问答的在线客服助手，在提高了在线客服效率的同时也提高了服务质量。

技术研发人员：徐正虹;吴科;吴立楠;徐懿;龙中武;彭伟
受保护的技术使用者：北京智齿博创科技有限公司
技术研发日：2020.08.24
技术公布日：2020.12.01

完整全部详细技术资料下载

当前第2页1 2