多轮智能问答方法、系统以及控制器和介质与流程

文档序号：19745235发布日期：2020-01-21 18:15阅读：来源：国知局

技术特征：

1.一种多轮智能问答方法，其特征在于，包括：

获取当前轮和先前轮的问句信息；

基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型；

基于所获取的当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型选择最优回答。

2.根据权利要求1所述的多轮智能问答方法，其特征在于，

所述基于所获取的当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型选择最优回答，包括：

基于所述当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型生成当前轮问答序列，基于所述当前轮问答序列选择最优回答。

3.根据权利要求2所述的多轮智能问答方法，其特征在于，

所述基于所述当前轮问答序列选择最优回答，包括：

将所述当前轮问答序列输入预先训练好的lstm模型，输出当前回答模板类型，根据所述当前回答模板类型输出回答，即为所述最优回答。

4.根据权利要求3所述的多轮智能问答方法，其特征在于，还包括：获取所述lstm模型，具体包括：

采集问答序列做训练数据，每一个所述问答序列至少包括一组问句类别、问句实体、回答模板类型这三个信息；

基于所述问答序列构建问答序列向量；

调参并训练lstm类别概率器得到所述lstm模型。

5.根据权利要求1所述的多轮智能问答方法，其特征在于，

获取问句信息，包括：

将用户输入的问句进行分词、去除停用词和无效字符以及同一字体处理，得到文本序列。

6.根据权利要求5所述的多轮智能问答方法，其特征在于，

所述基于所述问句信息确定意图和实体，包括：

将所述文本序列转换为文本向量后输入至预先训练好的意图分类模型中，得到对应的意图；

将所述文本序列输入预先训练好的实体提取模型中，得到对应的实体。

7.根据权利要求6所述的多轮智能问答方法，其特征在于，

所述方法还包括获取所述意图分类模型和实体提取模型，具体包括：

采集符合应用场景的问答数据作为训练集文本；

将所述训练集文本进行分词、去停用词和无效字符、统一字体处理；

构建空间向量模型，再进行特征选择，特征加权，特征降维处理；

调参并训练分类器得到所述意图分类模型；

将所述训练集文本进行数据清洗后进行序列标注，得到crf的训练数据；

设置特征模板和crf的训练数据标签；

调参并训练crf实体提取器得到所述实体提取模型。

8.根据权利要求1所述的多轮智能问答方法，其特征在于，所述方法还包括：

根据应用场景设定对应的意图校验规则和实体校验规则，根据所述意图校验规则和实体校验规则检测并校正所获取的意图和实体。

9.一种多轮智能问答系统，其特征在于，包括：

问句信息获取模块，配置为获取当前轮和先前轮的问句信息；

意图实体确定模块，配置为基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型；

最优回答选择模块，配置为基于所获取的当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型选择最优回答。

10.根据权利要求9所述的多轮智能问答系统，其特征在于，

所述最优回答选择模块包括：

问答序列生成单元：配置为基于所述当前轮的意图和实体，以及先前轮的意图、实体和回答模板类型生成当前轮问答序列，

最优回答选择单元，配置为基于所述当前轮问答序列选择最优回答。

11.根据权利要求10所述的多轮智能问答系统，其特征在于，

所述最优回答选择单元还配置为：将所述当前轮问答序列输入预先训练好的lstm模型，输出当前回答模板类型，根据所述当前回答模板类型输出回答，即为所述最优回答。

12.根据权利要求11所述的多轮智能问答系统，其特征在于，

所述系统还包括第一模型建立模块，配置为获取所述lstm模型；

所述第一模型建立模块包括：

训练数据采集单元，配置为采集问答序列做训练数据，每一个所述问答序列至少包括一组问句类别、问句实体、回答模板类型这三个信息；

问答序列向量构建单元，配置为基于所述问答序列构建问答序列向量；

lstm模型训练单元，配置为调参并训练lstm类别概率器得到所述lstm模型。

13.根据权利要求9所述的多轮智能问答系统，其特征在于，

所述问句信息获取模块具体配置为：

将用户输入的问句进行分词、去除停用词和无效字符以及同一字体处理，得到文本序列。

14.根据权利要求13所述的多轮智能问答系统，其特征在于，

所述意图实体确定模块包括：

意图判断单元，配置为将所述文本序列转换为轮文本向量后输入至预先训练好的意图分类模型中，得到对应的意图；

实体提取单元，配置为将所述文本序列输入预先训练好的实体提取模型中，得到对应的实体。

15.根据权利要求14所述的多轮智能问答系统，其特征在于，

所述系统还包括第二模型建立模块，配置为获取所述意图分类模型和实体提取模型，所述第二模型建立模块包括：

训练集文本采集单元，配置为采集符合应用场景的问答数据作为训练集文本；

训练集文本预处理单元，配置为将所述训练集文本进行分词、去停用词和无效字符、统一字体处理；

特征向量处理单元，配置为构建空间向量模型，再进行特征选择，特征加权，特征降维处理；

意图分类模型训练单元，配置为调参并训练分类器得到所述意图分类模型；

crf训练数据获取单元，配置为将所述训练集文本进行数据清洗后进行序列标注，得到crf的训练数据；

crf的训练数据处理单元，配置为设置特征模板和crf的训练数据标签；

实体提取模型训练单元，配置为调参并训练crf实体提取器得到所述实体提取模型。

16.根据权利要求9所述的多轮智能问答系统，其特征在于，

所述系统还包括意图实体校验模块，配置为根据应用场景设定对应的意图校验规则和实体校验规则，根据所述意图校验规则和实体校验规则检测并校正所述获取的意图和实体。

17.一种控制器，其包括存储器与处理器，其特征在于：所述存储器存储有计算机程序，所述程序在被所述处理器执行时能够实现权利要求1至8中任意一项权利要求所述的方法的步骤。

18.一种计算机可读存储介质，用于存储计算机程序，其特征在于：所述程序在由一计算机或处理器执行时实现如权利要求1至8中任意一项权利要求所述的方法的步骤。

完整全部详细技术资料下载

当前第2页1 2 3