本发明属于人工智能算法辅助,具体涉及一种多意图识别方法、系统及可读存储介质。
背景技术:
1、在人工智能和自然语言处理领域,多意图识别的技术已成为研究和应用的热点。这类技术主要用于理解和处理用户输入中包含的多个意图,如智能家居控制、虚拟助手等场景中的复杂指令。在现有的技术方案中,多意图判断通常依赖于传统的机器学习模型,如决策树、支持向量机或深度学习网络。
2、最相近的现有技术方案之一是基于深度学习的多意图识别模型。这类模型通常通过大量的数据训练来识别和分类用户指令中的不同意图。然而,这些方法在处理复杂和模糊的用户指令时存在明显不足。例如,当用户指令中包含多个意图且意图之间存在依赖关系时,现有技术往往难以准确识别所有意图。
3、存在这些问题的原因主要包括:
4、模型复杂性限制:传统的深度学习模型在处理高度复杂的指令时,由于其固有的结构限制,难以有效识别和关联多个意图。
5、数据依赖性:这些模型通常需要大量的标注数据进行训练,这在实际应用中可能难以满足,特别是在新兴领域或特定应用场景中。
6、泛化能力不足:在处理新颖或不常见的指令时,现有模型的泛化能力有限,导致意图识别的准确性下降。
技术实现思路
1、为了解决现有技术存在的问题,本发明提供
2、本发明所采用的技术方案为:
3、第一方面,本发明公开一种多意图识别方法,基于rag技术利用llm大模型对单个或多个query进行多意图识别增强检索,具体步骤如下:
4、步骤一、对输入的query进行确定,将确定的query进行预处理,获得若干相关子句集合形成关于该query的子句集;
5、步骤二、根据设定的若干检索路径在知识库中进行检索召回,将子句集通过每个检索路径进行向量化处理检索,并获得若干关于该query的召回信息形成召回集;
6、步骤三、利用训练好的rerank模型,将获得的召回集内的若干召回信息以与query相关性进行重新排序获得精排集;
7、步骤四、利用监督微调好的大模型,对query和对应的精排集进行意图确认,最终输出若干条关于该query的意图信息。
8、结合第一方面,本发明提供第一方面的第一种实施方式,所述步骤一中对于query的预处理过程中,设定词组数量的低阈值;
9、当确定的query的词组数量低于低阈值,采用短query处理方式,利用大模型根据确定的query生成若干假设性回答的doc信息,再利用query和所有doc信息形成子句集共同进行检索召回。
10、结合第一方面的第一种实施方式,本发明提供第一方面的第二种实施方式,所述短query处理方式还包括利用大模型利用抽象处理方式对确定的query形成上位概念词组,将上位概念的词组与query形成子句集进行检索召回。
11、结合第一方面,本发明提供第一方面的第三种实施方式,所述步骤一中对于query的预处理过程中,设定词组数量的高阈值;
12、当确定的query的词组数量高于高阈值,采用长query处理方式,设定子句的词组数量,将query拆分为若干子句形成子句集,根据子句集进行检索召回。
13、结合第一方面的第三种实施方式,本发明提供第一方面的第四种实施方式,所述长query处理方式还包括将原始的query拆分成若干短query,利用向量表征模型对拆分后的短query进行向量化处理,然后计算不同短query之间的向量相似度,根据设定的阈值合并相似度超过阈值的短query后形成子句集,根据子句集进行检索召回。
14、结合第一方面,本发明提供第一方面的第五种实施方式,所述步骤二中的检索路径包括:
15、子句并行检索,将子句集中的若干子句进行向量化处理,然后分别在知识库中以并行的方式直接检索获取到每个子句的检索召回信息形成召回集;
16、句子窗口检索,利用预处理后的子句集进行向量化处理,先在知识库中检索到与该子句集中每个子句最相关的n个句子,再对每个句子上下扩展k个句子形成段落,将若干段落作为独立召回信息形成召回集;
17、假设增强检索,利用大模型根据预处理后的query形成若干相关的假设query,将原始query与假设query的子句同时进行向量化处理后在知识库中检索召回形成召回集;以及
18、混合检索,对知识库中的文本内容处理形成索引,检索时根据预处理好的子句集先关联对应的索引进行展示,通过选择确认的索引确定相关的文本内容进行精确检索召回并获得召回集。
19、结合第一方面,本发明提供第一方面的第六种实施方式,所述步骤三中的rerank模型的训练步骤如下:
20、首先形成训练数据集,收集若干已经检索得到检索召回的query的训练数据,配置2-5个正样本和10个负样本;
21、然后在负样本中选择8-9个为随机抽样,1-2个为人工挖掘的困难负样本,其中困难负样本为每个作为样本的query获得的精排集中排名在30名以前的召回信息;
22、然后确定数据集格式,具体如下:
23、{"query":str,"pos":list[str],"neg":list[str],"prompt":str}
24、其中query为预处理后的query,pos为正样本集合,neg为负样本集合;
25、prompt为排序模型提示词,为给定querya和候选集合b,通过提供0-1的分数来确定候选集与query的相关程度;
26、构造完数据集后采用深度学习方式进行神经网络训练获取到rerank模型。
27、第二方面,本发明提供一种识别系统,采用上述的多意图识别方法,包括:
28、输入层,接受用户的query;
29、处理层,具有基础大模型、rerank模型和多意图选择模型;以及
30、输出层,针对输入的query输出由处理层检索识别一个或多个意图。
31、第三方面,本发明提供一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述所述的多意图识别方法。
32、本发明的有益效果为:
33、(1)本发明可以有效处理不同长度的query,对于包含信息较少的短query,可以对其进行有效改写或高级概念抽象,从而得到更丰富的query信息;对于长度较长的query,采用了句子长度、重叠度、语义相似度等度量方式对长句做拆分,并使用子句并行搜索策略,保证对query信息的完整利用;
34、(2)本发明能够从多个维度对用户query进行深入分析,从而更准确地识别用户query所包含的信息,能够混合多种不同的检索策略,以不同的语义单元进行混合检索,最大程度的保证召回集的覆盖率;
35、(3)本发明通过rerank模型的引入进一步优化了候选集的排序,筛选相关性高的集合,同时丢掉不相关的候选集合,同时由于大模型经过专项任务微调(sft),使得多意图选择的技术能够准确的获取到用户的意图;
36、(4)本发明不需要专门构建多意图的分类数据集,主要依靠检索增强和大语言模型的技术,用于替代传统的监督学习技术,大大简化了数据准备过程,并使得该方法更加灵活,能够适应不断变化和多样化的用户指令。