一种多意图识别方法及装置与流程

文档序号：36176666发布日期：2023-11-29 00:08阅读：46来源：国知局

本发明主要涉及自然语言处理，尤其是涉及一种多意图识别方法及装置。

背景技术：

1、人们在使用搜索引擎、智能助手或自然语言处理应用程序时，经常需要进行意图识别。意图识别是指从给定的文本或语音信号中识别和理解用户的意图和目的。意图识别广泛地应用于自动客服系统、智能语音助手及在线搜索中。

2、目前，意图识别功能还存在一些不足，传统的基于规则或关键词匹配的意图识别方法无法处理复杂的语言结构和上下文信息。基于机器学习的方法需要大量标注的数据集来训练模型，且可能受限于特定领域的数据可用性。此外，这些方法只能用于单意图识别，对于多意图识别无法准确的获得所有的意图。

技术实现思路

1、本发明所要解决的技术问题：

2、提供一种多意图识别方法及装置，解决目前搜索引擎等在进行语音识别的过程中无法进行多意图识别或多意图识别不准确的问题。

3、本发明解决上述技术问题所采用的技术方案：

4、定义意图个数标签与意图个数实体词、意图类别标签与意图类别实体词的映射关系；

5、将待预测文本与意图个数预测提示模板拼接，作为输入信号输入意图个数预测模型，意图个数预测模型输出待预测文本信号的意图个数实体词；根据意图个数标签与意图个数实体词的映射关系将意图个数实体词转换为意图个数标签，得出待预测文本的意图个数；

6、将待预测文本与意图类别预测提示模板拼接，作为输入信号输入意图类别预测模型，意图类别预测模型输出待预测文本信号的意图类别实体词；按照意图个数选择意图类别实体词，根据意图类别标签与意图类别实体词的映射关系将意图类别实体词转换为意图类别标签，得出待预测信号的意图类别。

7、进一步的，还包括构建标签实体词转换器，将一个意图个数标签与一个意图个数实体词进行对应，将一个意图类别标签与一类意图类别实体词进行对应。

8、进一步的，所述标签实体词转换器将一个意图类别标签与一类意图类别实体词进行对应具体包括，建立常用意图类别实体词的近义词词库，将每一个近义词词库中的意图类别实体词与一个意图类别标签相对应。

9、进一步的，还包括构建提示模板映射器，分别采用人工和生成模型构建意图个数预测任务和意图类别预测任务的文本描述，得到意图个数预提示测模板和意图类别预测提示模板。

10、进一步的，在多意图识别验证数据集上验证人工构建和使用生成模型构建的意图个数预测提示模板和意图类别预测提示模板的准确率，选择准确率最高的意图个数预测提示模板和意图类别预测提示模板作为最终的意图个数预测提示模板和意图类别预测提示模板。

11、进一步的，图类别预测模型输出待预测文本信号的意图类别实体词包括，将意图个数预测提示模板和待预测文本信号拼接，作为输入信号输入意图个数预测模型，意图个数预测模型预测输入信号属于不同意图个数实体词的概率，选择概率值最大的意图个数实体词作为最终的意图个数实体词。

12、进一步的，意图类别预测模型输出待预测文本信号的意图类别实体词包括，将意图类别预测提示模板与待预测文本信号进行拼接，作为输入信号输入意图类别预测模型，意图类别预测模型预测输入信号属于不同意图类别实体词的概率值，对概率值排序，根据意图个数选择概率值较大的意图类别实体词。

13、进一步的，对待预测文本进行意图识别之前还包括对待预测信号进行预处理，所述预处理包括：若获取的待预测信号为语音信号，对语音信号进行降噪处理后，将降噪后的语音信号转换为文本信号，并对文本信号进行纠错。

14、基于上述多意图识别方法，本发明还提供一种多意图识别装置，所述多意图识别装置包括签实体词转换器、提示模板映射器、意图个数预测模型和意图类别预测模型；

15、所述提示模板映射器，包括意图个数预测提示模板和意图类别预测提示模板，所述意图个数预测提示模板用于与待预测文本信号进行拼接输入意图个数预测模型中得出待预测文本信号的意图个数实体词；所述意图类别预测提示模板用于与待预测文本信号进行拼接输入意图类别预测模型，根据意图个数得出待预测文本的意图类别实体词；

16、所述标签实体词转换器，用于将意图个数实体转换为意图个数标签得到待预测文本的意图个数、将意图类别实体词转换为意图类别标签得到待预测文本的意图类别。

17、进一步的，所述多意图识别装置还包括数据处理模块，所述数据处理模块用于获取待预测信号，并对待预测信号进行预处理，所述预处理包括对语音信号降噪，将语音信号转化为文本信号，以及对文本信号进行纠错。

18、本发明的有益效果：

19、构建标签实体词转换器和提示模板映射器，提示模板映射器预测待预测信号的意图个数实体词，标签实体词转换器将意图个数实体词转换为意图个数标签，得到最终的意图个数；意图类别预测提示模板预测待预测信号的意图类别实体词，标签实体词转换器根据意图个数将意图类别实体词转换为意图类别标签，得到每个意图的类别，本发明所述的一种多意图识别方法将分界点识别和意图分类相互结合，通过意图个数限定意图类别的预测范围可以更准确的识别和处理不同数量的意图。

20、通过手工构建和使用自动生成模型自动生成意图个数预测提示模板和意图类别预测提示模板，然后在验证数据集上验证挑选最终的提示模板，能够更正确衡量得到高质量的提示模板，提升意图类别识别的准确率。

21、将待预测信号进行预处理后输入预测模型，提升了应用的范围。同时对信号进行预处理，有助于提升意图类别识别的准确率。

技术特征：

1.一种多意图识别方法，其特征在于，包括，

2.根据权利要求1所述的一种多意图识别方法，其特征在于，还包括构建标签实体词转换器，将一个意图个数标签与一个意图个数实体词进行对应，将一个意图类别标签与一类意图类别实体词进行对应。

3.根据权利要求2所述的一种多意图识别方法，其特征在于，所述标签实体词转换器将一个意图类别标签与一类意图类别实体词进行对应具体包括，建立常用意图类别实体词的近义词词库，将每一个近义词词库中的意图类别实体词与一个意图类别标签相对应。

4.根据权利要求1所述的一种多意图识别方法，其特征在于，还包括构建提示模板映射器，分别采用人工和生成模型构建意图个数预测任务和意图类别预测任务的文本描述，得到意图个数预提示测模板和意图类别预测提示模板。

5.根据权利要求4所述的一种多意图识别方法，其特征在于，在多意图识别验证数据集上验证人工构建和使用生成模型构建的意图个数预测提示模板和意图类别预测提示模板的准确率，选择准确率最高的意图个数预测提示模板和意图类别预测提示模板作为最终的意图个数预测提示模板和意图类别预测提示模板。

6.根据权利要求1所述的一种多意图识别方法，其特征在于，意图类别预测模型输出待预测文本信号的意图类别实体词包括，将意图个数预测提示模板和待预测文本信号拼接，作为输入信号输入意图个数预测模型，意图个数预测模型预测输入信号属于不同意图个数实体词的概率，选择概率值最大的意图个数实体词作为最终的意图个数实体词。

7.根据权利要求1所述的一种多意图识别方法，其特征在于，意图类别预测模型输出待预测文本信号的意图类别实体词包括，将意图类别预测提示模板与待预测文本信号进行拼接，作为输入信号输入意图类别预测模型，意图类别预测模型预测输入信号属于不同意图类别实体词的概率值，对概率值排序，根据意图个数选择概率值较大的意图类别实体词。

8.根据权利要求1-7任意一项所述的一种多意图识别方法，其特征在于，对待预测文本进行意图识别之前还包括对待预测信号进行预处理，所述预处理包括：若获取的待预测信号为语音信号，对语音信号进行降噪处理后，将降噪后的语音信号转换为文本信号，并对文本信号进行纠错。

9.一种多意图识别装置，用于实现权利要求1-8任意一项所述的多意图识别方法，其特征在于，包括标签实体词转换器、提示模板映射器、意图个数预测模型和意图类别预测模型；

10.根据权利要求9所述的一种多意图识别装置，其特征在于，还包括数据处理模块，所述数据处理模块用于获取待预测信号，并对待预测信号进行预处理，所述预处理包括对语音信号降噪，将语音信号转化为文本信号，以及对文本信号进行纠错。

技术总结
本发明主要涉及自然语言处理技术领域。为了解决目前搜索引擎等在进行语音识别的过程中无法进行多意图识别或多意图识别不准确的问题，本发明提供一种多意图识别方法及装置，分别构建标签实体词转换器和提示模板映射器，提示模板映射器包括意图个数预测提示模板和意图类被预测提示模板，意图个数预测提示模板用于预测待预测信号的意图个数实体词，标签实体词转换器将意图个数实体词转换为意图个数标签，得到最终的意图个数；所述意图类别预测提示模板用于预测待预测信号的意图类别实体词，标签实体词转换器根据意图个数将意图类别实体词转换为意图类别标签，得到每个意图的类别。

技术研发人员：周兴发,杨兰,谭斌,饶璐,孙锐,展华益
受保护的技术使用者：四川启睿克科技有限公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周兴发杨兰谭斌饶璐孙锐展华益
技术所有人：四川长虹电子控股集团有限公司
我是此专利的发明人

上一篇：一种基于规则的电力调度系统点表联动生成方法及系统与流程
上一篇：一种超高温高压的三轴试验装置