话务文本的语义信息确定方法、装置、电子设备及介质与流程

文档序号：36976058发布日期：2024-02-07 13:28阅读：36来源：国知局

本公开涉及人工智能，具体涉及一种话务文本的语义信息确定方法、装置、电子设备、介质和程序产品。

背景技术：

1、目前，我国商业银行、运营商等已建立较为完成的远程电话服务(如银行的客户之声、远程银行热线等)。在服务过程中，为了保证服务质量，可能会将通过内容进行录音，将录音的内容进行实时转写、离线转写质检等应用。

2、而实际上，在将语音流进行转写的过程中，转写算法通常以固定的“非活性”语音作为断句一句进行切分，从而将连续采集的语音流切分为多句，而固定的切分会将某个角色的一句话切分为两句以上(一般因为停顿、语气、思考等)。而断句后的文本，相较于完整的一句话语义信息有所损失，不能充分挖掘其中蕴含的语义信息。

技术实现思路

1、鉴于上述问题，本公开提供了一种话务文本的语义信息确定方法、装置、电子设备、介质和程序产品。

2、根据本公开的第一个方面，提供了一种话务文本的语义信息确定方法，包括：在远程通话服务中采集实时语音流，将实时语音流转写为连续的n句文本内容，n为大于1的整数；针对n句文本内容中的任意第i句文本内容，i＝1，2，…，n-1，利用预先训练的断句检测模型，检测第i句文本内容相较于第i+1句文本内容是否为断句，如果否，将该第i句文本内容与第i+1句文本内容进行拼接，将拼接后的文本内容作为更新后的第i+1句文本内容，并针对更新后的第i+1句文本内容返回利用断句检测模型进行断句检测的操作；在n句文本内容均拼接完成后得到m句文本内容，m为小于n的正整数，根据m句文本内容，确定语音流蕴含的语义信息。

3、根据本公开的实施例，在远程通话服务中采集实时语音流，还包括：根据远程通话服务的两种角色中的任一角色，按照交互顺序采集实时语音流，其中，两种角色包括客户方和服务方。

4、根据本公开的实施例，断句检测模型包括词法分析模型和语义分析模型，断句检测模型通过以下方式预先训练得到：在历史时刻的远程通话服务中获取历史语音流，将历史语音流转写为连续的多句文本内容；对多句文本内容中任一句文本内容的断句属性进行标注，其中，任一文本内容的断句属性表征了该句文本内容相较于下一句文本内容是否为断句；根据断句属性和预定的筛选比例，从多句文本内容中分别筛选出一部分断句标注数据和另一部分非断句标注数据，作为训练数据集；使用训练数据集，分别对词法分析模型和语义分析模型进行训练，得到训练好的词法分析模型和语义分析模型。

5、根据本公开的实施例，将历史语音流转写为连续的多句文本内容之后，还包括：通过正则匹配算法，去除多句文本内容中的特定字符，特定字符包括停止词和敏感字符；根据断句检测模型预设的编码要求，对多句文本内容中的每句文本内容进行长度限制。

6、根据本公开的实施例，使用训练数据集，分别对词法分析模型和语义分析模型进行训练，得到训练好的词法分析模型和语义分析模型，包括：针对训练数据集中任意相邻的两句文本内容，分别通过词法分析模型和语义分析模型对两句文本内容进行断句检测；对词法分析模型和语义分析模型的断句检测结果进行加权求和，得到两句文本内容的最终断句检测结果；将最终断句检测结果与两句文本内容已标注的断句属性进行比对，来调整词法分析模型和语义分析模型的参数，直至达到预期的性能指标，得到训练好的词法分析模型和语义分析模型。

7、根据本公开的实施例，对词法分析模型和语义分析模型的断句检测结果进行加权求和，包括：分别将词法分析模型和语义分析模型的断句检测结果赋予第一权值和第二权值，其中，第一权值和第二权值的总和为1，且第一权值小于第二权值；根据词法分析模型和语义分析模型的断句检测结果、第一权值和第二权值，计算两句文本内容的最终断句检测结果。

8、根据本公开的实施例，利用预先训练的断句检测模型，检测第i句文本内容相较于第i+1句文本内容是否为断句，包括：根据该第i句文本内容与第i+1句文本内容的最终断句检测结果，确定该第i句文本内容相较于第i+1句文本内容是否为断句。

9、根据本公开的实施例，词法分析模型采用nltk模型；语义分析模型采用word2vec模型、glove模型或bert模型。

10、本公开的第二方面提供了一种话务文本的语义信息确定装置，包括：语音流转写模块，用于在远程通话服务中采集实时语音流，将实时语音流转写为连续的n句文本内容，n为大于1的整数；断句检测与拼接模块，用于针对n句文本内容中的任意第i句文本内容，i＝1，2，…，n-1，利用预先训练的断句检测模型，检测第i句文本内容相较于第i+1句文本内容是否为断句，如果否，将该第i句文本内容与第i+1句文本内容进行拼接，将拼接后的文本内容作为更新后的第i+1句文本内容，并针对更新后的第i+1句文本内容返回利用断句检测模型进行断句检测的操作；语义信息确定模块，用于在n句文本内容均拼接完成后得到m句文本内容，m为小于n的正整数，根据m句文本内容，确定语音流蕴含的语义信息。

11、本公开的第三方面提供了一种电子设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序，其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得一个或多个处理器执行上述话务文本的语义信息确定方法。

12、本公开的第四方面还提供了一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行上述话务文本的语义信息确定方法。

13、本公开的第五方面还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述话务文本的语义信息确定方法。

技术特征：

1.一种话务文本的语义信息确定方法，包括：

2.根据权利要求1所述的方法，其中，所述在远程通话服务中采集实时语音流，还包括：

3.根据权利要求1所述的方法，其中，所述断句检测模型包括词法分析模型和语义分析模型，所述断句检测模型通过以下方式预先训练得到：

4.根据权利要求3所述的方法，其中，所述将所述历史语音流转写为连续的多句文本内容之后，还包括：

5.根据权利要求3所述的方法，其中，所述使用所述训练数据集，分别对所述词法分析模型和语义分析模型进行训练，得到训练好的词法分析模型和语义分析模型，包括：

6.根据权利要求5所述的方法，其中，所述对所述词法分析模型和语义分析模型的断句检测结果进行加权求和，包括：

7.根据权利要求5所述的方法，其中，所述利用预先训练的断句检测模型，检测第i句文本内容相较于第i+1句文本内容是否为断句，包括：

8.根据权利要求3所述的方法，其中，所述词法分析模型采用nltk模型；

9.一种话务文本的语义信息确定装置，包括：

10.一种电子设备，包括：

11.一种计算机可读存储介质，其上存储有可执行指令，该指令被处理器执行时使处理器执行根据权利要求1～8中任一项所述的方法。

12.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1～8中任一项所述的方法。

技术总结
本公开提供了一种话务文本的语义信息确定方法、装置、电子设备及介质，涉及人工智能技术领域。该方法包括：在远程通话服务中采集实时语音流，将实时语音流转写为连续的n句文本内容，n为大于1的整数；针对n句文本内容中的任意第i句文本内容，i＝1，2，…，n‑1，利用预先训练的断句检测模型，检测第i句文本内容相较于第i+1句文本内容是否为断句，如果否，将该第i句文本内容与第i+1句文本内容进行拼接，将拼接后的文本内容作为更新后的第i+1句文本内容，并针对更新后的第i+1句文本内容返回利用断句检测模型进行断句检测的操作；在n句文本内容均拼接完成后得到m句文本内容，m为小于n的正整数，根据m句文本内容，确定语音流蕴含的语义信息。

技术研发人员：刘涛
受保护的技术使用者：中国工商银行股份有限公司
技术研发日：
技术公布日：2024/2/6

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘涛
技术所有人：中国工商银行股份有限公司
我是此专利的发明人

上一篇：一种多功能电凝装置
上一篇：面向自动化的基材刮刀对刀调平方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。