异常语音识别方法、装置、设备、介质及产品与流程

文档序号：39862488发布日期：2024-11-01 19:49阅读：23来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及计算机，具体而言，涉及一种异常语音识别方法、装置、设备、介质及产品。

背景技术：

1、随着个人信息泄露案件日益增加，用户对异常语音的过滤要求越来越高。但越来越多的异常语音趋于隐蔽化，通话行为相关的异常特征减弱，使得难以准确识别异常语音。

2、因此，如何准确地识别异常语音成为业界亟待解决的技术问题。

技术实现思路

1、本申请提供一种异常语音识别方法、装置、设备、介质及产品，用以解决现有技术中如何准确地识别异常语音的技术问题。

2、第一方面，本申请提供了一种异常语音识别方法，包括：

3、基于调优后的自动语音识别模型将待识别语音转换为文本；

4、在所述文本的文本困惑度大于预设阈值的情况下，基于文本修正模型对所述文本进行修正，得到修正文本；

5、将所述修正文本输入至异常语义识别模型中，得到所述异常语义识别模型输出的所述待识别语音的识别结果；所述识别结果包括所述待识别语音是否异常和/或所述待识别语音的异常类型；

6、其中，所述自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的。

7、在一些实施例中，所述自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的，包括：

8、对所述异常文本进行分词，得到各个词汇；

9、基于各个词汇在所述异常文本中出现的频率和各个词汇的异常情况，在各个词汇中选取所述异常词汇；

10、将各个异常词汇的语音进行音韵转换，得到异常语音样本；

11、基于所述异常语音样本对所述自动语音识别模型进行调优。

12、在一些实施例中，所述基于文本修正模型对所述文本进行修正，包括：

13、将所述文本输入至所述文本修正模型中，得到所述文本修正模型输出的所述修正文本；

14、其中，所述文本修正模型是基于如下步骤得到的：

15、将目标文本中随机添加噪音，得到噪音文本；

16、将所述噪音文本和所述噪音文本对应的目标文本作为预训练样本对初始文本修正模型进行预训练；

17、将目标语音进行文本转换，得到转换文本；

18、将所述转换文本和人工修订后的转换文本作为训练样本对预训练后的初始文本修正模型进行训练，得到所述文本修正模型。

19、在一些实施例中，所述异常语义识别模型是基于如下步骤确定所述识别结果的：

20、对所述修正文本进行分词，得到各个词汇；

21、基于注意力掩码增加各个词汇中异常词汇的权重，确定所述待识别语音是否异常和/或所述待识别语音的异常类型。

22、在一些实施例中，所述异常语义识别模型是基于如下步骤得到的：

23、对训练文本主语进行随机替换、随机删除和重复，得到训练样本；

24、基于所述训练样本和构建的损失函数对初始异常语义识别模型进行优化，得到所述异常语义识别模型；

25、其中，在所述训练样本对应的语音为非异常语音的情况下，优化所述初始异常语义识别模型预测的语音是否异常的识别结果；在所述训练样本对应的语音为异常语音的情况下，优化所述初始异常语义识别模型预测的语音是否异常和异常类型的识别结果。

26、在一些实施例中，所述异常语义识别模型同时接入黑规则系统和白规则系统；所述黑规则系统用于对所述修正文本的异常文本命中的情况进行加分，用于快速确认异常文本；所述白规则系统用于对所述修正文本的异常文本命中的情况进行减分，用于快速确认非异常文本；

27、异常语义识别模型是基于如下步骤确定所述识别结果的：

28、基于所述修正文本在所述黑规则系统和所述白规则系统的累计得分，确定所述修正文本是否异常，并基于所述修正文本的异常结果确定所述待识别语音的识别结果。

29、第二方面，本申请提供了一种异常语音识别装置，包括：

30、转换模块，用于基于调优后的自动语音识别模型将待识别语音转换为文本；

31、修正模块，用于在所述文本的文本困惑度大于预设阈值的情况下，基于文本修正模型对所述文本进行修正，得到修正文本；

32、识别模块，用于将所述修正文本输入至异常语义识别模型中，得到所述异常语义识别模型输出的所述待识别语音的识别结果；所述识别结果包括所述待识别语音是否异常和/或所述待识别语音的异常类型；

33、其中，所述自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的。

34、第三方面，本申请实施例提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述程序时实现上述的方法。

35、第四方面，本申请实施例提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述的方法。

36、第五方面，本申请实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述的方法。

37、本申请实施例提供的异常语音识别方法、装置、设备、介质及产品，通过异常词汇对自动语音识别模型进行调优，使用调优后的自动语音识别模型将待识别语音转换文本，提高了文本转换的准确度；通过文本困惑度来评估文本的文本质量，通过文本修正模型将低质量的文本进行修正，并将修正后的文本输入至异常语义识别模型中，可以使异常语义识别模型更容易识别到异常文本，提高了异常语音识别的准确度。

技术特征：

1.一种异常语音识别方法，其特征在于，包括：

2.根据权利要求1所述的异常语音识别方法，其特征在于，所述自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的，包括：

3.根据权利要求1所述的异常语音识别方法，其特征在于，所述基于文本修正模型对所述文本进行修正，包括：

4.根据权利要求1至3任一项所述的异常语音识别方法，其特征在于，所述异常语义识别模型是基于如下步骤确定所述识别结果的：

5.根据权利要求1所述的异常语音识别方法，其特征在于，所述异常语义识别模型是基于如下步骤得到的：

6.根据权利要求1所述的异常语音识别方法，其特征在于，所述异常语义识别模型同时接入黑规则系统和白规则系统；所述黑规则系统用于对所述修正文本的异常文本命中的情况进行加分，用于快速确认异常文本；所述白规则系统用于对所述修正文本的异常文本命中的情况进行减分，用于快速确认非异常文本；

7.一种异常语音识别装置，其特征在于，包括：

8.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行权利要求1至6任一项所述的异常语音识别方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的异常语音识别方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的异常语音识别方法。

技术总结
本申请涉及计算机领域，提供一种异常语音识别方法、装置、设备、介质及产品。该方法包括：基于调优后的自动语音识别模型将待识别语音转换为文本；在文本的文本困惑度大于预设阈值时，基于文本修正模型对文本进行修正得到修正文本；将修正文本输入至异常语义识别模型中，得到待识别语音的识别结果；识别结果包括待识别语音是否异常和/或待识别语音的异常类型；自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的。本申请通过调优后的自动语音识别模型进行文本转换，提高了文本转换的准确度；通过将低质量文本进行修正后再输入异常语义识别模型中，可以使异常语义识别模型更易识别异常文本，提高了异常语音识别的准确度。

技术研发人员：叶鹏,张奕林,孙超,宋冬冬,严昱超,余立,蒋健
受保护的技术使用者：中国移动通信集团浙江有限公司
技术研发日：
技术公布日：2024/10/31

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶鹏,张奕林,孙超,宋冬冬,严昱超,余立,蒋健
技术所有人：中国移动通信集团浙江有限公司
我是此专利的发明人

上一篇：一种具有电活性的眼霜及其制备方法与流程
上一篇：一种导管用球囊和球囊扩张导管的制作方法