基于大模型的话务违规检测方法、装置及可读存储介质与流程

文档序号：37927990发布日期：2024-05-11 00:07阅读：48来源：国知局

本发明涉及人工智能，具体而言，涉及一种基于大模型的话务违规检测方法、装置及可读存储介质。

背景技术：

1、随着通信技术的发展，电话服务已经成为我们生活中不可或缺的一部分。然而，这也导致了各种违规行为的增加，比如垃圾广告电话、骚扰电话等。这些行为严重影响了用户的通话体验，甚至可能对用户造成实际的损失。因此，开发有效的违规行为检测方法是非常必要的。然而，传统的违规行为检测方法往往依赖于人工审核，效率低下，准确率也不能保证。近年来，虽然有一些基于机器学习的检测方法被提出，但是这些方法通常需要大量的标注数据，且对于新出现的违规行为的检测能力有限。因此，如何有效地检测电话服务中的违规行为，仍然是一个待解决的问题。

技术实现思路

1、本发明的目的在于提供一种基于大模型的话务违规检测方法、装置及可读存储介质。

2、第一方面，本发明实施例提供一种基于大模型的话务违规检测方法，包括：

3、获取待检测话务内容；

4、将所述待检测话务内容输入预先训练的话务违规检测模型，输出所述待检测话务内容的检测结果，所述话务违规检测模型是基于有监督微调大模型训练得到的；

5、根据所述检测结果，判断所述待检测话务内容的违规类型。

6、在一种可能的实施方式中，所述获取待检测话务内容，包括：

7、获取待检测通话内容；

8、将所述待检测通话内容进行语音转文字操作，得到所述待检测话务内容。

9、在一种可能的实施方式中，所述话务违规检测模型是通过以下方式得到的，包括：

10、调用生成式模型生成话务相关的种子数据；

11、利用预设语言大模型对所述种子数据进行处理，得到话务训练数据；

12、基于所述话务训练数据结合初始大模型进行训练，得到所述话务违规检测模型。

13、在一种可能的实施方式中，所述利用预设语言大模型对所述种子数据进行处理，得到话务训练数据，包括：

14、针对所述预设语言大模型设计提示词，以使所述预设语言大模型针对所述话务相关的种子数据进行不断生成和自我审核操作，得到所述话务训练数据。

15、在一种可能的实施方式中，所述基于所述话务训练数据结合初始大模型进行训练，得到所述话务违规检测模型，包括：

16、基于所述话务训练数据对所述初始大模型进行训练，得到中间大模型；

17、对所述中间大模型进行有监督微调处理，得到所述话务违规检测模型。

18、在一种可能的实施方式中，所述根据所述检测结果，判断所述待检测话务内容的违规类型，包括：

19、当所述检测结果包括预置敏感内容时，判定所述待检测话务内容的违规类型为泄露隐私类型；

20、当所述检测结果包括预置广告内容时，判定所述待检测话务内容的违规类型为垃圾广告类型；

21、当所述检测结果包括预置非法内容时，判定所述待检测话务内容的违规类型为非法活动类型。

22、在一种可能的实施方式中，所述方法还包括：

23、当所述待检测话务内容的违规类型为泄露隐私类型时，采取第一措施；

24、当所述待检测话务内容的违规类型为垃圾广告类型时，采取第二措施；

25、当所述待检测话务内容的违规类型为非法活动类型时，采取第三措施。

26、第二方面，本发明实施例提供一种基于大模型的话务违规检测装置，包括：

27、获取模块，用于获取待检测话务内容；

28、检测模块，用于将所述待检测话务内容输入预先训练的话务违规检测模型，输出所述待检测话务内容的检测结果，所述话务违规检测模型是基于有监督微调大模型训练得到的；根据所述检测结果，判断所述待检测话务内容的违规类型。

29、第三方面，本发明实施例提供一种计算机设备，所述计算机设备包括处理器及存储有计算机指令的非易失性存储器，所述计算机指令被所述处理器执行时，所述计算机设备执行第一方面至少一种可能的实施方式中所述的基于大模型的话务违规检测方法。

30、第四方面，本发明实施例提供一种可读存储介质，所述可读存储介质包括计算机程序，所述计算机程序运行时控制所述可读存储介质所在计算机设备执行第一方面至少一种可能的实施方式中所述的基于大模型的话务违规检测方法。

31、相比现有技术，本发明提供的有益效果包括：采用本发明公开的一种基于大模型的话务违规检测方法、装置及可读存储介质，通过获取待检测的话务内容，然后将这些内容输入预先训练的话务违规检测模型。这个模型是通过有监督微调大模型训练得到的。模型会输出待检测话务内容的检测结果。根据这些检测结果，我们可以判断待检测话务内容的违规类型。这种方法有效地解决了电话服务中违规行为的检测问题，增强了用户的通话体验。

技术特征：

1.一种基于大模型的话务违规检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取待检测话务内容，包括：

3.根据权利要求1所述的方法，其特征在于，所述话务违规检测模型是通过以下方式得到的，包括：

4.根据权利要求3所述的方法，其特征在于，所述利用预设语言大模型对所述种子数据进行处理，得到话务训练数据，包括：

5.根据权利要求3所述的方法，其特征在于，所述基于所述话务训练数据结合初始大模型进行训练，得到所述话务违规检测模型，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述检测结果，判断所述待检测话务内容的违规类型，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

8.一种基于大模型的话务违规检测装置，其特征在于，包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器及存储有计算机指令的非易失性存储器，所述计算机指令被所述处理器执行时，所述计算机设备执行权利要求1-7中任意一项所述的基于大模型的话务违规检测方法。

10.一种可读存储介质，其特征在于，所述可读存储介质包括计算机程序，所述计算机程序运行时控制所述可读存储介质所在计算机设备执行权利要求1-7中任意一项所述的基于大模型的话务违规检测方法。

技术总结
本发明公开了一种基于大模型的话务违规检测方法、装置及可读存储介质，包括：首先获取待检测的话务内容，然后将这些内容输入预先训练的话务违规检测模型。这个模型是通过有监督微调大模型训练得到的。模型会输出待检测话务内容的检测结果。根据这些检测结果，我们可以判断待检测话务内容的违规类型。这种方法有效地解决了电话服务中违规行为的检测问题，增强了用户的通话体验。

技术研发人员：华旭明,姜睿思,蔡奕杰,尚璟铭,谢淋,丁超仁,李嘉辉
受保护的技术使用者：上海创帧软件有限公司
技术研发日：
技术公布日：2024/5/10

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：华旭明,姜睿思,蔡奕杰,尚璟铭,谢淋,丁超仁,李嘉辉
技术所有人：上海创帧软件有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。