模型自学习迭代方法、装置、设备及介质与流程

文档序号：35869891发布日期：2023-10-28 01:56阅读：36来源：国知局

本发明涉及人工智能，尤其涉及一种模型自学习迭代方法、装置、设备及介质。

背景技术：

1、目前，电信网络诈骗长期处于高发态势，人民群众财产安全面临严重威胁。其中，电话诈骗是最普遍、后果最严重的一种。

2、但由于电话诈骗组织严密、诈骗手段隐蔽、犯罪涉案链条长，打击治理难；且对电话诈骗的事后打击并未达到治标治本的目标。现有的电话诈骗号码模型，采用多个算法同时建模，但未考虑到诈骗方法和手段在不断更新，根据旧的诈骗手段训练的识别模型，难以准确识别出最新的诈骗手法的诈骗号码。

3、基于现有的电话诈骗号码识别模型存在的弊端，亟需识别准确率高，且能够适应不断更新的诈骗手法的电话诈骗号码识别技术。

技术实现思路

1、本发明提供一种模型自学习迭代方法、装置、设备及介质，用以解决现有的诈骗号码识别技术准确率低的缺陷，实现提升诈骗号码识别准确率。

2、本发明提供一种模型自学习迭代方法，包括：

3、获取预测诈骗号码中实际被通报的实际诈骗号码数、号码关停后的投诉用户数和号码关停后的复通号码数；

4、将所述实际诈骗号码数、所述投诉用户数和所述复通号码数输入至预先构建的模型重优化函数中，得到模型重优化值；

5、若所述模型重优化参数值小于预设阈值，则触发自学习迭代优化流程，以更新目标诈骗电话号码识别模型；

6、其中，所述预测诈骗号码是基于目标诈骗电话号码识别模型得到的。

7、根据本发明提供的一种模型自学习迭代方法，将所述实际诈骗号码数、所述投诉用户数和所述复通号码数输入至模型重优化函数中，得到模型重优化值，包括：

8、将所述实际诈骗号码数和所述目标诈骗电话号码识别模型预测正确的正样本数输入至所述模型重优化函数中的第一计算部，得到所述第一计算部输出的正样本的覆盖率；

9、将所述目标诈骗电话号码识别模型预测正确的正样本数和所述目标诈骗电话号码识别模型推送至关停平台的推送号码数输入至所述模型重优化函数中的第二计算部，得到所述第二计算部输出的模型召回率；

10、将所述投诉用户数和所述目标诈骗电话号码识别模型推送至关停平台的推送号码数输入至所述模型重优化函数中的第三计算部，得到所述第三计算部输出的投诉率；

11、将所述复通号码数和申请复通的号码数输入至所述模型重优化函数中的第四计算部，得到所述第四计算部输出的复通成功率。

12、根据本发明提供的一种模型自学习迭代方法，所述自学习迭代优化流程，包括：

13、获取诈骗电话的通话特征；

14、基于所述通话特征对应的正样本和负样本，确定多个诈骗电话号码识别模型；

15、基于所述正样本和所述负样本，确定多个诈骗电话号码识别模型；

16、根据模型投票机，对所述多个诈骗电话号码识别模型进行投票，得到所述目标诈骗电话号码识别模型。

17、根据本发明提供的一种模型自学习迭代方法，确定所述通话特征对应的正样本和负样本，包括：

18、获取待识别号码；

19、根据所述待识别号码和所述通话特征，确定最近预设时长内的被通报号码，并将所述最近预设时长内的被通报号码作为正样本；

20、根据所述待识别号码和所述通话特征，确定最近预设时长内的未被通报号码，并将所述未被通报号码作为负样本。

21、根据本发明提供的一种模型自学习迭代方法，根据所述待识别号码和所述通话特征，确定最近预设时长内的未被通报号码，并将所述未被通报号码作为负样本，包括：

22、根据所述待识别号码和所述通话特征，确定最近预设时长内的未被通报号码；

23、按照入网时长和所述入网时长对应的分箱占比，对所述被通报号码进行分箱抽样，得到分箱抽样后的未被通报号码，并将分箱抽样后的未被通报号码作为负样本；

24、其中，所述入网时长越短，所述入网时长对应的分箱占比越高。

25、根据本发明提供的一种模型自学习迭代方法，若所述模型重优化参数值小于预设阈值，则触发自学习迭代优化流程，以更新目标诈骗电话号码识别模型之后，包括：

26、获取待识别的全网用户号码；

27、对所述全网用户号码进行分箱抽样，得到近1月新入网的第一待识别号码、近3月新入网的第二待识别号码、近6月新入网的第三待识别号码、近1年新入网的第四待识别号码、近2年新入网的第五待识别号码和大于2年入网的第六待识别号码；

28、根据更新后的目标诈骗号码识别模型，依次对所述第一待识别号码、所述第二待识别号码、所述第三待识别号码、所述第四待识别号码、所述第五待识别号码和所述第六待识别号码进行预测识别。

29、本发明还提供一种模型自学习迭代装置，包括：

30、参数获取模块，用于获取预测诈骗号码中实际被通报的实际诈骗号码数、号码关停后的投诉用户数和号码关停后的复通号码数；

31、模型重优化值计算模块，用于将所述实际诈骗号码数、所述投诉用户数和所述复通号码数输入至预先构建的模型重优化函数中，得到模型重优化值；

32、自学习迭代模块，用于若所述模型重优化参数值小于预设阈值，则触发自学习迭代优化流程，以更新目标诈骗电话号码识别模型；

33、其中，所述预测诈骗号码是基于目标诈骗电话号码识别模型得到的。

34、本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述模型自学习迭代方法。

35、本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述模型自学习迭代方法。

36、本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述模型自学习迭代方法。

37、本发明提供的模型自学习迭代方法、装置、设备及介质，为了应对电话诈骗的实时性要求，通过为模型优化设置了一个启动条件，即，根据预先构建的模型重优化函数，计算模型重优化值，在模型重优化值小于预设阈值时，满足启动条件，启动模型自优化流程，触发目标诈骗电话号码识别模型的自学习迭代流程，以进行更新该目标诈骗电话号码识别模型，实现了对模型实时更新，能够不断适应日期变化的诈骗手段，通过不断自学习的方式来迭代优化模型，从而解决现有的诈骗号码识别技术准确率低的缺陷，实现提升诈骗号码识别准确率。同时，模型重优化值考虑了模型预测诈骗号码中实际被通报的实际诈骗号码数、号码关停后的投诉用户数和号码关停后的复通号码数，综合考虑了多个因素对模型进行综合评估，提升了模型的准确率。

技术特征：

1.一种模型自学习迭代方法，其特征在于，包括：

2.根据权利要求1所述的模型自学习迭代方法，其特征在于，将所述实际诈骗号码数、所述投诉用户数和所述复通号码数输入至模型重优化函数中，得到模型重优化值，包括：

3.根据权利要求1所述的模型自学习迭代方法，其特征在于，所述自学习迭代优化流程，包括：

4.根据权利要求3所述的模型自学习迭代方法，其特征在于，确定所述通话特征对应的正样本和负样本，包括：

5.根据权利要求4所述的模型自学习迭代方法，其特征在于，根据所述待识别号码和所述通话特征，确定最近预设时长内的未被通报号码，并将所述未被通报号码作为负样本，包括：

6.根据权利要求1所述的模型自学习迭代方法，其特征在于，若所述模型重优化参数值小于预设阈值，则触发自学习迭代优化流程，以更新目标诈骗电话号码识别模型之后，包括：

7.一种模型自学习迭代装置，其特征在于，包括：

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述模型自学习方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述模型自学习方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述模型自学习方法。

技术总结
本发明提供一种模型自学习迭代方法、装置、设备及介质，方法包括：获取预测诈骗号码中实际被通报的实际诈骗号码数、号码关停后的投诉用户数和号码关停后的复通号码数；将所述实际诈骗号码数、所述投诉用户数和所述复通号码数输入至预先构建的模型重优化函数中，得到模型重优化值；若所述模型重优化参数值小于预设阈值，则触发自学习迭代优化流程，以更新目标诈骗电话号码识别模型；其中，所述预测诈骗号码是基于目标诈骗电话号码识别模型得到的。本发明通过不断自学习的方式来迭代优化模型，不断适应日期变化的诈骗手段，从而解决现有的诈骗号码识别技术准确率低的缺陷，实现提升诈骗号码识别准确率。

技术研发人员：朱一珍,陈雅娟,陈智扬,张晓川,邓逸斌,麦健
受保护的技术使用者：中国移动通信集团广东有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱一珍陈雅娟陈智扬张晓川邓逸斌麦健
技术所有人：中国移动通信集团有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。