基于人工智能的敏感信息检测方法、装置、设备及介质与流程

文档序号：36055738发布日期：2023-11-17 20:30阅读：54来源：国知局

本发明涉及人工智能，尤其涉及一种基于人工智能的敏感信息检测方法、装置、设备及介质。

背景技术：

1、随着人工智能技术的兴起，线上作业的方式已广泛应用于金融服务平台中，金融服务平台可以是保险系统、银行系统、交易系统、订单系统等，金融服务平台可以支持购物、社交、互动游戏、资源转移等功能，还可以具有申请贷款、信用卡或者购买保险、理财产品等功能。

2、线上作业可以包括企业线上会议、线上销售等，线上作业的方式避免了人员的面对面沟通，省去了线下会面的繁琐，而且能够保证图像数据和文本数据等实时共享，从而能够有效提高人员沟通的便捷性。

3、但是，在金融服务场景下，线上作业进行数据共享时，所共享的数据通常包含金融类数据，例如合同数据、保单数据、交易记录数据等，可能存在敏感信息，而线上作业的方式会受到监管，出现敏感信息的展示可能会给人员所属单位带来风险，现有的敏感信息检测方法通常是预先通过审核人员为数据设置标识，在线上共享时若数据存在标识，则认为该数据不存在敏感信息，但是，人为设置标识的方式将消耗大量的人力资源，而且会受到审核人员主观因素的影响，导致敏感信息检测的效率和准确率较低，因此，如何提高敏感信息检测的准确率和效率成为亟待解决的问题。

技术实现思路

1、有鉴于此，本发明实施例提供了一种基于人工智能的敏感信息检测方法、装置、设备及介质，以解决敏感信息检测的效率和准确率较低的问题。

2、第一方面，本发明实施例提供一种基于人工智能的敏感信息检测方法，所述敏感信息检测方法包括：

3、从获取的目标图像中提取得到至少一个初始字符串，针对任一个初始字符串，将所述初始字符串输入到训练好的敏感分类模型中，输出所述初始字符串的第一敏感分类结果及其第一分类概率；

4、在预设位置对所述初始字符串进行遮挡，得到遮挡结果，将所述遮挡结果输入训练好的生成模型中进行字符生成，得到参考字符串；

5、将所述参考字符串输入到所述训练好的敏感分类模型中，输出所述参考字符串对应的第二敏感分类结果及其第二分类概率；

6、通过预设的映射表，将所述第一敏感分类结果和所述第二敏感分类结果映射为分类权重，所述映射表包括所述第一敏感分类结果和所述第二敏感分类结果与所述分类权重的映射关系；

7、计算所述第一分类概率和所述第二分类概率的均值，将所述分类权重和所述均值相乘，确定相乘结果为对应所述初始字符串的更新分类概率，遍历所有初始字符串，得到所有初始字符串的更新分类概率；

8、若检测到所有的更新分类概率中存在大于预设概率阈值的更新分类概率，则确定所述目标图像包含敏感信息。

9、第二方面，本发明实施例提供一种基于人工智能的敏感信息检测装置，所述敏感信息检测装置包括：

10、第一敏感分类模块，用于从获取的目标图像中提取得到至少一个初始字符串，针对任一个初始字符串，将所述初始字符串输入到训练好的敏感分类模型中，输出所述初始字符串的第一敏感分类结果及其第一分类概率；

11、字符串遮挡模块，用于在预设位置对所述初始字符串进行遮挡，得到遮挡结果，将所述遮挡结果输入训练好的生成模型中进行字符生成，得到参考字符串；

12、第二敏感分类模块，用于将所述参考字符串输入到所述训练好的敏感分类模型中，输出所述参考字符串对应的第二敏感分类结果及其第二分类概率；

13、权重映射模块，用于通过预设的映射表，将所述第一敏感分类结果和所述第二敏感分类结果映射为分类权重，所述映射表包括所述第一敏感分类结果和所述第二敏感分类结果与所述分类权重的映射关系；

14、概率更新模块，用于计算所述第一分类概率和所述第二分类概率的均值，将所述分类权重和所述均值相乘，确定相乘结果为对应所述初始字符串的更新分类概率，遍历所有初始字符串，得到所有初始字符串的更新分类概率；

15、敏感信息检测模块，用于若检测到所有的更新分类概率中存在大于预设概率阈值的更新分类概率，则确定所述目标图像包含敏感信息。

16、第三方面，本发明实施例提供一种计算机设备，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的敏感信息检测方法。

17、第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的敏感信息检测方法。

18、本发明实施例与现有技术相比存在的有益效果是：

19、从获取的目标图像中提取得到至少一个初始字符串，针对任一个初始字符串，将初始字符串输入到训练好的敏感分类模型中，输出初始字符串的第一敏感分类结果及其第一分类概率，在预设位置对初始字符串进行遮挡，得到遮挡结果，将遮挡结果输入训练好的生成模型中进行字符生成，得到参考字符串，将参考字符串输入到训练好的敏感分类模型中，输出参考字符串对应的第二敏感分类结果及其第二分类概率，通过预设的映射表，将第一敏感分类结果和第二敏感分类结果映射为分类权重，计算第一分类概率和第二分类概率的均值，将分类权重和均值相乘，确定相乘结果为对应初始字符串的更新分类概率，遍历所有初始字符串，得到所有初始字符串的更新分类概率，若检测到所有的更新分类概率中存在大于预设概率阈值的更新分类概率，则确定目标图像包含敏感信息，对初始字符串进行遮挡，对遮挡结果进行字符生成，得到参考字符串，结合参考字符串和初始字符串的分类结果确定敏感信息的检测结果，能够对图像数据进行敏感信息的自动检测，而且能够避免数据上传方对敏感数据进行细微改动以规避敏感信息检测，从而有效提高了敏感信息识别的效率和准确率，提高了金融服务平台的可靠性和安全性。

技术特征：

1.一种基于人工智能的敏感信息检测方法，其特征在于，所述敏感信息检测方法包括：

2.根据权利要求1所述的敏感信息检测方法，其特征在于，所述从获取的目标图像中提取得到至少一个初始字符串包括：

3.根据权利要求2所述的敏感信息检测方法，其特征在于，所述将所述聚类结果中的所有初始字符进行排序，确定排序结果为所述初始字符串包括：

4.根据权利要求2所述的敏感信息检测方法，其特征在于，所述将所述初始字符串输入到训练好的敏感分类模型中，输出所述初始字符串的第一敏感分类结果及其第一分类概率包括：

5.根据权利要求4所述的敏感信息检测方法，其特征在于，在所述将所述第一分类概率对应的敏感分类子结果确定为所述第一敏感分类结果之后，还包括：

6.根据权利要求2所述的敏感信息检测方法，其特征在于，所述在预设位置对所述初始字符串进行遮挡，得到遮挡结果，将所述遮挡结果输入训练好的生成模型中进行字符生成，得到参考字符串包括：

7.根据权利要求1至6任一项所述的敏感信息检测方法，其特征在于，所述在预设位置对所述初始字符串进行遮挡，得到遮挡结果，将所述遮挡结果输入训练好的生成模型中进行字符生成，得到参考字符串包括：

8.一种基于人工智能的敏感信息检测装置，其特征在于，所述敏感信息检测装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的敏感信息检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的敏感信息检测方法。

技术总结
本发明涉及人工智能技术领域，尤其涉及一种基于人工智能的敏感信息检测方法、装置、设备及介质。该方法将从目标图像中提取的初始字符串输入敏感分类模型，得到第一敏感分类结果和第一分类概率，将遮挡后的初始字符串输入生成模型中，得到参考字符串，将参考字符串输入敏感分类模型，得到第二敏感分类结果和第二分类概率，将第一敏感分类结果和第二敏感分类结果映射为分类权重，根据第一分类概率、第二分类概率和分类权重，确定更新分类概率，在更新分类概率大于概率阈值时，确定检测到敏感信息，结合参考字符串和初始字符串的分类结果确定敏感信息检测结果，提高了敏感信息识别的准确率，提高了金融服务平台的可靠性和安全性。

技术研发人员：刘喜声
受保护的技术使用者：中国平安人寿保险股份有限公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘喜声
技术所有人：中国平安人寿保险股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。