敏感数据的识别模型的获取方法、装置、电子设备及介质与流程

文档序号:36783496发布日期:2024-01-23 11:57阅读:来源:国知局

技术特征:

1.一种敏感数据的识别模型的获取方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述非涉敏类型或不同涉敏类型的数据字段包括英文名字段、中文名字段和数据内容字段。

3.如权利要求1所述的方法,其特征在于,对任一类型的数据字段进行分词处理,得到相应类型的不同样本分词的文本向量,包括:

4.如权利要求1所述的方法,其特征在于,得到敏感信息识别模型之后,所述方法还包括:

5.如权利要求1所述的方法,其特征在于,获取训练样本和相应样本标注信息构建的样本数据集,构建样本数据集,包括:

6.一种敏感数据的识别模型的获取装置,其特征在于,所述装置包括:

7.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法。


技术总结
本申请涉及数据处理技术领域,提供了一种敏感数据的识别模型的获取方法、装置、电子设备及介质。该方法在获取训练样本和相应样本标注信息构建的样本数据集后,训练样本包括非涉敏和不同涉敏类型的数据字段,对任一类型的数据字段进行分词处理,得到相应类型的不同样本分词的文本向量;之后,基于不同类型下不同样本分词的文本向量和相应的样本标注信息,对待训练的深度学习模型进行迭代训练,得到敏感信息识别模型。该方法可实时识别敏感信息字段,高效地实现敏感数据的动态脱敏。

技术研发人员:翁志鹏,洪建帮,陈春旺,伍思文,罗卓尔,裴雷,陈志,金鑫,代军堂,丁有韬,王悦,丁征涛,李系能,张方昌
受保护的技术使用者:东亚银行(中国)有限公司
技术研发日:
技术公布日:2024/1/22
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1