敏感数据的识别模型的获取方法、装置、电子设备及介质与流程

文档序号：36783496发布日期：2024-01-23 11:57阅读：来源：国知局

技术特征：

1.一种敏感数据的识别模型的获取方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述非涉敏类型或不同涉敏类型的数据字段包括英文名字段、中文名字段和数据内容字段。

3.如权利要求1所述的方法，其特征在于，对任一类型的数据字段进行分词处理，得到相应类型的不同样本分词的文本向量，包括：

4.如权利要求1所述的方法，其特征在于，得到敏感信息识别模型之后，所述方法还包括：

5.如权利要求1所述的方法，其特征在于，获取训练样本和相应样本标注信息构建的样本数据集，构建样本数据集，包括：

6.一种敏感数据的识别模型的获取装置，其特征在于，所述装置包括：

7.一种电子设备，其特征在于，所述电子设备包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法。

技术总结
本申请涉及数据处理技术领域，提供了一种敏感数据的识别模型的获取方法、装置、电子设备及介质。该方法在获取训练样本和相应样本标注信息构建的样本数据集后，训练样本包括非涉敏和不同涉敏类型的数据字段，对任一类型的数据字段进行分词处理，得到相应类型的不同样本分词的文本向量；之后，基于不同类型下不同样本分词的文本向量和相应的样本标注信息，对待训练的深度学习模型进行迭代训练，得到敏感信息识别模型。该方法可实时识别敏感信息字段，高效地实现敏感数据的动态脱敏。

技术研发人员：翁志鹏,洪建帮,陈春旺,伍思文,罗卓尔,裴雷,陈志,金鑫,代军堂,丁有韬,王悦,丁征涛,李系能,张方昌
受保护的技术使用者：东亚银行（中国）有限公司
技术研发日：
技术公布日：2024/1/22

完整全部详细技术资料下载

当前第2页1 2