本发明涉及图纸处理方法,具体涉及一种cad文件脱敏方法及系统。
背景技术:
1、工程设计、图纸绘制、模型建立时,广泛利用cad(computer aided design,计算机辅助设计)软件产出的各种cad文件如各类图纸来指导项目施工和工程建造。在一些大型项目如铁路建设、桥梁建造、隧道建造中,为了方便绘制以及后续项目推进,从地质勘测到工程设计所产生的海量cad文件大都存在各种标注的敏感信息,例如大地坐标、各类敏感关键词(油库、靶场、气象站)等,通过大地坐标反推经纬度,加上关键词即可对图纸中的设施内容与地点精准定位。
2、随着当前数字化转型与信息化发展的需要,勘察设计单位必要时需要公布cad文件,如以档案或知识库的形式通过互联网进行传播再利用,为专业设计人员提供参考。但若直接将这些cad文件上传至公网,其上所带有的大地坐标、关键字等敏感信息势必存在严重的泄密风险。因此,在cad文件上传至公网前首先需要对其进行脱敏处理。以设计院的地形图等复杂图纸为例,这类cad文件存在上百个图层,敏感信息分布在各个cad文件的各个图层之中,若是以手动方式对其每一个cad文件的每一个图层进行检查和脱敏,将耗费大量人力物力成本,且人工脱敏准确性也无法百分之百保证。
3、所以,有必要提出一种cad文件脱敏方法,克服上述技术缺陷。
技术实现思路
1、本发明的目的是提供一种cad文件脱敏方法及系统,以解决人工检查和脱敏存在的费时费力、准确度低等问题。
2、为了达到上述目的,本发明所采用的技术方案为:
3、cad文件脱敏方法,所述方法包括:
4、获取cad文件并备份;
5、读取cad文件所有图层判断是否为带坐标地形图;
6、判断为是,通过图层坐标过滤器按图层筛选坐标信息并删除,之后通过图层关键字过滤器按图层筛选敏感信息并删除;
7、判断为否,直接通过图层关键字过滤器按图层筛选敏感信息并删除。
8、进一步地,获取cad文件并备份,包括:
9、批量导入文件;
10、对于cad文件,直接从本地文件夹导入;
11、对于压缩文件,解压并存储至临时tmp文件夹,选取其中的cad文件从临时tmp文件夹导入。
12、进一步地,读取cad文件所有图层判断是否为带坐标地形图,包括:
13、读取一个cad文件;
14、读取cad文件所有图层;
15、根据预设条件判断是否为带坐标地形图,预设条件包括是否存在坐标网格、是否具有等高线、是否为勘探设计行业所规定的带坐标特殊图层,满足至少一个预设条件即判断为是。
16、进一步地,通过图层坐标过滤器按图层筛选坐标信息并删除,包括:
17、根据cad绘图协议筛选坐标信息所在图层;
18、在筛选出的图层中提取文本实体;
19、设置图层坐标过滤器,并预设坐标字符串格式;
20、利用图层坐标过滤器按照文本实体的id遍历所有文本实体;
21、根据预设坐标字符串格式判断文本实体内容是否为坐标信息;
22、判断为是的,将其id加入到待删除数据集。
23、进一步地,通过图层关键字过滤器按图层筛选敏感信息并删除,包括:
24、从图层中提取文本实体;
25、设置图层关键字过滤器,并预设敏感关键字;
26、利用图层关键字过滤器按照文本实体的id遍历所有文本实体;
27、根据预设敏感关键字判断文本实体内容是否为敏感信息;
28、判断为是的,将其id加入到待删除数据集。
29、进一步地,所述方法按图层筛选坐标信息或敏感信息时,并行对所有图层进行筛选。
30、进一步地,所述方法统一根据待删除数据集中的id对对应的文本实体内容进行删除。
31、进一步地,坐标字符串包括方位标识和数字坐标,根据预设坐标字符串格式判断文本实体内容是否为坐标信息的过程为:
32、文本实体内容包括方位标识和数字坐标,判断为是;
33、文本实体内容中,若方位标识与数字坐标为一个文本字符串,则直接将其id加入到待删除数据集;若方位标识与数字坐标为不同文本字符串,则方位标识文本的id加入到待删除数据集,数字坐标文本通过弹窗提示后人工判断。
34、进一步地,读取cad文件所有图层时,对于关闭、冻结或锁定的图层进行开启、解冻或解锁;
35、脱敏之后,对前期开启、解冻或解锁的图层进行恢复。
36、另一方面,提供cad文件脱敏系统,所述系统用于实施所述的方法,包括:
37、获取备份模块,用于获取cad文件并备份;
38、读取判断模块,用于读取cad文件所有图层判断是否为带坐标地形图;
39、带坐标cad图脱敏模块,用于判断为是时,通过图层坐标过滤器按图层筛选坐标信息并删除,之后通过图层关键字过滤器按图层筛选敏感信息并删除;
40、非带坐标cad图脱敏模块,用于判断为否时,通过图层关键字过滤器按图层筛选敏感信息并删除。
41、与现有技术相比,本发明的有益效果如下:
42、本发明提供了一种cad文件脱敏方法及系统,结合cad文件的特点,分析敏感信息图层与数据内容特征,在不影响cad文件原有信息内容的前提下,对敏感信息进行批量脱敏,保证cad文件在公网上的信息安全。相较于人工逐图逐层操作,效率更高,准确度也有保障。
1.cad文件脱敏方法,其特征在于:
2.根据权利要求1所述的cad文件脱敏方法,其特征在于:
3.根据权利要求2所述的cad文件脱敏方法,其特征在于:
4.根据权利要求3所述的cad文件脱敏方法,其特征在于:
5.根据权利要求4所述的cad文件脱敏方法,其特征在于:
6.根据权利要求5所述的cad文件脱敏方法,其特征在于:
7.根据权利要求6所述的cad文件脱敏方法,其特征在于:
8.根据权利要求7所述的cad文件脱敏方法,其特征在于:
9.根据权利要求8所述的cad文件脱敏方法,其特征在于:
10.cad文件脱敏系统,其特征在于: