基于高精度地图采集图片中敏感信息自动检测脱敏方法与流程

文档序号:29996612发布日期:2022-05-11 14:20阅读:761来源:国知局
基于高精度地图采集图片中敏感信息自动检测脱敏方法与流程

1.本发明涉及高精度地图制作领域,尤其涉及一种基于高精度地图采集图片中敏感信息自动检测脱敏方法。


背景技术:

2.高精度地图制作中,为确保公司生产的高精度导航电子地图及路测服务采集数据符合国家规范,需要对图中的文字标志牌进行检测以及敏感信息打标签,预先对高精度文字标志牌进行提取,使得高精度地图数据中不得存在敏感文字图片信息。
3.采用传统的方法进行目标提取时,会使得提取速度较慢,适用场景单一。


技术实现要素:

4.本发明针对现有技术中存在的技术问题,提供一种基于高精度地图采集图片中敏感信息自动检测脱敏方法,针对采集车采集到的图片中的敏感信息涉密关键字需要提取剔除进行图片脱敏的问题,本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏方法,对地图采集车采集的图片进行关键文字检测,完成图片中的关键文字信息的自动检测剔除操作,从而进行采集图片的文字信息自动提取脱敏;考虑在地图制作规范中,由于涉及到敏感文字信息较多,敏感文字信息涉及范围交广,所以在匹配敏感信息前,构建敏感文字信息表,能够辅助快速进行匹配。
5.根据本发明的第一方面,提供了一种基于高精度地图采集图片中敏感信息自动检测脱敏方法,包括:制作关键敏感文字表,所述关键敏感文字表存储有分类后的各个敏感文字内容;
6.提取采集车采集的系列图片帧中的文字标志牌,对所述文字标志牌中的文字进行识别后,将识别结果与所述关键敏感文字表进行搜索匹配,根据匹配结果确定所述文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
7.在上述技术方案的基础上,本发明还可以作出如下改进。
8.可选的,所述关键敏感文字表中的各个铭感文字内容进行分类包括:
9.根据内容信息进行分类,包括:重要地理位置、机密单位和公共安全设施;
10.根据内容的敏感类型进行分类,包括:敏感关键字和半固定敏感字。
11.可选的,所述制作关键敏感文字表还包括:构建分类标签与敏感文字内容的索引。
12.可选的,所述提取采集车采集的系列图片帧中的文字标志牌包括:
13.获取高精度地图采集车采集的系列图片帧;
14.基于所述系列图片帧中训练得到所述文字标志牌的目标检测模型,基于训练好的所述目标检测模型进行所述文字标志牌的提取,并对所述文字标志牌中的文字目标区域进行裁剪。
15.可选的,所述目标检测模型采用多层级的transformer视觉模型,基于自注意机制
的骨架架构进行目标检测,通过包围框提取图片帧中的文字标志牌中的几何信息,并获取该文字标志牌的包围框内裁剪的图片内容信息。
16.可选的,对所述文字标志牌剪裁后,对所述文字标志牌中的文字进行识别包括:
17.采用基于分割的文本检测网络,通过固定的阈值获取裁剪后的所述文字标志牌的二值化掩码图,提取所述掩码图中的轮廓获取句文字的位置信息,并获取该位置信息对应的图片内容信息;
18.对提取的所述句文字采用对序列预测的rnn网络进行文字识别,通过卷积神经网络提取检测得到的句文字小图片的特征,采用循环神经网络对序列进行预测,通过ctc算法的翻译层得到最终的文字识别结果。
19.可选的,所述对包含敏感文字内容的标志牌的图片帧进行局部模糊处理之后还包括:
20.将操作后的所述系列图片帧的文字标志牌几何信息以及其对应的所述分类信息反馈给高精度地图制作系统,使用局部模糊后的图片帧对原图片进行替换。
21.根据本发明的第二方面,提供一种基于高精度地图采集图片中敏感信息自动检测脱敏系统,包括:关键敏感文字表制作模块和模糊处理模块;
22.所述关键敏感文字表制作模块,用于制作关键敏感文字表,所述关键敏感文字表存储有分类后的各个敏感文字内容;
23.所述模糊处理模块,用于提取采集车采集的系列图片帧中的文字标志牌,对所述文字标志牌中的文字进行识别后,将识别结果与所述关键敏感文字表进行搜索匹配,根据匹配结果确定所述文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
24.根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现基于高精度地图采集图片中敏感信息自动检测脱敏方法的步骤。
25.根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现基于高精度地图采集图片中敏感信息自动检测脱敏方法的步骤。
26.本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏方法、系统、电子设备及存储介质,将序列帧图片中的文字标志牌检测后进行文字检测识别,使用深度学习模型较简单,能快速进行检测识别,耗时较短泛华能力强;同时,对敏感文字信息进行表制作能够加快敏感文字信息的匹配操作;对标志牌中的敏感文字信息检测识别,主要应用简单的cnn+rnn+ctc的深度学习模型检测,模型简单耗时较短,能够快速准确的识别文字标志牌中的敏感文字;将局部小敏感文字区域模糊化处理替换原来的帧图片,尽可能的保留了采集图片信息的完整性,又使得操作简单方便快捷。
附图说明
27.图1为本发明实施例提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏的流程图;
28.图2(a)为本发明实施例提供的高精度地图采集车采集的系列图片帧中的单帧图
片的示意图;
29.图2(b)为本发明实施例提供的经过文字标志牌提取以及标志牌内文字检测识别后的效果图;
30.图3(a)为本发明实施例提供的采集车采集的图片帧的示意图;
31.图3(b)为本发明实施例提供的图片中提取的文字信息的示意图;
32.图3(c)为本发明实施例提供的进行局部小区域模糊处理后的效果示意图;
33.图4为本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏的结构框图;
34.图5为本发明提供的一种可能的电子设备的硬件结构示意图;
35.图6为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
36.以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
37.图1为本发明实施例提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏方法的流程图,如图1所示,该自动检测脱敏方法包括:
38.制作关键敏感文字表,关键敏感文字表存储有分类后的各个敏感文字内容。
39.提取采集车采集的系列图片帧中的文字标志牌,对文字标志牌中的文字进行识别后,将识别结果与关键敏感文字表进行搜索匹配,根据匹配结果确定文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
40.针对采集车采集到的图片中的敏感信息涉密关键字需要提取剔除进行图片脱敏的问题,本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏方法,对地图采集车采集的图片进行关键文字检测,完成图片中的关键文字信息的自动检测剔除操作,从而进行采集图片的文字信息自动提取脱敏;考虑在地图制作规范中,由于涉及到敏感文字信息较多,敏感文字信息涉及范围交广,所以在匹配敏感信息前,构建敏感文字信息表,能够辅助快速进行匹配。
41.实施例1
42.本发明提供的实施例1为本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏方法的实施例,结合图2可知,该自动检测脱敏方法的实施例包括:
43.制作关键敏感文字表,关键敏感文字表存储有分类后的各个敏感文字内容。
44.在一种可能的实施例方式中,关键敏感文字表中的各个铭感文字内容进行分类包括:
45.根据内容信息进行分类,包括:重要地理位置、机密单位和公共安全设施。
46.根据内容的敏感类型进行分类,包括:敏感关键字和半固定敏感字。
47.在一种可能的实施例方式中,制作关键敏感文字表还包括:构建分类标签与敏感文字内容的索引。
48.具体实施中,该关键敏感文字表可以根据大量采集车采集的文字标志牌进行统计后人工确定。对所需要的关键敏感字进行分类,根据其敏感内容进行内容信息分类,包括重
要地理位置、机密单位、公共安全设施等进行分类制表。同时再对分类制表中继续对固定的敏感关键字(如供水)和半固定敏感字(如某某发电站)进行划分,构建标签-敏感文字内容索引。
49.提取采集车采集的系列图片帧中的文字标志牌,对文字标志牌中的文字进行识别后,将识别结果与关键敏感文字表进行搜索匹配,根据匹配结果确定文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
50.在一种可能的实施例方式中,提取采集车采集的系列图片帧中的文字标志牌包括:
51.获取高精度地图采集车采集的系列图片帧。
52.基于系列图片帧中训练得到文字标志牌的目标检测模型,基于训练好的目标检测模型进行文字标志牌的提取,并对文字标志牌中的文字目标区域进行裁剪。
53.在一种可能的实施例方式中,目标检测模型采用多层级的transformer视觉模型,基于自注意机制的骨架架构进行目标检测,通过包围框提取图片帧中的文字标志牌中的几何信息,并获取该文字标志牌的包围框内裁剪的图片内容信息。
54.用深度学习目标检测模型进行文字标志牌进行检测,速度较快,模型泛化能力强,能够适用于多种道路文字标志牌场景检测。
55.在一种可能的实施例方式中,对文字标志牌剪裁后,对文字标志牌中的文字进行识别包括:
56.采用基于分割的文本检测网络,通过固定的阈值获取裁剪后的文字标志牌的二值化掩码图,提取掩码图中的轮廓获取句文字的位置信息,并获取该位置信息对应的图片内容信息。
57.对提取的句文字采用对序列预测的rnn网络进行文字识别,通过卷积神经网络提取检测得到的句文字小图片的特征,采用循环神经网络对序列进行预测,通过ctc(connectionist temporal classification,基于神经网络的时序分类)算法的翻译层得到最终的文字识别结果。
58.对标志牌中的敏感文字信息检测识别,主要应用简单的cnn+rnn+ctc的深度学习模型检测,主要是模型简单耗时较短,能够快速准确的识别文字标志牌中的敏感文字。然后采用对敏感文字局部小区域模糊处理了,既保留了原始的图片信息,又使得操作简单方便快捷。
59.在一种可能的实施例方式中,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理之后还包括:
60.将操作后的系列图片帧的文字标志牌几何信息以及其对应的分类信息反馈给高精度地图制作系统,使用局部模糊后的图片帧对原图片进行替换,即可完成敏感文字信息自动检测以及脱敏。
61.图2为采集车采集的图片中文字标志牌提取以及其内对应的文字检测识别,图2(a)为本发明实施例提供的高精度地图采集车采集的系列图片帧中的单帧图片的示意图,图2(b)为本发明实施例提供的经过文字标志牌提取以及标志牌内文字检测识别后的效果图。
62.图3为采集车敏感文字模糊操作图,图3(a)为本发明实施例提供的采集车采集的图片帧的示意图;图3(b)为本发明实施例提供的图片中提取的文字信息的示意图;图3(c)为本发明实施例提供的进行局部小区域模糊处理后的效果示意图;图3(c)中以图片中的“危险品车辆”为例,若“危险品车辆”在敏感文字信息表中,则进行局部小区域模糊处理。
63.实施例2
64.本发明提供的实施例2为本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏系统的实施例,图4为本发明实施例提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏系统结构图,结合图4可知,该自动检测脱敏系统的实施例包括:关键敏感文字表制作模块和模糊处理模块。
65.关键敏感文字表制作模块,用于制作关键敏感文字表,关键敏感文字表存储有分类后的各个敏感文字内容。
66.模糊处理模块,用于提取采集车采集的系列图片帧中的文字标志牌,对文字标志牌中的文字进行识别后,将识别结果与关键敏感文字表进行搜索匹配,根据匹配结果确定文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
67.可以理解的是,本发明提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏系统与前述各实施例提供的基于高精度地图采集图片中敏感信息自动检测脱敏方法相对应,基于高精度地图采集图片中敏感信息自动检测脱敏系统的相关技术特征可参考基于高精度地图采集图片中敏感信息自动检测脱敏方法的相关技术特征,在此不再赘述。
68.请参阅图5,图5为本发明实施例提供的电子设备的实施例示意图。如图5所示,本发明实施例提了一种电子设备,包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的计算机程序1311,处理器1320执行计算机程序1311时实现以下步骤:制作关键敏感文字表,关键敏感文字表存储有分类后的各个敏感文字内容;提取采集车采集的系列图片帧中的文字标志牌,对文字标志牌中的文字进行识别后,将识别结果与关键敏感文字表进行搜索匹配,根据匹配结果确定文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
69.请参阅图6,图6为本发明提供的一种计算机可读存储介质的实施例示意图。如图6所示,本实施例提供了一种计算机可读存储介质1400,其上存储有计算机程序1411,该计算机程序1411被处理器执行时实现如下步骤:制作关键敏感文字表,关键敏感文字表存储有分类后的各个敏感文字内容;提取采集车采集的系列图片帧中的文字标志牌,对文字标志牌中的文字进行识别后,将识别结果与关键敏感文字表进行搜索匹配,根据匹配结果确定文字标志牌是否具有敏感文字内容,并在判定具有敏感文字内容时确定其对应的分类信息,对包含敏感文字内容的标志牌的图片帧进行局部模糊处理。
70.本发明实施例提供的一种基于高精度地图采集图片中敏感信息自动检测脱敏方法、系统、电子设备及存储介质,采用的transformer的目标检测方法对文字标志牌进行包围框的预测获取。然后对裁剪的文字标志牌区域进行文字检测识别,再与敏感文字制作的表进行匹配搜索,获取包含敏感文字信息的文字标志牌进行敏感文字信息分类标记和局部敏感文字小区域模糊,即可完成高精度地图采集图片中敏感信息自动检测脱敏操作。用深
度学习目标检测模型进行文字标志牌进行检测,速度较快,模型泛化能力强,能够适用于多种道路文字标志牌场景检测。对标志牌中的敏感文字信息检测识别,主要应用简单的cnn+rnn+ctc的深度学习模型检测,模型简单耗时较短,能够快速准确的识别文字标志牌中的敏感文字。采用对敏感文字局部小区域模糊处理了,既保留了原始的图片信息,又使得操作简单方便快捷。
71.需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
72.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
73.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
74.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
75.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
76.尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
77.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1