基于检查图像的医疗图像脱敏方法与流程

文档序号:30967634发布日期:2022-07-30 19:07阅读:335来源:国知局
基于检查图像的医疗图像脱敏方法与流程

1.本发明涉及基于检查图像的医疗图像脱敏方法。


背景技术:

2.当下,随着大数据与互联网的迅速发展,网络信息增长,我国在网络信息安全方面面临者巨大的挑战。医疗行业网络安全存在的问题之一就是数据加密措施未落实,缺乏必要的系统防护。医疗信息包含大量敏感数据,在收集、存储、传输过程中若未实施有效的加密措施,信息将处于极大的泄露风险中。
3.医疗行业产出大量的检查图像,而在这些检查图像中包含着大量的病人隐私信息,例如,病人的姓名,病案号,门诊号等,针对这些信息,需要对其进行脱敏处理,现有技术对检查图像中病人隐私信息采用的方法一般为:打开图像-运用工具手动脱敏-保存脱敏图片。上述操作针对大量的图像数据,人工成本高且耗费时间长。鉴于此,本发明基于计算机视觉处理技术(特征提取、图像预处理等)实现对检测图像的自动数据脱敏。
4.医疗行业ct影像文件主要数据格式是dicom,现有技术针对此格式图像实现了数据脱敏,但医疗行业也存在着大量png、jpg等格式的检查图像数据,现有技术需要考虑检查图像的脱敏问题。


技术实现要素:

5.本发明所要解决的技术问题总的来说是提供一种基于检查图像的医疗图像脱敏方法。针对目前医疗脱敏系统尚未得到普及,人工脱敏效率低等问题,使用计算机视觉处理技术,基于pycharm开发平台和opencv库,实现检查文档图像敏感信息的自动脱敏。该算法脱敏精度为95%,达到场景应用要求。
6.图像预处理,进行图像二值化,梯度计算,滤波等处理,截取敏感信息图像并制作脱敏信息数据库,提取图像的特征,采用特征匹配算法获得敏感信息位置,通过获得位置信息进行敏感信息的脱敏。
7.图像二值化:是指将图像上的像素点的灰度值设置为0或255,使得整个图像呈现出明显的黑白效果。
8.图像特征提取:特征提取是指使用计算机提取图像中属于特征性的信息的方法及过程。
9.特征匹配:提取图像的特征,然后匹配相同或者相似的特征的过程。
10.为解决上述问题,本发明所采取的技术方案是:一种基于检查图像的医疗图像脱敏方法,包括以下步骤:s1,判断原始图像是否可读;s2,若原始图像可读,则对提供的原始图像进行数据预处理,获得原始图像的二值化图像;s3,处理二值化图像,对敏感信息进行截切,并采用sift进行特征检测,提取检查
图像,获得关键点与图像描述符,并获得脱敏信息数据库,其中,截取预处理后的图像里的敏感信息,提取需要脱敏的信息的特征,获得特征描述符,组成脱敏信息库;s4,首先,将获得图像描述符与脱敏信息数据库的图像描述符进行特征匹配,获得需要脱敏的信息区域;然后,在特征匹配过程中,采用快速最近邻搜索进行特征匹配:s5,对匹配的脱敏信息区域后面的内容进行数据脱敏;若脱敏成功的,则获取脱敏后的图像,若不成功的话,提醒需要人工参与。本发明设计合理、成本低廉、结实耐用、安全可靠、操作简单、省时省力、节约资金、结构紧凑且使用方便。
11.与现有技术的对比,本发明的有益之处在于:本发明提供的技术方案通过特征提取和特征匹配等算法实现检查图像敏感信息的自动脱敏,可以准确地对检查图像进行数据脱敏,对患者的隐私起到了保护的作用,同时节省了大量的人力和物力。
12.本发明能自动实现检查图像敏感信息的脱敏,与人工脱敏相比,节省了人力。此发明采用sift特征提取与flannbasedmatcher匹配方法,对不同尺度的图片实现脱敏。并且稳定性较好。
附图说明
13.图1是基于检查图像的医疗图像数据脱敏技术流程图;图2是sift特征提取流程图图3是步骤(2)图像预处理后的二值化图像效果图;图4是提供的检查图像原始数据实施例图1;图5是采用一种基于数据脱敏的检查图像脱敏处理后,采用遮掩方法的脱敏结果图;图6是提供的检查图像原始数据实施例图2;图7是提供的检查图像原始数据实施例图3。
具体实施方式
14.如图1-7,为了解决相关技术的问题,本发明的目的是基于检查图像的自动脱敏,实现对患者的检查图像进行隐私保护。为了实现此目的,基于检查图像的医疗图像数据脱敏技术,为保证程序正常运行,包括以下步骤:s1,判断原始图像是否可读;s2,若原始图像可读,则对提供的原始图像进行数据预处理,获得原始图像的二值化图像;当对图像预处理时,通过平滑,中值滤波,边缘检测,梯度计算,均衡化等算法对检查图像进行预处理,消除图像中的无关信息,增强有关信息的可检测性和最大限度的简化数据;s3,处理二值化图像,对敏感信息进行截切,并采用sift进行特征检测,提取检查图像,获得关键点与图像描述符,并获得脱敏信息数据库,其中,截取预处理后的图像里的敏感信息,提取需要脱敏的信息的特征,获得特征描述符,组成脱敏信息库;s4,首先,将获得图像描述符与脱敏信息数据库的图像描述符进行特征匹配,获得需要脱敏的信息区域;然后,在特征匹配过程中,采用快速最近邻搜索进行特征匹配:其次,
将从ct影像中提取的特征作为共轭实体,将所提特征属性或描述参数作为匹配实体,通过计算匹配实体之间的相似性测度以实现共轭实体配准的影像匹配方法,获得敏感信息位置;特征可以是实际图片的特征,也可以认为是影像的特征;s5,对匹配的脱敏信息区域后面的内容进行数据脱敏;若脱敏成功的,则获取脱敏后的图像,若不成功的话,提醒需要人工参与;敏感信息进行脱敏时,通过掩码操作,将检查图像中涉及病人的姓名,病案号等敏感信息进行脱敏处理。
15.关于特征提取;常见的图像特征有颜色特征,形状特征,纹理特征以及边缘特征等特征。
16.针对检查图像特性,主要是提取文字的特征,其纸张或者纸张凹凸性不应该考虑在内,不应该受纸张颜色,文字颜色影响。所以排除颜色和纹理特征,主要提取检查图像的边缘特征与形状特征。
17.边缘特征:采用sobel算子检测检查图像有无明显变化的边缘或者不连续的区域,提取检查图像的边缘特征。
18.形状特征:形状特征的表达必须以对图像中物体或区域的分割为基础。采用sift在尺度空间中提取图像局部特征点,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。
19.尺度不变特征转换即sift (scale-invariant feature transform)是一种计算机视觉的算法。它用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,其算法步骤如下:尺度空间极值检测:搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。
20.特征点过滤与关键点定位:在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。
21.方向确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。
22.关键点描述符:在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。
23.在s3中,sift特征提取步骤如下;s3.1, 尺度空间极值检测,获取尺度空间,构建图像金字塔;不同的尺度空间是不能使用相同的窗口检测极值点,对小的关键点使用小的窗口,对大的关键点使用大的窗口,为了达到上述目的,使用尺度空间滤波器,采用唯一可以产生多尺度空间的核函数的高斯核;定义一个图像的尺度空间,如下:
ꢀꢀꢀꢀꢀꢀ
式 (1) ;
ꢀꢀꢀ
式(2);
其中,代表图像的像素位置,表示原始图像,表示卷积运算,表示高斯函数,是尺度空间因子,是高斯正态分布的标准差,反映了图像被模糊的程度,其值越大图像越模糊,对应的尺度也就越大。
24.不同图像的尺度空间构成图像高斯金字塔,通过公式(1)、(2)函数对图像进行模糊以及降采样得到若干组图像,不同组包括若干层图像。
25.高斯金字塔的组数计算公式如下:
ꢀꢀꢀꢀꢀꢀꢀ
(3);其中,表示高斯金字塔的组数,分别是原始图像的行和列。系数是之间的任意值;高斯滤波参数由公式(4)关系得到:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4);其中,是所在的层, 是初始尺度,是每组的层数,为所在的组数;同组内相邻层的图像尺度间的关系: ,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5);相邻组之间的关系:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6);s3.2,构建图像高斯差分金字塔;图像沿着尺度轴做高斯差分,获得尺度空间上设定为比较显著的点,即尺度轴上的梯度极值,采用dog函数计算梯度极值,在高斯金字塔中每个组中相邻两层使用dog函数构成高斯差分金字塔;dog函数:
ꢀꢀ
(7);s3.3,dog空间极值检测;寻找极值点,在dog空间中寻找极值,极值比设定周围点都大或者都小的点认为是关键点。
26.s3.4, 特征点过滤与关键点定位由于dog对噪声和边缘比较敏感,因此在s3.2的高斯差分金字塔中检测到的局部极值点需经过进一步的检验才能精确定位为特征点;首先,去除较小的极值,为了获得更加准确的关键点位置,将每个关键点的每小段dog函数进行泰勒二次展开:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8);其中,,是高斯滤波参数,是图像像素点;然后,对公式(8)求极值,并令公式(8)导数为零得到极值点:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9);其次,对公式(9)得到极值点处的极值:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10);并剔除的极值点,以去除边缘噪声,即剔除山脊线。
27.dog经常在边缘方式上表现为山脊线,即在沿线方向的变化较缓慢,曲率较小,在垂直线的方向变化较剧烈,曲率较大。去除边缘噪声,就是剔除山脊线。
28.s3.5,首先,通过hessian矩阵刻画极值点(9)周围的变化趋势,协方差矩阵的特征值对应着在特征向量方向上的投影;该值越大就反应函数在该方向变化趋势越缓慢,也就是曲率越大,hessian矩阵的特征值和特征值所在特征向量方向上的曲率成正比;通过二阶差分公式(11)计算得到hessian矩阵:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11) ;其中,表示dog函数关于像素点二阶偏导数;计算特征值的比值,获得特征值在特征向量方向的变化趋势;然后,假设两个特征值分别为,则:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12) ;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13) ;其中,分别是矩阵的迹和矩阵的行列式;其次,设为较大特征值,并且,则
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14);其中,分别是矩阵的迹和矩阵的行列式,是的比值;当是最小,当越大时,对应的越大。将的点剔除;s3.6,方向确定经过s3.5的关键点定位,找得了比较精确的关键点,并且这些关键点具有尺度不变性。为了实现旋转不变性,需要为每个关键点分配一个方向角度,也就是根据检测到的关键点所在的高斯尺度图像的领域结构中确认关键点的方向。
29.首先,对于任意一个关键点,采集所在高斯金字塔图像以r为半径的区域内所有像素的梯度特征,半径r为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15);梯度幅度和方向的计算公式为:
ꢀꢀꢀ
(16);
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17);其中,表示像素点,是对应尺度的尺度图像;然后,通过公式(16)、公式(17)计算关键点周围区域内的所有样本点的梯度值与方向;其次,将方向分为若干个bins,使用高斯函数加权统计样本点的方向直方图,取最大峰值对应的bins,其就是关键点的方向;s3,7,关键点描述符;找得图像在不同尺度的关键点后,为了实现后续的分类或者匹配,需要获取关键点周围的特征。
30.首先,将关键点附件半径为的领域划分为的子区域,在每个子区域统计长度为的方向直方图,每个直方图作为一个种子点,获得一个长度为的向量;然后,为保证旋转不变性,固定关键点的方向为相同方向,即将图像旋转使得关键点的方向为坐标轴轴方向,再对旋转后的图像进行区域统计方向直方图;坐标旋转后的值为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18);其中,是关键点方向与坐标轴的夹角,顺时针旋转角度为负值,逆时针为正值;其次,计算子区域内的像素的梯度,并按照进行高斯加权,并采用双线性插值法得到每个种子的八个方向的梯度;再次,在方向直方图处,方向上的增量为:
ꢀꢀꢀꢀ
(19);其中,是点周围旋转后的样本点,限制其距离在单位内,是的坐标,是高斯权重,分别是对该网络点在两个方向的影响率和所求方向上的影响率;之后,区域大小的选择和高斯权重尺度的选择,每个子区域的选择和计算关键点方向时的区域大小一致,即,其中是图像在尺度空间的尺度;再后,考虑到旋转的问题,为了避免旋转后半径为的区域内有部分是空的,本发明在选的区域要能够在旋转后仍然后的区域检测到,每个子区域的半径为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20) ;所以总体区域半径为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(21);往后,为了去除光照影响:将关键点生成的特征向量归一化,计算公式如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(22);其中,是方差。本发明充分描述是为了更加清楚的公开,而对于现有技术就不再一一列举。
31.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;作为本领域技术人员对本发明的多个技术方案进行组合是显而易见的。而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1