本发明涉及计算机技术应用领域,特别是涉及一种医学影像伪标签生成系统。
背景技术:
1、近年来,随着深度学习技术的不断发展与进步,有监督学习被广泛应用至医学影像处理领域,并在图像分割、病灶检测等任务表现出良好的性能。有监督学习比较依赖高质量的标注数据,然而,高质量标记数据获取耗时、成本非常高,尤其是在医学影像领域。与高质量标注数据的有监督学习方法相比,自监督学习通过利用数据以及针对前期任务自动生成的伪标签进行训练,无需任何人工注释。因此,如何自动获取伪标签对自监督学习至关重要。目前,常见的伪标签生成方法是基于数据本身属性(如旋转角度、颜色等)自动生成,然而,这些方法生成的伪标签过于简单,不利于前期任务阶段模型的训练,尤其是医学影像领域。
技术实现思路
1、针对上述技术问题,本发明采用的技术方案为:
2、本发明实施例提供一种医学影像伪标签生成系统,所述系统包括处理器以及与所述处理器通信连接的数据库和存储器,所述存储器中存储有计算机程序;所述数据库中存储有医学影像信息记录表和n个医学影像,第i个医学影像di=(di1,di2,di3),其中,di1为从第一平面对第i个医学影像对应的观察区域vi进行观察得到的第1影像,di2为从第二平面观察vi得到的第2影像,di3为从第三平面观察vi得到的第3影像;di1包括f(i,1)个子图像,di2包括f(i,2)个子图像,di3包括f(i,3)个子图像,第一平面、第二平面和第三平面相互垂直,i的取值为1到n;所述医学影像信息记录表的第i行包括(ai,mi,fli),其中,ai为di的id,mi为di的伪标签信息,mi=(mi1,mi2,……,mij,……,mik),mij为基于第j个观察用户生成的伪标签信息,mij={uij,lij},uij为第j个观察用户的id,lij为基于第j个观察用户生成的影像伪标签集,lij={m1ij,m2ij,m3ij},m1ij为基于第j个观察用户生成的关于第1影像的伪标签,m2ij为基于第j个观察用户生成的关于第2影像的伪标签,m3ij为基于第j个观察用户生成的关于第3影像的伪标签,j的取值为1到k,k为观察用户的数量;fli为di的目标伪标签,fli=y(mi),y()为设定函数表达式;
3、所述处理器用于执行计算机程序以实现如下步骤:
4、s100,响应于当前检测到di被观察,执行s200;
5、s200,获取对应的观察信息,并基于获取的观察信息更新对应的医学影像信息记录表;
6、其中,s200具体包括:
7、s210,获取第一观察时间信息t1ir={t11ir,t12ir,……,t1sir,……,t1f(i,r)ir}和第二观察时间信息t2ir={t21ir,t22ir,……,t2pir,……,t2h(i,r)ir},t1sir为当前观察di的观察用户观察di的第r影像的第s个子图像的观察时间,s的取值为1到f(i,r),r的取值为1到3;t2pir为通过图像放大方式对第r影像中的第p个局部图像进行观察的观察时间,p的取值为1到h(i,r),h(i,r)为观察的第r影像中的局部图像的数量;
8、s212,基于t1ir和t2ir,获取第三观察时间信息t3ir={t31ir,t32ir,……,t3qir,……,t3g(i,r)ir};t3qir为dir对应的观察区域内的第q个像素点的观察时间,q的取值为1到g(i,r),g(i,r)为dir对应的观察区域内的像素点数量;
9、s214,基于t3ir获取置信度信息cir={c1ir,c2ir,……,cqir,……,cg(i,r)ir},cqir为对t3qir进行归一化得到的置信度;
10、s216,如果当前观察di的观察用户的id在所述数据库查询得到,则基于cir,更新对应的伪标签,以更新mi;否则,执行s218;
11、s218,基于cir,在mi中增加对应的伪标签信息,以更新mi;
12、s220,基于更新的mi,更新fli。
13、可选地,所述伪标签为置信度矩阵,每个置信度矩阵的大小和对应的影像的大小相同。
14、可选地,在s214中,cqir=(t3qir-tirmin)/(tirmax-tirmin),tirmin为t3ir中的最小值,tirmax为t3ir中的最大值。
15、可选地,在s216中,基于cir,更新对应的伪标签具体包括:
16、s2161,获取当前观察di的观察用户对应di的第r影像的伪标签,作为待更新伪标签lbir;
17、s2162,获取lbir中与dir对应的观察区域内的第q个像素点对应的元素值eqir;
18、s2163,设置eqir=cqir,或者,设置eqir=z(eqir,cqir),z()为设定函数表述式。
19、可选地,z(eqir,cqir)=eqir+cqir。
20、可选地,z(eqir,cqir)=a1×eqir+a2×cqir,a1和a2分别为第一预设系数和第二预设系数。
21、可选地,s218具体包括:
22、s2181,在mi中增加与当前观察di的观察用户对应的初始伪标签信息mif=(uif,m1if,m2if,m3if),uif为当前观察di的观察用户对应的id,m1if,m2if,m3if分别为第一初始伪标签、第二初始伪标签和第三初始伪标签;
23、s2182,获取mrif中与dir对应的观察区域内的第q个像素点对应的元素值eqir;
24、s2183,如果cqir>eqir,则设置eqir=cqir。
25、可选地,fli=w1×li1+w2×li2+……+wj×lij+……+wk×lik,wj为第j个观察用户对应的权重。
26、可选地,第一平面为横断面,第二平面为矢状面,第三平面为冠状面。
27、本发明至少具有以下有益效果:
28、本发明实施例提供的医学影像伪标签生成系统,通过记录、分析医生日常阅片过程生成其对应的伪标签,能够获取到尽可能复杂且准确的伪标签,能够有助于自监督学习中预训练模型的训练。
1.一种医学影像伪标签生成系统,其特征在于,所述系统包括处理器以及与所述处理器通信连接的数据库和存储器,所述存储器中存储有计算机程序;所述数据库中存储有医学影像信息记录表和n个医学影像,第i个医学影像di=(di1,di2,di3),其中,di1为从第一平面对第i个医学影像对应的观察区域vi进行观察得到的第1影像,di2为从第二平面观察vi得到的第2影像,di3为从第三平面观察vi得到的第3影像;di1包括f(i,1)个子图像,di2包括f(i,2)个子图像,di3包括f(i,3)个子图像,第一平面、第二平面和第三平面相互垂直,i的取值为1到n;所述医学影像信息记录表的第i行包括(ai,mi,fli),其中,ai为di的id,mi为di的伪标签信息,mi=(mi1,mi2,……,mij,……,mik),mij为基于第j个观察用户生成的伪标签信息,mij={uij,lij},uij为第j个观察用户的id,lij为基于第j个观察用户生成的影像伪标签集,lij={m1ij,m2ij,m3ij},m1ij为基于第j个观察用户生成的关于第1影像的伪标签,m2ij为基于第j个观察用户生成的关于第2影像的伪标签,m3ij为基于第j个观察用户生成的关于第3影像的伪标签,j的取值为1到k,k为观察用户的数量;fli为di的目标伪标签,fli=y(mi),y()为设定函数表达式;
2.根据权利要求1所述的系统,其特征在于,所述伪标签为置信度矩阵,每个置信度矩阵的大小和对应的影像的大小相同。
3.根据权利要求2所述的系统,其特征在于,在s214中,cqir=(t3qir-tirmin)/(tirmax-tirmin),tirmin为t3ir中的最小值,tirmax为t3ir中的最大值。
4.根据权利要求3所述的系统,其特征在于,在s216中,基于cir,更新对应的伪标签具体包括:
5.根据权利要求4所述的系统,其特征在于,z(eqir,cqir)=eqir+cqir。
6.根据权利要求4所述的系统,其特征在于,z(eqir,cqir)=a1×eqir+a2×cqir,a1和a2分别为第一预设系数和第二预设系数。
7.根据权利要求2所述的系统,其特征在于,s218具体包括:
8.根据权利要求1所述的系统,其特征在于,fli=w1×li1+w2×li2+……+wj×lij+……+wk×lik,wj为第j个观察用户对应的权重。
9.根据权利要求1所述的系统,其特征在于,第一平面为横断面,第二平面为矢状面,第三平面为冠状面。