本发明属于机器学习,具体涉及一种三维自动乳腺超声图像聚类方法。
背景技术:
1、乳腺癌是影响女性的最普遍恶性肿瘤之一,其在世界范围内的发病率不断上升。及时筛查可以为患者提供更加迅速且有效的干预措施。自动乳腺超声(abus)是乳腺成像的一种技术方式,以其高分辨率、结果可重复性和高度客观性而成为了乳腺癌早期筛查的常用技术。然而,人工观察三维abus图像来进行乳腺癌的早期筛查非常繁琐和费力,并且存在漏诊的风险。
2、因此,寻求高效且精准的三维abus图像的筛查方法是优化的乳腺癌早期诊断流程的迫切问题。
3、结合计算机辅助诊断(cad)系统利用复杂的算法和机器学习技术,帮助医疗保健专业人员对乳房图像、实验室数据或临床信息进行自动分类和解释。这提高了图像分析的速度、准确性和均匀性,从而促进了乳腺癌的早期筛查和诊断工作流程。
4、图正则化最小二乘回归(glsr)是一种适用生物数据聚类的子空间聚类(sc)方法,适用于cad系统。sc是一类机器学习领域的聚类算法。这类算法的优点在于能在不需要标签的情况下将数据点分类到各自的子空间中,并且所构建的模型拥有构建效率高、成本低和整体性能优秀的特点。图正则化最小二乘回归(glsr)采用将数据的内在几何结构编码到最小二乘回归框架中以兼顾数据的局部和全局结构。此外,glsr框架中还纳入了特征的流形结构并对特征施加非负约束,使得得到的亲和矩阵更加准确并为样本之间的相似关系提供更清晰的物理含义。
5、通过应用交替方向乘子法(admm)被求解glsr,可以保证glsr模型得到局部最优解并保证收敛。admm是一种求解具有可分离性的凸优化问题的迭代算法框架,由于结合了对偶分解法和增广拉格朗日乘子法,该算法有分解性的同时保证了良好的收敛性和处理速度。
6、本发明提出通过考虑生物数据聚类的子空间聚类算法和求解该算法的迭代优化算法,以及注重cad系统的实际应用,能够提供更有效、快速和经济可行的三维abus影像的乳腺癌早期筛查方案。
技术实现思路
1、针对现有技术中存在的上述问题,本发明的目的在于提供一种三维自动乳腺超声影像聚类方法,通过将图结构的正则化器合并到最小二乘回归算法的glsr算法及其迭代优化算法提供偏好的基于三维自动乳腺超声图像的乳腺癌早筛技术,能够优化乳腺癌早筛诊断流程,提高资源利用率和经济效益。
2、本发明提供如下技术方案:
3、一种自动乳腺超声图像聚类方法,包括以下步骤:
4、步骤1、获取三维乳腺超声影像数据;
5、步骤2、将获得的三维图像逐一处理成二维向量作为后续处理的样本;
6、步骤3、考虑样本空间的流形结构,得到样本与样本之间的相似度矩阵,并由相似度矩阵得到任意两个特征的平滑表示;
7、步骤4、创建表示图,并对特征应用非负约束;
8、步骤5、整合流形正则化器与表示图,并引入稀疏误差得到图正则化最小二乘回归glsr目标函数;
9、步骤6、基于交替方向乘子法admm求解法,引入两个辅助变量w和q,对图正则化最小二乘回归glsr目标函数进行求解,得到聚类结果。
10、进一步的,所述步骤3的具体过程如下:
11、步骤3.1、在总样本上建立具有n个节点的最邻近图,每个节点代表归属于该最邻近图的一个相似样本xi,对于每个样本xi都可以找到它的k个近邻,在图上xi和它的k个近邻由k条边相连,由此得到任意两个样本xi和xj的相似度矩阵sij;
12、步骤3.2、通过相似矩阵和样本之间的关联特征进一步计算两个特征的平滑性。
13、进一步的,所述步骤4中,表示图封装了数据的局部结构和全局结构,其具体过程如下:
14、步骤4.1、针对所有样本,求得每个样本数据残差矩阵l2范数平方与样本间特征的乘积的和,取所有和中的最小值作为局部结构的最优化约束;
15、步骤4.2、将全局特征矩阵的弗罗贝尼乌斯范数的平方乘以正的罚参数,得到节点之间的全局关系信息;
16、步骤4.3、将局部结构的最优化约束与全局关系信息参数方程进行整合,并对a矩阵进行非负约束,将局部结构的最优化约束与全局关系信息参数方程进行整合并进行参数矩阵a的非负约束的函数公式如下:
17、
18、s.t.x=xa,a≥0
19、其中,xi、xj表示的是任意两个样本i和j,aij是样本i和j的关联特征,m是样本的维度,a是一个由向量ai组成的矩阵,λ1为正的罚参数,是包含n个样本的数据矩阵,||.||f表示矩阵的弗罗贝尼乌斯范数,函数公式的第一项为考虑局部结构的函数因式,第二项为考虑样本全局信息的函数因式。
20、进一步的,所述步骤5的具体过程如下:
21、步骤5.1、将步骤3的流形正则化器合并到步骤4的表示图中,得到综合考虑样本流形结构、局部结构和全局结构的聚类函数模型;
22、步骤5.2、引入稀疏误差项λ3||e||1到聚类函数模型,其中λ3是正的正则化参数,e表示误差;
23、步骤5.3、对系数矩阵a增加约束a1=1,diag(a)=0,使其每行或列的元素和为1。
24、进一步的,所述步骤6的具体过程如下:
25、步骤6.1、新增参数变量w和q用以区分各个因式中的参数矩阵a,构造增广拉格朗日函数并对其进行简化;
26、步骤6.2、求解增广拉格朗日函数;
27、步骤6.3、计算亲和矩阵,通过谱聚类算法得到k个聚类结果。通过采用上述技术,与现有技术相比,本发明的有益效果如下:
28、1)本发明提出封装数据的局部结构并对特征应用非负约束的图像表征方法,来兼顾数据的全局和局部结构特征;同时将流形正则化器合并到图像表征中以考虑数据的流形结构,由此得到图正则化最小二乘回归glsr算法框架;然后基于交替方向乘子法admm迭代方法开发了一种高效的迭代算法来保证我们提出的图正则化最小二乘回归glsr算法得到局部最优解并保证收敛;
29、2)本发明中,使用子空间聚类机器学习算法解决自动乳腺超声图像聚类问题,大大降低了计算机辅助诊断系统应用于乳腺癌早期诊断的成本;
30、3)本发明中,提出的图正则化最小二乘回归glsr算法,在考虑图像数据的流形结构的同时兼顾图像的局部和全局结构,提高了子空间聚类算法在自动超声乳腺图像上的图聚类性能;
31、4)本发明中,基于交替方向乘子法admm优化算法对图正则化最小二乘回归glsr算法进行迭代,提升了图正则化最小二乘回归glsr算法求解过程的效率。
1.一种自动乳腺超声图像聚类方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种自动乳腺超声图像聚类方法,其特征在于,所述步骤3的具体过程如下:
3.根据权利要求2所述的一种自动乳腺超声图像聚类方法,其特征在于,所述步骤4中,表示图封装了数据的局部结构和全局结构,其具体过程如下:
4.根据权利要求3所述的一种自动乳腺超声图像聚类方法,其特征在于,所述步骤5的具体过程如下:
5.根据权利要求4所述的一种自动乳腺超声图像聚类方法,其特征在于,所述步骤6的具体过程如下: