本发明涉及地下空间混凝土裂缝检测,具体涉及一种基于改进transformer地下空间混凝土裂缝检测方法及系统。
背景技术:
1、随着社会经济的不断发展,混凝土桥梁、道路通行里程越来越长,同时隧道、建筑等混凝土建筑物也越来越多。人工巡查不但耗时耗力,有时成本也很高昂,其正确率和效率也很难满足日益增长的混凝土基础设施,同时人工对一些高处、身处险地的混凝土设备进行巡查也会带来一些潜在的安全危险。因此,表面裂缝检测又混凝土设施状态监测中最为关键的项目之一。
2、地下空间混凝土裂缝检测是建筑工程领域的一项重要任务,其准确性和效率直接影响着工程质量与安全。然而,由于地下空间光线较差、环境复杂,以及裂缝形状、尺寸和颜色的多样性,传统的视觉检测方法面临着巨大挑战。近年来,深度学习方法,特别是卷积神经网络(convolutional neural networks,cnn)在裂缝检测中展现了卓越的性能。然而,cnn的一大局限在于其固定的感受野和欠缺全局上下文信息的考虑,导致在处理尺度变化大、形状复杂的裂缝检测任务时效果不佳。
3、transformer,作为自然语言处理领域的革新性结构,近年来被广泛应用于图像处理任务中,其自注意力机制(self-attention)可以获取全局上下文信息,理论上其感受野可以覆盖整个输入,使其具有较大的潜力用于裂缝检测任务。然而,由于transformer的全连接结构导致其在处理大尺寸图像时,计算量和内存需求过大,难以直接应用于实际的裂缝检测任务。
4、因此,如何改进transformer的结构,以使其能够适应大尺寸图像,同时充分发挥其全局上下文信息获取能力,以提升地下空间混凝土裂缝检测的效果和效率,成为了研究的重要课题。基于此,本研究旨在提出一种基于改进transformer的地下空间混凝土裂缝检测方法及系统。
技术实现思路
1、现有的地下空间混凝土裂缝检测模型的检测效果差,为解决此问题,本发明提供一种基于改进transformer地下空间混凝土裂缝检测方法。
2、本发明解决上述技术问题的技术方案如下:
3、一种基于改进transformer地下空间混凝土裂缝检测方法,包括如下步骤:
4、获取地下空间混凝土图像;
5、将图像输入预测模型进行预测,得到裂缝检测结果;
6、所述预测模型包括编码器和解码器,所述编码器包括依次连接的卷积主干块、第一transformer块、第一多尺度语义块、第二transformer块、第二多尺度语义块和第三transformer块;所述所述多尺度语义块中的卷积采用深度可分离卷积;
7、所述解码器包括依次连接的第一上采样块、第四transformer块、第二上采样块、第五transformer块和第三上采样块;
8、所述第二多尺度语义块的输出与第一上采样块的输入之间跨越连接,所述第一多尺度语义块的输出与第二上采样块的输入之间跨越连接,所述卷积主干块的输出与第三上采样块的输入之间跨越连接。
9、具体地,所述卷积主干块包括3*3深度卷积层和relu层,其中3*3深度卷积层为多层卷积。
10、具体地,所述第一transformer块、第二transformer块、第三transformer块、第四transformer块和第五transformer块的结构包括依次连接的emsa块和两个依次连接的线性层,emsa块的输入与emsa块的输出进行相加操作,两个线性层的输入与其输出进行相加操作,emsa块为多头自注意力机制,且各注意力头的输出进行线性投影,然后将这些投影进行混合。
11、具体地,所述多尺度语义块中,多尺度提取采用的结构为特征金字塔spp结构,其中的卷积为3*3深度可分离卷积。
12、具体地,所述上采样块包括上采样层、卷积层、3*3深度卷积层和relu层,其中3*3深度卷积层包括多层卷积,3*3深度卷积层的输入与relu层的输出进行相乘操作。
13、进一步地,所述emsa块的结构如下:
14、输入特征分并行输入两路,一路输入线性层得到q矩阵,另一路经过深度可分离卷积和层归一化后再分别输入两路线性层得到k矩阵和v矩阵;对q矩阵和k矩阵进行相乘操作后输入卷积层和softmax层,对其输出与v矩阵相乘后得到的结果与v矩阵进行相加操作,得到的结果输入到线性层后与原emsa块的输入特征进行相加操作,得到最终输出。
15、为解决上述技术问题,本发明还提供了一种基于改进transformer地下空间混凝土裂缝检测系统,包括:
16、图像获取模块,用于获取地下空间混凝土图像;
17、预测模块,用于将图像输入预测模型进行预测,得到裂缝检测结果;所述预测模型包括编码器和解码器,所述编码器包括依次连接的卷积主干块、第一transformer块、第一多尺度语义块、第二transformer块、第二多尺度语义块和第三transformer块;所述所述多尺度语义块中的卷积采用深度可分离卷积;所述解码器包括依次连接的第一上采样块、第四transformer块、第二上采样块、第五transformer块和第三上采样块;所述第二多尺度语义块的输出与第一上采样块的输入之间跨越连接,所述第一多尺度语义块的输出与第二上采样块的输入之间跨越连接,所述卷积主干块的输出与第三上采样块的输入之间跨越连接。
18、为解决上述技术问题,本发明还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的基于改进transformer地下空间混凝土裂缝检测方法。
19、为解决上述技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的基于改进transformer地下空间混凝土裂缝检测方法。
20、采用上述方案后,本发明的有益效果在于:
21、(1)提高裂缝检测的准确性:采用改进的transformer模型,能够获取全局上下文信息,提高了对于混凝土裂缝特性的感知能力,从而有效提升裂缝检测的准确性。
22、(2)提升裂缝检测的效率:通过对transformer模型进行针对性的改进,优化了其在处理大尺寸图像时的计算效率和内存需求,使其能够完成大尺寸地下空间混凝土裂缝的检测,显著提升了检测效率。
23、此外,通过投影交互来补偿每个注意力头输入标记的短长度限制,同时保持多头的多样性能力。
24、(3)优化资源分配:通过在模型设计中采取高效的优化措施,本发明能够在有限的计算资源下实现更高效的裂缝检测。
25、(4)增强系统的鲁棒性:由于transformer模型理论上的感受野可以覆盖整个输入,使其能够更好地处理尺度变化大、形状复杂的裂缝检测任务,从而增强了系统在复杂环境中的鲁棒性。
26、(5)提升安全性能:通过提供准确、及时的地下空间混凝土裂缝检测,本发明有助于早期发现并处理潜在的安全隐患,从而显著提升建筑工程的安全性能。