Leveraging Saliency in Single-Stage Multi-Label Concrete Defect Detection
创始人
2025-05-31 15:01:15

Leveraging Saliency in Single-Stage Multi-Label Concrete Defect Detection Using Unmanned Aerial Vehicle Imagery

利用无人机图像进行单阶段多标签混凝土缺陷检测

摘要:
摘要:使用无人机图像对混凝土结构进行目视检查是一种由于缺陷尺寸和外观的可变性,这项任务具有挑战性。本文提出了一种利用无人机自动快速检测桥梁混凝土缺陷的高性能模型图像。我们创造了基于显著性的多标签缺陷检测器(SMDD-Net),结合通过一阶段的混凝土缺陷检测模型进行金字塔特征提取和注意。注意力模块提取局部和全局显著性特征,这些特征与最大池化、乘法和剩余跳过连接操作。这有助于加强小型和低对比度缺陷以及在变化的图像采集范围中检测的总体精度。最后,使用多标签损失函数检测来识别和定位重叠缺陷。这个在标准数据集和真实世界图像上的实验结果证明了关于最先进技术的SMDD-Net的准确性和计算效率SMDD-Net使其成为一种适用于无人机桥梁结构检测的方法。

1. Introduction

在本文中,我们研究了在基于无人机的检查中通常出现的上述具有挑战性的情况下,使用注意力来增强具体缺陷检测。我们提出了一种快速准确的模型,即基于显著性的多标签缺陷检测器(SMDD-Net),它利用显著性和金字塔特征提取来更好地检测和定位混凝土缺陷。SMDD Net将两个模块集成在一个单级管道中:(1) 注意力模块,其提取全局和局部显著性以突出图像中的感兴趣区域,以及(2)检测模块,其使用受RetinaNet模型启发的特征金字塔网络(FPN)来定位多个和潜在重叠的缺陷。选择RetinaNet是因为它能够在不同规模和存在的情况下检测缺陷由于使用了FPN和FL损失,训练数据集不平衡。这两个模块通过残差跳跃连接进行集成,以突出金字塔特征的空间表示中的感兴趣区域。换句话说,注意力模块使将检测更多地集中在表征一般混凝土缺陷的局部对比区域上。SMDD-Net能够检测小的和低对比度的缺陷,以及在杂乱的背景,使其成为基于无人机的检查的合适方法。
在这里插入图片描述在这里插入图片描述

图1(顶部)显示了SMDD-Net体系结构的流水线,包括注意力和检测模块。第一个模块提取显著性特征,而第二个模块优化用于检测重叠缺陷的多标签丢失函数。我们在本文中的主要贡献可以列出如下:

1)我们提出了SMDD-Net架构,它将注意力集中在单级混凝土缺陷检测中。注意力模块提取全局和局部显著性图,其突出显示局部特征,以便在存在背景杂波(例如,伪影、桥接结构元素等)的情况下更好地检测多个缺陷类别。与针对均匀背景的单个缺陷定位的检测方法相反,SMDD-Net能够定位以可变形状、小尺寸、低对比度和重叠为特征的复杂缺陷。

2)我们提出了一个基于显著性提取的注意力模块,通过对我们的特征提取网络进行基于梯度的反向传播。反向传播通过两个路径形成:全局路径,其突出大尺寸缺陷结构,局部路径,其高亮包含小对比度和低对比度缺陷的局部图像特征。使用通道间最大池化将两条路径融合,并通过剩余跳过连接将输出添加到金字塔特征中。

3)我们在著名的CODEBRIM数据集上演示了SMDD-Net模型的性能,该数据集包含五类缺陷和几个具有小、低对比度和重叠缺陷的图像示例。我们的模型利用了两种检测范式的优势:两阶段检测的高精度和一阶段检测的高速。我们还使用真实世界无人机图像的几个例子,将我们的模型的性能与最先进的方法进行了比较。

2. Literature Review

3. Proposed Method
本文的核心思想是通过利用具有显著性的对象检测来改进缺陷检测和定位。这是因为缺陷通常以其相对于无缺陷背景表面的局部对比度为特征。将显著性和对象检测相结合,直观地吸引人们将注意力集中在具有最高局部对比度的零件上,用于可以定位潜在缺陷的区域建议。显著性还可以增强低对比度缺陷(例如,裂纹、风化)的特征表示,这将增强其用于检测的区域建议分数。SMDD-Net方法的流水线如图2所示,它由两个主要模块组成:(a)注意力模块和(b)多标签一阶段混凝土缺陷检测模块。注意力模块旨在通过更加强调图像中包含局部不连续性的部分来增强特征表示。换句话说,显著性图将精确定位图像的部分,从而能够在具有最高缺陷可能性的混凝土表面上生成区域建议。第二个模块扫描区域建议,通过边界框回归和分类来确定缺陷。后者使用CODEBRIM数据集对多标签缺陷检测进行了微调。在下文中,我们通过给出每个模块的实现示例来分别描述每个模块,如图2所示,其中Grad CAM和RetinaNet被用作实现我们的架构的基线。
在这里插入图片描述
用于缺陷检测的增强区域特征表示的注意力模块
用于缺陷检测的增强区域特征表示的注意力模块

在这里插入图片描述
在这里插入图片描述
多标签单阶段缺陷检测模块使用RetinaNet模型

3.1. Saliency for Defect Region Proposals
3.1. 缺陷候选区的显著性
显著性的目的是基于视觉感知的认知研究,能够识别与周围环境表现出局部对比的区域。
这个问题与混凝土缺陷检测问题非常一致,即缺陷通常表现出与直接无缺陷混凝土表面的一些对比。虽然不是每个显著区域都构成缺陷,但大多数缺陷都表现出一定程度的局部显著性。因此,计算显著性并使用它来引起对缺陷区域的关注可以非常有用地减少假阴性(例如,由于尺寸小和对比度低缺陷),这是混凝土缺陷检测中的一个常见问题。

早期的显著性检测方法是基于手工制作的特征,如局部直方图,在区域支持(如超级像素)上计算,并使用对比度在特征的局部统计或图形排名之间分配显著性得分到像素。这些方法在区分紧凑的显著区域方面取得了成功不需要广泛的训练,但它们不能很容易地用于区分缺陷。首先,一些缺陷,如裂纹,很难用局部统计数据来描述。第二缺陷并不总是占据紧凑的区域,而是具有不同的尺寸和形状,有时甚至被分割成不同的部分。
通过使用深度学习,表征显著性的局部对比度模式可以通过训练适当的模型例如,Hou等人引入了CNN架构的短连接具有提取整体局部不连续性的作用。Selvaraju等人提出梯度加权类激活图(Grad-CAM)方法,旨在产生粗定位图,突出显示图像的重要区域,导致概念的预测。梯度CAM可以应用于各种CNN模型族并且正确地识别由模型预测的对象的一般区域。

为了在输入图像中搜索可能包含缺陷的区域,SMDD-Net方法将Grad-CAM
(本质是前向传播过程中的梯度图,通过注意力机制的方式将算力集中过来,热力图只是用来可视化)
的结果集成到原始图像中,以突出显示负责缺陷类激活的图像。为此,输入图像被细分为几个重叠的部分,其中每个部分的显著性图被单独计算(见图3b)。为了最大限度地提高缺陷检测率,在分割的每个部分保留最大显著性,以产生输入图像的最终显著性图

在这里插入图片描述
这里的公式和代码来自Grad-CAM热力图生成部分
在这里插入图片描述
每个分块图像的热力图激活函数
在这里插入图片描述
多张图像汇集一起时,有些分块会有多分类的现象,用max处理
在这里插入图片描述

最后,通过合并为部分图成的局部显著性图,为整个图构建了完整的局部显著度图。对于两个补丁之间的重叠部分,最大化处理。此外,为了确保整体显著性对特征的增强,对整个图像通过CAM来单独生成一个显著性图。
图3说明了显著性提取模块,该模块在图像上包含分布在整个图像上的多个缺陷。全局显著性确定了右侧最显著的缺陷(暴露棒+剥落),局部显著性识别出风化占据了图像的大部分以及左边的剥落。
通过推理的梯度图与原图的concat,构造了局部与全局两个分支,并最终融合在一起,这样更加全面。

3.2. Multi-Label One-Stage Defect Detection
3.2.多标签一阶段缺陷检测
缺陷检测不仅要对缺陷进行分类,还要将它们定位在边界框内。请注意,单阶段检测模型主要关注计算效率,这使得能够以有限的准确性为代价进行快速检测。在这里,我们试图通过简单地缩小一级检测器的搜索区域来获得两个世界的好处,从而实现快速准确的缺陷检测。使用计算的显著性图,我们在显著部分周围生成候选区域,以缩小缺陷的搜索空间,类似于使用深度学习的两阶段对象检测。

在大多数对象检测方法(如RetinaNet)中,边界框被分配一个标签。然而,对于混凝土缺陷检测,几个缺陷可能同时出现在同一位置。例如,裸露的钢筋通常与腐蚀或剥落缺陷有关。同样,裂纹也可能与风化缺陷有关。为了考虑到这一现实,我们重新审视了RetinaNet的FL损失,通过为每个边界框分配多个标签来实现多标签版本。RetinaNet的原始焦点损失(FL)是交叉熵损失(CE)的增强,由于anchor盒的密集采样,交叉熵损失存在极端的前景-背景类不平衡问题。由于每个金字塔层中有数百个锚框,因此只有少数锚框会被分配给地面实况对象,而绝大多数锚框将是背景类,这可能会共同压倒模型。为了缓解这个问题,FL减少了简单示例的损失贡献,并增加了纠正错误分类示例的重要性。

为了考虑缺陷检测的多标签方面,我们通过创建包含多个缺陷标签的边界框的副本来增强基本事实。这将使该地区提案中的不同候选人能够回归,以针对相同的基本事实边界框。这样做的最终效果是生成紧密重叠的边界框,这些边界框可以以不同的方式进行标记。更正式地说,具有一组L={c1…cn}标签的给定边界框位置的FL由下式给出
在这里插入图片描述
4. Experiments
4 实验
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
5.结论
本文提出了一种新的一阶段混凝土缺陷检测方法。该方法利用显著性形式的注意力将检测集中在图像的最重要部分。这具有提高整体检测精度的优点,而且还可以检测大多数一阶段和两阶段检测方法所遗漏的非对比度和小缺陷。我们的注意力模块是通过融合实现的使用反向传播提取的局部和全局显著性图。要改进功能对于缺陷检测,将显著性特征与锥体相结合特征。实验结果表明,所提出的方法优于在检测精度方面的其他方法,同时在计算上是有效的。它还能够更好地识别和定位重叠缺陷。虽然结果表明,SMDD-Net可以很容易地应用于混凝土桥梁缺陷检测而不需要对任何其他混凝土结构缺陷检测任务进行重大修改。

相关内容

热门资讯

头歌--第1关:Linux文件... 任务描述 假设系统中存在一个文件File,修改该文件的权限,根据实际需求...
【Spring从成神到升仙系列... 👏作者简介:大家好,我是爱敲代码的小黄,独...
梦见蜈蚣是什么意思,做梦梦见蜈... 梦见蜈蚣是什么意思目录梦见蜈蚣是什么意思做梦梦见蜈蚣什么意思梦见蜈蚣是什么意思,哪里有解释啊梦见蜈蚣...
小区车位比一般是多少,车库配比... 小区车位比一般是多少目录小区车位比一般是多少车库配比是什么小区总户数8200,总车位是1450个,配...
车锁上的lock什么意思,汽车... 车锁上的lock什么意思目录车锁上的lock什么意思汽车上lock是什么意思?车子上“lock标志”...
kirin710是什么处理器,... kirin710是什么处理器目录kirin710是什么处理器海思kirin710是高通多少?骁龙71...
程序的循环结构和random库...   第三个参数就是步长     引入文件时记得指明字符格式,否则读入不了 ...
跟着文档制作cocos第一个游... 背景 近期打算学习一下cocos creator,想着开发自己的游戏,是...
乌干达是什么梗,网络语乌干达什... 乌干达是什么梗目录乌干达是什么梗网络语乌干达什么意思?乌干达是什么梗乌干达是什么梗乌干达是什么梗 ...
车载电子狗怎么用,怎样使用电子... 车载电子狗怎么用目录车载电子狗怎么用怎样使用电子狗怎么使用电子狗求简答车载电子狗怎么使用车载电子狗怎...
梦见偷东西是什么意思,梦见自己... 梦见偷东西是什么意思目录梦见偷东西是什么意思梦见自己偷东西是什么意思?做梦梦见自己偷东西好不好梦见偷...
黄金瞳到底是什么,黄金瞳电视剧... 黄金瞳到底是什么目录黄金瞳到底是什么黄金瞳电视剧什么时候上映?《黄金瞳》的结局是什么?电视剧《黄金瞳...
前端-session、jwt 目录:   (1)session (2&#x...
企业即时通讯怎样为企业实现移动... 对于企业来说,在办公过程中少不了工作人员相互传递信息和数据传输,企业内部...
骑行选择什么自行车 极速百科网... 骑行选择什么自行车目录骑行选择什么自行车骑行选择什么自行车 1. 山地自行车:适合崎岖不平的路...
蓝色都有哪几种,蓝色都有什么颜... 蓝色都有哪几种目录蓝色都有哪几种蓝色都有什么颜色的蓝图片,蓝色都有什么颜色的蓝二年级蓝色有哪些种类蓝...
如何自学游泳要安全的,初学游泳... 如何自学游泳要安全的目录如何自学游泳要安全的初学游泳的人需要准备哪些东西,注意哪些事项?如何自学游泳...
一年级家长的话怎么写评语,一年... 一年级家长的话怎么写评语目录一年级家长的话怎么写评语一年级学生评价手册家长寄语怎么写一年级最佳家长评...
EEG微状态的功能意义 导读大脑的瞬时全局功能状态反映在其电场结构上。聚类分析方法一致地提取了四种头表面脑电场结构ÿ...
docker 镜像管理 查看本地镜像 docker images 可以查看本地下载的镜像 docker images [O...
k8s-1.22.15部署ng... 1.介绍 在前面文章中已经提到,Service对集群之外暴露服务的主要方式有两种&#x...
革命烈士寄语怎么写,清明节缅怀... 革命烈士寄语怎么写目录革命烈士寄语怎么写清明节缅怀先烈的寄语有哪些呢?革命烈士寄语怎么写 革命...
5万元以下新车推荐,5万以下买... 本篇文章极速百科给大家谈谈5万元以下新车推荐,5万以下买什么车好,以及5万以下的新车哪款最好对应的知...
真皮沙发翻新一般多少钱?(真皮... 本篇文章极速百科给大家谈谈真皮沙发翻新一般多少钱?,以及真皮沙发翻新一般多少钱一个对应的知识点,希望...
磨皮什么意思(磨皮是啥?) 磨... 本篇文章极速百科给大家谈谈磨皮什么意思,以及磨皮是啥?对应的知识点,希望对各位有所帮助,不要忘了收藏...
进程间通信【Linux】 1. 进程间通信 1.1 什么是进程间通信 在 Linux 系统中,进程间通信...
从NVIDIA GTC大会,看... 从NVIDIA GTC 2023这场全球行业盛宴,我们可以解读出AI算力行业的哪些重要...
请问什么是童子,什么是童子 极... 请问什么是童子目录请问什么是童子什么是童子古代 童子是什么意思童子是什么意思?请问什么是童子 ...
中招考试考哪些科目,中招考试考... 中招考试考哪些科目目录中招考试考哪些科目中招考试考几门科目一共多少分?中考有哪些科目中考考几科,都什...
做电商如何做,电商怎样做才能赚... 做电商如何做目录做电商如何做电商怎样做才能赚钱?做的好的电商朋友可以教教我怎么做吗新手小白怎么做跨境...