遥感学报

基于改进算法的遥感建筑物检测研究 

来源:遥感学报 【在线投稿】 栏目:期刊导读 时间:2021-03-07

1 引言

随着遥感技术的发展,遥感图像幅员更加辽阔,包含的信息更加复杂,因此其已被广泛应用于图像识别、语义识别、视频分析、文本分析和大数据分析等领域[1]。遥感图像中对固定地物与移动地物的检测一直是研究热点,其中固定地表建筑物是人类主要活动场所,因此对该类目标实现检测显得尤为重要。考虑到实际工程应用中实时性是一个极为重要的问题,且检测目标(建筑物)小,对建筑物检测也造成了极大的困难。故而,如何实现对遥感图像中该类建筑物的检测是目标检测领域的一个研究难点[2]。

相比传统的根据建筑物颜色、形状、纹理等提取简单特征的目标检测算法,基于深度学习的目标检测利用深度神经网络强大的特征学习能力来解决复杂的遥感图像检测问题,更能满足今天遥感图像中目标检测的要求[3]。本文的研究重点为固定地表中的建筑物检测,以基于深度学习的目标检测算法Yolo v3为研究基础,并以修改特征图分辨率、调整先验框维度为改进方向,加强对小型建筑物的检测,生成更适合遥感建筑物检测的网络模型。

2 相关工作

从遥感图像中检测建筑物有传统算法和基于深度学习的算法两大类。传统目标检测算法是一种基于人工设计特征的分类方法,利用了建筑物某一方面的特征,如颜色、形状等,虽然具有一定的检测效果,但是在检测精度和检测速度上具有较大的局限性。如文献[4]提出一种阴影验证的建筑物检测方法,该方法通过建筑物的阴影、形状以及颜色特征结合起来检测建筑物,对特征简单的建筑物检测效果良好,但对于复杂特征的建筑物检测,该方法无法满足工程应用中对检测精度及实时性的要求。与之相比,基于深度学习的检测算法以其适应能力强、检测效率高而得到了广泛应用,该类检测算法以卷积神经网络为基础,具有强大的特征表示能力,在背景模糊、地理环境复杂的情况下,仍然能够学习到有用的特征,大幅提高了物体检测精度,适用于当今遥感图像复杂多变的场景,具有非常好的泛化能力和鲁棒性[5]。如文献[6]提出一种端到端的密集反卷积神经网络,将图像中的抽象特征与细节特征结合,能够捕捉到目标建筑物的细微复杂特征;文献[7]中使用金字塔技术构建多级训练的样本,提出候选建筑区域检测建筑物,在检测精度及实时性方面有显著提升。

目前基于深度学习的检测算法可以分为两类:基于区域的目标检测算法和基于端到端的目标检测算法。前者先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类,这类算法在检测精度和定位精度上占优,代表算法有:Faster RCNN[8-9]和Fast RCNN等;后者不生成候选框,直接将目标边框定位的问题转化为回归问题,这类算法在检测速度上占优,代表算法有:Yolo[10-11]系列和 SSD[12]等。

考虑到目前遥感技术的发展,需要对上千平方公里图像进行处理,而且目标小、背景复杂度高,因此检测速度及泛用性是首先考虑的问题,所以本文将基于深度学习的Yolo v3检测算法应用于建筑物的检测,并在检测小型建筑物方面提出改进。

3 改进Yolo v3算法

3.1 Yolo v3原理

Yolo v3 是基于端到端的检测算法,网络结构分为骨干网络(Darknet-53)和检测网络。Darknet-53由52个卷积层和1个全连接层组成,构成了一个53层的卷积神经网络(CNN),并输出13×13、26×26和52×52三种尺度的特征,送入检测网络。检测网络对三种尺度的特征回归,预测出多个预测框,并使用非极大抑制(NMS)算法删除置信得分较低的预测框,保留置信得分较高的预测框为目标检测框,从而得到目标的类别和位置,检测流程如图1。

图1 Yolo v3检测流程

(1)边界框预测:检测网络对13×13、26×26和52×52三种尺度的特征回归,预测出多个预测框,在检测的过程中,每个网格会产生多个边界框,每个边界框都要预测边界框位置信息(x,y,w,h)和置信度(confidence)。置信度是边界框所含目标的可能性Pr(object)与边界框准确度IOU的乘积,计算公式如式(1)所示:

若网格中包含某个目标则Pr(object)=1 ,否则表示真实标注框与预测框的交并比,用来衡量预测边界框的准确性,当IOU=1 时,说明真实标注框与预测框重合。

(2)分类:对包含目标的网格预测多个类别概率,用Pr(classi|object)表示。为了得到每个边界框的分类信息,将边界框所属网格的类别概率与边界框的置信度相乘得到置信度评分,如公式(2)所示,其代表了边界框中目标属于某个类的概率。

上一篇:遥感中心开展遥感天地沙龙活动
下一篇:没有了