遥感学报

复杂卫星图像中的小目标船舶识别 

来源:遥感学报 【在线投稿】 栏目:期刊导读 时间:2021-04-09

Yao H G,Wang C,Yu J,Bai X J and Li of small-target ships in complex satellite of Remote Sensing(Chinese),24(2):116-125[DOI:10./jrs.]

1 引 言

海上目标识别是计算机视觉的重要内容,对海上目标的自动识别具有重要的现实意义。近年来我国海上航运和渔业活动增多、海上侵权事件多发,为了维护海洋安全,实现对海上船只目标的自动识别已经迫在眉睫。

随着卫星技术的发展,卫星遥感图像分辨率大幅提高,获取来源愈加多元,利用遥感卫星进行海域船舶目标识别得到迅速发展。船舶识别是海域目标预警等方面的基础组成部分,识别结果的好坏对后续操作有决定性的影响,目前常用的船舶识别方法有RFID(肖志良,2017)、模板匹配法(魏娜,2016)、背景建模法(王培玉等,2017)和神经网络法(杨名等,2017),其中RFID、模板匹配和背景建模是传统的目标识别方法,其效果不理想,而神经网络的方法预处理繁琐,方法组合冗杂,不确定性高。同时,由于卫星图像中的船只尺寸相对较小、云雾遮挡、陆地背景干扰等问题,因此对卫星图像中的船只实现自动识别仍面临诸多挑战。

近年来,深度学习(Hinton和Salakhutdinov,2006;LeCun等,2015)在目标识别(Girshick等,2014;Girshick,2015;Ren 等,2017;Redmon 等,2016;Liu等,2016)、自然语言处理(林奕欧等,2017)、图像分类(田娟秀等,2018;廖明等,2019)、图像检索(周晔和张军平,2017;刘颖等,2018)和人工智能(唐振韬等,2017)等领域取得突破进展。深度学习能够根据训练样本,自主调整特征提取参数,且提取到的特征具有极佳的自适应性,避免了人为设计特征提取器的复杂过程。在这方面,Bousetouane和Morris(2015)通过卷积神经网络来对遥感图像中的舰船目标进行特征提取,然后与模板库里面的舰船模板进行匹配,最后进行船只分类识别,识别率为89%。Zhang等(2015)对不同尺度、不同角度下的目标船舶通过深度学习工具箱进行检测识别,并采用多波段遥感的方法对难识别目标船只进行识别。Bentes等(2018)通过深度卷积神经网络实现了TerraSAR-X高分辨率雷达卫星中的目标识别,所采用的方法能够准确地识别出卫星影像中的货物、油轮、风车、平台和港口等5类目标。但无论是以上3种方法还是其他的算法若直接应用于实际场景中的船只识别,均存在以下4类问题:(1)无法解决实际中云雾遮挡的影响;(2)小目标船只无法识别;(3)无法实现对目标进行细粒度识别;(4)船只目标区域比背景区域小,负样本空间大,训练收敛困难。

针对上述问题,提出了一种多尺度深度学习模型训练方法。该方法以Faster R-CNN(Ren等,2017)为基础,通过负样本增强学习的方法训练模型,以此解决复杂海情的影响,结合多尺度的训练策略,将产生的多尺度的船只样本送入网络中进行训练,以解决小目标船只识别难的问题。实验结果表明,所提方法能够完整地检测出船舶位置,且能够准确的识别船舶类别,提高识别精度。

2 船舶细粒度识别原理

本文在FRCN(Faster R-CNN)(包含RPN和Fast RCNN两个模块)的基础之上进行船舶检测与识别,目的是实现卫星图像中的船舶目标精确定位与识别。卫星图像中的船舶细粒度识别可以分为多尺度训练、特征提取、生成目标建议区域、细粒度识别这4个步骤。复杂海情下船舶识别整体流程如图1所示。

图1 复杂海情下的船舶识别流程图Fig.1 The flow chart of ship fine-grained recognition

2.1 多尺度训练

由于卫星图像中的船舶目标较小,尺寸不一,会影响识别率。另外数量样本有限,训练时不能充分提取目标特征,易造成船只目标误检或漏检。本文采用多尺度样本进行训练,将每张图片设置为多个尺度。具体思想为:将训练样本图缩小成3个尺度 (1024×1024,512×512,256×256),等同在训练集中加入大量的小目标船只的样本进行训练,由于小目标样本数量的增加,确保了网络能够有效提取到小目标船只的特征,避免误检或漏检的情况。实验证明:通过多尺度训练能够使各类用于训练的目标大小分布更加均匀,从而使训练出来的网络模型能够对多尺寸的船只目标具有较强的鲁棒性。

2.2 船舶特征提取

若要实现船舶的精确分类与识别,则需要有效提取各类别船舶的特征,卷积神经网络的结构会直接决定船舶特征提取的优劣性。卷积神经网络CNN(Convolutional Neural Network)(Krizhevsky 等 ,2012)的核心就在于由卷积层和池化层不同组合构成的特征提取网络,CNN将特征提取和目标分类放入一个端到端的网络中,网络依据输出值和标签值之间的误差关系,不断的优化修正网络参数,最后在输出层将输出值逐渐拟合标签值,图2为一个经典的CNN网络结构。卷积层和池化层的组合方式会直接影响船只的有效特征提取,经过大量实验,选用通过Imaget预训练完成的ZF网络(Rafique等,2018)作为特征提取网络,相较于GoogleNet(Szegedy等,2015)、VGG (Vedaldi和Lenc,2015)、ResNet(He等,2016) 等网络,ZF结构复杂度低,在能够有效提取船只特征的同时,也能够降低特征提取的时间复杂度。

上一篇:基于无人机实景影像的齿轨铁路三维线路设计方
下一篇:没有了