第一章 绪论
1.1 研究背景和意义
现有的卫星图像来源,包括 DigitalGlobe,欧洲卫星公司 Airbus,NASA 的Landsat 项目和新一代卫星公司 Planet Labs 等等。除军用领域以外,大大小小的商业卫星公司也不断推出更低成本的卫星发射和部署。发射升空的卫星数量逐年递增,尤其是自从传输型遥感卫星投入使用后,卫星遥感影像的数据量不再受到胶片等存储介质的束缚,卫星传感器获取的影像维度和分辨率也随着技术进步不断提高,导致数字遥感图像资源极其庞大,其数据量爆炸性增长,大量高分辨率全球卫星的分布,为现代产业与社会的发展提供了新的有力支撑。
而人工遥感解译的判读员需要长时间培养,数量有限且效率低下,难以处理并有效利用这极其海量的原始数据。将人工智能的深度学习技术引入遥感数据解译应用中,可以全方面提升遥感数据的自动化处理、分析能力。
遥感应用和遥感产业的业务领域方面,推动智能算法与应用落地的公司目前有 Orbital Insight、Spire、PlanetiQ、 以色列 Windward、 Ardusat 、SpaceKnow、九天微星、阿根廷 Satellogic、佳格天地等。四维世景、长光卫星等公司和机构,各自也纷纷推出了不同类别的遥感卫星群计划,并在很多应用方面取得了进展。国内的商业航天相对起步较晚,但目前也已经超过百家,据报道,2018 年国内至少有 15 家的商业航天公司融资计划的披露,融资总金额预计在 20 亿以上。由此可见,如何有效利用如此大规模的原始卫星数据,不只是是行业风口,更需要研究人员不断推陈出新,提高应用技术,挖掘这笔资源。
遥感技术不断发展,人们获取地表水体信息已经不再仅仅依靠人工实地测量,尤其是卫星遥感影像,通过形成星群的远程传感器绕地拍摄,可以在较短的周期内得到当前大范围地区的高精度影像数据,辅以机器视觉的方法来快速处理并利用实时化和分辨率越发提高的遥感影像,在解放人力提高自动化水平的同时,可及时获取准确的水体资源信息。例如通过卫星影像的智能识别技术,识别洪水、堰塞湖或某一流域河流水体的变化等,对于救灾或生态地理变化能做出更及时的判断和决策。
........................
1.2 研究现状
遥感影像与普通图片有极大的不同,其收集地物的光谱响应信息,一般情况下是由多波段组成的,如图 1-1 所示,可以看做一个二维空间和一维光谱的图像立方体。
进行图像遥感影像的水体提取任务,水体分割时面对的分类对象为影像像元,依据水体和其他地物的差异,影像的分类效果很大程度上取决于所提取的影像特征能否对影像信息进行有效的表达。正因为如此,关于其特征的构建和选取[1,2]一直得到广泛的关注。
1.2.1 特征选择概述
遥感影像波段众多,波段间具有强相关性,因此在特征选取的过程中,结合加权概率原型分析[3]、拟态物理学优化算法或快速 SGA 算法、自适应带选择(ABS)和联合偏态-峰度图形(JSKF)[4]等进行波段选择,使用独立成分分析(ICA)、最小噪声分离变换(MNF)算法[5]等降低影像数据的维度,减小数据开销,同时结合多种特征实现分类,是当前的主流。
经典的多光谱图像水体检测算法,包括单波段阈值法、多波段谱间关系法、归一化差异水体指数法等[6-8],均仅仅使用了单一像元的光谱信息,且依赖先验知识,需要通过不断试验确定阈值的选择。国内外有些研究学者针对不同地表物体在图像中所呈现的不同特征表现进行了研究,比如熊显名等人[9]研究了光谱反射率在水体与地表其他物体的不同,通过二值形态学方法提取了水陆分界线。专家学者们不仅分析了主要地物的光谱特性,进行多光谱影像解译[10];随着技术发展,对遥感图像进行特征综合方式开始增多,张立民等[11]在对遥感图像进行分割时,为避免边缘定位不准确问题,将光谱信息和纹理特征进行了结合,提出了遥感图像的分水岭分割算法。
...........................
第二章 特征提取研究
2.1 数据预处理
遥感图像成像时,由于光谱仪器本身具有的随机噪声、大气的随机扰动、地形和邻近地物等影响,会出现辐射误差、大气消光等现象。本章为了避免这些现象对构成较为复杂的多光谱图像带来的影响,采用如下所述的几种措施预处理影像数据。
2.1.1 辐射定标与大气校正
首先通过辐射定标,建立数字量化值(DN)与对应物理量,如辐射亮度值、反射率等之间的关系并进行相应的转换,从而准确获取遥感影像成像时的对应辐射值。大气校正主要针对的是卫星传感器获取地物信息过程中,由于远距离影响,地球大气、太阳光和地表对光的漫反射反射的等现象,尽可能的避免干扰,保证数据的真实性。
2.1.2 图像增强
考虑到识别结果的精确与稳定性,He Kaiming 博士[45]提出的暗通道先前去雾算法被用以增强图像。暗通道先验理论的描述公式如式(2.1):
.........................
2.2 特征提取
2.2.1 光谱特征提取研究
水体对太阳光具有强吸收性,对水体光谱特征进行分析整理选择特征来提取水体。如图 2-1 所示,Landsat ETM 遥感影像中,开看出在七个波段中,水体、植被、旱地和盐碱地存在差异。
多光谱图像与常规图像较为突出的差异,在于不同波段的光谱值可反应地物资源等的独特特征,通过波段本身(阈值法)和相互之间的关系(谱间关系法),可突出目标资源的信息表达。水体信息的表达在前人的研究中,已有多种光谱特征的计算方式。光谱特征一般只通过单像元本身的曲线数值序列计算,对相邻像元的变化规律并不加以捕捉。所以当发生不同位置的同一类地物拥有光谱数值上的差异,或者同一数值但事实上分属不同地类的问题,不考虑图像自身的局部甚至全局变化规律就无法准确区分。
........................
第三章 基于 DBN 水体信息提取模型 ........................... 12
3.1 特征扩充介绍 ............................... 12
3.2 DBN 模型 .................................... 13
3.3 实验与分析 ............................... 15
第四章 基于多模态模型的遥感影像自动识别研究 ............................. 18
4.1 基于双向 LSTM 网络提取光谱特征 ............................. 19
4.2 基于 M-CNN 网络提取多尺度的空间纹理特征 ........................ 20
第五章 基于双自动编码器的无监督遥感影像分割 ................................. 28
5.1 空洞卷积自编码器 .................. 29
5.1.1 自编码器 ................................ 29
5.1.2 空洞卷积编码 .................................. 30
第五章 基于双自动编码器的无监督遥感影像分割
5.1 空洞卷积自编码器
影像像元类似普通像素,也是连续变化的,获取单个像元的邻域感受野,能够更充分地获取遥感影像的空间信息。
5.1.1 自编码器
自编码器(AutoEncoder)通过编码(encoder)和解码(decoder)操作可以对输入的影像进行复现,对输入与输出数据进行一致性对比,通过修正权重偏置参数降低差异性,实现无监督学习。自编码器结构如图 5-2。
.........................
第六章 结论与展望
6.1 结论
商业航空蓬勃发展,遥感卫星大量升空,有效利用这些卫星影像资源有利民生,识别地表水体变化,及时掌握生态变化情况,具有重要的理论意义和应用价值。人工智能的浪潮对于解放人力效果显著,深度学习技术发展迅速,将深度学习模型和算法应用到实际领域中,使其适用于遥感影像水体识别等[64,65],应对大规模数据,可以进一步节省人力资源和计算资源。本文就水体识别和遥感影像分割开展研究,提升算法准确率和自动化程度,并进一步探索无标签数据的处理。
本文分析了几种遥感影像的特征提取方法,包括光谱特征和纹理特征、形态学特征等,分析了浅层特征与深层特征对遥感影像水体等数据的表达能力,对比分析了浅层机器学习算法和深度学习算法在性能上的差异,证明了深度学习模型的有效性,通过特征扩充算法,优化提升了 DBN 模型的水体识别的准确性。
由于手工特征提取再分类的分阶段模型自有其局限性,本文结合双向长短时记忆网络(BiLSTM)与改进的卷积神经网络(Modified-CNN,M-CNN),通过全连接条件随机场(DenseCRF)层进行分类,对多模态模型自动生成的横纵向多尺度特征实现整合和识别验证,构建了遥感影像智能识别的端到端(end-to-end)神经网络模型。并通过实验证明了模型的准确性,相对于多阶段水体识别模型,所构建的模型可进行整体一致的训练,自动化程度和准确性更高。
参考文献(略