无人机航拍能够快速准确获取地表的高分辨率影像,已经成为遥感数据获取的重要手段之一。采用eCognition软件面向对象分类方法,对无人机影像进行地物分类研究。通过ENVI OneButton生成无人机正射镶嵌影像,选择合适的分割参数对实验区影像进行多尺度分割,找出最优的分割尺度。利用eCognition特征优化功能选择最优对象特征组合,进行最近邻分类。结果表明,分类的总体精度达到83%,Kappa达到0.8,采用eCognition面向对象的分类方法能够较为准确地得到地物覆盖信息。利用无人机技术和eCognition面向对象分类方法,可充分利用影像的光谱信息和形状、纹理等空间信息,能够实现地物信息的快速、准确提取。 Unmanned aerial vehicle can obtain high-resolution images quickly and accurately, which had become one of the most important means of remote sensing data acquisition. In this paper, ob-ject-oriented method of eCognition software is used to UAV ortho-images classification. ENVI OneButton was used to generate UAV orthographic mosaic image. We selected the appropriate multi-resolution segmentation parameters for image segmentation and optimal object feature combination using optimization function of eCognition software. Finally, the nearest neighbor method is used for classification. The results showed that the overall accuracy of the classification was 83%, and the Kappa reached 0.8. The objected-oriented classification method of eCognition software can obtain more accurate coverage information of ground objects. combined with UAV technology and objected-oriented classification method, the surface information can be acquired accurately by full use of the spectral ,shape, texture and other spatial information.
宋雪莲1,阮玺睿1,张威2,张文1,3,丁磊磊1,雷霞1,谢彩云1,陈伟1,王志伟1*
1贵州省农业科学院草业研究所,贵州 贵阳
2贵州省水利水电勘测设计研究院,贵州 贵阳
3贵州阳光草业科技有限责任公司,贵州 贵阳
收稿日期:2018年6月13日;录用日期:2018年6月28日;发布日期:2018年7月5日
无人机航拍能够快速准确获取地表的高分辨率影像,已经成为遥感数据获取的重要手段之一。采用eCognition软件面向对象分类方法,对无人机影像进行地物分类研究。通过ENVI OneButton生成无人机正射镶嵌影像,选择合适的分割参数对实验区影像进行多尺度分割,找出最优的分割尺度。利用eCognition特征优化功能选择最优对象特征组合,进行最近邻分类。结果表明,分类的总体精度达到83%,Kappa达到0.8,采用eCognition面向对象的分类方法能够较为准确地得到地物覆盖信息。利用无人机技术和eCognition面向对象分类方法,可充分利用影像的光谱信息和形状、纹理等空间信息,能够实现地物信息的快速、准确提取。
关键词 :无人机影像,面向对象,eCognition,特征选择,分类
Copyright © 2018 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
无人机航拍相对于传统航拍具有机动灵活、环境适应性强、作业成本低的优势,能快速准确获取飞行困难地区的高分辨率影像,已经成为航空摄影测量的重要手段之一 [
eCognition软件采用基于目标信息的遥感信息提取方法,它集合了面向对象的分割方法以及大量的分类规则,适用于高分辨率遥感影像的解译。目前已有学者采用eCognition面向对象方法进行遥感影像分类的研究,并取得了较好的结果 [
以具有代表性的贵州省贵阳市某城乡结合部作为实验区,采用Phantom 4 DJI无人机对实验区进行拍摄,影像获取的时间为2017年12月,拍摄高度为100m,选用的数据大小为6000×5000像元。无人机影像包含红、绿、蓝三波段。实验区域包含菜地、裸地、道路、房屋、水体、废弃建材用地、灌丛、树木等。
利用ENVI OneButton生成无人机正射镶嵌影像。ENVI OneButton是ENVI新增的无人机图像处理工具,利用先进的摄影测量和计算机视觉算法,采用空三加密和区域网平差技术快速得到高精度、具备标准地理参考、无缝镶嵌的正射影像。ENVI OneButton对影像的正射处理主要包含影像匹配、空三计算、正射影像生产和镶嵌匀色等步骤。生成的无人机正射影像无明显拼接痕迹(图1),颜色色调平衡,影像边界无明显畸变,可用于地物分类。
eCognition软件的提取对象是基于影像分割后的多边形,综合影像空间和波谱信息,对影像进行分类。进行面向对象分类的核心流程包含是对象分割和分类。eCognition在对象分割后,选择参加分类的对象特征,并按照对象在特征空间中的距离及相应的分类规则进行分类。
对象分割是分类的基础,分类的精度很大程度上取决于分割的效果。eCognition中的多尺度分割是用的最多、最有效、速度最慢的一种分割方式。多尺度分割通过合并相邻的像素或小的分割对象,在符合对象异质性标准前提下,进行区域合并,实现影像分割 [
多尺度分割的参数设置决定着对象间的差异,也影响着对象的数量和面积的差异。多尺度分割是一个合并与判断算法是否终止的反复过程,并不对原始影像提取与知识相关的任何信息。在多尺度分割过程中,光谱、紧致度、平滑度等作为度量是否同质或者异质的标准。分割时,将具有相同或者相近的特征性质的像素组合成一个对象。不同的对象间的像素则具有明显的特征差异。在已分割的对象层基础上,
图1. 实验区正射镶嵌影像
通过比较相邻对象间的异质标准,当其小于定义的尺度参数则继续合并为同一个对象。
多尺度分割的三个主要参数分别为尺度参数、颜色参数和形状参数。颜色参数和形状参数用来表示对象的同质性,两者的权重之和为1。形状参数由光滑度和紧致度来表示,二者的权重之和为1。同一幅影像在不同的分割参数设置下生成的影像对象及其包含的特征不同,分割产生的对象将直接影像分类的精度和效率。因此在分类前,要选取合适的尺度参数,才能在分类时充分利用对象特征。最优分割应保证对象内部同质性最大,不同对象间的异质性尽可能大。
分别设置不同的尺度参数、形状参数和紧凑度参数,通过对比分割对象来确定最适应的分割参数。将形状参数和紧凑度参数分别为软件默认值0.1和0.5,将尺度参数设置为50、100、150、200、250、300,来对比不同尺度参数对分割结果的影响(图2)。
图2. 不同尺度参数下的分割结果
尺度参数用来衡量不同对象间的最大异质性。尺度参数越大,对象生成过程中合并的次数越多,产生的差异越多。从图2中可以看出,分割尺度越小,产生的对象斑块越小,产生的对象数越多,分割结果越破碎。当分割尺度设置为100以下时,分割的结果过于破碎,相同地物被分成为多个对象,这样可能导致在分类时同一地物不能被分为同一类。当分割尺度在250以上时,地物出现欠分割,不同的地物类型被划分成同一个对象,如农田中的空地没有从农田中分割出来,裸地中的植被也没有被分割出来。因此,认为最适宜的尺度参数为150~200左右。
固定尺度参数和紧凑度参数分别为150和0.5,设置形状参数分别为0.1、0.3、0.5、0.7,来对比不同形状参数的分割结果(图3)。
在设置形状参数的同时,也定义了颜色参数,即定义了影像层光谱值用于整体一致性准则的比例。形状参数能制约对象形状的发展,形状参数越大,分割后的对象形状越平滑,更符合视觉习惯。当形状参数大于0.9,影像的光谱信息在分割计算中应用的比例少,分割的对象与光谱信息无关,无法充分利用其光谱信息。且形状参数过大时,产生的对象形状越规整,无法反应真实的地物形状。从图3中可以看出,形状参数越大,产生的对象斑块面积越大,其形状大小的差异越少,且对象数越少,对象的形状更加规则平滑。形状参数大于0.5后,虽然道路、房屋等规则形状的地物能更好的被分割,但在农田,植被及裸地区域出现过分割的现象。形状参数设为0.3时,分割的效果较好。
固定尺度参数和形状参数分别为150和0.3,设置紧凑度分别为0.1、0.3、0.5、0.7,分割结果如图4。
形状因子包含光滑度和紧凑度,确定紧凑度后,光滑度也随之确定。光滑度的权重较高,则分割后的对象边界较光滑;若紧致度权重较高,分割后的对象形状较为紧密且接近矩形。紧凑度参数是利用形状准则,考虑整体性,对影像对象结果进行优化。从图4可以看出,紧致度参数设置越大,分割对象的
图3. 不同形状参数下的分割结果
图4. 不同紧致度下的分割结果
面积越大,形状越紧密,且较接近规则形状。
综合对比不同尺度参数、形状、紧致度参数的分割效果,当尺度参数为150,形状参数和紧致度参数分别为0.3,0.5时,分割的效果较好。如道路,房屋等地物形状较为规则,水体、农田边界清晰。农田中的空地也能较好地从农田中分割出来,裸地中的植被也能较好地从裸地中分割出来。同一对象包含同种地物,不同地物类型被分割到不同的对象中。
对象分割后会产生一系列的对象特征,生成的对象特征不仅包含光谱信息、还包含形状、纹理和上下文的信息,从而弥补了对象在合并过程中光谱均质化所造成的信息丢失,这些特征都可以用做影像分类。eCognition针对所选的分类特征和样本对象,形成描述类的模糊逻辑函数。
通过目视解译,在本实验中建立道路、建筑、水体、农田、裸地、灌丛等8个类别,并选择三波段的灰度值以及最大差分、几何特征中的长宽比、形状参数中的紧凑度和密度,纹理特征中的灰度共生矩阵的均质性作为特征进行分类。在选择纹理特征时要谨慎选择,多增加一个纹理特征,eCognition计算的时间会增加较多。参加分类的特征越多,精度不一定越高。分类特征过多会造成特征冗余,增加计算量,降低计算效率,甚至降低分类精度。
eCognition具有分类特征选择优化的功能,在人工选择的特征的基础上进行优化选择,并计算每种类别间的距离矩阵。优化结果显示当选择面积、灰度共生矩阵相关性,最大差分,灰度共生矩阵熵以及红波段灰度作为分类特征时,可分性最大,可分性最小的为废弃建材用地与落地,最小可分距离为1.5592 (表1)。
eCognition提供的最近邻分类法,根据人工选定的分类对象特征和训练样本样本,自动建立特征空间,并分配不同特征的权重,计算样本与对象的距离,从而进行分类,是一种监督分类方法。一个对象特征对应该特征空间中的一个维度,在建立特征空间后,对各地物类型选取若干的样本。对象特征在特征空间中都对应一个确定的特征值,选择样本后,样本在特征空间中的特征值也随之确定。最邻近分类在特征空间中计算待分类影像对象与各地类训练样本之间的距离,将该待分类对象归属到最近样本对象所在的类别。
从最近邻分类结果(图5)可以看出,水体的分类效果较好,水体内部完整,边界清晰;农田中的裸地
类别 | 水体 | 建筑 | 道路 | 农田 | 树木 | 裸地 | 废弃建材 | 灌丛 |
---|---|---|---|---|---|---|---|---|
水体 | 0 | 8.0445 | 5.8964 | 7.6494 | 6.7282 | 5.6001 | 10.4885 | 9.3781 |
建筑 | 8.0445 | 0 | 1.7256 | 5.2822 | 7.9406 | 3.8755 | 3.9128 | 6.2307 |
道路 | 5.8964 | 1.7256 | 0 | 6.8752 | 5.9144 | 2.9122 | 3.1726 | 3.3505 |
农田 | 7.6494 | 5.2822 | 6.8752 | 0 | 1.5739 | 1.7088 | 3.4885 | 2.8762 |
树木 | 6.7282 | 7.9406 | 5.9144 | 1.5739 | 0 | 2.1432 | 3.2088 | 1.8511 |
裸地 | 5.6001 | 3.8755 | 2.9122 | 1.7088 | 2.1432 | 0 | 1.5592 | 2.3152 |
废弃建材 | 10.4885 | 3.9128 | 3.1726 | 3.4885 | 3.2088 | 1.5592 | 0 | 2.9540 |
灌丛 | 9.3781 | 6.2307 | 3.3505 | 2.8762 | 1.8511 | 2.3152 | 2.9540 | 0 |
表1. 类别间距离矩阵
图5. 最近邻分类结果
以及裸地中的灌丛都能够被提取出来,道路旁边的废弃建材堆积用地也能得到较好的区分。eCognition面向对象的分类结果克服了传统像素分类的“椒盐”问题和由于细微的光谱差异,混合像元造成的碎斑现象;同一地物内部更加完整,边界清晰;分类结果具有丰富的语义信息,便于解释和理解。
分类精度是检验分类方法是否可行的首要指标 [
从混淆矩阵(表2)中可以看出,水体、灌丛的分类结果较好,一部分建筑被错分为道路,道路也有一部分被错分为建筑和农田,农田一部分被错分为树木和裸地,小部分的树木被错分为农田,灌丛有一部分被分为树木。部分建筑的材质与水泥道路非常相近,在影像上的光谱显示非常接近,容易产生错分现象。沟渠中长有水生植物,且沟渠与农田的形状相近,呈长条状,因而与农田产生错分。农田中,生长稀疏的部分明显能观察到裸地,也容易被分类为裸地。总体来说,分类的精度较好,所有类别的生产者精度在0.65以上,总体精度和Kappa系数分别为83%和0.80 (表3)。
本文利用eCognition软件采用面向对象的分类方法对无人机正射影像进行地物分类。通过选择合理的分割尺度以及分类特征,采用最近邻分类方法,较好地区分出实验区的8类地物,分类总体精度和Kappa
类别 | 水体 | 建筑 | 道路 | 农田 | 树木 | 裸地 | 废弃建材 | 灌丛 | 总和 |
---|---|---|---|---|---|---|---|---|---|
水体 | 183,162 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 183,162 |
建筑 | 0 | 58,014 | 9755 | 0 | 0 | 0 | 0 | 0 | 67,769 |
道路 | 0 | 30,074 | 85,677 | 0 | 0 | 0 | 0 | 0 | 115,751 |
农田 | 0 | 0 | 34,100 | 114,485 | 2392 | 0 | 0 | 0 | 150,977 |
树木 | 0 | 0 | 0 | 18,428 | 50,772 | 0 | 0 | 22,482 | 91,682 |
裸地 | 0 | 0 | 0 | 28,768 | 0 | 108,541 | 0 | 0 | 137,309 |
废弃建材用地 | 0 | 0 | 0 | 0 | 0 | 0 | 58,714 | 0 | 58,714 |
灌丛 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 70,401 | 70,401 |
总和 | 183,162 | 88,088 | 129,532 | 161,681 | 53,164 | 108,541 | 58,174 | 92,883 |
表2. 混淆矩阵
评价指标 | 水体 | 建筑 | 道路 | 农田 | 树木 | 裸地 | 废弃建材用地 | 灌丛 |
---|---|---|---|---|---|---|---|---|
生产精度/% | 1 | 65.86 | 66.14 | 70.8 | 95.5 | 1 | 1 | 0.758 |
用户精度/% | 1 | 85.6 | 74.01 | 75.82 | 55.37 | 79.05 | 1 | 1 |
总体精度/% | 83.32 | |||||||
Kappa系数 | 0.857 |
表3. 各类别分类精度和总体精度
系数分别达到83%和0.8。利用无人机影像作为数据源,采用面向对象的分类方法,能够同时在效率和精度上取得较好的效果。面向对象的分类方法不仅能利用影像的光谱信息,还能综合考虑地物的形状,纹理等信息,有效地避免基于像元分类方法产生的“椒盐”现象。面向对象分类的基础是对象分割,分类的依据是对象的特征,分类结果精度很大程度上取决于分割对象。多尺度分割参数的选取对面向对象的分类至关重要,需要进行更加深入的研究。
贵州省科技计划项目“铜仁汞污染地区农田系统治理与修复关键技术与工程示范”(黔科合支撑[
宋雪莲,阮玺睿,张威,张文,丁磊磊,雷霞,谢彩云,陈伟,王志伟. 基于面向对象的无人机正射影像地物分类 UAV Ortho-Images Classification Based on Object[J]. 测绘科学技术, 2018, 06(03): 165-173. https://doi.org/10.12677/GST.2018.63018