建筑物作为一种重要的地理空间要素,在城市规划与建设、居住环境、交通管理、房地产以及灾害损失评估等领域占有极为重要的地位。车载激光扫描(Mobile Laser Scanning, MLS)数据是建筑物三维模型重建的主要数据源之一,本文针对基于MLS数据建筑物的提取耗时过长和错分漏提率高等问题,提出了一种融合Open Street Map (OSM)和MLS点云数据的三维建筑物快速提取方法。该方法包含数据预处理、改进的ICP精配准、OSM与MLS数据的信息融合及辅助提取四个步骤,实验结果表明该方法可以有效提升效率,处理时间可缩短50%以上;同时该方法还可有效避免误提取问题,对漏提取问题也有所改善,因此提升了建筑物提取的精度。两种数据的融合,实现了双方的优势互补,为建立位置精准、关系正确、几何细节和属性信息丰富,方便快速更新的城市三维模型,提供了数据支撑。 As a geospatial element, building plays an extremely important role in fields of urban planning and construction, residential environment, traffic management, real estate industry, and hazard assessment. Mobile Laser Scanning (MLS) data is one of the main data sources for 3D-models reconstruction of buildings. This paper proposes a fast method of 3D-building extraction from MLS point clouds, by fused with Open Street Map (OSM) data, to solve the problems of time-consuming and building mistaken extraction. The method includes four steps: data preprocessing, improved ICP fine registration, information fusion of OSM and MLS, and assisted building extraction. The experimental results show that this method can effectively improve the efficiency, the processing time is shortened by more than 50%, and it is effective to avoid the problem of building mistaken and missing, therefore improves the precision and accuracy of building extraction. The fusion of OSM and MLS data can provide data support for 3D urban models with accurate location, correct relations, geometric details, and rich semantic information.
石蒙蒙*,杨必胜,刘缘,宋爽,董震
武汉大学,测绘遥感信息工程国家重点实验室,湖北 武汉
收稿日期:2018年10月6日;录用日期:2018年10月22日;发布日期:2018年10月29日
建筑物作为一种重要的地理空间要素,在城市规划与建设、居住环境、交通管理、房地产以及灾害损失评估等领域占有极为重要的地位。车载激光扫描(Mobile Laser Scanning, MLS)数据是建筑物三维模型重建的主要数据源之一,本文针对基于MLS数据建筑物的提取耗时过长和错分漏提率高等问题,提出了一种融合Open Street Map (OSM)和MLS点云数据的三维建筑物快速提取方法。该方法包含数据预处理、改进的ICP精配准、OSM与MLS数据的信息融合及辅助提取四个步骤,实验结果表明该方法可以有效提升效率,处理时间可缩短50%以上;同时该方法还可有效避免误提取问题,对漏提取问题也有所改善,因此提升了建筑物提取的精度。两种数据的融合,实现了双方的优势互补,为建立位置精准、关系正确、几何细节和属性信息丰富,方便快速更新的城市三维模型,提供了数据支撑。
关键词 :Open Street Map,车载激光点云,建筑物提取,数据融合,ICP配准
Copyright © 2018 by authors and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
建筑物作为一种重要的地理空间信息要素,是人们主要的活动场所,在城市规划与建设、居住环境、交通管理、房地产以及灾害损失评估等领域占有极为重要的地位 [
对于激光点云数据中的多目标提取,其中包括建筑物立面提取,有一类方法是先对点云数据进行分割。因此国内外学者对点云数据分割做了大量的研究工作,并取得了一定的研究成果。T. Varady等最早给出了点云分割的定义 [
随着传感器、物联网与云计算的快速发展,志愿者地理信息(Volunteered Geographic Information, VGI),又称众源地理数据,不断兴起,其中影响力较大的主要有Open Street Map (OSM),Waze,Wikimapia,Google Map Maker,Foursquare,以及国内的新浪微博、大众点评等社交与生活服务类网站 [
VGI数据大部分来自于没有经验的非专业人士,数据采集设备精度不一,且创建编辑过程中所用用比例尺也有所差别,具有数据质量各异、分布不均匀、冗余而又不完整、缺少统一规范等问题 [
由于OSM数据质量不具有全局一致性,但在一定范围内的质量差异可以忽略,因此对于大范围的MLS数据,本文采取按轨迹长度分段处理。基于当前MLS数据的空间范围,可从Open Street Map网站直接获取最新的OSM数据,该数据为XML格式,通过相互关联的几何要素(Nodes, Ways, Relations)和属性要素(tags)来描述地面实体目标,采用的是WGS84椭球参考系,无投影坐标系。本文先利用空间数据转换处理系统Feature Manipulate Engine,简称FME,将OSM数据转换为shape格式的二维矢量地图数据后,再统一OSM-shp数据与MLS数据的地理参考系,最后分别根据MLS数据的采集轨迹信息和OSM属性数据中的“building”关键字选取关键OSM路网和建筑物polygon,用于后续操作。
众源地理数据形式是二维矢量地图数据,具有对象化的特性和复杂的拓扑关系,而三维激光点云是一系列带有三维信息和强度信息的离散点集,无对象化的概念,这种二维与三维数据的配准存在一定难度。又由于第2章所述众源数据存在的问题,使得OSM数据和点云数据的配准精度难以保证。经过数据预处理工作,OSM和MLS数据已处于相同的地理参考之下,但由于投影变换是由控制点近似或统一参数求得,在考虑到OSM数据与MLS数据的绝对定位误差的前提下,仍需要在提取区域内进行局部的精
图1. 方法流程图
图2. 数据预处理
细配准。因此文本结合研究目标,根据实际需求,将配准问题适当简化,提出适用于当下研究问题的配准方法,即转化为MLS轨迹点集与OSM道路点集的二维配准问题。
OSM数据提供了建筑物的粗略边界轮廓,为确定OSM数据与点云数据中建筑物立面的对应关系,本文利用MLS的轨迹数据建立OSM数据与MLS数据的正确叠加,并利用迭代最近邻点算法(Iterative Closest Point,简称ICP)求得两份数据之间的变换参数。经典的ICP算法的目标函数为:
d | = argmin ∑ i = 0 k | R n i + T − m i | (1)
R | = [ cos θ − sin θ sin θ cos θ ] , T = [ x , y ] T | (2)
其中,k是匹配点的数量;mi为目标点ni为匹配点;R和T为变换参数,在本文中由于是二维的位姿变换,所以R为θ构成的旋转矩阵,T为x和y坐标的偏移量。但轨迹和路网之间的匹配,利用点到点之间的关系建立变换并不精确。一方面采样函数无法保证在两种轨迹相同的位置进行采样;另一方面点到点的ICP算法并没有用到轨迹之间节点的相关性。所以本文采用了基于点到线距离约束的ICP版本,算法流程图如下图3所示。
首先,为参考点集构建搜索树,此处的参考点集为车载数据轨迹点。接着针对每一个待配准点集内的点,搜索在参考点集对应的线段,由最近邻点及其上/下一点构成。然后对每一个匹配点线建立约束方程,最终利用Levenberg-Marquardt算法 [
图3. ICP配准流程图
d | = argmin ∑ i = 0 k | ( R n i + T − m i a ) × ( R n i + T − m i b ) | | m i a − m i b | (3)
构建约束方程的Jacobian矩阵并利用LM算法进行求解。LM算法的迭代形式如下式。迭代收敛后,利用得到的变换参数对OSM的建筑物矢量数据进行变换。
[ R , T ] ← [ R , T ] − ( J T J + λ diag ( J T J ) ) − 1 J T d (4)
MLS 轨迹点集与 OSM 道路点集的二维配准结果如图4所示。
众源地理数据具有几何信息和语义信息,理论上可以从空间上和语义上为激光点云分割分类、目标提取提供先验知识,且在建立匹配关系之后,可将其语义信息赋给点云,最终得到具有丰富语义信息的三维模型。对于有明确范围的建筑物目标来说,可以在点云数据中得到其候选区域,代替直接从数据量巨大的三维点云中提取,可极大地缩小其搜索范围。
对存在误差的两种数据源进行信息融合,为了的到更加准确可靠的结果,本文采用贝叶斯信息融合方法,利用概率的方法对两种数据源进行建模和融合。首先本文利用OSM数据与LiDAR数据初步融合给出似然概率。顾及到OSM数据本身的误差,在融合时设置了两重缓冲区,作为建筑物点云的候选区域。在第一重缓冲区范围内,认为其概率与OSM图斑内一致,在第二重缓冲区内其概率随距离的增大递减,这里的概率为先验概率,公式如下:
P ( B O S M ) = { 0.9 , d < S b 1 | 0.9 ∗ e − d , S b 1 | < d < S b 2 | (5)
图4. OSM数据配准前后对比——红色为MLS轨迹点
其中d定义为点云到OSM图斑的距离,在图斑内时该值为0,BOSM定义为由OSM数据所推测点属于建筑物。
然后是建筑物提取,本文用的是组合基于点特征、对象特征和基于规则的分类方法并利用先验知识设计多层次策略进行分割分类的针对建筑物的提取方法 [
最后,将得到的建筑物点赋予初始概率0.9,再以数据点的概率进行邻域平滑。最后利用贝叶斯公式融合两者,由于两种概率的获取方式相互独立,故有如下公式:
P ( A | B O S M , B E X T ) = | P ( B O S M | A ) P ( B E X T | A ) P ( A ) P ( B O S M , B E X T ) (6)
其中A定义为假设点属于建筑物,BEXT定义为由3.1方法所推测点属于建筑物。
实验中MLS数据采用Paris-Lille-3D benchmark [
本文取了两块实验区域(Lille2和Paris部分区域),分别利用文献 [
精 确 度 = T P / ( T P + F P )
准 确 率 = ( T P + T N ) / ( T P + F N + F P + T N )
召 回 率 = T P / ( T P + F N )
交 并 比 = T P / ( F P + T P + F N )
图5. 建筑物提取方法流程
数据集 | 轨迹长度 | 点数 | RGF93偏移量 |
---|---|---|---|
Lille 2 | 340 m | 26.8 M | (711,164.0 m, 7,064,875.0 m) |
Paris | 450 m | 45.7 M | (650,976.0 m, 6,861,466.0 m) |
表1. MLS数据集描述信息
方法 | 精确度 | 准确率 | 召回率 | 交并比 | 提取时间 |
---|---|---|---|---|---|
Yang et al., 2015 | 94.66% | 90.74% | 90.32% | 85.99% | 142.772 s |
本文方法 | 97.26% | 92.31% | 90.62% | 87.99% | 70.534 s |
表2. Lille 2数据实验结果评价指标对比
方法 | 精确度 | 准确率 | 召回率 | 交并比 | 提取时间 |
---|---|---|---|---|---|
Yang et al., 2015 | 81.69% | 91.30% | 97.32% | 79.76% | 2134.170 s |
本文方法 | 97.36% | 98.12% | 97.12% | 94.82% | 136.344 s |
表3. Paris数据实验结果评价指标对比
FN: False Negative,被判定为非建筑物点,但事实上是建筑物点。
FP: False Positive,被判定为建筑物点,但事实上是非建筑物点。
TN: True Negative,被判定为非建筑物点,事实上也是非建筑物点。
TP: True Positive,被判定为建筑物点,事实上也是建筑物点。
从Lille 2数据集中分别截取三块区域(如上图6所标记)的提取结果,如下图7~图9所示。其中图8、9分别为本文方法所避免的误提取和漏提取现象的两个个示例。
Lille 2数据的非地面点中,建筑物点占52%,道路两侧均有建筑物及低矮植被分布,路面上有汽车停靠,还有部分形态类似于建筑物立面的篱笆等地物分布。由表2,本文方法相比于Yang et al., 2015方法:处理时间减少了约50%,由于本文方法利用配准后的VGI数据,有效提供了建筑物候选区域,因而减少了近50%的数据处理量;精确度提升了3%、准确率提升了2%、交并比提升了2%,这是由于数据中的篱笆(如图7)和部分汽车(如图8)等被Yang et al.方法误提取,而本文方法有效避免了这类现象,使得FP数下降;召回率提升了0.3%,这是由于实验区域在Open Street Map上的数据比较完备,且因为使用了贝叶斯信息融合的方法避免了少量如图9所示的漏提取问题,在此基础上,也很好地验证了本文方法对建筑物提取有效,即在提高效率的同时,也较好地避免了误提取问题,并对漏提取问题有所改善。
Paris数据的非地面点中,建筑物点占36%,道路一侧主要分布着建筑物,另一侧主要是排列整齐的行道树,场景较为简单(如图10所示)。由表3,本文方法相比于Yang et al., 2015方法:处理时间减少了约93%,效果显著,一方面由于该数据建筑物密度较小,用本文方法大大减少了处理数据量,另一方面由于该数据场景较为简单,各建筑物之间分隔明显,采用了分治策略,使得效率更高;精确度提升了16%、准确率提升了7%、交并比提升了15%,同理,主要是由于现有方法将道路另一侧的行道树误提取(如图11),且行道树点约占非地面点的18%,而本文有效避免了此问题的发生,所以效果提升明显;召回率几乎没有下降,再次验证了上述方法的有效性。
图6. Lille 2原始数据-按高程赋色
图7. Lille 2数据集示例1:提取结果(按高程赋色)
图8. Lille 2数据集示例2:Yang et al.方法提取结果(按高程赋色)。说明:此处为篱笆,为Yang et al.方法的误提取,本文方法未出现此结果。
图9. Lille 2数据集示例3:本文方法提取结果(按高程赋色)。说明:此处Yang et al., 2015方法漏提取,所以无图。
图10. Paris原始数据(按高程赋色)
图11. Paris数据集提取结果对比(按高程赋色)
总体而言,经实验验证:本文方法在时间效率上有较大提升,且提升效果跟场景内的建筑物密度成反比;当OSM数据较为完备的情况下,该方法在保证召回率不受影响的基础上,能有效避免误提取和漏提取的问题,从而提升分类的精确度、准确率及交并比。
本文提出了一套融合OSM数据和MLS点云建筑物快速提取的方法流程,选取较好的现有建筑物提取方法进行了对照实验验证。实验结果表明,通过OSM数据的辅助,大大提高了现有点云建筑物提取方法的效率和精度,尤其适用于建筑物密度较小的场景,可以实现三维建筑物点云的快速提取,为建立位置精准、关系正确、几何细节和属性信息丰富(例如:POI信息,建筑物用途等)的城市三维模型,及后续应用提供了有效的数据支撑。而且,本文方法可以有效改善现有方法的误提取问题,避免形态近似于建筑物的其他地物的影响。但是,该方法对OSM数据的完整度和精确度有一定的依赖性,在OSM数据缺失的情况下可能会导致漏提取问题。
石蒙蒙,杨必胜,刘缘,宋爽,董震. 融合OSM和车载激光扫描数据的建筑物三维快速提取 3D Buildings Fast Detection by Fusion of Open Street Map Data and MLS Point Clouds[J]. 测绘科学技术, 2018, 06(04): 363-373. https://doi.org/10.12677/GST.2018.64044