为使交通网络控制子区内的交通流具有更好的同质性,本文将道路网络中的路段抽象为点,相邻路段之间的连接关系抽象为边,形成一个对偶的网络拓扑结构图。以用户均衡交通分配得到的路段交通流数据除以路段长度计算得到路段的“拟交通密度”;通过引入路段拟交通密度,扩展了Newman子区划分算法。最后,选取实际路网、以NSK (Normalized cut Silhouette)指标验证K均值聚类算法、传统Newman算法和扩展的Newman子区划分算法的优劣。研究发现:传统K均值聚类算法得到的各子区NSK指标和路网NSK指标都相对最小,但同一个子区内的路段在空间位置上不相连,没有实际运用价值;扩展的Newman子区划分算法的NSK值优于传统Newman快速划分算法,证实引入了路段拟交通密度作为边权,使得划分出来的结果更加符合交通网络的特性。 A dual network is structured firstly by setting link of road network as dual node and incidence relationship between links of road network as dual links in the dual network in order to keep homogeneity of traffic flow in each road sub-network partitioned. Link traffic flow, which is the result of traffic demand assignment based on user equilibrium principle, is divided by link length and then the definition of quasi traffic density of each link is proposed secondly. Newman network partition algorithm is extended by introducing the definition of quasi traffic density. Thirdly, the superiority of K-means cluster algorithm, Newman network partition algorithm and extended Newman network partition algorithm are identified by measurement of Normalized cut Silhouette (NSK) on a real road network. This study has identified that: indexes value NSK and NSK on networks of traditional K-means cluster algorithm are relatively small, but the sub-network partitioned is not connected in the space so that it lacks practical value. Index NSK of extended Newman network partition algorithm is prior to that of Newman network partition algorithm. The sub-network which is partitioned by extended Newman network partition algorithm introduced the definition of quasi traffic density is favorable for purpose of traffic flow control.
黎茂盛,王永亮,姚力煊
中南大学,交通运输工程学院,湖南 长沙
收稿日期:2019年3月5日;录用日期:2019年3月19日;发布日期:2019年3月26日
为使交通网络控制子区内的交通流具有更好的同质性,本文将道路网络中的路段抽象为点,相邻路段之间的连接关系抽象为边,形成一个对偶的网络拓扑结构图。以用户均衡交通分配得到的路段交通流数据除以路段长度计算得到路段的“拟交通密度”;通过引入路段拟交通密度,扩展了Newman子区划分算法。最后,选取实际路网、以 N S k (Normalized cut Silhouette)指标验证K均值聚类算法、传统Newman算法和扩展的Newman子区划分算法的优劣。研究发现:传统K均值聚类算法得到的各子区 N S k 指标和路网 N S k 指标都相对最小,但同一个子区内的路段在空间位置上不相连,没有实际运用价值;扩展的Newman子区划分算法的 N S k 值优于传统Newman快速划分算法,证实引入了路段拟交通密度作为边权,使得划分出来的结果更加符合交通网络的特性。
关键词 :交通控制,控制子区,聚类算法,Newman网络划分算法,交通密度
Copyright © 2019 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
如何根据交通网络的拓扑结构和交通流的网络分布特征,将庞大且复杂的路网划分成若干独立的子区,有效实现子区上的信号控制,使得整个路网系统变得更加高效、可靠和灵活,一直备受研究者关注。自1971年Walinchus提出路网交通控制子区的概念 [
此外,当前在路段交通流密度的获取上,多是采用微观仿真,如王晓轩运用浮动车数据结合Vissim仿真得到路网各路段的交通流密度值来进行交通控制子区的划分,本文采用基于用户均衡模型进行交通分配得到的路段交通流量来求解路段拟交通密度,因为其有两个优点:一是考虑了交通流量在网络中的分布,从而比已有方法更深入地考虑了人对路径的选择;二是能更好地适应交通需求变化情况下,交通控制灵活变动的需求,屏蔽现有交通控制方案给历史交通流带来的相关性影响。
为了使控制子区交通流具有更好同质性,提高其理论最大路网容量,本文以路段为节点,以路段拟交通流密度相似性为边权,对传统Newman算法进行改进,使该方法能够运用于有权网络的“社团”(交通控制小区)发现,使划分的小区更加符合交通控制的需要,并利用 N S k 指标 [
社区发现算法比较经典的有基于图分割的算法、层次聚类算法和基于模块度的优化算法。图分割算法的基本思想是循环迭代将网络划分成事先设定好规模的两个社区,停止条件是这两个社区之间边的数量达到最小,该数量即为图论中的最小割。其中,Kernighan-Lin算法 [
社团模块度 [
假设有 n 个节点的网络,节点彼此之间共有m个连接。 i 和 j 表示节点,当两节点直接相连时,则 A i j = 1;否则 A i j = 0 。 代表节点 i 的度。 δ ( C i , C j ) 用来判断节点 i 和 j 是否在同一个社区内,在同一个社区内 δ ( C i , C j ) = 1 ,否则 δ ( C i , C j ) = 0 。则 Q 函数可以表达为:
Q = ∑ i j [ A i j 2 m − k i * k j ( 2 m ) ( 2 m ) ] δ ( C i , C i ) (1)
假设网络已经被划分成 k 个社团。定义 k × k 维的对称矩阵 e = e i j ,其中,矩阵元素
Q = ∑ i ( e i i − a i 2 ) = Tre − ‖ e 2 ‖ (2)
式中:
e 2 = ∑ i a i 2 = ∑ i ∑ j , k e i j e i k (3)
模块度 Q 越大则表明社区划分效果越好。若社团内部边的比例不大于任意社团间连接边的比例的期望值,则 Q ≤ 0 。 Q 的上限为 Q = 1 。 Q 越接近1,说明社团结构越明显,相应的社团结构划分良好。而在实际的网络中, Q 值通常在0.3~0.7之间。在划分社团的过程中,计算每一种划分对应的模块度值,并找出最大 Q 值所对应的一种或者几种划分,即找出最优的社团结构划分。
该算法基于贪婪算法的思想,算法开始时,将社团中的每个节点看作一个初始社团,然后沿着使网络模块度增加最大或减少最小的方向不断地进行社区合并,在算法执行过程中会形成一个树状图,将树状图在 Q 值达到最大的位置处进行断开,这样便能够得到网络中的最佳社区结构。
Newman快速算法执行过程如下:
1) 首先把含有 n 个的节点复杂网络视为 n 个社团,那么,初始时有:
(4)
a i = k i 2 m (5)
式中, k i 为节点 i 的度; 为网络中连接节点的边的总数。
2) 根据贪婪算法的原理,沿着使 Q 增加或者减小速度最小的方向,依次合并两个有边连接的社团,并计算合并后的 Q 值增量:
Δ Q = e i j + e j i − 2 a i a j = 2 ( e i j − a i a j ) (6)
合并以后,对相应的元素更新,并将 i 和 社团的行和列相加。
3) 重复上一步,直到每个节点都合并成为一个社团为止。
将道路网络中的路段抽象为点,相邻路段之间的连接关系抽象为边,则区域路网将被抽象为一个对偶的网络拓扑结构图。但是,道路交通网络拓扑结构图中各个元素之间的关系并不是简单的布尔关系。考虑到引言中各种划分方法虽然考虑的因素不太相同,但最终目的都是为了使得划分后的小区具有交通流的同质性且路网划分的目的是将路网划分为多个具有同等关联水平的小区,为了使Newman算法更加适用于有权网络划分,对经典的Newman社团快速划分算法进行改进,即以各路段拟交通流密度为参数,建立路段拟交通流密度相似度模型 作为道路网络节点 i 和 j 之间的边权参数, D i j 的计算如公式1所示:
D i j = 1 − | d i − d j | ∑ d i (7)
式中: 表示路段 i 的拟交通流密度, D i j 即表示两路段 和 的拟交通流密度相似度水平,密度越接近, D i j 的值就越接近1。
由于引入了路段接近水平边权参数 D i j ,改进后的元素 e i j 表示为:
e i j = { D i j ∑ i , j D i j ; 节 点 i 与 节 点 j 之 间 有 边 相 连 0 ; 其 他 (8)
a i 可以表示为:
a i = ∑ j e i j ∑ i , j D i j (9)
改进的Newman快速划分算法的合并原则与传统Newman快速划分算法一致,都是沿着 值增大最多或者是减少最小的方向,直至所有节点合并为一个社团。
为了验证本文方法在交通路网控制子区划分的有效性,选取常德市中心城区交通路网,进行划分实验。图1为研究片区的交通路网图,该路网中共有48个信号控制路口和103条路段。划分算法通过Matlab程序语言实现,其中使用用户均衡交通分配得到的路段交通流数据,然后除以路段长度计算得出各条路段的“拟交通密度”。
图1. 常德市中心城区道路网络图
为了验证方法的有效性,将传统Newman社团快速划分算法、本文提出的方法和传统K均值聚类方法得到的子区划分结果进行对比。
首先,将路网视为无权网络,只考虑路段间的拓扑关系,运用传统Newman快速划分算法对图1所示的交通路网进行控制子区划分,划分结果如图2所示。然后,引入路段拟交通流密度相关性参数,采用本文的改进的Newman快速划分算法对路网进行子区划分,划分结果如图3所示。子区合并过程中两种方法模块度 Q 值变化情况如图4所示。由图4可知,采用传统Newman快速划分算法进行子区划分时,当子区划分至第98次时,模块度 Q 达到最大值0.6021,此时子区划分结果最优,路网被划分为5个控制子区,如图5所示,对应图2的子区划分树状图。采用本文改进的Newman快速划分算法进行子区划分时,当子区划分至第98次时,模块度 Q 达到最大值0.6278,此时子区划分结果最优,此时路网被划分为6个控制子区,如图6所示,对应图3的子区划分树状图。
图2. 传统Newman算法控制子区划分树状图
图3. 改进Newman算法控制子区划分树状图
图4. 子区划分模块度值
图5. 传统Newman算法控制子区划分结果
图6. 改进Newman算法控制子区划分结果
接着,运用传统 k 均值聚类方法进行两次子区划分实验,每次划分的初始聚类中心都是随机选取且不相同,划分结果分别如图7、图8所示:
图7. K均值聚类第一次子区划分
图8. K均值聚类第二次子区划分
图7、图8显示了两次随机 k 均值聚类算法划分出的控制子区在空间上的分布情况,同一种线型的路段被划分到同一控制子区,可以看出,各个控制子区的路段在空间上都比较分散,下一节将结合 N S k 指标对划分出的子区“同质性”进行评价。
为了评价划分出的控制子区同质性水平,这里引入文献中 [
N S k ( A , B ) = ∑ i ∈ A ∑ j ∈ B ( d i − d j ) 2 N A N B (10)
d i 表示路段 i 的密度, N A , N B 分别为子区域A和子区域B路段的数目。由于 N S k ( A , B ) 仅表征了子区域A和子区域B之间的平均密度距离,并不能体现子区之间的空间关系。为了补充这一点,进而采用公式(11)对其进行评价:
N S k ( A ) = N S k ( A , A ) N S k ( A , B ) (11)
N S k ( A , B ) = min { N S k ( A , K ) | K ∈ N e i g h b o r ( A ) } (12)
式中, k 表示为与子区A相邻接的子区(这里我们只比较相邻子区之间的密度相近性,因为对于两个空间上不相邻的控制子区,即使它们内部的路段密度水平接近,也并不影响分区结果的好坏)。
整个路网的划分结果将由公式(13)进行评价,其表示所有划分子区平均密度距离的平均值:
A N S k = ∑ A ∈ C N S k ( A ) k (13)
式中, k 为划分出的子区数,C为划分的子区集合。
N S 评价标准也可以以路段拟交通流密度的方差和均值来表达:
N S k ( A , B ) = V a r ( A ) + V a r ( B ) + ( u A − u B ) 2 (14)
式中 u A , V a r ( A ) 分别为子区A中路段拟交通流密度的均值和方差,同样的可以得到:
N S k ( A ) = N S k ( A , A ) N S k ( A , B ) = 2 V a r ( A ) V a r ( A ) + V a r ( B ) + ( u A − u B ) 2 (15)
由公式(15)可知,当均值差很大、方差很小时,说明子区A划分结果很好。一般情况下如果子区A的方差很小,可知子区A的划分结果很好,此时由 V a r ( A ) < V a r ( B ) 可知, N S k ( A ) < 1 。如果大部分子区都有较小的方差和 N S 值,但是有个别的子区有较大的方差和 N S 值时,这种划分结果仍是有效的。
参照图5~8由各方法的划分结果,计算的各子区和整个路网的 N S k 值如表1所示。
通过划分后的路网分区图(图5~8)和相关指标(表1)对比,可以发现传统K均值聚类算法得到的各子区 N S k 指标和路网 N S k 指标都相对最小,但同一个子区内的路段在空间位置上不相连,没有实际运用价值,且通过第一次和第二次划分试验结果(图7~8)对比可以发现,划分结果的质量过于依赖初始聚类中心的选取,造成划分结果的不稳定。与传统Newman快速划分算法控制子区划分结果对比,可以发现本文方法得到的 N S k 值更小,表明划分结果更好,且引入了路段拟交通密度作为边权,使得划分出来的结果更加符合交通网络的特性、更合理。由于路段密度随着时间的变化而不断改变,可以获取不同时段的路段密度对交通路网进行动态划分。本文提出的方法,在评价指标上不及传统的K均值算法,但其很好地保证了子区路网的连接性和控制子区的“同质性”,实现了其在路网划分中的有效应用。
子区 N S k | 路网 A N S k | |||||||
---|---|---|---|---|---|---|---|---|
子区1 | 子区2 | 子区3 | 子区4 | 子区5 | 子区6 | 整个路网 | ||
传统Newman算法 | 1.22 | 0.77 | 1.51 | 0.83 | 1.16 | 1.10 | ||
本文方法 | 0.97 | 0.99 | 0.65 | 1.29 | 0.53 | 0.77 | 0.86 | |
传统K均值方法 | 第一次 | 0.76 | 0.03 | 0.73 | 0.76 | 0.07 | 1.38 | 0.62 |
第二次 | 0.13 | 0.47 | 1.27 | 0.48 | 0.14 | 0.41 | 0.48 |
表1. 各种分区方法评价指标
为使交通网络控制子区内的交通流具有更好的同质性,本文以路段为对象,通过对传统的Newman快速划分算法进行改进,引入路段拟交通流密度相关性参数作为边权,使得划分出的控制子区既能达到空间上的紧凑性,又能结合路网交通流相关性,使得划分出的子区内部路段拟交通密度相近,可以近似认为子区内部为同质的交通流,便于交通子区内的交通协调控制。本文从宏观层面探讨城市控制子区的划分,实现了子区划分自动化;下一步将在本文基础上研究如何实现子区间的协调控制 [
黎茂盛,王永亮,姚力煊. 基于含权Newman算法的交通控制子区划分Traffic Control Subarea Partition Based on Weighted Newman Algorithms[J]. 交通技术, 2019, 08(02): 145-154. https://doi.org/10.12677/OJTT.2019.82018