时间不一致问题长期以来一直是金融、经济领域的一个悬而未解之题,诸如著名数学家Ekeland,诺贝尔经济学奖获得者Edward C. Prescott都长期对此问题进行了研究。2014年雍炯敏教授在国际数学家大会上作了“时间不一致控制问题”的专题报告,标志着时间不一致问题成为数学与金融的前沿交叉热点课题。本文对时间不一致问题的意义、研究历史,尤其是近期的研究概况进行系统的梳理与总结,凝练下一步的研究重点及其关注的问题。 The time-inconsistent problem is an important problem which has not been completely solved in the financial and economic fields. The famous mathematician Ekeland and Nobel Prize winner Edward C. Prescott have studied this problem for a long time. In 2014, Professor Jiongmin Yong made a special report on the issue of “time-inconsistent control problem” at the International Conference of Mathematicians. This indicates that the time-inconsistent control problem has become a frontier cross-cutting hot topic in mathematics and finance. This paper systematically summarizes the significance, research history, recent research summary and open problem on time-inconsistent control problem.
蒋太江,彭云飞
贵州大学数学与统计学院,贵州 贵阳
收稿日期:2020年1月17日;录用日期:2020年1月29日;发布日期:2020年2月5日
时间不一致问题长期以来一直是金融、经济领域的一个悬而未解之题,诸如著名数学家Ekeland,诺贝尔经济学奖获得者Edward C. Prescott都长期对此问题进行了研究。2014年雍炯敏教授在国际数学家大会上作了“时间不一致控制问题”的专题报告,标志着时间不一致问题成为数学与金融的前沿交叉热点课题。本文对时间不一致问题的意义、研究历史,尤其是近期的研究概况进行系统的梳理与总结,凝练下一步的研究重点及其关注的问题。
关键词 :时间不一致,时间一致均衡控制,开环均衡控制,闭环均衡控制
Copyright © 2020 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
在本节主要阐述时间不一致问题的内涵及其数学模型。为此,我们首先借助一个例子来说明时间一致的内涵。考虑没有通货膨胀情形下的银行存款问题。让 P ( 0 ) 表示初始存款,r表示年利率。在复利的意义下,在第t年年底的收益为 P ( t ) = P ( 0 ) e r t 。进而,对任意给定的未来时间 T > 0 ,显然对 ∀ t ∈ [ 0 , T ] 有 P ( t ) = P ( 0 ) e r t 。这意味着
e r ( T − t 1 ) P ( t 1 ) = P ( T ) = e r ( T − t 2 ) P ( t 2 ) , ∀ t 1 , t 2 ∈ [ 0 , T ] .
这表明:无论我们是在 t 1 时刻还是 t 2 时刻将钱存入银行,最终收益均相同。此问题本质是一个决策问题,表明我们的决策不受时间因素的影响。
事实上,在不同时空背景下,即使是同一个人决策心态也是完全不一样的。为此我们借用1988年诺贝尔经济学奖得主Maurice Allais在1953年的所做一个实验 [
对比上述的银行存款问题和Allais悖论,我们给出时间不一致问题的定义。对于一个涉及决策的问题,如果在t时刻作出的最优决策,在任意时刻 s > t 来看此决策都是最优的,我们称这类问题是时间一致问题,否则称为时间不一致问题。这个定义最早是雍炯敏教授给出的。显而易见,假设决策者是理性的,如果问题是时间一致的,一旦我们做出最优决策,我们将永远不会后悔。如果整个世界是时间一致的,则事情将变得非常理想,生活也将变得轻松自在。但是,如果真是这样的话,我们的生活将可能变得有点无聊。幸运的是,生活并不是那么理想!因为,时间不一致问题几乎无处不在!例如著名的双曲贴现就是典型的时间不一致问题 [
在本节结束之前,我们陈述时间不一致问题的数学模型。控制集(或策略集)表示为 U [ 0 , T ] = { u : [ 0 , T ] → U | u 可 测 } 受控系统为
{ d X ( s ) = A X ( s ) d s + f ( s , X ( s ) , u ( s ) ) d s + σ ( s , X ( s ) , u ( x ) ) d W ( s ) , 0 ≤ t < s ≤ T , X ( t ) = x .
问题就是极小化或极大化下列目标泛函
值得注意的是,在目标泛函中,期望及其函数 g , G , Φ 均依赖于初始状态 ( t , x ) ,这恰好是时间一致问题所不容许的。一言以蔽之,当期望及其函数 g , G , Φ 均不依赖于初始状态 ( t , x ) 时,问题是时间一致的,否则就是时间不一致的。
关于时间不一致问题的定性分析,至少可以追溯到1739年Hume [
关于时间不一致问题的研究,主要包括实证研究(如2004年诺贝尔经济学家Edward C.Prescott的经济政策时间一致性理论 [
这里需要特别指出的是,雍炯敏教授也研究了闭环均衡控制(或称时间一致闭环均衡控制),但与经济学家期望的闭环均衡控制是有区别的。
雍炯敏教授从非合作微分博弈的思想研究时间不一致问题,自2012年引进时间一致均衡控制以来并建立了一套理论。
雍教授在文章 [
{ X ˙ ( s ) = A ( t , x , s ) X ( s ) + B ( t , x , s ) u ( s ) , 0 ≤ t < s ≤ T , X ( t ) = x ,
问题是极小化下列目标泛函
J ( t , x ; u ) = ∫ t T [ 〈 Q ( t , x , s ) X ( s ) , X ( s ) 〉 + 〈 R ( t , x , s ) u ( s ) , u ( s ) 〉 ] d s + 〈 G ( t , x , T ) X ( T ) , X ( T ) 〉 .
为此,对时间区间 [ 0 , T ] ,引进分割 Δ : 0 = t 0 < t 1 < ⋯ < t N = T 以及联系 Δ 的N人微分博弈,第k位玩家从 U [ t k − 1 , t k ] 中选取控制。对任意的
( u 1 ( ⋅ ) , ⋯ , u N ( ⋅ ) ) ∈ U [ t 0 , t 1 ] × ⋯ × U [ t N − 1 , t N ]
定义控制 u Δ ( ⋅ ) ∈ U [ 0 , T ] 为
u Δ ( s ) = u k ( s ) , s ∈ [ t k − 1 , t k ) , 1 ≤ k ≤ N .
为了叙述方便,在不引起混淆的情况下,让 u Δ ( ⋅ ) = ( u 1 ( ⋅ ) , u 2 ( ⋅ ) , ⋯ , u N ( ⋅ ) ) 。对给定 ( x , u Δ ) ∈ R n × U [ 0 , T ] , X Δ ( ⋅ ) 下列方程的解
{ X ˙ Δ ( s ) = A ( t k − 1 , X Δ ( t k − 1 ) , s ) X Δ ( s ) + B ( t k − 1 , X Δ ( t k − 1 ) , s ) u Δ ( s ) , s ∈ ( t k − 1 , t k ) , 1 ≤ k ≤ N , X ( 0 ) = x ,
第k个玩家的支付函数定义如下
J k ( u Δ ( ⋅ ) ) ≡ J k ( u 1 ( ⋅ ) , ⋯ , u N ( ⋅ ) ) = J ( t k − 1 , X Δ ( t k − 1 ) , u Δ (⋅) )
问题 ( LQ Δ ) 寻找控制 u ¯ Δ ( ⋅ ) ∈ U [ 0 , T ] 得对每个 k = 1 , 2 , ⋯ , N ,
J k ( u ¯ ) ≡ J ( u ¯ 1 , ⋯ , u ¯ k − 1 , u ¯ k , u ¯ k + 1 , ⋯ , u ¯ N ) ≤ J ( u ¯ 1 , ⋯ , u ¯ k − 1 , u k , u ¯ k + 1 , ⋯ , u ¯ N ) , ∀ u k ∈ U [ t k − 1 , t k ] .
若上述问题 u ¯ Δ ( ⋅ ) 存在,则 u ¯ Δ ( ⋅ ) 为问题 ( LQ Δ ) 的均衡控制。而关于问题 ( L Q ) :对任意的 x ∈ R n ,寻找控制使 u ¯ ∈ U [ 0 , T ] 得对任意 ε > 0 ,存在 δ > 0 ,当区间 [ 0 , T ] 的任意分割 Δ 适合 ‖ Δ ‖ < δ 有
J k ( u ¯ ( ⋅ ) ) ≤ J k ( u ¯ Δ ( ⋅ ) ) + ε (1)
如果控制 u ¯ ∈ U [ 0 , T ] 满足上述条件,则将之称为问题 ( L Q ) 的时间一致均衡控制。进而,在此基础上讨论了时间一致均衡控制的存在性。这个解法的核心思想是将时间不一致问题视为时间一致问题的极限。
雍炯敏教授在文章 [
{ d X ( s ) = b ( s , X ( s ) , u ( s ) ) d s + σ ( s , X ( s ) , u ( s ) ) d W ( s ) , s ∈ [ t , T ] , X ( t ) = x ,
目标泛函为
J ( t , x ; u ( ⋅ ) ) = E t [ ∫ t T g ( t , s , X ( s ) , u ( s ) ) d s + h ( t , X ( T ) ) ]
为了凸出思想和叙述简明,我们以对应的确定型的问题来陈述。引进问题(N)对任意给定初始对 ( t , x ) 寻找
一个连续映射
存在唯一解
其中
这里的
他也引进相应的均衡值函数函,建立均衡HJB方程,进而构造了时间一致均衡控制。
雍教授在2017年研究MF-SDE [
性能指标为
对区间
且对任意固定的
的解;对任意的
和
的解,引入记号
我们称
称
对任意
的解。进而定义
周迅宇教授在2013年的文章 [
目标泛函为
给定控制
其中
此外,彭云飞教授等人也讨论了一般常微分方程支配的时间不一致控制问题开环均衡控制的存在性。
时间不一致问题是数学与金融交叉的前沿课题,长期以来许多知名经济学家都十分关注该问题的求解。经济学家给出了时间不一致问题的闭环均衡控制的定义:函数
其中
他们认为这样的解才能刻画实际问题。很显然,这与前面的(1)和(2)有本质区别。
但长期以来闭环均衡控制的存在性一直是未知的。Bjork等人在文章 [
2014年周迅宇教授与彭云飞教授获得了刻画值函数的均衡原理,并由此导出了Bjork所得到的拓展HJB方程。2018年彭云飞教授等人证明了一类常微分方程系统支配的时间不一致问题闭环均衡控制的存在性 [
目标泛函为
其中
时间不一致问题历史悠久,运用广泛,目前已经取得许多进展。但依旧有许多问题亟待解决,如一般常微分方程系统支配的时间不一致问题,时间不一致控制的一般理论,无限时区上时间不一致LQ问题等诸多问题仍需有待进一步研究。
本文获得国家自然科学基金项目(11661020)资助。
蒋太江,彭云飞. 时间不一致问题的研究进展Research Summary on Time-Inconsistent Control Problems[J]. 运筹与模糊学, 2020, 10(01): 57-64. https://doi.org/10.12677/ORF.2020.101007