Advances in Applied Mathematics
Vol. 10  No. 01 ( 2021 ), Article ID: 39855 , 6 pages
10.12677/AAM.2021.101016

一个倒向随机微分时滞方程的最优 控制问题

吴霜

中国石油大学(华东)理学院,山东 青岛

收稿日期:2020年12月16日;录用日期:2021年1月5日;发布日期:2021年1月20日

摘要

本文研究了一个倒向随机微分时滞方程的最优控制问题。利用三个正倒向耦合的伴随方程,文中得到了最优控制满足的充分条件并给出一个最优消费选择的例子来说明理论结果的应用。

关键词

倒向随机微分时滞方程,最优控制,伴随方程

An Optimal Control Problem of Backward Stochastic Differential Delay Equation

Shuang Wu

College of Science, China University of Petroleum, Qingdao Shandong

Received: Dec. 16th, 2020; accepted: Jan. 5th, 2021; published: Jan. 20th, 2021

ABSTRACT

This paper studies an optimal problem of backward stochastic differential delay equation. By means of a three-coupled system of adjoint equations, we give a sufficient condition for optimal control. As an application, a financial example is presented to illustrate the theoretical result.

Keywords:Backward Stochastic Differential Delay Equation, Optimal Control, Adjoint Equation

Copyright © 2021 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

近来,Delong,Imkeller [1] 研究了一种含有状态延迟的新型倒向随机微分方程,本文称之为倒向随机微分时滞方程。随后,对于这种方程的最优控制问题也陆续展开,涌现出一些有代表性的成果。比如:Chen,Huang [2] 研究了倒向随机微分时滞方程的最优控制问题并给出相应的最大值原理;而Shi,Wang则在文献 [3] 中研究了一个倒向随机微分时滞方程的非零和微分对策,他们得到了纳什均衡点满足的必要和充分条件。本文的特点是采用两个倒向和一个正向随机微分方程作为伴随方程,这和文献 [2] [3] 中的不同,那里的伴随方程是时间超前的正向随机微分方程。借助于伴随方程,文中给出最优控制满足的充分条件。最后,通过一个金融市场中的最优消费问题来说明主要结果的应用。

2. 问题描述

本文以R来表示一维欧式空间;以 T > 0 表示终端时间;以 ( Ω , F , { F t } t 0 , P ) 表示具有 σ -代数族的完备的概率空间; W ( t ) 表示一维标准布朗运动,且有 F t = σ { W ( s ) , 0 s t } , F = F T ;此外:

L 2 ( r , s ; R ) = { φ ( t ) | φ ( t ) R r s φ 2 ( t ) d t < + } ;

L 2 ( F t ; R ) = { ζ | ζ R F t E ζ 2 < + } ;

L F 2 ( r , s ; R ) = { ψ ( ) | ψ ( ) R F t E r s ψ 2 ( t ) d t < + } .

现在从下面的状态方程开始:

{ d y v ( t ) = f ( t , y v ( t ) , y δ v ( t ) , y ¯ v ( t ) , z v ( t ) , v ( t ) ) z v ( t ) d W ( t ) , t [ 0 , T ) y v ( T ) = ξ , y ( t ) = φ ( t ) , t [ δ , 0 ) . (1)

这里, f : [ 0 , T ] × R × R × R × R × R × R R 是连续函数; y δ v ( t ) = y v ( t δ ) y ¯ v ( t ) = δ 0 e λ s y v ( t + s ) d s ξ L 2 ( F T ; R ) φ ( t ) L 2 ( δ , 0 ; R ) v ( ) L F 2 ( 0 , T ; R ) 是控制过程。价值泛函如下:

J ( v ( ) ) = E 0 T l ( t , y v ( t ) , y δ v ( t ) , y ¯ v ( t ) , z v ( t ) , v ( t ) ) d t + h ( y v ( 0 ) ) ,

我们的问题是寻找控制 u ( ) ,使得: J ( u ( ) ) = max v ( ) L F 2 ( 0 , T ; R ) J ( v ( ) )

以下给出两个假定:

(H2.1) f是连续可微的;偏导 f y , f y δ , f y ¯ , f z , f v 是一致有界的;

(H2.2) l和h是连续可微的,且存在 C > 0 ,使得:

| l y | + | l y δ | + | l y ¯ | + | l z | + | l v | + | h y | C ( 1 + | y | + | y δ | + | y ¯ | + | z | + | v | )

然后有以下解的存在唯一性结果。

引理 [2] 如果(H2.1)成立,则对于任意的 v ( ) L F 2 ( 0 , T ; R ) 以及充分小的 δ ,方程(1)有唯一的解 ( y v ( ) , z v ( ) ) L F 2 ( δ , T ; R ) × L F 2 ( δ , T ; R )

3. 充分条件

本节将建立最优控制 u ( ) 满足的充分条件,为此,我们先定义Hamiltonian函数 H : [ 0 , T ] × R × R × R × R × R × R × R R 如下:

H ( t , y , y δ , y ¯ , z , v , p , p ¯ ) = l ( t , y , y δ , y ¯ , z , v ) p f ( t , y , y δ , y ¯ , z , v ) + p ¯ ( y λ y ¯ e λ δ y δ ) ,

并引入伴随方程:

{ d p ( t ) = H y ( t ) d t H z ( t ) d W ( t ) , p ( 0 ) = h y ( y u ( 0 ) ) , (2)

{ d p ¯ ( t ) = H y ¯ ( t ) d t q ¯ ( t ) d W ( t ) , p ¯ ( T ) = 0 , (3)

{ d p ˜ ( t ) = H y δ ( t ) d t q ˜ ( t ) d W ( t ) , p ˜ ( T ) = 0. (4)

为简化,记 θ u ( t ) = ( y u ( t ) , y δ u ( t ) , y ¯ u ( t ) , z u ( t ) ) , H ( t ) = H ( t , θ u ( t ) , u ( t ) , p ( t ) , p ¯ ( t ) ) 。然后我们有以下主要结果。

定理 假设(H2.1)和(H2.2)成立,而 u ( ) 是某个给定控制。假设有:(i) 对任意 t [ 0 , T ] H v ( t , θ u ( t ) , v , p ( t ) , p ¯ ( t ) ) v = u ( t ) 处连续;(ii) 对于 p ( t ) p ¯ ( t ) H ( t , , , , , , p ( t ) , p ¯ ( t ) ) h ( ) 是凸的;(iii) 方程(2)~(4)有解且 ( p ˜ ( ) , q ˜ ( ) ) = 0 ;(iv) H ( t , θ u ( t ) , u ( t ) , p ( t ) , p ¯ ( t ) ) = max v R H ( t , θ u ( t ) , v , p ( t ) , p ¯ ( t ) ) 。那么 u ( ) 是最优的。

证明:对于任意控制 v ( ) ,由Hamiltonian函数H的定义,可以验证:

J ( v ( ) ) J ( u ( ) ) = E 0 T { H ( t , θ v ( t ) , v ( t ) , p ( t ) , p ¯ ( t ) ) H ( t , θ u ( t ) , u ( t ) , p ( t ) , p ¯ ( t ) ) + p ( t ) ( f ( t , θ v ( t ) , v ( t ) ) f ( t , θ u ( t ) , u ( t ) ) ) p ¯ ( t ) ( y v ( t ) λ y ¯ v ( t ) e λ δ y δ v ( t ) ( y u ( t ) λ y ¯ u ( t ) e λ δ y δ u ( t ) ) ) } d t + h ( y v ( 0 ) ) h ( y u ( 0 ) ) (5)

p ( t ) ( y v ( t ) y u ( t ) ) + p ¯ ( t ) ( y ¯ v ( t ) y ¯ u ( t ) ) + p ˜ ( t ) ( y δ v ( t ) y δ u ( t ) ) 利用伊藤公式,可得:

0 = E 0 T { H y ( t ) ( y v ( t ) y u ( t ) ) p ( t ) ( f ( t , θ v ( t ) , v ( t ) ) f ( t , θ u ( t ) , u ( t ) ) ) H y ¯ ( t ) ( y ¯ v ( t ) y ¯ u ( t ) ) H y δ ( t ) ( y δ v ( t ) y δ u ( t ) ) H z ( t ) ( z v ( t ) z u ( t ) ) + p ¯ ( t ) ( y v ( t ) λ y ¯ v ( t ) e λ δ y δ v ( t ) ( y u ( t ) λ y ¯ u ( t ) e λ δ y δ u ( t ) ) ) } d t h y ( y u ( 0 ) ) ( y v ( 0 ) y u ( 0 ) ) (6)

结合(5)和(6)可知

J ( v ( ) ) J ( u ( ) ) = E 0 T { H ( t , θ v ( t ) , v ( t ) , p ( t ) , p ¯ ( t ) ) H ( t , θ u ( t ) , u ( t ) , p ( t ) , p ¯ ( t ) ) H y ( t ) ( y v ( t ) y u ( t ) ) H y ¯ ( t ) ( y ¯ v ( t ) y ¯ u ( t ) ) H y δ ( t ) ( y δ v ( t ) y δ u ( t ) ) H z ( t ) ( z v ( t ) z u ( t ) ) } d t + h ( y v ( 0 ) ) h ( y u ( 0 ) ) h y ( y u ( 0 ) ) ( y v ( 0 ) y u ( 0 ) ) . (7)

由(7),然后利用H和h的凸性有

J ( v ( ) ) J ( u ( ) ) E 0 T H v ( t , θ u ( t ) , u ( t ) , p ( t ) , p ¯ ( t ) ) ( v ( t ) u ( t ) ) d t

再由假设(ii)和(iv)可知:

H v ( t , θ u ( t ) , u ( t ) , p ( t ) , p ¯ ( t ) ) ( v ( t ) u ( t ) ) 0

这说明 J ( v ( ) ) J ( u ( ) ) 0 ,从而 u ( ) 是最优的。证毕。

方程(2)是一个正向随机微分方程,而(3)、(4)是两个倒向随机微分方程,它们是相互耦合的,因此解的存在性并非显然,读者可参考文献 [4] 来进一步了解正倒向随机微分方程解的存在性问题。然而在某些特殊的情况下,方程(2)~(4)的解确实存在,从而可以利用以上定理来确定最优控制,让我们来看一个例子。

4. 应用

考虑一个金融市场,其中有一种债券和一种股票可以交易。它们的价格满足:

d B ( t ) = r ( t ) B ( t ) d t , B ( 0 ) = b 0

以及

d S ( t ) = S ( t ) [ μ ( t ) d t + σ ( t ) d W ( t ) ] , S ( 0 ) = s 0

其中, r ( t ) 为无风险利率; μ ( t ) 为增值回报率; σ ( t ) 为股票波动系数。给出以下假设:

(H4.1) r ( t ) , μ ( t ) , σ ( t ) 是确定性的函数;它们和 σ 1 ( t ) 都是一致有界的。

我们这里假定只有一种股票是为了简化论述,多种股票的情形并无本质区别。假设某人投资债券和股票,他需要在时刻T达成财富目标 ξ ,与此同时,投资人希望最大化他的效用泛函J。我们以 π ( ) 来表示在股票上的投资量,以 y ( ) 来表示财富过程,以 c ( ) 来表示投资者的瞬时消费率。假设投资人可以根据过去的投资表现来注入或者撤出资金,比如投资表现好就追加投入,否则就撤出部分资金回避风险,则财富过程可以用下述倒向随机微分时滞方程来描述:

{ d y ( t ) = [ r ˜ ( t ) y ( t ) β ( t ) y δ ( t ) α y ¯ ( t ) + π ( t ) b ( t ) c ( t ) ] d t + π ( t ) σ ( t ) d W ( t ) , y ( T ) = ξ , y ( t ) = 0 , t [ δ , 0 ) . (7)

这里, α > 0 ,而 β ( t ) 是某个确定性的函数, r ˜ ( t ) = r ( t ) + α + β ( t ) b ( t ) = μ ( t ) r ( t ) 。如果记 z ( t ) = π ( t ) σ ( t ) ,则(7)可改写为:

{ d y ( t ) = [ r ˜ ( t ) y ( t ) β ( t ) y δ ( t ) α y ¯ ( t ) + b ( t ) σ 1 ( t ) z ( t ) c ( t ) ] d t + z ( t ) d W ( t ) , y ( T ) = ξ , y ( t ) = 0 , t [ δ , 0 ) . (8)

假设投资者的效用泛函为:

J ( c ( ) ) = E 0 T L e γ t c ( t ) 1 R 1 R d t K ( y ( 0 ) ) ,

这里, L > 0 , K > 0 , γ > 0 , 0 < R < 1 。投资者的目的是最大化以上效用泛函。上述实例可以看成文献 [5] 中应用的一个推广,现在利用第三节的结果来解决这个问题。

此时,Hamiltonian函数为:

H ( t , y , y δ , y ¯ , z , c , p , p ¯ ) = L e γ t c 1 R 1 R p ( r ˜ ( t ) y β ( t ) y δ α y ¯ + σ 1 ( t ) b ( t ) z c ) + p ¯ ( y λ y ¯ e λ δ y δ ) ,

而伴随方程满足:

{ d p ( t ) = [ r ˜ ( t ) p ( t ) + p ¯ ( t ) ] d t σ 1 ( t ) b ( t ) p ( t ) d W ( t ) , p ( 0 ) = K , (9)

{ d p ¯ ( t ) = [ α p ( t ) + λ p ¯ ( t ) ] d t q ¯ ( t ) d W ( t ) , p ¯ ( T ) = 0 , (10)

{ d p ˜ ( t ) = [ β ( t ) p ( t ) + e λ δ p ¯ ( t ) ] d t q ˜ ( t ) d W ( t ) , p ˜ ( T ) = 0 , (11)

为确保 ( p ˜ ( ) , q ˜ ( ) ) = 0 ,令

β ( t ) p ( t ) + e λ δ p ¯ ( t ) = 0 , (12)

然后对 β ( t ) p ( t ) 利用伊藤公式得:

d β ( t ) p ( t ) = { β ( t ) [ r ˜ ( t ) p ( t ) + p ¯ ( t ) ] + β ˙ ( t ) p ( t ) } d t β ( t ) σ 1 ( t ) b ( t ) p ( t ) d W ( t ) , (13)

把(12)代入(13),再把它和(10)比较系数,可知 β ( t ) 应满足:

{ β ˙ ( t ) ( r ˜ ( t ) + λ ) β ( t ) + e λ δ β 2 ( t ) + e λ δ α = 0 , β ( T ) = 0 (14)

以及 q ¯ ( t ) = e λ δ β ( t ) σ 1 ( t ) b ( t ) p ( t ) 。因 r ˜ ( t ) = r ( t ) + α + β ( t ) ,(14)也可写为:

{ β ˙ ( t ) ( r ( t ) + α + λ ) β ( t ) + ( e λ δ 1 ) β 2 ( t ) + e λ δ α = 0 , β ( T ) = 0 (15)

注意(15)并非标准Riccati方程。如果 α = 0 ,显然 β ( t ) = 0 。我们讨论 α > 0 的情形。令 A ( t ) = r ( t ) + α + λ B = e λ δ 1 C = e λ δ α β 1 ( t ) = B β ( t ) C 。如果 B = 0 ,(15)显然有解。现假设 B > 0 ,可以验证:

{ β ˙ 1 ( t ) ( A ( t ) 2 B C ) β 1 ( t ) + B β 1 2 ( t ) C ( A ( t ) 2 B C ) = 0 , β 1 ( T ) = C . (16)

A ( t ) 2 B C 0 , t [ 0 , T ] 时,由文献 [6] 中的命题4.2可知,(16)有唯一的解 β 1 ( t ) < 0 。从而(15)有解 β ( t ) = β 1 ( t ) + C / B

然后把(12)代入(9)可解得 p ( t ) = K Ψ ( t ) ,这里, Ψ ( t ) 满足:

{ d Ψ ( t ) = [ r ( t ) + α + ( 1 e λ δ ) β ( t ) ] Ψ ( t ) d t σ 1 ( t ) b ( t ) Ψ ( t ) d W ( t ) , Ψ ( 0 ) = 1. (17)

我们令:

c * ( t ) = ( L e γ t ) 1 R ( p ( t ) ) 1 R = ( L K ) 1 R ( Ψ ( t ) ) 1 R e γ R t (18)

根据第三节的定理可以验证, c * ( ) 是最优控制。

我们总结以上分析后有如下结论。

命题 假定(H4.1)成立。如果 α > 0 r ( t ) 2 α ( 1 e λ δ ) α λ , t [ 0 , T ] (即: A ( t ) 2 B C 0 ), β ( t ) 满足(15),那么 c * ( ) 是投资者的最优消费。

文章引用

吴 霜. 一个倒向随机微分时滞方程的最优控制问题
An Optimal Control Problem of Backward Stochastic Differential Delay Equation[J]. 应用数学进展, 2021, 10(01): 137-142. https://doi.org/10.12677/AAM.2021.101016

参考文献

  1. 1. Delong, L. and Imkeller, P. (2010) Backward Stochastic Differential Equations with Time Delayed Generators—Re- sults and Counter Examples. Annals of Applied Probability, 20, 1512-1536. https://doi.org/10.1214/09-AAP663

  2. 2. Chen, L. and Huang, J. (2015) Stochastic Maximum Principle for Controlled Backward Delayed System via Advanced Stochastic Differential Equation. Journal of Optimization Theory and Applications, 167, 1112-1135. https://doi.org/10.1007/s10957-013-0386-5

  3. 3. Shi, J. and Wang, G. (2015) A Non-Zero Sum Differential Game of BSDE with Time-Delayed Generator and Applications. IEEE Transactions on Automatic Control, 61, 1959-1964. https://doi.org/10.1109/TAC.2015.2480335

  4. 4. Peng, S. and Wu, Z. (1999) Fully Coupled Forward Backward Stochastic Differential Equations and Applications to Optimal Control. SIAM Journal on Control and Optimization, 37, 825-843. https://doi.org/10.1137/S0363012996313549

  5. 5. Wang, G. and Yu, Z. (2012) A Partial Information Non-Zero Sum Differential Game of Backward Stochastic Differential Equations with Applications. Automatica, 48, 342-352. https://doi.org/10.1016/j.automatica.2011.11.010

  6. 6. Lim, A. and Zhou, X. (2001) Linear-Quadratic Control of Backward Stochastic Differential Equations. SIAM Journal on Control and Optimization, 40, 450-474. https://doi.org/10.1137/S0363012900374737

期刊菜单