Advances in Applied Mathematics
Vol. 13  No. 05 ( 2024 ), Article ID: 87773 , 8 pages
10.12677/aam.2024.135200

微分方程方法求解约束优化问题

谢红俭,孙菊贺,王莉,吕琪楠

沈阳航空航天大学理学院,辽宁 沈阳

收稿日期:2024年4月28日;录用日期:2024年5月21日;发布日期:2024年5月30日

摘要

本文探讨了微分方程方法在求解约束优化问题的应用,讨论解的收敛性和收敛速度。首先,通过对原始约束优化所对应的Karush-Kuhn-Tucker条件进行转换后,利用光滑互补函数,将问题转化成求解光滑方程组 S ( ε , x , μ , λ ) = 0 ,进一步转化成无约束优化问题。我们利用了微分方程系统来求解最终的无约束优化问题,并在一定的约束条件下,得到了该微分方程系统的解稳定性及收敛速度,从而得到了所求约束优化问题的收敛性和解的收敛速度。最后,给出数值实验说明所提出的微分方程方法求解约束优化问题的有效性。

关键词

微分方程,约束优化问题,Karush-Kuhn-Tucker条件,数值计算

Differential Equation Method for Solving Constrained Optimization Problems

Hongjian Xie, Juhe Sun, Li Wang, Qinan Lyu

School of Science, Shenyang University of Aeronautics and Astronautics, Shenyang Liaoning

Received: Apr. 28th, 2024; accepted: May 21st, 2024; published: May 30th, 2024

ABSTRACT

This article explores the application of differential equation methods in solving constrained optimization problems, and discusses the convergence and speed of solutions. Firstly, by transforming the Karush Kuhn Tucker condition corresponding to the original constrained optimization, and using a smooth complementarity function, the problem is transformed into solving a smooth equation system S ( ε , x , μ , λ ) = 0 , which is further transformed into an unconstrained optimization problem. We utilized a differential equation system to solve the final unconstrained optimization problem, and under certain constraint conditions, obtained the solution stability and convergence rate of the differential equation system, thus obtaining the convergence and convergence rate of the constrained optimization problem. Finally, numerical experiments are provided to demonstrate the effectiveness of the proposed differential equation method for solving constrained optimization problems.

Keywords:Differential Equations, Constrained Optimization Problems, Karush-Kuhn-Tucker Conditions, Numerical Calculation

Copyright © 2024 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

约束优化问题是一类常见和重要的数学问题,它在工程、经济学和管理等领域中得到广泛的应用。在实际应用中,约束优化问题常常涉及到多个变量和多个约束条件,因此其求解难度较大。近年来,微分方程方法在求解约束优化问题中得到了广泛的应用。

本文将考虑以下约束优化问题:

min f ( x ) (1)

其中 x C ,约束集合C表示为 C = { x R n | h ( x ) = 0 , g ( x ) 0 } h : R n R l g : R n R m 都是连续可微的, R n 表示为n维实列向量空间。

约束优化问题的Karush-Kuhn-Tucker (KKT)条件为:

L ( x , μ , λ ) = f ( x ) + J h ( x ) T μ + J g ( x ) T λ = 0 h ( x ) = 0 g ( x ) λ (2)

其中, L ( x , μ , λ ) 是约束优化问题的Lagrange函数, μ R l λ R m 是拉格朗日乘子。

本文将运用微分方程方法求解约束优化问题。用微分方程求解约束优化问题在最近几年引起人们的重视,最早工作是Arrow与Hurwicz [1] ,Fiacco与McCormick用微分方程来研究最优性条件中的约束规范问题,微分方程系统求解原问题的思想是构造微分方程系统,满足其平衡点是原问题的最优解并且是渐近稳定的,通过求解该微分方程系统得到原问题的最优解。Antipin [2] 研究了具有耦合约束的变分不等式问题,引入了对称函数,并提出了全局收敛的微分方程方法。

近些年来,运用微分方程方法求解约束优化问题受到许多学者的关注。Gao,Liao和Oi [3] 根据投影算子理论提出可求解带有线性和非线性约束的变分不等式的微分方程模型。Sun等 [4] 将神经网络方法应用于求解二阶锥约束变分不等式问题,提出了两种神经网络模型。Attouch [5] [6] 又提出了用二阶微分方程系统来解决凸优化问题。Evtushenko与Zhadan [7] [8] [9] 对这一类方法进行系统的研究。

Evtushenko与Zhadan工作的特色是迭代点具有较好的稳定性,一旦迭代点属于可行域,其后继的迭代点都不会再落在可行域外面。我们一直认为Evtushenko等人的工作没有得到充分的重视,且我们认为用微分方程方法求约束优化问题的工作还远不够深入,以往的做法都是把问题先转化为光滑的无约束优化问题,再对无约束优化用负梯度构造微分方程方法。本文将运用微分方程方法来解决约束优化问题,即构造一个微分方程系统,研究这个微分方程系统轨迹的存在性和收敛性。

2. 预备知识

我们运用互补函数将约束优化问题作以转化,将约束优化问题的Karush-Kuhn-Tucker (KKT)条件转化为光滑方程组问题 [10] 。对于 φ : R m × R m R m ,满足 φ ( a , b ) = 0 当且仅当 a b ,我们有光滑互补函数

φ N R ε ( x , y ) = x ϕ ( ε , x y ) (3)

其中 ( ε , x y ) R + × R m 。对于 ε , x y R + × R m ,有

ϕ ( ε , x y ) = 1 2 ( x y + ε 2 e + ( x y ) 2 )

其中e为 R m 的单位向量。

所以,约束优化问题的KKT条件(2)转化为

S ( ε , x , μ , λ ) = ( ε L ( x , μ , λ ) h ( x ) φ N R ε ( g m i ( x ) , λ m i ) ) = 0 (4)

其中, g m i , λ m i R m i i = 1 p m i = m

下面,我们引入价值函数 Ψ ( ε , x , μ , λ ) ,即

Ψ ( ε , x , μ , λ ) = 1 2 S T ( ε , x , μ , λ ) S ( ε , x , μ , λ ) = 1 2 S ( ε , x , μ , λ ) 2

从而,将约束优化问题转化成无约束优化问题:

min Ψ ( ε , x , μ , λ ) = min 1 2 S ( ε , x , μ , λ ) 2

3. 二阶微分方程系统

我们用具有阻尼惯性系数 γ ( t ) 和时间缩放参数 β ( t ) 的二阶微分方程系统(DIN-AVD) [11]

z ¨ ( t ) + α t z ˙ ( t ) + β 2 Φ ( z ( t ) ) z ˙ ( t ) + Φ ( z ( t ) ) = 0 (5)

来求解最终转化成的优化问题:

min 1 2 S ( z ) 2

其中, γ ( t ) β ( t ) [ t 0 , + ) 上非负连续函数且 S ( z ) = S ( ε , x , μ , λ ) ,即

min 1 2 S ( z ) 2 = min 1 2 S ( ε , x , μ , λ ) 2

再令 Ψ ( ε , x , μ , λ ) = 1 2 S ( ε , x , μ , λ ) 2 ,得

min 1 2 S ( z ) 2 = min Ψ ( ε , x , μ , λ )

从而,建立与无约束优化问题所对应的二阶微分方程系统

( ε ¨ ( t ) x ¨ ( t ) μ ¨ ( t ) λ ¨ ( t ) ) + α t ( ε ˙ ( t ) x ˙ ( t ) μ ˙ ( t ) λ ˙ ( t ) ) + β 2 Ψ ( ε ( t ) x ( t ) μ ( t ) λ ( t ) ) ( ε ˙ ( t ) x ˙ ( t ) μ ˙ ( t ) λ ˙ ( t ) ) + ( ε S T ( z ) S ( z ) x S T ( z ) S ( z ) μ S T ( z ) S ( z ) λ S T ( z ) S ( z ) ) = 0 (6)

下面,我们分析(DIN-AVD)沿轨迹值的快速收敛。假设 α 3 z * arg min Ψ 。设z是(DIN-AVD)的一个解,它的柯西数对 ( z ( t 0 ) , z ˙ ( t 0 ) ) = ( z 0 , z ˙ 0 ) Η × Η 。对于 λ [ 2 , α 1 ] 我们定义函数 Ε λ ( t ) : [ t 0 , + ) R

Ε λ ( t ) = t ( t β ( λ + 2 α ) ) ( Ψ ( z ( t ) ) min Ψ ) + 1 2 λ ( z ( t ) z * ) + t u ˙ β ( t ) 2 + λ ( α λ 1 ) 1 2 z ( t ) z * 2 (7)

其中, u ˙ β ( t ) = u ˙ θ = β ( t ) = z ˙ ( t ) + θ Ψ ( z ( t ) ) = z ˙ ( t ) + β Ψ ( z ( t ) )

为了计算 d d t Ε λ ( t ) ,我们首先对 Ε λ ( t ) 的每一项依次求导。

d d t [ t ( t β ( λ + 2 α ) ) ( Ψ ( z ( t ) ) min Ψ ) ] = ( 2 t β ( λ + 2 α ) ) ( Ψ ( z ( t ) ) min Ψ ) + t ( t β ( λ + 2 α ) ) z ˙ ( t ) , Ψ ( z ( t ) )

d d t 1 2 λ ( z ( t ) z * ) + t u ˙ β ( t ) 2 = λ ( z ( t ) z * ) + t u ˙ β ( t ) , λ z ˙ ( t ) + u ˙ β ( t ) + t u ¨ β ( t ) = λ ( z ( t ) z * ) + t u ˙ β ( t ) , ( λ + 1 α ) z ˙ ( t ) ( t β ) Ψ ( z ( t ) ) = λ ( λ + 1 α ) z ( t ) z * , z ˙ ( t ) t ( α λ 1 ) z ˙ ( t ) 2 β t ( t β ) Ψ ( z ( t ) ) 2 λ ( t β ) z ( t ) z * , Ψ ( z ( t ) ) t ( t β ( λ + 2 α ) ) z ˙ ( t ) , Ψ ( z ( t ) )

d d t λ ( α λ 1 ) 1 2 z ( t ) z * 2 = λ ( α λ 1 ) z ( t ) z * , z ˙ ( t )

因此,

d d t Ε λ ( t ) = ( 2 t β ( λ + 2 α ) ) ( Ψ ( z ( t ) ) min Ψ ) λ ( t β ) z ( t ) z * , Ψ ( z ( t ) ) t ( α λ 1 ) z ˙ ( t ) 2 β t ( t β ) Ψ ( z ( t ) ) 2

由于 z ( t ) z * , Ψ ( z ( t ) ) Ψ ( z ( t ) ) Ψ ( z * ) ,当 t max { t 0 , β } ,我们得到

d d t Ε λ ( t ) ( ( λ 2 ) t β ( α 2 ) ) ( Ψ ( z ( t ) ) min Ψ ) t ( α λ 1 ) z ˙ ( t ) 2 β t ( t β ) Ψ ( z ( t ) ) 2 (8)

函数 Ε λ 是非负的。对于式(8)不等号右侧各项:首先,如果 λ > 2 ,当 t t 1 = max { t 0 , β , β ( α 2 ) λ 2 } 时, ( λ 2 ) t β ( α 2 ) 0 ;其次,由 α λ 1 0 λ α 1 。因此 2 < λ α 1 α > 3 。极限情况 λ = 2 (结果为 α = 3 )同时包含在下面的定理1中。最后, t β β t ( t β ) 0 。综上所述,若 λ ( 2 , α 1 ] ,我们立即推导出 Ε λ [ t 1 , + ) 上是非递增的且 lim t + Ε λ ( t ) 存在。

定理1 令 α 3 arg min Ψ ϕ ,设 z : [ t 0 , + ) Η 是(DIN-AVD)的解,若 λ [ 2 , α 1 ] ,则函数

t ( t t β ) α 2 Ε λ ( t )

是非递增的且 lim t + Ε λ ( t ) 存在。

证明:由于我们比较在意z的渐近性,假设 t > max { t 0 , β } ,从式(8)推断得到

d d t Ε λ ( t ) β ( α 2 ) ( Ψ ( z ( t ) ) min Ψ ) (9)

我们在式(9)的不等号两边同时乘以 t ( t β ) 并利用 λ + 2 α 1 ,我们得到

t ( t β ) d d t Ε λ ( t ) β ( α 2 ) t ( t β ) ( Ψ ( z ( t ) ) min Ψ ) β ( α 2 ) t ( t β ( λ + 2 α ) ) ( Ψ ( z ( t ) ) min Ψ ) β ( α 2 ) Ε λ ( t ) (10)

接下来,式(10)的不等号两边再同时乘以 t α 3 ( t β ) 1 α ,得到

( t t β ) α 2 d d t Ε λ ( t ) β ( α 2 ) t α 3 ( t β ) α 1 Ε λ ( t )

进而,我们推出

d d t [ ( t t β ) α 2 Ε λ ( t ) ] 0

因此,函数 ( t t β ) α 2 Ε λ ( t ) 是非递增的。由于函数非负,所以当 t + 时,极限存在。显然, Ε λ 也是如此。

定理2 令 α > 3 arg min Ψ ϕ ,设 z : [ t 0 , + ) Η 是(DIN-AVD)的解,则z有界。同时,设 λ [ 2 , α 1 ] t 1 = max { t 0 , β } ,对于所有的 t s > t 1 ,我们有

Ψ ( z ( t ) ) min Ψ 1 t 2 ( s s β ) α 2 Ε λ ( s ) = Ο ( t 2 )

证明:取 λ [ 2 , α 1 ] ,根据 Ε λ 的定义(7)。我们有

1 2 λ ( z ( t ) z * ) + t ( z ˙ ( t ) + β Ψ ( z ( t ) ) ) 2 Ε λ ( t ) (11)

根据定理1,存在结果 lim t + Ε λ ( t ) ,我们可以取M为 Ε λ 的上界。将式(11)不等号左侧的平方展开,我们得到

λ 2 1 2 z ( t ) z * 2 + λ t z ( t ) z * , z ˙ ( t ) + λ t z ( t ) z * , β Ψ ( z ( t ) ) + t 2 1 2 z ˙ ( t ) + β Ψ ( z ( t ) ) 2 M (12)

我们忽略(12)不等号左侧后两个非负项,可以推导出

λ 1 2 z ( t ) z * 2 + t z ( t ) z * , z ˙ ( t ) M λ (13)

再令 h ( t ) = 1 2 z ( t ) z * 2 ,式(13)不等号两边同时乘以 t λ 1 得到

λ t λ 1 h ( t ) + t λ h ˙ ( t ) = d d t ( t λ h ( t ) ) M λ t λ 1 (14)

式(14)不等号两边从 t 1 t > t 1 同时进行积分,得到

t λ h ( t ) t 1 λ h ( t 1 ) M λ 2 ( t λ t 1 λ )

因此

h ( t ) h ( t 1 ) + M λ 2

由此,我们得出h是有界的,x也是有界的。对于收敛速度,根据 Ε λ 的定义(7),我们有

Ψ ( z ( t ) ) min Ψ Ε λ ( t ) t ( t β ( λ + 2 α ) ) Ε λ ( t ) t ( t β )

再次利用定理1,函数 ( t t β ) α 2 Ε λ ( t ) 是非递增的。因此,当 t s > t 1 时,我们推导出

Ψ ( z ( t ) ) min Ψ 1 t ( t β ) ( t β t ) α 2 ( s s β ) α 2 Ε λ ( s ) 1 t 2 ( t β t ) α 3 ( s s β ) α 2 Ε λ ( s ) 1 t 2 ( s s β ) α 2 Ε λ ( s )

4. 数值实验

我们在本节进行数值实验,我们通过两个算例来证明微分方程系统求解约束优化问题的有效性,程序由 MATLAB编写并在普通PC机上运行。算法中相关参数取为 α = 25 β = 1

例1 考虑最优化问题

min f ( x ) = 10 x 1 2 x 2 2 s .t . x 1 + x 2 = 0 , x 1 2 + x 2 0

该问题具有唯一的最优解 x * = ( 0 , 0 ) T ,微分方程系统解的收敛轨迹见图1。结果显示微分方程系统解的轨迹总是收敛到原优化问题的最优解。

例2 考虑目标函数

min f ( x ) = ln ( 1 + x 1 ) 2 ln ( 1 + x 2 ) s .t . x 1 + x 2 2 , x 1 , x 2 0.

该问题的最优解 x * = ( 0.33 , 1.67 ) T ,该问题在微分方程系统求解下解的收敛轨迹见图2,且微分方程系统解的轨迹总是收敛到原优化问题的最优解。

Figure 1. The convergence trajectory of the solution x ( t ) for differential equation systems of case 1

图1. 例1微分方程系统解 x ( t ) 的收敛轨迹

Figure 2. The convergence trajectory of the solution x ( t ) for differential equation systems of case 2

图2. 例2微分方程系统解 x ( t ) 的收敛轨迹

5. 结论

本文利用光滑互补函数(NR函数)和价值函数,将约束优化问题的KKT条件转化为无约束优化问题,构造了一个二阶微分方程系统来求解转化后的无约束优化问题,从而求解了优化问题。本文基于微分方程系统的稳定性理论,通过对参数 α β 的调整,证明了二阶微分方程系统的解的收敛性,通过数值算例验证了该微分方程系统的平衡点能够收敛到原问题的最优解。

文章引用

谢红俭,孙菊贺,王 莉,吕琪楠. 微分方程方法求解约束优化问题
Differential Equation Method for Solving Constrained Optimization Problems[J]. 应用数学进展, 2024, 13(05): 2125-2132. https://doi.org/10.12677/aam.2024.135200

参考文献

  1. 1. Arrow, K.J. and Hurwicz, L. (1956) Reduction of Constrained Maxima to Saddle-Point Problems. Proceedings of the Third Berkeley Symposium on Mathematical Statistics and Probability, Volume 5: Contributions to Econometrics, Industrial Research, and Psychometry, 3, 1-21.

  2. 2. Antipin, A.S. (2000) Solving Variational Inequalities with Coupling Constraints with the Use of Different Equations. Differential Equations, 36, 1587-1596. https://doi.org/10.1007/BF02757358

  3. 3. Gao, X.B., Liao, L.Z. and Qi, L. (2005) A Novel Neural Network for Variational Inequalities with Linear and Nonlinear Constraints. IEEE Transactions on Neural Networks, 16, 1305-1317. https://doi.org/10.1109/TNN.2005.852974

  4. 4. Sun, J., Chen, J.-S. and Ko, C.H. (2012) Neural Networks for Solving Second-Order Cone Constrained Variational Inequality Problem. Computational Optimization and Applications, 51, 623-648. https://doi.org/10.1007/s10589-010-9359-x

  5. 5. Attouch, H., Chbani, Z. and Riahi, H. (2019) Fast Convex Optimization via Time Scaling of Damped Inertial Gradient Dynamics. hal-02138954. https://hal.science/hal-02138954

  6. 6. Attouch, H. and Cabot, A. (2017) Asymptotic Stabilization of Inertial Gradient Dynamics with Time-Dependent Viscosity. Journal of Differential Equations, 263, 5412-5458. https://doi.org/10.1016/j.jde.2017.06.024

  7. 7. Extushenko, Y. (1974) Two Numerical Methods of Solving Nonlinear Programming. Soviet Mathematics Doklady, 15, 420-423.

  8. 8. Evtushenko, Y.G. and Zhadan, V.G. (1973) Numerical Methods for Solving Some Operations Research Problems. USSR Computational Mathematics and Mathematical Physics, 13, 56-57. https://doi.org/10.1016/0041-5553(73)90100-6

  9. 9. Evtushenko, Y.G. and Zhadan, V.G. (1978) A Relaxation Method for Solving Problems of Non-Linear Programming. USSR Computational Mathematics and Mathematical Physics, 17, 73-87. https://doi.org/10.1016/0041-5553(77)90105-7

  10. 10. 孙菊贺. 锥约束变分不等式问题的数值方法的研究[D]: [博士学位论文]. 大连: 大连理工大学, 2008.

  11. 11. Attouch, H., Peypouquet, J. and Redont, P. (2016) Fast Convex Optimization via Inertial Dynamics with Hessian Driven Damping. Journal of Differential Equations, 261, 5734-5783. https://doi.org/10.1016/j.jde.2016.08.020

期刊菜单