迭代精化下求解三对角Toeplitz线性方程组的快速算法 A Fast Algorithm for Solving Tridiagonal Toeplitz Linear Systems with Iterative Refinement

doi:10.12677/PM.2020.105052

Pure Mathematics
Vol. 10 No. 05 ( 2020 ), Article ID: 35505 , 8 pages
10.12677/PM.2020.105052

A Fast Algorithm for Solving Tridiagonal Toeplitz Linear Systems with Iterative Refinement

Shan Li¹, Zhongyun Liu¹, Yulin Zhang²

●How to Cite this Article

¹School of Mathematics and Statistics, Changsha University of Science and Technology, Changsha Hunan

²Centro de Matemática, Universidade do Minho, Braga, Portugal

Received: Apr. 16^th, 2020; accepted: May 5^th, 2020; published: May 12^th, 2020

ABSTRACT

This paper mainly discusses how to numerically solve tridiagonal Toeplitz linear systems $A x = b$ efficiently. Since the coefficient matrix A has a special structure, we can design a direct algorithm to quickly solve $A x = b$ . We will apply the above algorithm to the calculation of practical examples and find that the calculation precision of some examples is not as high as that of computer's machine accuracy. In order to improve the precision of algorithm, this paper further carries out iterative refinement to quickly solve the tridiagonal Toeplitz linear equations of $A x = b$ . Numerical experiments show that the computational accuracy of our algorithm can reach computer's machine accuracy by iterative refinement [1].

Keywords:Toeplitz Matrices, Iterative Refinement, Fast Algorithm

迭代精化下求解三对角Toeplitz线性方程组的快速算法

李姗¹，刘仲云¹，张育林²

¹长沙理工大学数学与统计学院，湖南长沙

²Minho大学数学中心，布拉加，葡萄牙

收稿日期：2020年4月16日；录用日期：2020年5月5日；发布日期：2020年5月12日

摘要

本文主要讨论如何对三对角Toeplitz线性方程组 $A x = b$ 进行高精度数值求解。由于系数矩阵A这种比较特殊的结构，使得我们可以设计出快速求解 $A x = b$ 的直接算法。我们将该算法应用到实际例子的计算过程中，发现大部分例子计算效果显著，但部分例子的计算精度还不能达到计算机机器精度。针对这类达不到计算机机器精度的例子，本文将在快速求解三对角Toeplitz线性方程组 $A x = b$ 的直接算法基础上，进一步进行迭代精化，从而提高这类例子的计算精度。数值实验表明通过迭代精化，我们算法计算精度可以达到计算机机器精度 [1]。

关键词 :Toeplitz矩阵，迭代精化，快速算法

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).

http://creativecommons.org/licenses/by/4.0/

1. 引言

本文考虑迭代精化下求解三对角Toeplitz线性方程组

$A x = b,$ (1.1)

$A = [\begin{matrix} α & γ \\ β & ⋱ & ⋱ \\ ⋱ & ⋱ & γ \\ β & α \end{matrix}]$

其中 $A = Tritoep (β, α, γ)$ 为三对角Toeplitz矩阵。

关于三对角Toeplitz线性方程组的求解方法主要分为两类：一类是直接法如高斯消元法、循环约简法和特殊LU分解法 [2] [3] [4] 等等。另一类就是迭代法如古典迭代法(Smith迭代法，ADI迭代法 [5] [6] [7] [8] 等)和投影迭代法(Krylov子空间法等)。在不考虑舍入误差的情况下，对于小型稀疏求解线性方程组的问题，我们通常使用直接法求解。因为直接法可以通过改善置换策略，引入尽量少的填充，充分利用硬件的性能设计算法。但当遇到大型稀疏求解线性方程组的问题时，直接解法计算量太大且数值不稳定，而迭代解法数值稳定且易于并行计算，所以这时我们通常使用迭代法求解。

Toeplitz矩阵是一类特殊结构的矩阵，它在数学、科学计算和工程中有着广泛的应用，如信号处理中的图像恢复存储问题、代数微分方程、时间序列和控制理论等。本文主要讨论如何对三对角Toeplitz线性方程组 $A x = b$ 进行高精度数值求解。由于系数矩阵A这种比较特殊的结构，我们在前面一篇论文中已经设计出快速求解 $A x = b$ 的直接算法。其系数矩阵主要是上次对角占优、下次对角占优、若对角占优。具体情况如下：

我们首先从系数矩阵为次对角占优情况开始考虑。

$C = [\begin{matrix} 0 & 1 \\ 0 & 1 \\ ⋱ & ⋱ \\ 0 & 1 \\ 1 & 0 \end{matrix}]$

我们容易得到 $\hat{A} = C A$ 并且具有如下 $2 \times 2$ 的块结构

$\begin{array}{l} \hat{A} = [\begin{matrix} β & α & γ \\ β & α & ⋱ \\ ⋱ & ⋱ & γ \\ β & α \\ α & γ & 0 \end{matrix}] \equiv [\begin{matrix} A_{11} & p \\ w^{T} & 0 \end{matrix}] . \end{array}$ (1.2)

我们对 $\hat{A}$ 作如下的 $2 \times 2$ 的块LU分解

$\hat{A} = [\begin{matrix} I \\ w^{T} A_{11}^{- 1} & 1 \end{matrix}] [\begin{matrix} A_{11} & p \\ - w^{T} A_{11}^{- 1} p \end{matrix}] .$ (1.3)

$- w^{T} A_{11}^{- 1} p$ 是叫做 $\hat{A}$ 的Schur补。

同样地，要求问题(1.1)的解也就变成了求如下线性方程组的解

$\hat{A} x = \hat{b}$ (1.4)

其中 $\hat{b} = C b = {(b_{2}, b_{3}, \dots, b_{n}, b_{1})}^{T}$ 。对x和 $\hat{b}$ 做如下格式的划分

$x = [\begin{matrix} x_{1} \\ x_{n} \end{matrix}], \hat{b} = [\begin{matrix} b_{2} \\ b_{1} \end{matrix}] .$

用块LU分解法分解(1.3)，我们就可以通过求下面方程的解来获得方程(1.1)的解

$(\begin{array}{l} A_{11} x_{1} + x_{n} p = b_{2}, \\ w^{T} x_{1} = b_{1} . \end{array}$ (1.5)

$(\begin{array}{l} x_{n} = (w^{T} v - b_{1}) / w^{T} u, \\ x_{1} = v - x_{n} u . \end{array}$ (1.6)

为了获得 $x = {[x_{1}^{T} x_{n}]}^{T}$ 的解，我们首先求解如下方程中的 $u$ 和 $v$

$(\begin{array}{l} A_{11} u = p, \\ A_{11} v = b_{2} . \end{array}$ (1.7)

通过如下算法，我们得到式(1.7)中方程组的解 $u$ 和 $v$ ，具体算法如下：

我们注意到，为了得到(1.6)的解 $x_{1}$ 和 $x_{n}$ ，我们需要解(1.7)中的两个线性方程组，其中 $A_{11}$ 是一个上三对角矩阵。显然，向量 $u$ 和 $v$ 可以通过向后代入法求解。此外，由于 $A_{11}$ 是对角占优的，计算出的向量 $u$ 和 $v$ 都是稳定可靠的。

基于以上分析，我们现在可以重新设计求解(1.1)的算法如下

算法2的稳定性取决于第三步的求解 $x_{n} = (w^{T} v - b_{1}) / w^{T} u$ 。如果 $w^{T} u$ 不是足够小，那么 $x_{n}$ 的就是相当精确的。因此，我们可以得出结论，我们求解这类线性方程组的算法在数值上是稳定的，计算出的解是可靠的，如果A是下次对角占优的并且 $w^{T} u$ 不是足够小。

对于计算复杂度，我们的算法需要大约12n (flops)的浮点运算，选主元的LU分解法需要13n (flops)浮点运算，我们的方法与选主元的LU分解法相比需要更少的浮点运算量。对于内存存储空间，我们的算法只需要存储2个大小为n向量，少于选主元的LU分解法需要存储5个大小为n向量。特别是，我们的算法需要较少的数据传输。在数据传输过程中它只需要读取1个向量即右边的向量并写入一个向量(即方程的解)。但是选主元的LU分解法需要读取个向量。正如我们所知，现代计算机有多层的内存结构，有不同的存储级别，如较小的高速缓存和较大的低速磁盘存储。在计算过程中，数据在不同级别的高速缓存中传输。因此，较少数据传输的算法可能会显示出更好的计算性能。这使得该算法比选主元的LU分解方法更有效。

现在，我们考虑上次对角占优的情况。设J为交换对角矩阵，在交叉对角上为1 (从左下到右上)，其他地方为0，即

$J = [\begin{matrix} 0 & 0 & \dots & 0 & 1 \\ 0 & 0 & \dots & 1 & 0 \\ ⋮ & ⋮ & ⋱ & ⋮ & ⋮ \\ 0 & 1 & \dots & 0 & 0 \\ 1 & 0 & \dots & 0 & 0 \end{matrix}],$ (1.8)

因为A是上次对角占优的， $\tilde{A} = J A J = Tritoep (γ, α, β)$ 是下次对角占优的。因此，我们可以将原来的线性线性方程组(1.1)转化为以下新的线性方程组

$\tilde{A} \tilde{x} = \tilde{b}$ (1.9)

$\tilde{x} = J x$ ， $\tilde{b} = J b$ 。因此，结合算法2得到下面的算法3用于求解方程(1.1)。

由于J是一个置换矩阵，因此算法3的稳定性、计算复杂度和内存存储都与算法2相同。

最后，我们讨论了不可约对角占优的情形。已知，在这种情况下，A是一个H矩阵，使用LU分解法不需要选主元。显然，这种情况下LU分解法不会导致任何非零元素的填充，但需要更多的内存存储空间。为了避免这个问题，我们采用以下方法：

如果 $β > γ$ ，那么我们选择算法2解方程(1.1)，如果 $β < γ$ ，然后调用算法3解解方程(1.1)。我们把以上情况总结，得到综合算法如下：

算法4的计算复杂度和内存存储与算法2或3基本相同。

与选主元LU分解法相比，我们提出的三对角Toeplitz线性方程组快速直接算法(算法4)具有以下优点：不仅需要更少的计算时间和存储空间以及数据传输，而且具有更高的计算精度。我们将该算法应用到实际例子的计算过程中，发现大部分例子计算效果显著，但部分例子的计算精度还不能达到计算机机器精度。为解决这类问题，我们将在快速求解三对角Toeplitz线性方程组 $A x = b$ 的直接算法基础上进行迭代精化(详情见算法5)，从而减小我们的计算误差，提高解的精度。

2. 迭代精化算法及收敛性分析

求解(1.1)的精化迭代法的迭代格式 [12] 为：

$x^{(k + 1)} = x^{(k)} + d^{(k)}$ (2.1)

$A d^{(k)} = r^{(k)}, r^{(k)} = b - A x^{(k)}$ (2.2)

其中 $x^{(0)}$ 为初始迭代向量， $k = 0,1, \dots$ 。当 $d^{(k)}$ 为(2.2)的精确解时，迭代格式(2.1)~(2.2)退化为单步迭代精化。不难看出，该迭代格式可以提高解 $x^{(k)}$ 的精度。另外，如果我们用高精度方法求解(2.2)，那么我们把迭代格式(2.1)~(2.2)称为迭代精化。

引理2.1 [12] 假设不考虑舍入误差，精确计算残差 $r^{(k)}$ ， $d^{(k)}$ 为(2.2)的精确解，则 $x^{(k + 1)}$ 为(1.1)的精确解 [9]。

证明：由(2.2)式知 $A d^{(k)} = r^{(k)}$ ， $r^{(k)} = b - A x^{(k)}$ ，从而 $A x^{(k + 1)} = A x^{(k)} + A d^{(k)} = b$ 。这意味着 $x^{(k + 1)}$ 是(1.1)的精确解，证毕。

结合引理2.1与算法4，我们得到迭代精化 [10] 的具体算法如下：

定理2.1 [12] 假设r是双精度并且 $κ (A) \cdot ε < c \equiv \frac{1}{3 n^{3} g + 1} < 1$ ，n表示矩阵A的阶数，g表示主元增长

因子， $κ (A) = ‖ A ‖ \cdot ‖ A^{- 1} ‖$ 。那么迭代精化收敛于：

$\frac{‖ x^{i} - A^{- 1} b ‖}{‖ A^{- 1} b ‖} = o (ε) .$ (2.3)

定理2.2 [12] 令 $x^{*}$ 为线性方程组(1.1)的精确解。对第k步迭代，用算法5求解(2.2)的初始迭代向量均为 $d^{(0)} = x^{(0)}$ (其中 $x^{(0)}$ 为用算法4求得的线性方程组(1.1)的解)，相应的迭代序列为 $d^{(k)}$ ，且 $d^{(k)}$ 满足终止检验公式

$η = \frac{‖ r^{(k)} - A d^{(k)} ‖}{‖ r^{(k)} ‖} < ε$ (2.4)

则迭代序列 $x^{(k)}$ 满足

$‖ x^{(k + 1)} - x^{*} ‖ \leq κ (A) ε ‖ x^{(k)} - x^{*} ‖$ (2.5)

特别地，当 $κ (A) ε < 1$ ，迭代序列 $x^{(k)}$ 收敛到 $x^{(*)}$ [11]。

证明：由(2.1)、(2.2)及(2.4)式知

(2.6)

从而

(2.7)

当时，迭代序列收敛，证毕。

针对算法5，只要，则满足终止检验公式(2.4)，那么就是满足计算机机器精度的解 [12]。

3. 数值实验

下面我们用一些例子证明我们算法的有效性。本文所有数值实验的电脑运行环境为：Intel(R) Core(TM) i3-2310M CPU @2.10 by Matlab 7.4.0.287 (R2014a)。分别用快速直接算法和加迭代精化的快速直接法分别对三对角Toeplitz线性方程组进行求解。选取典型代表例子如下：

例1：；

例2：。

在例1、例2中的矩阵A是由一维对流扩散方程离散差分得到的方程的系数矩阵。在所有例子中二阶差分都采用中心差分格式。但在例1和例2中一阶差分分别使用中心差分格式和向后差分格式。在数值实验中，我们计算了许多不同n和参数c的例子。我们可以得到共同的结论。接下来我们展示一些有代表性的例子结果。在实验中，n表示矩阵A的阶数，Iter表示迭代次数，CPU表示计算时间，右端向量

，R表示计算相对残差，即()，Fast algorithm表示快速算法，Iter algorithm表示对快

速算法进行迭代精化。

数值结果表1是例1取和的两个例子，数值结果表2是例2取和的两个例子。我们发现当我们用直接算法1计算三对角Toeplitz线性方程组时，存在计算精度无法达到机器精度的情况。但是通过我们进一步迭代精化，当迭代一定次数(本例Iter = 10)时，我们的计算精度就可以达到计算机机器精度。

数值实验表明，当采用直接算法求解三对角Toeplitz线性方程组的时候，存在计算精度达不到计算机机器精度的情况。但是通过我们的迭代精化算法，可以使三对角Toeplitz线性方程组的解都能够达到计算机机器精度。

基金项目

2019年硕士研究生校级科研创新项目(CX2019SS34)。

文章引用

李姗,刘仲云,张育林. 迭代精化下求解三对角Toeplitz线性方程组的快速算法
A Fast Algorithm for Solving Tridiagonal Toeplitz Linear Systems with Iterative Refinement[J]. 理论数学, 2020, 10(05): 425-432. https://doi.org/10.12677/PM.2020.105052

参考文献

1. Saad, Y. (2000) Iterative Methods for Sparse Linear Systems. 2nd Edition, SIAM, Philadelphia, PA.

2. Yan, W.-M. and Chung, K.-L. (1994) A Fast Algorithm for Solving Special Tridiagonal Systems. Computing, 52, 203-211.https://doi.org/10.1007/bf02238076

3. Garey, L.E. and Shaw, R.E. (2001) A Parallel Method for Linear Equa-tions with Tridiagonal Toeplitz Coefficient Matrices. Computer & Mathematics with Applications, 42, 1-11. https://doi.org/10.1016/s0898-1221(01)00125-0

4. Kim, H.J. (1990) A Parallel Algorithm Solving a Tridiagonal Toeplitz Linear System. Parallel Computing, 13, 289-294. https://doi.org/10.1016/0167-8191(90)90131-r

5. Benner, P., Li, R.C. and Truhar, N. (2009) On the ADI Method for Sylvester Equations. Journal of Computational and Applied Mathematics, 233, 1035-1045. https://doi.org/10.1016/j.cam.2009.08.108

6. Kurschner, P., Benner, P. and Saak, J. (2014) Self-Generating and Efficient Shift Parameters in ADI Methods for Large Lyapunov and Sylvester Equations. Electronic Transactions on Numerical Analysis, 43, 142-162.

7. Levenberg, N. and Reichel, L. (1993) A Generalized ADI Iterative Method. Numerische Mathematik, 66, 215-233. https://doi.org/10.1007/bf01385695

8. Lu, A. and Wachspress, E.L. (1991) Solution of Lyapunov Equations by Alternating Direction Implicit Iteration. Computers and Mathematics with Applications, 21, 43-58. https://doi.org/10.1016/0898-1221(91)90124-m

9. Horn, R.A. and Johnson, C.R. (1985) Matrix Analysis. Cambridge University Press, Cambridge.

10. Bai, Z.-Z., Golub, G.H. and Ng, M.K. (2003) Hermitian and Skew-Hermitian Splitting Methods for Non-Hermitian Positive Definite Linear Systems. SIAM Journal on Matrix Analysis and Applications, 24, 603-626. https://doi.org/10.1137/s0895479801395458

11. Garey, L.E., Majedi, M. and Shaw, R.E. (2008) A Parallel Sewing Method for Solving Tridiagonal Toeplitz Strictly Diagonally Dominant Systems. I.P.D.P.S., 1-8. https://doi.org/10.1109/ipdps.2008.4536466

12. Demmel, J.W. 应用数值线性代数[M]. 王国荣, 译. 北京: 人民邮电出版社, 2007.

期刊菜单