矩阵差分方程 是一种差分方程 ,其中某时刻的变量向量(或矩阵)与之前时刻的值通过矩阵相关。[ 1] [ 2] 方程的阶 是变量向量任意两个指示值之间的最大时差。例如
x
t
=
A
x
t
−
1
+
B
x
t
−
2
{\displaystyle \mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {Bx} _{t-2}}
是二阶矩阵差分方程,其中x 是n × 1 变量向量,A 、B 是n × n 矩阵。该方程齐次,因为方程末尾没有常数项向量。同一个方程也可写成
x
t
+
2
=
A
x
t
+
1
+
B
x
t
{\displaystyle \mathbf {x} _{t+2}=\mathbf {Ax} _{t+1}+\mathbf {Bx} _{t}}
或
x
n
=
A
x
n
−
1
+
B
x
n
−
2
{\displaystyle \mathbf {x} _{n}=\mathbf {Ax} _{n-1}+\mathbf {Bx} _{n-2}}
最常见的矩阵差分方程都是一阶的。
非齐次一阶情形及稳态
非齐次一阶矩阵差分方程如:
x
t
=
A
x
t
−
1
+
b
{\displaystyle \mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {b} }
与一个加性常向量 b 。该系统的稳态是x 向量的值x * ,一旦达到就不会偏离。x * 可通过置x t = x t −1 = x * 、解x * 以得
x
∗
=
[
I
−
A
]
−
1
b
{\displaystyle \mathbf {x} ^{*}=[\mathbf {I} -\mathbf {A} ]^{-1}\mathbf {b} }
其中I 是n × n 单位矩阵 ,假定[I − A ] 可逆。非齐次方程可用偏离稳态的齐次方程重写:
[
x
t
−
x
∗
]
=
A
[
x
t
−
1
−
x
∗
]
{\displaystyle \left[\mathbf {x} _{t}-\mathbf {x} ^{*}\right]=\mathbf {A} \left[\mathbf {x} _{t-1}-\mathbf {x} ^{*}\right]}
一阶情形的稳定性
一阶矩阵差分方程[x t − x *] = A [x t −1 − x *] 是稳定 的,即当且仅当转移矩阵A 的所有特征值(无论实复)绝对值都小于1时,x t 才逐渐收敛到稳态x * 。
解一阶情形
假定方程齐次形式为y t = Ay t −1 ,然后可从初始条件 y 0 开始迭代。y 0 是y 的初值,必须得知才能求解:
y
1
=
A
y
0
y
2
=
A
y
1
=
A
2
y
0
y
3
=
A
y
2
=
A
3
y
0
{\displaystyle {\begin{aligned}\mathbf {y} _{1}&=\mathbf {Ay} _{0}\\\mathbf {y} _{2}&=\mathbf {Ay} _{1}=\mathbf {A} ^{2}\mathbf {y} _{0}\\\mathbf {y} _{3}&=\mathbf {Ay} _{2}=\mathbf {A} ^{3}\mathbf {y} _{0}\end{aligned}}}
以此类推,由数学归纳法 ,用t 表示的解为
y
t
=
A
t
y
0
{\displaystyle \mathbf {y} _{t}=\mathbf {A} ^{t}\mathbf {y} _{0}}
此外,若A 可对角化,就可用它的特征值和特征向量重写A ,得到解
y
t
=
P
D
t
P
−
1
y
0
,
{\displaystyle \mathbf {y} _{t}=\mathbf {PD} ^{t}\mathbf {P} ^{-1}\mathbf {y} _{0},}
其中P 是n × n 矩阵,列是A 的特征向量(假设特征值互异);D 是n × n 对角矩阵 ,对角元是A 的特征值。这个解就是上述稳定性结果的依据:当且仅当A 的特征值绝对值都小于1,A t 才会随时间收缩到零矩阵。
从一阶矩阵系统中提取单一标量变量的动力特性
从n 维系统y t = Ay t −1 开始,可以提取其中一个状态变量(如y 1 )的动态变化。上述yt 的求解方程表明,y 1,t 的解是根据A 的n 个特征值求得的。因此,描述y 1 变化的方程本身必须有涉及特征值的解。这种描述直观地产生了y 1 的演化方程,即
y
1
,
t
=
a
1
y
1
,
t
−
1
+
a
2
y
1
,
t
−
2
+
⋯
+
a
n
y
1
,
t
−
n
{\displaystyle y_{1,t}=a_{1}y_{1,t-1}+a_{2}y_{1,t-2}+\dots +a_{n}y_{1,t-n}}
其中参数ai 来自A 的特征方程式 :
λ
n
−
a
1
λ
n
−
1
−
a
2
λ
n
−
2
−
⋯
−
a
n
λ
0
=
0.
{\displaystyle \lambda ^{n}-a_{1}\lambda ^{n-1}-a_{2}\lambda ^{n-2}-\dots -a_{n}\lambda ^{0}=0.}
因此,n 维一阶线性系统中的每个标量变量都根据一元n 阶差分方程演化,与矩阵差分防尘具有相同的稳定性。
高阶情形的解与稳定性
可用分块矩阵将高阶矩阵差分方程转换到一阶,可以求解时滞超过一个周期的高阶方程,并分析其稳定性。例如,假设有二阶方程
x
t
=
A
x
t
−
1
+
B
x
t
−
2
{\displaystyle \mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {Bx} _{t-2}}
变量向量x 尺寸为n × 1 ,A 、B 尺寸为n × n 。则可以叠加为下列形式
[
x
t
x
t
−
1
]
=
[
A
B
I
0
]
[
x
t
−
1
x
t
−
2
]
{\displaystyle {\begin{bmatrix}\mathbf {x} _{t}\\\mathbf {x} _{t-1}\\\end{bmatrix}}={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {I} &\mathbf {0} \\\end{bmatrix}}{\begin{bmatrix}\mathbf {x} _{t-1}\\\mathbf {x} _{t-2}\end{bmatrix}}}
其中I 是n × n 单位矩阵 ,0 是n × n 零矩阵 。然后将当前变量和一度滞后变量的2n × 1 叠加向量表示为z t ,将2n × 2n 分块矩阵表示为L ,就得到了之前的解
z
t
=
L
t
z
0
{\displaystyle \mathbf {z} _{t}=\mathbf {L} ^{t}\mathbf {z} _{0}}
与之前一样,当且仅当矩阵L 的所有特征值的绝对值都小于1时,叠加方程与原二阶方程才稳定。
非线性矩阵差分方程:黎卡提方程
在LQG控制 中,会出现一个当前和未来成本矩阵反向演化的非线性矩阵方程,下面用H 表示。这个方程也被称为离散动力黎卡提方程 ,当据线性矩阵差分方程演化的变量向量受外源向量的控制,以优化二次 损失函数 时,就会产生这个方程。黎卡提方程形式如下:
H
t
−
1
=
K
+
A
′
H
t
A
−
A
′
H
t
C
[
C
′
H
t
C
+
R
]
−
1
C
′
H
t
A
{\displaystyle \mathbf {H} _{t-1}=\mathbf {K} +\mathbf {A} '\mathbf {H} _{t}\mathbf {A} -\mathbf {A} '\mathbf {H} _{t}\mathbf {C} \left[\mathbf {C} '\mathbf {H} _{t}\mathbf {C} +\mathbf {R} \right]^{-1}\mathbf {C} '\mathbf {H} _{t}\mathbf {A} }
其中H 、K 、A 尺寸为n × n ;C 尺寸为n × k ;R 尺寸为k × k ,n 是受控向量元素数,k 是控制向量元素数。参数矩阵A 、C 来自线性方程,参数矩阵K 、R 来自二次损失函数。详见此处 。
一般来说,该方程无法根据t 分析求解H t ,而是通过迭代黎卡提方程,求出H t 的值序列。不过,已经证明[ 3] ,若R = 0 、n = k + 1 ,则可将黎卡提方程简化为标量有理差分方程 分析求解;对任意k 、n ,若转移矩阵A 可逆,则黎卡提方程就可根据矩阵特征值进行分析求解,尽管特征值可能要用数值计算才能找到。[ 4]
在大多数情况下,H 随时间的演化是稳定的,也就是说H 会收敛到特定的常矩阵H * ,其他矩阵都有理时也可能是无理的。参见隨機控制#離散時間系統 。
相关的黎卡提方程[ 5] 是
X
t
+
1
=
−
[
E
+
B
X
t
]
[
C
+
A
X
t
]
−
1
{\displaystyle \mathbf {X} _{t+1}=-\left[\mathbf {E} +\mathbf {B} \mathbf {X} _{t}\right]\left[\mathbf {C} +\mathbf {A} \mathbf {X} _{t}\right]^{-1}}
其中X , A , B , C , E 全都是n × n 方阵。这个方程可以显式求解。假设
X
t
=
N
t
D
t
−
1
{\displaystyle \mathbf {X} _{t}=\mathbf {N} _{t}\mathbf {D} _{t}^{-1}}
,在t = 0 时N 0 = X 0 、D 0 = I 显然成立。然后将其用于差分方程,得出
X
t
+
1
=
−
[
E
+
B
N
t
D
t
−
1
]
D
t
D
t
−
1
[
C
+
A
N
t
D
t
−
1
]
−
1
=
−
[
E
D
t
+
B
N
t
]
[
[
C
+
A
N
t
D
t
−
1
]
D
t
]
−
1
=
−
[
E
D
t
+
B
N
t
]
[
C
D
t
+
A
N
t
]
−
1
=
N
t
+
1
D
t
+
1
−
1
{\displaystyle {\begin{aligned}\mathbf {X} _{t+1}&=-\left[\mathbf {E} +\mathbf {BN} _{t}\mathbf {D} _{t}^{-1}\right]\mathbf {D} _{t}\mathbf {D} _{t}^{-1}\left[\mathbf {C} +\mathbf {AN} _{t}\mathbf {D} _{t}^{-1}\right]^{-1}\\&=-\left[\mathbf {ED} _{t}+\mathbf {BN} _{t}\right]\left[\left[\mathbf {C} +\mathbf {AN} _{t}\mathbf {D} _{t}^{-1}\right]\mathbf {D} _{t}\right]^{-1}\\&=-\left[\mathbf {ED} _{t}+\mathbf {BN} _{t}\right]\left[\mathbf {CD} _{t}+\mathbf {AN} _{t}\right]^{-1}\\&=\mathbf {N} _{t+1}\mathbf {D} _{t+1}^{-1}\end{aligned}}}
因此通过归纳法,形式
X
t
=
N
t
D
t
−
1
{\displaystyle \mathbf {X} _{t}=\mathbf {N} _{t}\mathbf {D} _{t}^{-1}}
对所有t 都成立。那么N 、D 的演化可写为
[
N
t
+
1
D
t
+
1
]
=
[
−
B
−
E
A
C
]
[
N
t
D
t
]
≡
J
[
N
t
D
t
]
{\displaystyle {\begin{bmatrix}\mathbf {N} _{t+1}\\\mathbf {D} _{t+1}\end{bmatrix}}={\begin{bmatrix}-\mathbf {B} &-\mathbf {E} \\\mathbf {A} &\mathbf {C} \end{bmatrix}}{\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}\equiv \mathbf {J} {\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}}
因此可归纳
[
N
t
D
t
]
=
J
t
[
N
0
D
0
]
{\displaystyle {\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}=\mathbf {J} ^{t}{\begin{bmatrix}\mathbf {N} _{0}\\\mathbf {D} _{0}\end{bmatrix}}}
另见
参考文献
^ Cull, Paul; Flahive, Mary ; Robson, Robbie. Difference Equations: From Rabbits to Chaos . Springer. 2005. ch. 7. ISBN 0-387-23234-6 .
^ Chiang, Alpha C. Fundamental Methods of Mathematical Economics 3rd. McGraw-Hill. 1984: 608–612 . ISBN 9780070107809 .
^ Balvers, Ronald J.; Mitchell, Douglas W. Reducing the dimensionality of linear quadratic control problems (PDF) . Journal of Economic Dynamics and Control. 2007, 31 (1): 141–159 [2023-10-15 ] . doi:10.1016/j.jedc.2005.09.013 . (原始内容存档 (PDF) 于2022-01-18).
^ Vaughan, D. R. A nonrecursive algebraic solution for the discrete Riccati equation. IEEE Transactions on Automatic Control. 1970, 15 (5): 597–599. doi:10.1109/TAC.1970.1099549 .
^ Martin, C. F.; Ammar, G. The geometry of the matrix Riccati equation and associated eigenvalue method. Bittani; Laub; Willems (编). The Riccati Equation. Springer-Verlag. 1991. ISBN 978-3-642-63508-3 . doi:10.1007/978-3-642-58223-3_5 .