最佳投影方程

最佳投影方程(optimal projection equations)[1][2][3]控制理论中,建構局部最佳降階LQG控制器的充分必要条件[4]

LQG控制(線性二次高斯控制)問題是最优控制領域中最基礎的問題之一,這問題包括了存在不確定性的線性系統,受到加性高斯白噪声的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是非線性系統中最佳擾動控制的基礎[5]

LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的分離原理,在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法[4][6][7][8]來求解對應的最佳投影方程。

問題的數學表示以及其解

連續時間

降階的LQG控制問題幾乎和全階的LQG控制問題相同。令 表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度 是事先定義好的值,比受控系統的狀態維度 要少。

降階LQG控制器可以表示為下式:

 
 

上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式:

 
 

其中

 

降階LQG控制器的矩陣  是由所謂的最佳投影方程(optimal projection equations、OPE)來決定[3]

 維的最佳投影方陣 OPE的核心。此矩陣的秩在所有狀態下幾乎都等於 。相關投影為斜投影(oblique projection): 。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中 表示 ,而  維的單位矩陣

 
 

若LQG的維度沒有減少,也就是 ,則 ,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若 ,則兩個方程會有斜投影項 。這也是為何降階的LQG控制器無法分離的原因,斜投影 是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣:

 
 
 
 

則最後二個矩陣微分方程如下:

  almost everywhere,
  almost everywhere,

其中

 

此處的 * 表示群廣義逆矩陣(group generalized inverse)或Drazin逆矩陣英语Drazin inverse,是唯一的,定義如下

 

其中 + 是摩尔-彭若斯广义逆.

矩陣 都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣  

 
 
 
 

上式中的矩陣 是符合以下性質的矩陣:

 幾乎在所有狀態下。

可以由 的投影分解中得到[4]

若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon) 趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的[1]。此情形下,最佳投影方程左側的微分項會為零。

離散時間

離散時間的情形類似連續時間的例子,要處理的是將 階傳統離散時間全階LQG問題轉換為事先已知固定階數的 階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣:

 
 
 
 

則離散時間OPE為

 .
 .
  almost everywhere,
  almost everywhere.

斜投影(oblique projection)矩陣為

 

非負對稱矩陣 是離散時間OPE的解,也決定了降階LQG控制器的矩陣  and  

 
 
 
 

在上述的方程中,矩陣 是有以下性質的矩陣:

 幾乎在所有狀態下。

這些矩陣可以從 的投影因式分解中求得[4]

如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon) 趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器[2]

離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)[6]。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。

參考資料

  1. ^ 1.0 1.1 Hyland D.C; Bernstein D.S. The optimal projection equations for fixed order dynamic compensation. IEEE Transactions on Automatic Control. 1984, AC–29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. hdl:2027.42/57875. 
  2. ^ 2.0 2.1 Bernstein D.S.; Davis L.D.; Hyland D.C. The optimal projection equations for reduced-order discrete-time modeling estimation and control (PDF). Journal of Guidance Control and Dynamics. 1986, 9 (3): 288–293 [2020-02-04]. Bibcode:1986JGCD....9..288B. doi:10.2514/3.20105. hdl:2027.42/57880. (原始内容 (PDF)存档于2022-01-09). 
  3. ^ 3.0 3.1 Haddad W.M.; Tadmor G. Reduced-order LQG controllers for linear time-varying plants. Systems & Control Letters. 1993, 20 (2): 87–97. doi:10.1016/0167-6911(93)90020-7. 
  4. ^ 4.0 4.1 4.2 4.3 Van Willigenburg L.G.; De Koning W.L. Numerical algorithms and issues concerning the discrete-time optimal projection equations. European Journal of Control. 2000, 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4.  Associated software download from Matlab Central页面存档备份,存于互联网档案馆).
  5. ^ Athans M. The role and use of the stochastic linear-quadratic-Gaussian problem in control system design. IEEE Transactions on Automatic Control. 1971, AC–16 (6): 529–552. doi:10.1109/TAC.1971.1099818. 
  6. ^ 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters. Automatica. 1999, 35: 129–138. doi:10.1016/S0005-1098(98)00138-1.  Associated software download from Matlab Central页面存档备份,存于互联网档案馆).
  7. ^ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem. International Journal of Control. 1996, 56 (1): 173–191. doi:10.1080/00207179208934308. 
  8. ^ Collins Jr. E.G; Haddad W.M.; Ying S. A homotopy algorithm for reduced-order dynamic compensation using the Hyland–Bernstein optimal projection equations. Journal of Guidance Control & Dynamics. 1996, 19 (2): 407–417. doi:10.2514/3.21633.