貝爾曼擬譜法

貝爾曼擬譜法(Bellman pseudospectral method)是針對最優控制擬譜法,以貝爾曼方程為基礎,是I. Michael Ross英語I. Michael Ross提出擬譜最佳控制中的一部份[1]。此方法得名自理查德·貝爾曼,是由I. Michael Ross英語I. Michael Ross開始使用[2][3],一開始是用來求解多尺度的最佳控制問題,後來擴展到一般最佳問題的次佳解。

理論基礎

貝爾曼擬譜法的多尺度版本是以Ross–Fahroo擬譜法的譜收斂特性為基礎。因為Ross–Fahroo擬譜法會快速的以指數型式收斂,可以在只有非常少節點的情形下達到解的點收斂,而其解還有很多高頻的成份。最佳控制的混疊現象一開始是由Ross等人發現的[2]。他們沒有用一般信號處理中處理反混疊的技巧,而提出最佳控制的貝爾曼原則可以應用在收斂解上,找到各節點之間的資訊。因為Gauss–Lobatto節點在邊界點會相當的密集,Ross等人認為若在初始條件附近的節點密度滿足採樣定理,可以用遞迴方式用一種稱為貝爾曼分段(Bellman segments)的分段,求解最佳控制問題,得到完整的解[2]

在此方法的擴展版本中,Ross等人[3]提出可以用此方式得到不一定是最佳解的可行解。此版本中,即使是知道解沒有收斂到最佳化,也可以用貝爾曼擬譜法在更低密度的節點條件下求解。此條件下得到的是可行解。

貝爾曼擬譜法的一個重要特點是它會以原始的擬譜法以貝爾曼分段下求和的成本為基礎,自動決定一些次最佳化的量測[2][3]

計算效率

貝爾曼擬譜法在計算上的優點之一是可以不用遵守節點的高斯分佈。在標準的擬譜法中,節點會以高斯分佈(有限時域會是Gauss-Lobatto,無限時域會是Gauss-Radau)。高斯分佈在區間的中間會很稀疏(無限時域中的「中間」會有其他的定義方式),在邊界則會很密集貝爾曼擬譜法的利用初始點節點累計的好處來對所到的解反混疊,不考慮其他的節點。因此最後節點的分佈是非高斯及密集的,不過其計算方式仍維持稀疏的結構。

應用

貝爾曼擬譜法最早是由Ross等人使用的[2],是要求解很有挑戰性的低推力軌跡最佳化問題。此方法已成功的用來求解實際的問題,產生跨地球注入問題的高精度解,該問題是將太空艙從繞月軌道帶到一個很小的地球接面位置,以便成功的重返地球[4][5]

貝爾曼擬譜法最常用作Ross–Fahroo擬譜法產生的擬譜解的最佳性確認。除了使用龐特里亞金最大化原理配合Ross–Fahroo擬譜法的解之外,貝爾曼擬譜法也用來做為其解最佳性的初步確認[6][7]

相關條目

參考資料

  1. ^ Ross, I. M.; Karpenko, M. A Review of Pseudospectral Optimal Control: From Theory to Flight. Annual Reviews in Control. 2012, 36: 182–197 [2019-01-12]. doi:10.1016/j.arcontrol.2012.09.002. (原始內容存檔於2015-09-24). 
  2. ^ 2.0 2.1 2.2 2.3 2.4 Ross, I. M.; Gong, Q.; Sekhavat, P. Low-Thrust, High-Accuracy Trajectory Optimization. Journal of Guidance, Control and Dynamics. 2007, 30 (4): 921–933. doi:10.2514/1.23181. 
  3. ^ 3.0 3.1 3.2 I. M. Ross, Q. Gong and P. Sekhavat, The Bellman pseudospectral method, AIAA/AAS Astrodynamics Specialist Conference and Exhibit, Honolulu, Hawaii, AIAA-2008-6448, August 18–21, 2008.
  4. ^ Yan, H.; Gong, Q.; Park, C.; Ross, I. M.; D'Souza, C. N. High Accuracy Trajectory Optimization for a Trans-Earth Lunar Mission. Journal of Guidance, Control and Dynamics. 2011, 34 (4): 1219–1227. doi:10.2514/1.49237. 
  5. ^ H. Yan, Q. Gong, C. D. Park, I. M. Ross and C. N. D'Souza, High-Accuracy Moon to Earth trajectory optimization, AIAA Guidance, Navigation, and Control Conference, 2010.
  6. ^ Fleming, A.; Sekhavat, P.; Ross, I. M. Minimum-Time Reorientation of a Rigid Body. Journal of Guidance, Control and Dynamics. 2010, 33 (1): 160–170. doi:10.2514/1.43549. 
  7. ^ Ross, I. M.; Sekhavat, P.; Fleming, A.; Gong, Q. Optimal feedback control: foundations, examples, and experimental results for a new approach. Journal of Guidance, Control, and Dynamics. 2008, 31 (2): 307–321. doi:10.2514/1.29532.