最佳投影方程(optimal projection equations)[1][2][3]是控制理論中,建構局部最佳降階LQG控制器的充分必要條件[4]。
LQG控制(線性二次高斯控制)問題是最優控制領域中最基礎的問題之一,這問題包括了存在不確定性的線性系統,受到加性高斯白噪聲的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是非線性系統中最佳擾動控制的基礎[5]。
LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的分離原理,在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法[4][6][7][8]來求解對應的最佳投影方程。
問題的數學表示以及其解
連續時間
降階的LQG控制問題幾乎和全階的LQG控制問題相同。令表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度是事先定義好的值,比受控系統的狀態維度要少。
降階LQG控制器可以表示為下式:
上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式:
其中
降階LQG控制器的矩陣和是由所謂的最佳投影方程(optimal projection equations、OPE)來決定[3]。
維的最佳投影方陣是OPE的核心。此矩陣的秩在所有狀態下幾乎都等於。相關投影為斜投影(oblique projection):。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中表示,而為維的單位矩陣
若LQG的維度沒有減少,也就是,則,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若,則兩個方程會有斜投影項。這也是為何降階的LQG控制器無法分離的原因,斜投影是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣:
-
-
則最後二個矩陣微分方程如下:
- almost everywhere,
- almost everywhere,
其中
此處的 * 表示群廣義逆矩陣(group generalized inverse)或Drazin逆矩陣,是唯一的,定義如下
其中 + 是摩爾-彭若斯廣義逆.
矩陣都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣和:
上式中的矩陣是符合以下性質的矩陣:
- 幾乎在所有狀態下。
可以由的投影分解中得到[4]:
若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon)趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的[1]。此情形下,最佳投影方程左側的微分項會為零。
離散時間
離散時間的情形類似連續時間的例子,要處理的是將階傳統離散時間全階LQG問題轉換為事先已知固定階數的階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣:
-
-
則離散時間OPE為
- .
- .
- almost everywhere,
- almost everywhere.
斜投影(oblique projection)矩陣為
非負對稱矩陣是離散時間OPE的解,也決定了降階LQG控制器的矩陣 and :
在上述的方程中,矩陣是有以下性質的矩陣:
- 幾乎在所有狀態下。
這些矩陣可以從的投影因式分解中求得[4]。
如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon)趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器[2]。
離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)[6]。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。
參考資料