最佳投影方程(optimal projection equations)[1][2][3]是控制理论中,建构局部最佳降阶LQG控制器的充分必要条件[4]。
LQG控制(线性二次高斯控制)问题是最优控制领域中最基础的问题之一,这问题包括了存在不确定性的线性系统,受到加性高斯白噪声的影响,没有完整的状态资讯(无法量测到所有的状态变数,也无法透过回授得知),对应二次的成本泛函。不过存在唯一解,而且可以建构线性动态回授的控制律,易于计算以及实现。而LQG控制器也是非线性系统中最佳扰动控制的基础[5]。
LQG控制器的架构会类似要控制的系统,两者会有相同的维度。因此若系统本身就是高维度,要实现(全阶)LQG控制器会很困难。降阶LQG问题(固定阶LQG问题)事先固定LQG控制器的阶数,因此克服了这个困难。不过在全阶LQG控制器中适用的分离原理,在降阶LQG问题中已无法适用,因此这方面会更困难,而且其解也不唯一。不过可以找到数值分析的演算法[4][6][7][8]来求解对应的最佳投影方程。
问题的数学表示以及其解
连续时间
降阶的LQG控制问题几乎和全阶的LQG控制问题相同。令表示降阶LQG控制器的状态,唯一的差异是LQG控制器的状态维度是事先定义好的值,比受控系统的状态维度要少。
降阶LQG控制器可以表示为下式:
上述公式刻意写的类似传统全阶LQG控制器的形式,降阶的LQG控制问题也可以改写为下式:
其中
降阶LQG控制器的矩阵和是由所谓的最佳投影方程(optimal projection equations、OPE)来决定[3]。
维的最佳投影方阵是OPE的核心。此矩阵的秩在所有状态下几乎都等于。相关投影为斜投影(oblique projection):。最佳投影方程包括四个矩阵微分方程。前二个是LQG控制器对应的矩阵Riccati微分方程的扩展。在方程式中表示,而为维的单位矩阵
若LQG的维度没有减少,也就是,则,上述二个方程就是二个没有耦合的矩阵Riccati微分方程,对应全阶的LQG控制器。若,则两个方程会有斜投影项。这也是为何降阶的LQG控制器无法分离的原因,斜投影是由另外二个矩阵微分方程所决定,其中也和秩的条件(rank conditions)有关。这四个矩阵微分方程组成了最佳投影方程。为了要列出另外二个矩阵微分方程,先定义以下二个矩阵:
-
-
则最后二个矩阵微分方程如下:
- almost everywhere,
- almost everywhere,
其中
此处的 * 表示群广义逆矩阵(group generalized inverse)或Drazin逆矩阵,是唯一的,定义如下
其中 + 是摩尔-彭若斯广义逆.
矩阵都需要是非负对称矩阵。可以建构最佳投影方程的解,而此解可以决定降阶LQG控制器矩阵和:
上式中的矩阵是符合以下性质的矩阵:
- 几乎在所有状态下。
可以由的投影分解中得到[4]:
若降阶LQG问题中的所有矩阵都是非时变的,且最终时间(horizon)趋近无限大,则最佳降阶LQG控制器和最佳投影方程也都会是非时变的[1]。此情形下,最佳投影方程左侧的微分项会为零。
离散时间
离散时间的情形类似连续时间的例子,要处理的是将阶传统离散时间全阶LQG问题转换为事先已知固定阶数的阶降阶LQG控制器。为了要表示离散时间的OPE,先引入以下二个矩阵:
-
-
则离散时间OPE为
- .
- .
- almost everywhere,
- almost everywhere.
斜投影(oblique projection)矩阵为
非负对称矩阵是离散时间OPE的解,也决定了降阶LQG控制器的矩阵 and :
在上述的方程中,矩阵是有以下性质的矩阵:
- 几乎在所有状态下。
这些矩阵可以从的投影因式分解中求得[4]。
如同在连续时间中的例子一样,若问题中所有的矩阵都是非时变,且且最终时间(horizon)趋近无限大,降阶LQG控制器就会是非时变的。因此离散时间OPE会收敛到稳态解,决定非时变的降阶LOG控制器[2]。
离散时间OPE也可以应用在状态维度,输入维度或是输出维度可变的离散时间系统(具有时变维度的离散时间系统)[6]。若在数位控制器中的取样是不同步的,就可能会出现这类的系统。
参考资料