前言
最优控制理论已经被广泛用于网络控制、系统工程、金融投资等生产及生活的各个领域,并且取得了显著成果。具有线性二次型性能指标的最优控制(H2控制或LQG控制)是最优控制理论中具有广泛工程背景的一类控制问题,能较好地实现工业工程中的控制目标,使系统获得良好的动态以及稳态性能。
我们面对既定的控制任务时,往往会面临一些约束,在满足约束的条件下通过最优的路径实现任务就是最优控制。本书讨论的最优控制是探讨以最小的代价完成控制任务。这里提到的代价可能是消耗的能量、所需时间、花费的金钱等。例如,人类对航天航空的探索涉及火箭的控制问题,比如设计火箭上升的控制策略,让火箭在最小化需要携带燃料的前提下达到给定的最高速度等类似问题。又如,以两个飞行器的距离为性能指标,追者希望将指标最小化,而逃者希望将其最大化。在搭建的追逃动态系统中,状态的变化和双方的性能指标都由二者的控制共同决定,通常认为追逃双方在矛盾中会采取博弈的平衡策略。所以,微分博弈问题可理解为一种有两个或多个参与者的最优控制问题,或者把最优控制问题看作一种只有一人参与的微分博弈问题。
本书利用极值原理、Stackelberg博弈方法和正则Riccati方法等工具,研究Stackelberg模型在非合作博弈系统(具有时滞、乘性噪声以及性能指标中有控制加权矩阵半正定情况等)中的控制问题。各章内容概述如下:
第1章介绍博弈论以及最优控制的研究背景和重要意义,回顾已有结果,指出亟待解决的问题,分析具有输入时滞的LQ控制问题和具有乘性噪声的LQ控制问题的难点所在,指出本书的主要研究内容。
第2章研究了Stackelberg模型的开环控制问题。采用Stackelberg博弈方法,分别将控制输入作为领导者(leader),将扰动输入作为跟随者(follower),其中,控制输入使H2范数最小化,扰动输入使H∞范数最大化。在标准假设下,应用极大值原理得到控制器存在的充要条件,保证开环Stackelberg策略的存在唯一性。通过对变量的齐次分析,基于三个解耦的Riccati方程得到正倒向差分/微分方程控制器的显式表达式。最优控制策略表明,领导者和跟随者的控制器存在层级性,领导者首先宣布自己的控制器,跟随者控制器受领导者控制器的影响。
第3章研究了具有输入时滞的LQ系统的Stackelberg博弈开环控制问题。问题的难点是由输入时滞导致的控制变量的非因果性,为了解决这个问题,分别引入两个伴随状态变量来捕获控制输入的未来信息和一种状态变量来获取控制输入的历史信息。基于极大值原理,得到控制器存在且唯一的充分必要条件; 通过求解对称且解耦的三个Riccati方程,设计控制器,得到混合控制问题的开环解。
第4章研究了具有乘性噪声的LQ系统的Stackelberg博弈开环控制问题。引入一种新的伴随状态变量来捕获控制输入的信息,从而得到一种新的正倒向随机微分(差分)方程(FBSDEs)。针对FBSDEs与最优控制之间的关系,定义了前向变量与后向变量之间的齐次关系,有助于获得控制器的显式表达式。利用解耦代数方程的可解性,得到Stackelberg策略存在且唯一的充要条件。通过求解三个解耦的Riccati方程得到FBSDEs的解,得到领导者跟随者随机差分对策的开环解。
第5章讨论了性能指标中具有半正定控制加权矩阵的线性系统,在性能指标中,加权矩阵R≥0保证了闭环解的存在。首先,在H∞优化过程中,得到的(u,w)策略保证了H∞约束具有规定的干扰了衰减水平,其中,w最大化H∞性能指标,同时u最小化H2性能指标。由于控制加权矩阵的半正定性,在控制输入u中存在一个任意项。其次,在H2优化过程中,通过矩阵转换,任意项被重新定义为待解决的控制器,这将进一步最小化H2范数。基于这两个优化过程,通过引入正则Riccati方程得到控制问题的闭环解。
本书由作者近年来的研究成果汇编而成,为方便读者阅读,我们对各种公式和算法的推导过程都进行了详细的解释; 此外,在每一章后我们还加入了应用例子,希望读者能够借此了解博弈论与最优控制的具体应用过程。感谢在本书写作过程中,我校相关专业教师和学生的热情帮助。感谢我校国忠金教授对本书的认真评阅。
本书是控制类专业的专业书籍,可作为高等院校自动化及相关专业的师生和学者参考。由于作者水平有限,难免存在不当和疏漏之处,敬请广大读者不吝批评指正。
李小倩2022年5月
于泰山学院
