第1章引言 1.1研究背景和意义 能源是人类生存和发展的重要物质基础,是世界范围内的大国竞争与可持续发展的重要影响因素[1]。于我国而言,持续高速的社会经济发展对能源生产过程的安全性、经济性和环保性都提出了日益严格的要求。 我国是以煤为主要一次能源的国家。《中国能源发展报告2014》[2]指出,截至2013年年底,我国火力发电装机总量占比69.1%。在可预期的将来,火力发电仍将占据我国发电结构的主导地位。因此,提高火电机组的运行水平对我国当前的能源产业发展存在以下三方面的重要意义: (1) 节能减排。考虑到目前庞大的火电装机容量,火电机组发电效率的每一点提高即可节约大量的煤炭消耗,进而减少二氧化碳的排放量。 (2) 降低污染。相比于众多规模较小的煤炭用户,大型火电机组依国家标准集中处理二氧化硫、氮氧化物和粉尘等污染物,有利于改善环境。 (3) 工业示范。鉴于国家和社会对于火力发电的高度重视,火电技术的现代化技术和经验可以为我国其他工业的发展提供示范参考。 随着火电机组向高参数、大容量方向发展,设计高性能的热工自动控制系统对于火电机组的安全经济运行体现着日益重要的作用: (1) 有利于提高火电机组的稳定性和安全性。另外,高度自动化的发电过程也是未来实现电站信息化、智能化的必要基础。 (2) 有利于提高火电机组的经济性。设计合理的自动控制系统能减少执行器和参数波动,提高参数设定值,进而提高效率。 (3) 有利于提高电网安全性。通过合理的控制设计,能够显著提高火电机组的调峰调频能力,进而有效平衡太阳能、风能等间歇性能源的功率波动对电网的影响。 一般而言,火电机组的安全、稳定、经济运行对热工控制系统提出的要求可以归结为以下三个方面: (1) 设定值跟踪问题,如机组功率输出需要实时快速跟踪电网指令。 (2) 扰动抑制问题,如抑制由煤粉热值扰动引起的系统参数波动。在扰动抑制的过程中,设定值一般为常值,控制目标为使过程输出尽可能小的偏离设定值。 (3) 鲁棒性问题,即控制性能对于建模误差和工况偏移的敏感性。 需要说明的是,以上三方面的控制目标常常会相互矛盾,如有些控制器可以产生非常理想的设定值跟踪性能,但其抗扰响应却非常缓慢; 有些控制器的抗扰能力很强,但其可能会带来较差的鲁棒性和较大的跟踪超调量。值得注意的是,不同于运动控制或化工过程控制,热工对象往往需要同时兼顾以上三个方面,这就使控制设计尤为复杂。下面,本书将就此做一些对比分析。 首先,对于运动对象(如航天器、机械臂、电机伺服等),控制器设计的核心目标是使对象的位移或速度输出以很高的精度跟踪一个预期的三维轨迹。在设计过程中,设定值跟踪问题是其核心目标。在这类对象中,恒定设定值下的扰动抑制问题不甚突出。 基于动力学定律往往能够为该类对象建立较为精确的数学模型,因此对控制器的鲁棒性要求亦不突出。其次,对于化工过程对象,为持续生产出合格的化工产品,大部分回路长期运行在一种近似稳态的工况下,其设定值在很长时间内被置为恒值。因此,其控制器设计的主要目标是抑制生产过程中的未知扰动。然而,不同于化工过程,火电机组的最终产品是发电输出功率,它的设定值需要根据电网指令而实时调整。相应地,其他众多回路的设定值也需要随着负荷指令的变化而做出调整。比如在机组滑压运行状态下,锅炉主汽压力的设定值需要随着负荷设定值的变化而实时变化。决定变化规律的压力功率曲线是根据理论计算和反复试验而制定的一个优化结果。另外,在锅炉燃烧系统中,炉膛压力和烟气含氧量的设定值也需要因此做出调整,以达到燃烧优化的作用。顾燕萍在其博士学位论文[3]中对该问题进行了详细的研究。形象地讲,负荷指令的变化对于整个机组的影响“牵一发而动全身”。另一方面,扰动抑制也是火电机组极其重要的控制目标。过热汽温和再热汽温对象就是其中典型的例子。即使在大范围变负荷下,汽温也被要求尽可能稳定在一个固定设定值上,以实现较高的循环热效率和较小的热应力波动。即使在稳定负荷下,由于煤粉热值的摄动和火电机组的高度复杂性,各回路的过程输出值不可避免地会偏离其设定值,所以过程控制器需要承担快速抗扰的调节任务。最后,由于复杂的燃烧、传热和流动机理,几乎不可能建立热工过程的精确数学模型,甚至连模型的阶次都很难确定。另外,过程特性会随着负荷工况的变化发生显著变化。因此,保证控制性能对模型误差的鲁棒性也是热工控制的一项基本要求。 综上所述,为实现火电机组的高效运行,热工控制系统的设计需要统筹兼顾以上三方面的控制目标。如果控制设计只注重其中某一个目标,那么极有可能顾此失彼,使其他两个目标不能很好地被满足。 1.2研究进展和现状 1.2.1热工过程控制研究现状 随着近几十年来控制理论的飞速发展,国内外众多学者积极将最新的控制方法介绍到火电机组的许多重要热工过程中。目前,热工过程的先进控制理论与应用都已取得了许多重要的成果。以火电机组负荷协调控制系统为例,几乎所有主流的先进控制方法都已获得了深入的应用研究,表1.1总结归纳了部分具有代表性文献的方法和特点。 表1.1协调控制系统的先进控制方法 控 制 方 法文献主 要 特 点 自适应控制[4]~[6]较侧重设定值跟踪设计; 对模型参数不确定的问题有良好的适应能力,但对时滞以及阶的不确定较敏感 鲁棒控制[7]~[9]能够综合上述三方面控制目标; 需要建立模型不确定性的界限; 最终控制性能较为保守 滑模控制[10]~[11]能够综合上述三方面控制目标; 避免了保守的控制性能; 但在滑模面附近会出现控制量颤振现象 模型预测控制[12]~[19]较侧重设定值跟踪设计; 具有一定鲁棒性; 在线计算量很大 智能控制[20]~[22]较侧重设定值跟踪设计; 算法实现复杂; 算法的稳定性和收敛性分析存在较大困难 解耦控制[23]较侧重设定值跟踪设计; 鲁棒性比较差 近年来,国内外学者也将这些先进控制方法应用到了磨煤机控制[2428]、燃烧过程控制[2931]、过热汽温控制[3235]和流化床锅炉控制系统[3643]中。 从表1.1可以看出,很多控制方法着重于提高设定值跟踪的性能,而较少关注抗扰性能和鲁棒性方面的要求。另一方面,这些 控制方法缺少定量简便的参数整定方案,工程实现较为困难,鲜有在热工现场进行试验应用的文献报道。目前火电机组的热工过程控制仍然以经典的PID/PI控制器为主。 因此,要将先进的控制方案应用到电站现场,并显著提高热工过程的运行水平,应当同时满足以下三个条件: (1) 控制器应综合考虑设定值跟踪、抗扰和鲁棒性三方面的要求; (2) 控制器参数应便于整定,且易于工程师掌握; (3) 控制器实现应尽可能简单。 为达到以上三个要求,本书基于不确定性补偿的思想,针对不同类型的热工对象分别设计合适的二自由度控制方案,最后将自抗扰控制应用到火电机组的几个典型的热工过程中。 1.2.2不确定性: 自动控制的核心问题 图1.1系统不确定性分类 在介绍本书研究的控制方法之前,我们有必要先讨论自动控制系统与不确定性之间的关系。对于控制设计而言,系统中的不确定性主要来自于建模误差和未知的干扰信号,图1.1对系统中的各种不确定性进行了更加细致的分类。美国工程院院士、哈佛大学教授R.Brockett[44]指出: “如果没有不确定性,反馈控制就没有必要存在。”反过来,如果所建模型能够完全准确地描述系统特性,且系统中不存在任何扰动,那么我们完全可以为被控对象设计出一个最优的开环控制律,闭环或反馈在这里显得并不必要。因此,不确定性应当是反馈控制的出发点和最终归宿,反馈控制的设计不应忽略不确定性这一核心问题。 钱学森在20世纪50年代出版的《工程控制论》[45]一书中质疑了当时控制理论所基于的基本假设,即“被控系统的属性和特性总是被假想为已知”,并指出了“系统属性实际上可能发生大的不可预知的变化”。美国工程院院士strm的2014年的综述长文[46]也印证了钱学森的观点——“早期基于模型的状态空间理论的普遍缺点在于其对模型不确定性的鲁棒性”。 为适应参数不确定性问题,strm于1973年提出了一种著名的自适应控制器,即自整定调节器(selftuning regulator)[47],它采用最小二乘法在线更新模型参数,进而提高了控制性能。然而,当模型集与真实对象不匹配时,这类方法 也被发现存在严重的鲁棒性问题[48]。随后,为同时兼顾不确定参数和不确定动态,鲁棒控制理论进入了快速发展的时期。Zames在1981年发表的论文[49] 通过最小化灵敏度函数的H∞范数,奠定了H∞控制的基础。随后,加州理工学院Doyle教授发表的两篇论文[5051]为H∞控制和H2控制提供了标准的数值解法,这项工作被strm形容为鲁棒控制的登顶之作[46]。尽管鲁棒控制能够很好地处理多种系统不确定性,且已经有标准解法,但在工业中仍然难以广泛应用,其原因在于 : (1) 设计鲁棒控制器需要知道所建立模型的不确定性的界限,而这实际上难以获得; (2) 各种鲁棒控制器所得到的结果都存在一定的保守性,即为获得强鲁棒性牺牲了标称状态下的控制性能,尤其是抗扰动方面的性能; (3) 鲁棒控制器的理解和计算都非常复杂,不利于现场工程师掌握; (4) 标准算法所得的鲁棒控制器的阶次一般都很高,参数在线修改几乎不可能。 不同于鲁棒控制方法被动地适应了模型不确定性的思想,近年来,许多学者提出了一种新的处理方式,即根据输入输出数据来实时估计补偿系统总不确定性(含模型不确定性和信号不确定性)的思想,进而基于补偿后的对象再进行控制设计。这本质上是一种二自由度控制结构。然而,在这类方法刚被提出的时候,设计者们往往并没有意识到自身的二自由度特性,甚至还没有二自由度控制相关的知识,二自由度特性是在后续的研究中逐渐被发现的。下文先介绍传统的二自由度控制结构,再介绍三种新的基于不确定性补偿的二自由度控制理念。 1.2.3传统二自由度控制结构 图1.2所示为经典的反馈控制结构,其中GP为被控过程,Gc为控制器,r,y,d,e,u 分别为设定值、输出值、扰动、偏差和控制量。由于这种结构中只有一个控制器可以设计,因此被称为 “单自由度(onedegreeof freedom,1DOF)控制”。自20世纪40年代反馈控制理论开始蓬勃发展以来,这种控制结构长期占据了控制理论与应用的主导地位。目前的自动控制教科书也大都基于这种单自由度结构。许多先进的控制策略也是基于这种结构来设计复杂的Gc以代替传统的PID控制器。strm在专著[52] 中详细讨论了这种单自由度控制的缺点。他指出,在单自由度控制框架下,往往难以同时获得较好的跟踪和抗扰控制性能。 Shinskey[5354]则进一步指出,许多基于单自由度控制结构的先进方法往往专注于提高跟踪性能,而忽略了抗扰的要求,这使得许多先进的控制理论与实际过程严重脱节。这里,我们简要说明在单自由度控制结构下跟踪目标和抗扰目标存在的矛盾。 图1.2经典单自由度反馈控制结构 首先,设定值到控制误差的传递函数为 Ger(s)=e(s)r(s)=11+Gc(s)GP(s)(11) 而扰动到控制误差的传递函数为 Ged(s)=e(s)d(s)=GP(s)1+Gc(s)GP(s)=GP(s)Ger(s)(12) 由式(12)可以看出,对于一个惯性很大的过程GP,即使设计了一个理想的跟踪响应Ger(s),对应的抗扰响应Ged(s)也可能收敛得非常缓慢。 尽管在20世纪60年代即有学者[55]指出单自由度控制的这个缺点,但长期以来并没有得到理论学者和工程师的重视。直到20世纪80年代,日本学者Araki引入设定值前馈信号,提出了多个二自由度PID控制形式[5658],才很好地解决了跟踪和抗扰的矛盾,使两方面的性能指标可以同时被很好地满足。Araki在综述[59]中进一步讨论了这些控制结构的特点和设计方法,并指出这些控制结构都可以等价为如图1.3所示的二自由度控制结构。 图1.3经典二自由度控制结构 Reprinted from Sun L,Li D,Lee K Y,Optimal disturbance rejection for PI controller with constraints on relative delay margin,ISA Transactions,2016,63: 103111,Copyright(2016),with permission from Elsevier. 显然,二自由度控制结构与单自由度控制的不同之处就在于其在设定值信号后加了一个前置滤波器F(s), 使设定值到控制误差的传递函数变为 Ger(s)=e(s)r(s)=F(s)1+Gc(s)GP(s)(13) 而扰动到控制误差的传递函数维持不变,仍为 Ged(s)=e(s)d(s)=GP(s)1+Gc(s)GP(s) (14) 通过式(13)和式(14)可以看出,这时系统有两个自由度(即Gc(s)和F(s))可以调整,以分别获得满意的闭环传递函数Ger(s)和Ged(s)。这就是所谓“二自由度控制”说法的来源[59]。 目前常见的二自由度控制即为二自由度PID控制器[5965],其设计方法主要是两步法[52]: (1) 设计反馈控制器Gc(s)获得优化的扰动响应; (2) 设计前置滤波器F(s)获得满意的设定值跟踪响应。 1.2.4基于扰动观测器的二自由度控制 基于扰动观测器(disturbance observer,DOB)的控制是由日本学者Ohnishi等人[6667]于20世纪80年代针对最小相位对象提出的。而后,文献[68]揭示了这种控制结构的二自由度特性。近年来,该方法已经被逐渐改进完善以适应非最小相位对象[6970]和时滞对象[7172]。 综合文献[66]~文献[72],可以得到基于DOB的一般控制结构,如图14所示。其中被控过程 GP(s)的数学模型为 G~P(s)=Pm(s)Pi(s) (15) 其中,n为测量噪声,Pm(s)和Pi(s)分别为模型的可逆(最小相位)部分和不可逆(非最小相位及时滞)部分。P-1m(s)一般为非正则传递函数,因此引入滤波器Q(s)以使扰动观测器物理可实现。 图1.4基于扰动观测器的控制结构 利用过程的实时输入输出信号,扰动观测器的主要功能是估计进入系统的扰动信号d。当模型匹配时,即GP(s)=G~P(s),忽略外环控制器Gc(s)的影响,采用梅森公式可以算出从真实扰动信号d到扰动估计信号d^的传递函数: d^(s)d(s)=Q(s)Pi(s)1-Q(s)Pi(s)+Q(s)Pi(s)=Q(s)Pi(s)(16) 由式(16)可以看到,真实扰动信号进入系统后,在经过系统的不可逆部分和滤波器后,可以很好地被观测到。对最小相位系统,扰动观测的精度仅取决于滤波器Q(s)的带宽。滤波器带宽越大,扰动估计效果越好,对噪声也越敏感。 当扰动被DOB观测并直接在控制端进行补偿抑制后,外环控制器Gc(s)可以根据成熟的伺服控制理论来实现理想的设定值跟踪性能。不同于传统的二自由度结构通过反馈控制器来被动抑制扰动,DOB控制方法采用了积极主动的策略来更准确地观测进而消除扰动。而其设定值跟踪控制器也可以比传统二自由度控制的前置滤波器F(s)的设计更加主动灵活。因此,近年来,基于DOB的控制获得了广泛的研究与应用,如球磨机控制[73]、压电振荡控制[74]和直升机控制[75]等。 1.2.5基于扩张状态观测器的二自由度控制: 自抗扰控制 扰动观测器的最初提出主要是为了快速观测抑制信号扰动,而未显式考虑模型不确定性的影响。 20世纪90年代,我国学者韩京清在经历了对模型论和控制论的深入反思[76]后,提出了反馈系统标准型(串联积分器)的概念,并把实际对象中除标准型外的未知动态和扰动综合为系统的一个扩张状态,进而通过一个扩张状态观测器(extended state observer,ESO)[77]对其进行实时估计并抵消,最后基于串联积分器标准型设计反馈控制器。这种方法后来被命名为“自抗扰控制”(active disturbance rejection control,ADRC)[7879],它突破了一直以来基于模型设计控制器的框架,将模型不确定性和信号扰动作统一处理。在ADRC的框架下,设定值跟踪、扰动抑制和鲁棒性这三个目标得到了兼顾,且避免了过度保守性的问题。以下通过线性ADRC的基本设计原理来说明这一问题。 对一个n阶系统: y(n)(t)=f(y(n-1)(t),…,y(t),w(t))+bu(t)(17) 其中,b 为系统的增益参数,w为外扰信号,f为包含系统外扰和状态的未知动态。将f视作系统的扩张状态,进而式 (17)可以被描述成 x·=Ax+Bu+Eh y=cTx (18) 其中,状态向量x=(x1,x2,…,xn,xn+1)T=(y, y·,…,y(n),f)T,h= f·,cT=(10…0)(n+1)×(n+1) 以及 A=01  01 0……0(n+1)×(n+1),B=0 0  b 0(n+1)×1,E=0 0  1(n+1)×1(19) 为扩张后的系统(18)设计扩张状态观测器ESO如下: x=Ax^+Bu+L(y- y^) y^=cTx^(110) 其中,x^ 用于观测x,L=(l1l2…ln+1 )T是观测器增益。通过在控制端实时补偿f的估计量x^n+1, u=u0-x^n+1b(111) 考虑到x^n+1≈f,原系统(17)可以被近似为 y(n)=f+bu=f+u0-x^n+1≈u0(112) 由式(112)可以看出,经过ESO补偿后的新系统(从u0~y)可以被近似为预想的串联积分器标准型。由于串联积分器对象的形式非常简单,可以采用反馈控制律 u0=k1(r-x^1)-k2x^2-…-knx^n(113) 来获得预期的近似闭环跟踪响应 G(s)=y(s)r(s)=k1sn+knsn-1+…+k3s2+k2s+k1(114) 文献[80]提出了一种带宽法来整定观测器增益l1,l2,…,ln+1和控制器增益k1,k2,…, k n,以使扩张状态观测器(110)的特征根均配置在-ωo,闭环跟踪响应的根(114)均配置在-ωc,即 (s+ωo)n+1=sn+1+l1sn+l2sn-1+…+lns+ln+1(115) (s+ωc)n=sn+knsn-1+…+k3s2+k2s+k1(116) 为便于实践应用,目前通常采用低阶ADRC(n=1或2)进行控制,近年来已经在运动控制领域获得了显著的应用成果,如压电控制[81]、陀螺仪控制[82]、内燃机控制[83]。特别值得一提的是,2013年4月,美国得州仪器公司开始在全球发布以ADRC为核心的运动控制芯片[84],极大地促进了ADRC在工业界的广泛应用,也吸引了更多的学者关注ADRC技术。近年来,ADRC的理论研究也获得了极大的进展,文献[85]~文献[88]分别从不同角度以不同方法论证了ESO和ADRC的收敛性和稳定性。文献[89]指出,通过适当的框图变换,线性ADRC也可以被等效成如 图13所示的二自由度控制结构,只是其反馈控制器和前置滤波器的传递函数在形式上远比式(110)~式(113)描述的控制律复杂,而且基于二自由度结构的参数整定显得很不直观。 自抗扰控制突破了以往单独处理信号不确定性(抗扰)或模型不确定性(鲁棒)的思路,以抑制系统的综合不确定性为核心,针对串联积分器标准型设计反馈控制器,实现了设计范式的一次转变[90]。