随机模型预测控制

您所在的位置:网站首页 模拟预测模型的优点是什么意思 随机模型预测控制

随机模型预测控制

2023-10-03 06:47| 来源: 网络整理| 查看: 265

鲁棒模型预测控制(RMPC)是一种设计不确定系统控制器的有效方法,在这种不确定系统中,每个可能的扰动实现都必须满足状态和输入约束。然而,在某些情况下,由于需要防止低概率异常值,这一要求可能会显著降低控制器的整体性能。随机模型预测控制(SMPC)是对RMPC的一种放松,通过机会约束对约束进行概率解释,允许(小)违反约束的概率。不幸的是,机会约束控制问题通常是困难的,必须经常被近似。在我们的工作中,我们注重抽样-​基于近似方法求解这类问题,推导了线性和非线性问题的有效样本量-​线性SMPC问题。该方法在建筑物能效控制问题上得到了数值验证。

研究

模型预测控制(MPC)又称为滚动时域控制和滚动时域控制,是一种强有力的工程应用技术。MPC的价值主要体现在其处理约束的内在能力,同时最小化一些代价(或最大化一些回报)。MPC的基本思想是用有限时域最优控制问题来反复逼近无限时域约束最优控制问题。在每一个时间步,这样一个有限时域问题被解决,并且只有第一个输入以一种后退时域的方式被应用到系统中。

MPC使用一个对象模型来预测其未来的行为,然后根据预测计算出一个最优的输入轨迹。然而,在大多数实际应用中,由于模型的不确定性或外界干扰,都无法得到精确的模型。在文献中,不确定性通常是通过描述一个鲁棒MPC问题来解决的,在这个问题中,不确定性被假定为有界的,并且计算出满足每个可能的不确定性实现的约束的控制律。这种悲观的观点可能会显著降低控制器的整体性能,因为需要防范低概率不确定性异常值。

随机MPC(SMPC)提供了另一种对不确定性不那么悲观的观点。在SMPC中,约束是概率解释的,允许很小的违反概率。在这种情况下,甚至可以研究无界不确定性。不幸的是,SMPC问题通常很难解决,只能近似地或通过施加特定的问题结构来解决。在这种情况下,我们主要关注以下问题:但是如果不确定性没有界,会发生什么?或者当它不是均匀分布的时候?一个不太保守的方法显然是考虑到这些可能性,确定不确定性的适当分布,并制定一个随机的MPC问题。在这种情况下,在提出问题时应考虑以下几点:

概率约束:

在无界随机扰动的情况下,以概率1满足所有约束是不可能的,因为在任何时候系统都可能遇到一个非常大的扰动,迫使它违反约束。因此,用软概率约束代替硬约束是很重要的,以确保它们以期望的概率得到尊重。

期望值约束:

处理约束的另一种选择是确保它们在所考虑的优化问题上平均得到尊重。根据问题的性质,这种期望值约束可能比概率约束更有意义。

成本(报酬):

最简单的成本(报酬)可能是一个预期成本(报酬),用贴现成本之和的预期值来表示-​每级功能。根据不同的应用,替代和更困难的配方可能需要考虑很长时间-​运行预期平均成本(报酬),或长期-​运行路径成本(奖励)。

研究

本研究小组的目标是发展SMPC的理论基础,以及考虑由一些相关应用驱动的实现问题。我们目前和过去的工作重点可分为以下几个方面:

随机MPC

一般来说-​有约束的有限时域最优控制问题是一个很难解决的问题,因为它们通常是非平稳的-​凸的和需要计算的多重-​量纲积分。因此,SMPC在计算上不适用于许多应用。获得SMPC可处理近似值的一种方法是随机MPC(RMPC)。RMPC的优点在于它不局限于不确定性的特定概率分布。事实上,确切的概率分布甚至不需要知道,以样本为单位的历史数据就足够了。

RMPC的基本思想是用有限个样本约束代替机会约束,这些样本约束对应于不确定性分布的样本。从实践的角度来看,这些样本往往以历史数据的形式出现。例如,在建筑气候控制中,不确定性的来源之一是由于天气预报的不确定性。由于通常有大量的历史天气数据可用,这些数据可用于生成不确定性样本。随机MPC的主要问题是确定合适的样本量。一般来说,在满足机会约束的同时,应选择尽可能小的样本(因为每个样本对应一个附加约束)。

在SMPC组中,我们主要研究两类系统,即线性动力学系统和控制系统-​仿射系统。对于这两类系统,我们得到了有效的样本大小。我们解决这类问题的方法主要是基于so-​所谓的情景方法,这是一种随机技术来解决凸机会-​约束系统。对于不确定线性系统,我们证明了在仿射反馈策略和多面体约束下,所需的样本量在预测范围内呈线性增长,而在已有界的预测范围内呈二次增长。新的边界有两个优点:1。以前由于大量采样约束而无法解决的问题现在可以解决。2得到的解在破坏概率和代价方面都不太保守。

在SMPC中我们研究的第二类问题是控制家族-​仿射系统,一般是非线性的。这使得采样的有限时域最优控制问题不存在-​凸的,因此标准场景方法的结果不能直接应用。此外,由于在非-​凸规划一般没有希望获得全局最优解,而且求解者往往陷入局部极小,我们设计了一种对给定集合中任意一点都具有可行性的方法。这在图1中说明,其中集合可行性集合被给出为M点的凸包。我们证明,如果样本大小是在输入数目上二次选择的,那么在跨距多面体中获得的任何(局部)极小值都将受到概率约束。

图1 多面体上的一致保证:上述多面体中的任何点都满足机会约束。

有界控制输入

尽管对状态的约束通常可以“软化”,例如,转化为概率约束,但对控制输入的硬约束无处不在。这一特性在控制综合阶段必须加以考虑,由于不可避免的非线性,这给控制器综合技术带来了很大的困难。

其目的是提供一个可处理的,凸的,全局可行的有限元解-​具有可能无界加性噪声和控制策略硬约束的水平随机线性二次(LQ)问题。在这个框架内,控制器设计有两个直接的方向,即标准LQG控制器的后验边界,或采用确定性-​等效MPC控制器。前者明确地包含反馈的某些方面,后者的综合则包含控制约束,并隐含地包含反馈的概念。

我们对反馈策略的选择(在[HCL09]和[CHL09]中报道)探索了这两种选择之间的中间地带:我们在设计阶段明确地结合了控制界限和反馈。更具体地说,我们采用的策略是仿射在某些有界函数的过去噪声输入。将最优控制问题提升到候选控制函数的一般向量空间上,通过求解凸优化问题从中选择控制器。我们的新方法不需要人为地将控制输入的硬约束放松为软概率约束(以确保大的可行集),并且仍然提供了一个全局可行的解决方案。给出了噪声序列为i.i.d且具有有限二阶矩的最小假设。在凸优化问题中,噪声的影响表现为一定的固定交叉-​协方差矩阵,可以离线计算和存储。

一旦优化问题的可处理性得到了保证,我们就以一种滚动的方式采用所得到的控制策略。上述方案需要对国家进行全面观察。我们还讨论了部分状态观测的情况下,线性控制系统的i.i.d高斯噪声;本案允许雇用一名律师-​类似于滤波器,可以构造性地用于MPC。我们的后退视野策略与确定性的性能比较-​基准系统的等效MPC和饱和LQG如图2和图3所示。

图2:我们策略的平均成本曲线图,针对试验工厂中的水平递减MPC。

图3:我们的策略和饱和LQG在试验工厂的平均成本图。

除了性能方面外,研究所设计的控制器在滚动时的稳定性也很重要。在确定性条件下,当系统矩阵不稳定时,控制输入有界的线性受控系统不可能全局渐近稳定;然而,对于Lyapunov稳定系统,这样做是可能的。在随机MPC的背景下,我们的研究表明,在有限元模型中加入适当的约束-​水平最优控制子问题,可以保证均值-​结果闭函数的平方有界性-​循环系统,如果未引用系统是Lyapunov稳定的。目前调查正在进行中。

凸逼近格式

我们研究随机噪声和控制输入驱动的线性动力系统,并考虑在同时满足控制输入和状态演化约束的情况下,寻找一个最小化期望代价函数的控制策略的问题。一般来说,不存在保证在整个无限范围内满足确定性(硬)约束的控制策略。解决这个问题的一种方法是根据概率(软)约束放松约束。这相当于要求约束不会以足够大的概率被违反,或者要求实现约束的预期回报保持足够大。

在随机MPC中,每次t都是有限的-​无穷大的视界逼近-​地平线问题得到了解决,但只实现了对结果策略的第一个控制。在t+1下一次考虑新问题时,更新控制策略,并以后退的方式重复该过程(时间不足-​不变性假设,有限-​水平最优控制问题在任何时候都是相同的,由此产生了一个可以离线计算的平稳最优控制策略。)

有两个考虑因素导致了用有限水平长度的子问题来重新表述无限水平问题。首先,给定任意一个有界集(如安全集),无论控制策略如何,线性随机动力系统的状态都保证在未来某一时刻以1的概率退出该集。因此,软约束可能会使原来的(不可行的)约束变硬-​约束优化问题转化为一个可行的问题,只要视界长度是有限的。第二,即使约束被重新表述,使得一个可容许的无穷大-​视界策略是存在的,这种策略的计算通常是困难的。

本文的目的是建立一类随机有限元的凸性-​具有软约束的水平控制问题。凸性对于确定最优解的唯一性以及通过数值方法快速计算解是至关重要的。

我们已经发展了不同类型的有限元凸松弛-​随机条件下高斯扰动线性系统的时域随机最优控制-​约束或综合机会-​对状态和/或控制输入的限制。目前正在审查结果。

恢复策略

确定性MPC的基本思想包括两个步骤:(i)求解有限元问题-​带状态约束和受控输入约束的水平最优控制问题,以获得最优策略,以及(ii)在滚动过程中应用从步骤(i)中获得的策略导出的控制器-​地平线时尚。鉴于随机预测控制与应用的密切关系,任何令人满意的随机预测控制理论都必须考虑到它的实际应用。在这种情况下,对一个标准线性系统的研究表明,没有一种控制策略能够确保在概率为1的情况下,状态在所有时刻都被限制在一个有界安全集内。这是因为噪声是无界的,而且样本是相互独立的。尽管干扰在实践中不太可能是无界的,但分配一个先验界似乎需要相当的洞察力。

如果一个有界的-​采用噪声模型,现有最差-​控制具有有界不确定性的确定性系统的案例分析技术可以应用。其核心思想是根据噪声的界合成一个控制器,使目标集相对于闭系统保持不变-​循环动力学。然而,由于最优策略是基于最坏的-​案例分析,通常会导致控制器比较保守,甚至不可行。此外,优化问题的复杂性随着优化时间的推移而迅速增长(通常呈指数增长)。另一种方法是用概率(软)约束代替硬约束。其思想是找到一种策略,保证在足够长的时间范围内以高概率满足状态约束。虽然这一办法可以改善问题的可行性,但它没有解决一旦国家违反限制就应该采取什么行动的问题。

鉴于上述考虑,开发恢复策略似乎是处理SMPC中约束冲突的必要步骤。一旦状态违反了约束,这种策略就会被激活,而一旦系统返回到安全集,这种策略就会被停用。一般来说,恢复策略必须在满足其他性能目标的同时将系统快速驱动到安全集。在MPC的背景下,有两个优点是立竿见影的:(a)一旦违反了约束,就可以采取适当的措施,使状态快速地、最优地回到安全集;(b)如果原始问题是由状态的硬约束构成的,鉴于(a)可以将约束放宽到概率约束,以提高可行性。

一种可能的恢复策略可以表述为一个到达进入时间的最优控制问题,称为追踪问题、暂态规划、第一次通过问题、随机最短路径问题等。我们将该问题表述为期望折扣成本的最小化,直到状态进入安全集。文献中关于随机最优控制的一个常见假设是目标集是吸收的。也就是说,存在一个控制策略,使得目标集相对于闭集是不变的-​循环随机动力学。这对于控制问题是相当严格的-​--例如,在具有i.i.d.高斯噪声输入的线性控制系统的非常简单和规范的情况下,它是无效的。我们不做这个假设,因为如上所述,我们解决这个问题的主要动机正是为了处理目标集不被吸收的情况。

非中心化随机MPC

在一些应用中,例如区域监视,任务非常复杂,因此需要将问题分解为多个子系统(例如室内场景中的摄像机),以协调它们的动作。此外,操作条件可能随机变化(移动目标、外部干扰等),并且依赖于计算整个系统动作的集中单元在计算上可能是昂贵的并且在发生故障时是关键的。为了缓解这些问题,我们采用了一种分散的随机MPC方法,将复杂的全局问题分解为相对简单的局部问题,每个子系统都可以处理这些局部问题。然而,这种子任务的分布如果是任意的,可能会影响执行所需任务的能力,如果不是不稳定的话,可能会导致性能恶化。自然出现的一些关键问题如下:

非中心化方案是否稳定?就整个系统的某些全局性能指标而言,它的性能如何?子系统之间要进行什么样的信息交换?在操作条件发生变化的情况下,子系统如何在它们之间交换子任务,从而不影响总体性能?

我们研究这些问题的动机是在空中交通管理和监控摄像网络领域的应用。

赞助商

 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3