最优控制、模糊控制、神经网络和PID控制,哪种控制方法最好?

发布时间:2023-10-12  

控制系统设计人员始终追求的就是为应用找到最佳的控制方法。除了经典的PID控制外,本文还探讨了最优控制、模糊控制和人工神经网络控制。


每一个控制系统的用户/设计人员,都经常会被问到同一个问题:哪种控制方法最好。现在,比几十年前有了更多的选择,控制方法的问题尤为重要。很久以前,“黄金”解决方案(实际上是唯一的)是比例-积分-微分(PID)控制器。虽然PID控制本身没有什么问题,但实际存在的限制使其它控制方法在许多应用中更受欢迎。现在,还有哪些控制方法可供选择?


除了经典的PID控制外,本文还研究了最优控制、模糊控制和人工神经网络(或基于神经网络的控制)。在工厂应用的受控系统分析中,可以看到经典PID控制器的局限性。虽然可以有很多应用领域,但本文分析聚焦于位置伺服机构,此类装置广泛应用于工业机器人、自动驾驶车辆和许多其它(不仅是在工业领域)应用。


01

位置伺服系统识别

如果受控系统是基于恒定励磁(例如永磁体)的直流电机的伺服机构,则可以通过简化的传递函数来描述,在s域中电压的角位移为:

93e826ec-ff81-11ed-90ce-dac502259ad0.png

其中:K代表电机扭矩常数;T代表电机的机械参数:J/B,其中J是包括负载在内的总惯性,B表示电机阻尼;Ti代表积分常数(由电机转速和传动比确定)。


上面的传递函数代表与积分器组合的一阶系统。理论上,还有另一个一阶、低通滤波器,其时间常数等于电机绕组电感和电阻的比值;这个时间常数明显小于主时间常数T,因此不必考虑它。


如果您是电机用户,而不是电机设计师,那么通过实验测量其在开环中的响应来找到(主)时间常数可能会更简单。为此,向伺服系统施加一定的驱动变量(电压,VIN),例如,相当于最大伺服速度的50%。伺服系统负载必须是正常工作条件下的满载。扫描伺服机构的位置响应,并在其到达最大位置之前将其关闭。可能产生的测量值如图1所示。

941e3b92-ff81-11ed-90ce-dac502259ad0.png

▲图1:控制系统设计图展示了开环伺服系统的响应特性。

根据上述特性,并通过输入值(例如,对应于最大伺服速度50%的阶跃函数VIN),确定典型伺服系统的一阶非静态(积分器与一阶滞后相结合)传递函数的T和Ti常数。伺服电机和伺服驱动运动控制系统,可以使用下述的各种闭环控制,包括方程、案例、图形、表格。

02

如何应用PID控制器?

PID补偿是最常见的闭环控制形式之一。为什么它如此受欢迎?在大多数应用中,受控过程可以通过一阶或二阶传递函数进行建模。PID控制器可以消除或至少显著补偿传递函数的两个极点。PID控制器在s域中的传递函数(U(s))/(E(s))可以表示如下:

9436ca2c-ff81-11ed-90ce-dac502259ad0.png

现在,让我们假设一个受控系统,它可以用一阶非静态传递函数来近似表示:

9452e8c4-ff81-11ed-90ce-dac502259ad0.png

控制系统的开环传递函数(Y(s))/(E(s)),等于

946dd422-ff81-11ed-90ce-dac502259ad0.png

为什么使用PD而不是PID?首先,请注意,在完整的PID控制器中,积分部分是缺失的。为什么?因为积分器已经存在于受控的伺服系统中。在最佳调谐的控制系统中,比率KD /KP必须与τ1时间常数相匹配,因此开环传递函数将减小到:(KPK)/(sτ2)。理想调谐PD控制系统的闭环传递函数 (Y(s))/(R(s)),等于:

948b0dc6-ff81-11ed-90ce-dac502259ad0.png

这对应于具有时间常数τ的单极传递函数,相当于τ2 /(KP K),其中τ2是积分时间常数,KP是控制器的比例常数,K是受控系统的增益。然而,如果通过使用如图1所示的响应特性找到时间常数,则增益(即常数K)值变为1.0。则闭环传递函数时间常数τ等于τ2 /KP。这非常好,因为通过使ΚP足够大,可以从闭环控制系统获得更快的时间响应。实际上,“足够大”可以提供5到10倍的响应速度。KP值越高,反应越不稳定。记住,在近似的系统参数中,实际值肯定会不同。

然而,这种最佳调谐的P(I)D控制器有其缺点。观察P(I)D控制器的输出(驱动)变量:一开始它几乎达到极限值,然后迅速下降,但在相当长的一段时间内,仍远远高于这种受控系统(伺服机构)所能承受的水平。想象一下,伺服电机的运行电压为24V,最初获得的电压会高达数千伏,随后稳定在数百伏。没有控制器能够驱动如此高的电压,即使能驱动,电机也无法承受如此高的压力。因此,在控制器中添加限制器,可确保驱动变量不会超过受控系统(在这种情况下为直流电机)可接受的最大值。伺服机构的最终PID控制配置如图2所示。

949c28a4-ff81-11ed-90ce-dac502259ad0.png

▲图2:控制系统设计图展示了位置伺服系统的 PID 控制。

在本文的最后,会比较PID控制器与其它控制器的性能。具有无限驱动变量的最佳调谐PD控制器(即理想控制器),其输出特性如图8中黄色线所示;实际输出(驱动变量限于最大可接受值)则以红色线表示。

03

应用时间最优控制

几十年来,最优控制一直是广泛研究的主题。关于最优控制的一些基本观点值得回顾,我们可以用一个例子来更好地理解时间最优控制。

假设一个带有直流电机的常用电动伺服机构。手头的任务是控制伺服,使其在最短的时间内到达新的参考点。如果必须应用实际驱动变量,优化的PID控制器将无法实现这一目标。直觉反应是向直流电机施加最大可接受电压,并让电机全速前进。

然后,在某一时间点改变电压极性,使电机开始以最大可能的速度减速。稍后,当电机速度为零时,关闭电压。如果电压极性在合适的时点改变,那么,在电机停止运行的瞬间,伺服将准确地停在所需的位置。这被称为最优控制。在这种情况下,因为时间是该最优控制的标准,所以这种控制被称为时间最优控制。

04

查找开关曲线的形状

图3展示了在状态空间中的时间最优控制过程,在这种情况下,状态空间是二维空间(区域);一个维度是输出变量,另一个维度则是其(时间的)导数。在应用新参考值时,输出变量沿水平轴移动,因此它代表调节误差(err),即参考值与实际输出值之间的差值。同时在t0时刻,向直流电机施加最大电压。伺服离开其初始位置P0,并开始加速。在时间点t1,控制器改变电压极性,电机速度很快开始下降。在时间点t2,电机速度变为零并且达到期望位置P2,驱动变量电压被关闭。虽然这看起来很简单,但获得开关曲线的形状并不是那么简单。

94b1c182-ff81-11ed-90ce-dac502259ad0.png

▲图3:控制系统设计图展示了状态空间中的时间最优控制。

如果受控系统是具有简化传递函数的伺服机构,则s域中电压的角位移为:

94ddd70e-ff81-11ed-90ce-dac502259ad0.png

那么一个完整的、时间最优的控制系统可以用图4所示的框图表示。

该控制方案与PID控制完全不同。这是一种非线性控制,因为第二个非线性部分N2代表的是继电器:提供驱动变量±U值,所以这种控制被称为开关控制。N1是开关曲线的第一个非线性部分,调节误差E的“sqrt”平方根函数,提供了相当合理的结果。在实践中,总是很难找到精确的开关曲线,因此,控制器可能一直在其最大值和最小值之间切换驱动电压。为了避免这种情况的发生,需要为继电器增加死区。

在本文的最后,让我们看看与其它类型的控制器相比,这种时间最优控制器的性能如何。其输出变量函数以图8中亮蓝色线表示。

05

如何应用模糊控制?

模糊控制是另一种非线性控制方法,对于难以分析的受控系统,或在设计时动态行为未知的受控系统,它是非常好的解决方案。模糊控制可以与“次优”时间最优控制相比较(它可以提供比最优结果较差的结果),尽管它们仍然可以是非常好的。在这种具有位置伺服机构控制的特殊情况下,可以采用图5中的控制方案(图5)进行模糊控制。

94eefeee-ff81-11ed-90ce-dac502259ad0.png

▲图4:控制系统设计图展示了伺服机构的时间最优控制系统。

950817bc-ff81-11ed-90ce-dac502259ad0.png

▲图5:控制系统设计图展示了伺服机构的模糊控制系统。

模糊控制可以看作是模糊逻辑的扩展或修改。第一阶段,模糊逻辑(在一个被称为模糊化的过程中)将“清晰”的输入变量转换为“模糊”的集合。第二阶段,它处理这些模糊集。最后,在一个被称为去模糊化的过程中,将处理后的模糊集转换为清晰的输出变量。

对于输入变量的模糊化,例如,选择一组lambda形状_/_的5个成员函数。为了使控制过程更好(更精细),在本文案例中使用了7个成员函数。它们涵盖了调节误差、误差及其导数和状态变量,这些变量值处于-1000到+1000之间。它们可以被称为:高负(HN),中等负(MN),低负(LN),小(S),低正(LP),中等正(MP)和高正(LP)。输出(驱动)变量模糊化,使用了7个类似的级别:全负(FN),中等负(MN),低负(LN),零(Z),低正(LP),中等正(MP)和全正(FP)。

952d54dc-ff81-11ed-90ce-dac502259ad0.png

▲图6:在控制系统设计中,参考模糊控制知识库很有帮助。

处理模糊集是模糊控制最关键的阶段。它由模糊控制知识库“控制”。图6展示了适用的知识库。注意err和der输入变量是如何量化的。它们的分布函数不是等距分布的;err成员函数被更多地“推向”中心(S),而der成员函数则被更多地推向最高值。为什么这种安排更好?检查知识库中的输出变量分布提供了答案。考察零(Z)级。它们的配置为:紧密地跟随误差的平方根函数err的输出,这是可能是对时间最优控制中使用的开关曲线的最佳仿真。接下来,看看与其它控制器相比,模糊控制器的性能如何,其输出变量的形状以图8中橙色线表示。

06

应用基于神经网络的控制

在控制系统中使用人工神经网络(ANN)有无数种可能性。其中,很多使用基于神经网络的受控系统(工厂)模型,或对其逆动态进行建模,与经典PID控制器相结合,有助于创建自适应和其它更复杂的控制系统。

通过训练这种神经网络,模拟位置伺服系统的开关曲线可以尝试一种不同的方法。正如之前所了解的,通过使用时间最优控制可以实现最快速的伺服机构运动。开关曲线最关键的一个方面,是使用调节误差的平方根函数。甚至是模糊控制器,也被“调谐”以模拟该平方根函数。

然而,由于实际开关曲线仍然可以与sqrt()函数的近似值不同。有没有办法找到位置伺服机构的实际开关曲线?答案是肯定的。可以找到位置伺服机构的实际开关曲线,“训练”ANN记住它并按需生成它。更进一步,可以训练ANN来接管整个开关控制器。

开关曲线是关于[err,der]对值的序列,伺服电机驱动器对可施加到电机的额定(最大)电压进行极性转换。通过在开环中运行伺服机构(即无反馈),测量并记录其位置(err)和速度(der)来查找相应的值。

首先,准备一系列预期的伺服机构速度(der)值,从最低值到最高值。现在,将正的最大驱动变量(电压+U)施加到电机上,并让其运行,直到伺服机构达到该系列中的第一个预期der值。重要提示:记录与P1相同时刻的伺服位置,同时将执行变量转换为-U值。当der降至零时,关闭电压并将当前位置记录为P2。该过程提供了第一个开关曲线点的第一对[err,der]坐标(其中err=P2–P1)。当然,伺服机构必须完全按照预期使用的方式满载运行。

[err,der]坐标序列表示开关曲线点。为了获得最佳结果,沿der轴均匀分布大约50个坐标(对)。然后训练一个合适的神经网络,使用这些开关点将执行变量传送到伺服机构。即使是最简单的具有一个隐藏层和大约12个节点的ANN也可以实现这种功能。


图7展示了一个输出值表,可用于训练ANN控制器。在捕获开关曲线点之后,需要离线训练ANN控制器,即不直接在物理控制系统实体上进行训练。从捕获的坐标序列的底部(或顶部)开始,对于每个单独的der输入,您需要生成多个err值(从-max到+max),并向[err,der]坐标的每个组合提供(到ANN输出)特定的输出值。开关曲线的所有输出值对应负的最大驱动值;开关曲线右侧的所有输出值对应为正的最大值。误差坐标离开关曲线越远,需要提供的±U值就越少,因为输出曲线保持平坦。

9541acd4-ff81-11ed-90ce-dac502259ad0.png

▲图7:这个简单的人工神经网络训练数据表,有助于 ANN 控制系统的设计。

此训练数据表与模糊系统的知识库非常相似。起初,只使用状态空间的上半部分来训练ANN控制器。当伺服必须沿相反方向移动时,ANN控制器将仅交换输出值。然而,如果伺服系统在两个运动方向上的行为不相同,则必须在整个状态空间内,对ANN控制器进行行为训练。基于神经网络的控制系统如何与其它系统竞争?可查看其输出变量的形状,如图8中白色线展示。

07

四种控制方法的比较

使用Python的屏幕截图(图8)展示了模拟伺服机构及其控制器的结果。伺服机构的传递函数近似为1/((1+s100)s200),其中时间常数以样本数表示。阶跃函数(期望的伺服系统位置)是从0到800(其中1000是期望位置和驱动变量的最大值)生成的,在1000个样本之后,它从800下降到400。输入阶跃函数在图8中以绿色线表示。

图8还展示了各个控制系统的运行情况。第一个是最佳调谐的PD控制器,它对阶跃函数做出即时反应。它的KP参数设置为5。但这实际上只是一个理想的PD控制。这些实际最佳调谐PD控制器具有有限驱动变量,其行为如红色曲线所示。与其它控制器相比,它实际上是表现最差(最慢)的。然而,如果调整得当,它不会超调,这在某些应用中可能非常重要。

9554b298-ff81-11ed-90ce-dac502259ad0.png

▲图8:此图比较了不同的控制方法,以帮助确定应用的最佳状态。包括最优控制(蓝色线)、模糊控制(橙色线)、人工神经网络(白色线)和 PID 控制(黄色和红色线)。

表现最好(最快)的控制器是基于ANN的控制器(如白色曲线所示)。这并不奇怪;神经网络经过训练,可以模拟精确的开关曲线,因此它表现为一个完美的、时间最优的控制系统。


通过sqrt(e)函数来模拟开关曲线的经典时间最优控制器(蓝色线)表现稍差(较慢)。不过,考虑到其实施非常简单,因此不应对其性能有太多抱怨。

在这种特殊情况下,模糊控制器(橙色线)表现不佳。不过,它没有调整到最佳性能(仅进行了初始调整以大致模拟开关曲线),因此其性能有进一步提高的空间。理论上,模糊控制器的性能不应比经典的时间最优控制器差。


这个特定案例验证了神经网络在工业控制中的应用。然而,如果系统“在运行中”改变行为/参数,则需要一个更能容忍这种变化的控制器。容差是模糊控制器的亮点。最令人惊讶的发现之一是:50多年前在大学里学习的经典时间最优控制器(基于sqrt()函数),仍然可以很好地运行。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>