基于BP神经网络的PID参数自适应整定(共18页).doc
《基于BP神经网络的PID参数自适应整定(共18页).doc》由会员分享,可在线阅读,更多相关《基于BP神经网络的PID参数自适应整定(共18页).doc(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上基于BP神经网络的PID参数自适应整定曾正1,蔡容容2,詹立新21 武汉大学电气工程学院,2 武汉大学动力与机械学院,联系方式:摘 要:针对简单单入单出(SISO)系统中PID控制的参数整定问题进行了仿真研究,利用BP神经网络进行PID参数自适应整定。首先,得到了问题的传递函数模型,并建立了对应的离散化传递函数模型作为仿真研究的对象,并对未校正系统进行了相关的理论分析。然后,利用BP神经网络算法在线进行PID参数自适应整定。同时,为了形成参照,给出了运用模拟退火算法离线整定PID参数的仿真过程。建立了3层BP网络结构,以规则为学习规则,控制器算法为有监督的Hebb算法
2、,教师信号为给定与被控对象的输出间的偏差信号。最后,针对系统在多工况下的复杂情况,从静态稳定和动态稳定的角度,对系统稳定性进行了仿真分析。仿真结果表明,所设计的基于BP神经网络参数自适应PID控制系统,控制品质高、鲁棒性强。为了支持更加复杂情况下的仿真,还搭建GUI仿真界面。关键字:PID控制;参数整定;BP神经网络;稳定分析;GUI;1 问题背景分析1.1 准备知识1.1.1 控制系统的性能指标当系统的时间响应中的瞬态分量较大而不能忽视时,称系统处于动态或过渡过程中,这时系统的特性称为动态特性。动态特性指标通常根据系统的阶跃响应曲线定义。设系统的阶跃响应曲线如图1所示,图中称为稳态值。动态性
3、能指标主要有以下几种1。图1 系统的阶跃响应曲线 (1)上升时间:阶跃响应曲线从零第一次上升到稳态值所需的时间为上升时间。若阶跃曲线不超过稳态值(称为过阻尼系统),则定义阶跃响应曲线从稳态值的10%上升到90%所对应的时间为上升时间。 (2)最大超调:设阶跃响应曲线的最大值为,则对大超调为 (1)大,称系统阻尼小。 (3)调节时间:阶跃响应曲线进入并保持在允许的误差范围内所对应的时间称为调节时间。这个误差范围通常为稳态值的倍,称为误差带,为5%或2%。当系统时,系统的响应趋于稳定,此时系统跟踪阶跃信号的误差 (2)定义为稳态误差,它反映了系统跟踪阶跃信号的能力,也是最重要静态性能指标。1.1.
4、2 系统的数学模型系统的数学模型在经典控制理论中有微分方程、传递函数、动态框图和信号流图,在现代控制理论中广泛采用状态空间模型。在初始条件为零时,线性定常系统或元件输出信号的拉氏变换与输入信号的拉氏变换之比,称为该系统或元件的传递函数,通常记为。因此,有 (3)同时,应注意到在已知系统传递函数的情况下,由,经过反拉氏变换,可以很容易地知道系统在给定输入信号下的响应。在现代控制理论中,系统的数学模型是用状态空间法来表示的,对于一个简单的单输入单输出系统来说,可以描述为 (4)其中,为输出变量,为n维状态向量。状态空间模型和传递函数模型是统一的,它们之间可以相互转换。在本问题中,我们将用到将状态空
5、间模型转换为传递函数模型的方法,其逆转换在本文中不涉及,可参考任何一本控制理论相关的书籍。由状态空间模型转换为传递函数模型的公式为 (5)1.2 问题分析对于SISO系统 (6)输入为,输出为,用PID控制方法进行设计,并用数值仿真确定控制器参数,使系统输出跟踪期望的输出:。由1.1可知,系统的传递函数模型为 (6)在MATLAB的Simulink工具箱中建立如图2所示的仿真模型,系统跟踪给定阶跃输入信号的结果如图3所示。图2 系统在Simulink下的仿真模型从图3可以看出:系统是稳定的,但是不能够实现对给定阶跃信号的跟踪。稳态响应为0.78,模型的稳态误差为2.22。图3 校正前系统跟踪给
6、定阶跃输入信号的结果模型的稳态误差也可以通过理论计算得到 (7) (8)理论的分析结果与仿真结果完全一致。为了实现对给定阶跃信号的跟踪,必须对系统进行校正或控制。对这样一个本身稳定的系统,可以采用预测控制、模糊控制、自适应控制等先进控制技术,也可以采用传统的PID控制(或称为校正)技术。问题要求采用PID控制,且整定合适的PID参数。我们将采用BP神经网络自适应的方法给出PID参数的整定值,这些参数必须是使得控制系统的性能最优的,我们拭目以待。为了便于计算机数值仿真,我们将模型进行了离散化。采用零阶保持的方法将模型离散化,采样周期为0.01s。离散化的仿真模型为 (9)1.3 PID基本原理在
7、模拟控制系统中,控制器最常用的控制规律是PID控制。模拟PID控制系统原理框图如图4所示。系统由模拟PID控制器和被控制对象组成。比例微分积分被控对象图4 模拟PID控制系统原理框图PID控制器是一种线性控制器,它根据给定值与实际输出值构成控制偏差 (10)PID的控制律为 (11)或写成传递函数的形式 (12)式中,为比例系数,为积分常数,为微分时间常数。简单说,PID控制器各校正环节的作用为(1)比例环节:成比例地反映控制系统的偏差信号,偏差一旦产生,控制器立即产生控制作用,减少偏差;(2)积分环节:主要用于消除静差,提高系统的无差度。积分作用的强弱取决于积分时间常数,越大,积分作用越弱,
8、反之则越强。(3)微分环节:反映偏差信号的变化趋势(变化速率),并且能在偏差信号变化太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减少调节时间。2 符号说明:系统的输出;:系统待跟踪的信号;:系统稳态输出;:系统的传递函数;:控制系统稳态的输入、输出之差(稳态静差);:PID控制的比例系数;:PID控制的积分系数;:PID控制的微分系数;:PID积分常数;:PID微分时间常数。注:还有一些局部变量,在使用时加以说明。3 PID控制参数整定原理本文采用基于BP神经网络PID参数自适应整定,为了形成对比。给出了利用模拟退火算法整定的结果,作为参照。本文给出的整定方法是一种在
9、线的自适应调整方法,与离线整定的方法相比,具有超调小、控制量变化小、抗干扰能力强的优点。特别是在模型参数摄动或控制量存在扰动时,控制系统的鲁棒性体现得尤为明显。在后面的仿真中,我们将看到,基于该方法的PID参数整定对提高控制系统的静态和动态稳定具有很好的作用。3.1 模拟退火算法参数整定原理 从图5可看出,要获取满意的过渡过程动态特性和稳态特性,可采用误差绝对值积分性能指标作为参数选择的最小日标函数(即图中阴影部分的面积)。 (13)式中,为系统误差。当误差的绝对值积分小时,系统的调节时间、超调和稳态误差均会是最优的,系统性能的优化过程正好是误差绝对值积分极小的过程。图5 误差绝对值积分的示意
10、图由于PID参数的整定是一个复杂的非线性优化过程,采用常规的方法很难达到目的。在本文中,先利用模拟退火算法整定其参数。模拟退火算法来源于固体退火原理,用固体退火模拟组合优化问题,将内能E模拟为目标函数f,温度T演化为控制参数t,即得到解组合优化问题的模拟退火算法:由初始解和控制参数初值t开始,对当前解重复“产生新解计算目标函数差接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解,即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。模拟退火算法可以分解为解空间、目标函数和初始解三部分(程序流程图见附录)。模拟退火算法的基本步骤如下:Step1:初始化:初始温度(充分大),
11、末温,退火系数。初始解(是算法迭代的起点,其中,),马氏链长度,联合图6所示的Simulink仿真模型,得到在该组参数下的目标函数值;图6 利用模拟退火算法整定PID参数时的Simulink模型Step2:对k=1,2,L做Step3至Step6;Step3:随机产生新解;Step4:计算目标函数值增量 ,其中为新解的目标函数值;Step5:若,则接受作为新的当前解,否则以概率接受作为新的当前解;Step6:如果满足终止条件则输出当前解作为最优解,结束程序;Step7:逐渐减少,若,然后转Step2;否则,转Step8;Step8:程序结束,输出PID参数的整定结果。3.2 BP神经网络PID
12、参数自适应整定原理PID控制要取得较好的控制效果,就必须通过调整比例、积分和微分三种控制作用,形成控制量中既相互配合又相互制约的关系,这种关系不一定是简单的“线性组合”,从变化无穷的非线性组合中可以找出最佳的关系。但是,这仅仅是离线状态下的最优整定结果而已,且一旦确定就不可变化了。设想有这样一种PID控制器,它输出的控制作用不仅与偏差大小有关,而且与被控对象的状态有关。在偏差较大时,采用一组PlD参数,增强控制作用,使对象较快地趋于给定值:当偏差较小时,自动调整为另一组参数,削弱控制作用,避免出现过大的超调量。显然,这样的控制器可以较好地解决稳定性和快速性的矛盾。更进一步,当对象模型摄动时,控
13、制器参数也自动修正,保证模型变化后系统的稳定和控制品质。BP神经网络具有高度的并行分布式、联想记忆、自组织、自学习、容错能力强的非线性映射能力,体现了人工神经网络最为精华的部分,得到了广泛的应用35。神经网络所具有的任意非线性表达能力,可以通过对系统性能的学习来实现具有最佳组合的PID控制。采用BP网络,可以建立参数自学习的PID控制器。基于BP网络的PID控制系统机构图如图7所示,控制器由两部分组成(1) 经典的PID控制器,直接对被控对象进行闭环控制,并且三个参数为在线调整方式;(2) 神经网络,根据系统的运行状态,调整PID控制器的参数,以期达到某种性能指标的最优化,使输出层神经元的输出
14、状态对应于PID控制器的三个可调参数。通过神经网络的自学习、加权系数调整,使神经网络输出对应于某种最优控制规律下的PID控制器参数。NN网络PID控制器被控对象图7 基于BP神经网络结构的PID控制器结构为了便于计算机仿真,被控对象采用9式所示的离散化模型,PID控制器采用经典的数字式PID控制器。其中经典增量式数字PID的控制算法为 (14)式中,分别为比例、积分、微分系数。采用三层BP网络,其结构如图8所示。网络输入层的输入为:,式中输入变量的个数取决于被控系统的复杂程度。网络隐含层的输入、输出为 (15)式中,隐含层加权系数;上角标(1)、(2)、(3)分别代表输入层、隐含层和输出层。隐
15、含层神经元的活化函数取正负对称的Sigmoid函数 (16)网络输出层的输入输出为 (17)输出层输出节点分别对应三个可调参数。由于不能为负值,所以输出层神经元的活化函数取为非负的Sigmoid函数为 (18)取性能指标函数为 (19)按照梯度下降法修正网络的权系数,即按照对加权系数的负梯度方向搜索调整,并附加一个使搜索快速收敛全局极小的惯性项 (20)式中,为学习速率;为惯性系数。 (21)由于未知,所以近似用符号函数sgn()取代,由此带来计算不精确的影响可以通过调整学习速率来补偿。由式(1)和式(4)可求得 (22)上述分析可得网络输出层权的学习算法为 (23)同时可以得到隐含层加权系数
16、的学习算法 (24)式中,。基于BP网络的PID控制器结构如图8所示,值得注意的是在仿真中我们利用的是离散化的控制对象,该控制器控制算法如下Step1:确定BP网络的结构为三层,即确定输入层节点数和隐含层节点数,并给出各层加权系数的初始值和,选定学习速率和惯性系数,此时;Step2:采样得到,计算k时刻的误差;Step3:计算神经网络各层神经元的输入、输出;Step4:根据式(1)计算PID控制器的输出;Step5:进行神经网络学习,在线调整加权系数,实现PID控制参数的自适应调整;Step6:,若k大于设定的仿真时间上限,则转Step7;否则,转Step1;Step7:结束仿真。图8 BP神
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 BP 神经网络 PID 参数 自适应 18
限制150内