人工神经网络理论及应用课件.ppt
人工神经网络理论及应用人工神经网络理论及应用屈桢深哈尔滨工业大学哈尔滨工业大学11. 神经网络控制神经网络控制n神经网络控制基础神经网络控制基础n神经神经PID控制控制nNARMA控制控制n神经神经模型参考自适应控制模型参考自适应控制n其他控制方法其他控制方法(MPC等等) NN控制基础n 是将神经网络在相应的控制结构中做控制器、辨识器n 主要是为解决复杂的非线性、不确定、不确知系统,在不确定、不确知环境中的控制问题n 使控制系统稳定、鲁棒性好,具有要求的动态、静态性能NN控制与已有控制方法关系n 能对变化的环境具有自适应性,且成为基本上不依赖于模型的一类控制,因此,神经控制已成为 “智能控制”的一个新的分支n 将具有学习能力的控制系统称为学习控制系统。NN控制是有学习能力的,属于学习控制控制系统设计过程控制系统分析正问题求解:(1)已知控制系统中各环节结构、参数;(2)已知被控对象所处的环境求解控制系统的稳定性、动态、稳态特性。控制系统设计(综合)逆问题求解: 有多种解法,可选择不同的控制结构,确定不同的准则函数。确定性系统NN控制设计已知对象特性及外加扰动是确定性的,时不变的;已知系统期望输出r,要求的性能指标。控制系统的设计:控制系统的设计: 设计控制器,校正对象的特性,使控制系统达到要求的性能指标,即使控制系统在r作用下,由控制器给出的控制量u作用于对象,使其输出y跟踪r 。 对于确定性系统与环境,选择某种控制结构,可设计出确定参数的控制器。不确定环境下NN控制设计 对处于不确定、不确知环境中的复杂的非线性不确定、不确知系统的设计问题,是控制领域研究的核心问题。神经控制是解决问题的一条途径。 在已知被控对象的一些先验知识情况下:n 由神经网络做辨识器,在线识别对象模型,由于网络的学习能力,辨识器的参数可随着对象、环境的变化而自适应的改变。n 由神经网络做控制器,其性能随着对象、环境的变化而自适应的改变(通过神经辨识器)。 神经网络系统实现(硬件) 神经控制绝大多数是数字控制,用数字量实现对被控对象的控制,讨论连续对象用数字计算机实现的神经控制问题。 神经控制系统的组成神经控制系统的组成 (1)硬件 连续被控对象 神经控制器 模拟输入通道 模拟输出通道 实时时钟神经网络系统实现示意图(硬件) )(te)(tr - )(tu )(ty 模拟输出通道 模拟输入通道 A/D 神经控制器 D/A 保持器 对象 (过程) 实时时钟 采样 开关 神经PID控制n PID控制是 工业过程控制中常用的控制方法,因PID控制器结构简单、实现简易,且能对相当一些工业对象(或过程)进行有效的控制。n 常规PID控制局限性在于 控制对象具有复杂的非线性特性,难以建立精确的数学模型,且由于对象和环境的不确定性,往往难以达到满意的控制效果。n 神经PID控制是 针对上述问题而提出的一种控制策略。经典数字PID控制器数字PID控制基本算式各部分作用:设计目标:调整kp, ki, kd.使用经典PID设计,得到常数系数。 11kpidtu kk e kke kke ke k是 PID 控制器的三个系数。 用网络的学习能力,对象与扰动变化时,辨识的对象模型随着变化,神经 PID 控制器的权系值不断的调整,使控制系统能适应环境,实现有效控制。 神经 PID 控制器用动态神经网络,其中的神经网络用自适应线性神经元。 输入: c ke kcke kc ke ke ke kjk12031( )( )( )( )( )( )( )() 输出: u kv c kv ckv c k( )( )( )( )1 12233 vi:NNC 的权值,i=1,2,3 神经PID控制器基本思想神经PID控制结构 PID 控制器 e - y u y - r 2e 1e - 对象 学习算法 学习算法 NNC NNI 由辨识器NNI在线辨识对象,对控制器NNC的权系数进行实时调整,使系统具有自适应性,从而达到控制目的。 准则函数: Ekr ky kek22221211121( ) ()()() NNC 网络权值调整用梯度下降法: v kEkv keky kv keky ku ku kv kiiii( )( )( )()()( )()()( )( )( ) 2222221111 u kv kc kii( )( )( ),代入上式,有 v kekcy ku kii( )()()( )2211 ()( )()( )( )( )( )( )y ku ky ko ko kx kx ku kiiiii11神经PID控制器学习算法 由神经网络辨识器计算得出 1y ku kNARMA模型及NARMA控制NARMA模型:当系统相对阶为d时,则有:系统控制问题:选择使) 1(,),1(),();1(,),1(),() 1(nkukukunkykykykyF) 1(,),1(),();1(,),1(),()(nkukukunkykykydkyF) 1(,),1(),();();1(,),1(),()(nkukukudkynkykykyGkur0)()(limkykyrkNARMA-L1模型在U=0处展开,有:控制算法:UY;)(FdkyUUYTUddFFdky00 ;)(100)() 1(,),1(),() 1(,),1(),(niiikunkykykygnkykykyf 0110()( ), (1), (1)( ), (1), (1)()( ), (1), (1)rniiy kdfy ky ky kngy ky ky knu kiu kgy ky ky knNARMA-L2模型在u(k)=0处展开,有:因此,控制量可取:) 1(,),1() 1(,),1(),()(0nkukunkykykyfdky;)() 1(,),1() 1(,),1(),(kunkukunkykykyg;) 1(,),1() 1(,),1(),() 1(,),1() 1(,),1(),()(0nkukunkykykygnkukunkykykyfdkyur;示例1 2112222222121210.12110.121u kxkx kx ku kxkukxkxku kxkxky kx kxk示例四种模型线性化非线性NARMA-L1NARMA-L2) 1()() 1()() 1( 4321kuwkuwkywkywky) 1(),(),1(),() 1( kukukykyNky) 1(),() 1( 0kykyfky)() 1(),()() 1(),(10kukykygkukykyg)() 1(),1(),() 1(),1(),() 1( 0kukukykygkukykyfky示例辨识效果图(1) 2sin102sin25ku kk辨识信号-2,2随机数测试信号示例1辨识效果图(2)示例控制效果图502sin4)(kkyr1002sin4k示例控制输入NN NARMA-L2辨识器NN NARMA控制器NN NARMAMATLABNN直接模型参考自适应控制 构造一个参考模型,使其输出为期望输出,控制的目的是使y跟踪r。 r y My u r - - 参考模型 对象 NNC NN间接模型参考自适应控制构造一个参考模型,使其输出为期望输出,控制的目的,是使y跟踪r。对象特性非线性、不确定、不确知时采用。 - 1e - y 2eMyr y - u 参考模型 对象 NNI NNC 1Ew kw kw2212Ee控制律设计(仿射模型)目标:考虑NARMA-L2模型则理想控制律 系统理想响应 0Meyy (1);1;1( )y kfkkgkku kYUYU *T1( )1Mu kfykg k e 11(1)0me kk e kk e kmNN 模型参考自适应控制(MRAC)系统使用神经网络示例:单自由度机械臂:摆角;u: 电机施加扭矩参考模型:NN MRAC控制器演示mrefrobotarm模型预测控制基础考虑SISO模型,控制目标:yp (k)跟踪yr (k)思想:神经网络预测;最优控制解u神经网络预测控制(NNPC)框图yr(n)神经网络预测控制(NPC)JNNPC计算步骤1. 生成参考轨迹。如未知,则设为常量;2. 使用前一时刻计算的控制输入向量u,进行模型预测,得到预测输出;3. 根据预测输出计算最优控制向量;4. 重复2,3, 直到误差小于指定精度;5. 取控制向量中的第一个元素作为控制输入;在每一采样时刻重复上述过程。NNPC使用的NNCSTR(连续搅拌反应罐)问题h(t): 液位;w1(t), Cb1: 浓缩料1的注入速率(流速)和浓度;w2(t), Cb2: 稀释料2的注入速率(流速)和浓度;k1, k2: 消耗速率数学模型9 .241bC1 . 02bC1 . 0)(2tw121 kk控制目标:通过调整流速w1(t)保持产品浓度Cb(t)使用过程演示predcstr使用过程演示图4-6-1内模控制基本结构 1e内模 控制器 )(zD 内部模型 )(zP y u r e y _ 对象 )(zP 内模控制基本原理I图4-6-1内模控制基本结构 1e内模 控制器 )(zD 内部模型 )(zP y u r e y _ 对象 )(zP 内模控制基本原理II图4-6-1内模控制基本结构内模控制模型与对象匹配当对象稳定,模型与对象完全匹配时,有:n控制系统相当于开环;n控制系统稳定D和P零极点在单位圆内;n若控制器取 ,即能实现完全控制( )( ) ( )( )U zD z R zz ( ) ( ) ( )1( ) ( )( )Y zD z P z R zD z P zz ( ) ( )( )Y zD z P zR z 1D zP z 1e内模 控制器 )(zD 内部模型 )(zP y u r e y _ 对象 )(zP 内模控制模型与对象失配n 系统输出与模型差及扰动量有关;对于阶跃输入,系统稳态误差终值:n若 ,且 ,注意到 则稳态误差为0,称为无静差特性 11lim1lim1( ) ( )1( ) ( )( )( )1( ) ( )( )1( ) ( )( )zzy kzY zzD z P zD z P zR zzD z P zP zD z P zP z 11PP 111DP( )1zR zz内模控制控制器设计I被控对象:控制器设计(1) 稳定的内模控制器设计内模控制器应是稳定的、物理可实现的(2) 滤波器设计改善模型失配、时延问题。可改善系统动态响应和平滑噪声 dP zPz Pz z 1D zPz内模控制控制器设计II系统输出:(1) 闭环特征方程变为通过配置滤波器,改善响应(2) 取简化设计,此时:(3) 可取一阶形式 ?( ) ( )( )( ) ( )( ) ( )( )1( )( ) ( )( )iffD z P zY zF z R zFzzzD z Fz P zP z1( )( ) ( )( )0fD z Fz P zP z( )( )ifF zFzF 111F zz内模控制控制器设计III(1) 取上述形式,误差终值为1.(2)若全部特征根均在Z平面单位圆内,则闭环系数稳定。 (3)适当选取滤波器的参数,可增强系统的稳定性、鲁棒性。但需兼顾鲁棒性与快速性。因增大,使系统克服模型失配与参数波动的能力提高,但使其输出响应变缓。(4)鲁棒性:注意到 抗干扰能力 1( ) ( ) ( )( )0D z F z P zP z( )( ) ( )1( )( ) ( )( )( )( )1( ) ( ) ( )( )1( ) ( ) ( )( )F z D z P zF z D z P zY zR zzD z F z P zP zD z F z P zP z内模控制例3神经网络内模控制器设计演示