《神经网络在控制中的应用讲稿.ppt》由会员分享,可在线阅读,更多相关《神经网络在控制中的应用讲稿.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于神经网络在控制中的应关于神经网络在控制中的应用用第一页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.2v神经网络在控制中的应用神经网络在控制中的应用 神经网络辨识技术神经网络辨识技术 神经网络控制技术神经网络控制技术第二页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.35.1 神经网络辨识神经网络辨识系统辨识是自适应控制的关键所在,它通过测量对象的输入输出状态来估计对象的数学模型,使建立的数学模型和对象具
2、有相同的输入输出特性。神经网络对非线性函数具有任意逼近和自学习能力,为系统的辨识,尤其是非线性动态系统的辨识提供了一条十分有效的途径。神经网络系统辨识实质上是选择一个适当的神经网络模型来逼近实际系统的数学模型。第三页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.45.1 神经网络辨识神经网络辨识5.1.1 神经网络系统辨识的原理 系统辨识的原理就是通过调整辨识模型的结构来使e最小。在神经网络系统辨识中,神经网络用作辨识模型,将对象的输入输出状态u,y看作神经网络的训练样本数据,以J=1/2e2作为网络
3、训练的目标,则通过用一定的训练算法来训练网络,使J足够小,就可以达到辨识对象模型的目的。第四页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.55.1 神经网络辨识神经网络辨识5.1.2多层前向BP网络的系统辨识 假设非线性对象的数学模型可以表示为:)(,),1(),(),(),2(),1()(mtututuntytytyfty其中f是描述系统特征的未知非线性函数,m,n分别为输入输出的阶次。则可以利用多层前向BP网络来逼近非线性函数,进而估计对象的模型。第五页,讲稿共四十八页哦College of E
4、lectrical and Information Engineering,Hunan Univ.65.1 神经网络辨识神经网络辨识多层前向BP网络系统辨识原理图 第六页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.75.1 神经网络辨识神经网络辨识网络的输出可以通过下式计算得到:ljmniiijjxwwty111)1()2()()(,121mnxxxX)(,),1(),(),(,),2(),1(mtututuntytytyH(*)表示隐层神经元的激发函数 Wij(1),Wj(2)分别表示网络第1-2
5、层和2-3层的连接权值 第七页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.85.1 神经网络辨识神经网络辨识定义网络训练的目标函数为:221)()(tytyJ则网络训练的BP算法可以描述为:)2(1)2()2()()1(jjjwJtwtw11)1()2()2()(mniiijjjxwHyywyyJwJ)1(2)1()1()()1(ijijijwJtwtwijijxHwyywJ)()2()1(第八页,讲稿共四十八页哦College of Electrical and Information Engin
6、eering,Hunan Univ.95.1 神经网络辨识神经网络辨识5.1.3.递归神经网络系统辨识递归神经网络结构 第九页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.105.1 神经网络辨识神经网络辨识递归神经网络的输入输出关系可以描述为:niiiiijljjkktxwtxwHwy1)0()1(1)2()1()(H(*)表示隐层神经元的激发函数 Wij(1),Wjk(2)分别表示网络第1-2层和2-3层的连接权值 Wi(0)表示网络第一层的递归权值 第十页,讲稿共四十八页哦College of
7、Electrical and Information Engineering,Hunan Univ.115.1 神经网络辨识神经网络辨识由于递归神经网络本身具有动态反馈环,可以记录以前的状态,因此用递归神经网络来对非线性对象进行辨识时只需以对象当前的输入状态u(t)和前一时刻的输出状态y(t-1)作为网络的输入即可,与前向多层神经网络相比,网络的结构较为简单。递归网络动态对象学习算法1z)(ku)(ky)(ky)1(ky)(ke-+第十一页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.125.2 神经
8、网络控制神经网络控制 神经网络在控制中主要起以下作用:(1)基于精确模型的各种控制结构中充当对象的模型;(2)在反馈控制系统中直接充当控制器的作用;(3)在传统控制系统中起优化计算作用;(4)在与其它智能控制方法和优化算法相融合中,为其提供对象模型、优化参数、推理模型及故障诊断等。第十二页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.135.2 神经网络控制神经网络控制5.2.1 神经网络直接反馈控制系统神经网络直接用作误差闭环系统的反馈控制器,神经网络控制器首先利用其它已有的控制样本进行离线训练,而
9、后以系统的误差的均方差为评价函数进行在线学习。第十三页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.145.2 神经网络控制神经网络控制5.2.2 神经网络逆控制 自适应逆控制的基本思想就是用被控对象传递函数的逆模型作为串联控制器对控制对象实施开环控制。神经网络先离线学习被控对象的逆动力学模型,然后用作对象的前馈串联控制器。由于开环控制缺乏稳定性,所以神经网络还需要根据系统的反馈误差在线继续学习逆动力学模型 第十四页,讲稿共四十八页哦College of Electrical and Informat
10、ion Engineering,Hunan Univ.155.2 神经网络控制神经网络控制5.2.3 神经网络内模控制 将对象模型与实际对象相并联,控制器逼近模型的动态逆。一般有两种方法:1)两个神经网络分别逼近模型和模型的逆;2)采用神经网络逼近模型,然后用非线性优化方法数值计算内模控制量。第十五页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.165.2 神经网络控制神经网络控制5.2.4 神经网络自适应控制(1)神经网络模型参考直接自适应控制 模型参考自适应控制的目的是:系统在相同输入激励r的作用
11、下,使被控对象的输出y与参考模型的输出ym达到一致。这样通过调整参考模型,可以调整系统的动态特性。神经网络控制器(NNC)先离线学习被控对象的逆动力学模型,与被控对象构成开环串联控制,而后神经网络根据参考模型输出与被控对象输出的误差函数进行在线训练,使误差函数最小。第十六页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.175.2 神经网络控制神经网络控制(2)神经网络模型参考间接自适应控制 在直接自适应控制的基础上,引入了一个神经网络辨识器(NNI)来对被控对象的数学模型进行在线辨识,这样可以及时地将
12、对象模型的变化传递给NNC,使NNC可以得到及时有效的训练。第十七页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.18例:二关节机器人神经网络自适应控制1)控制问题机器人动态控制问题就是要使机器人的各关节或末端执行器位置能够以理想的动态品质跟踪给定的轨迹或稳定在指定的位置上。XY112XY12L122AB),(ddyx1L第十八页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.191伺服控制器杆1杆21d212
13、2d坐标变换坐标变换dxdyxy二关节机器人控制结构第十九页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.202)机器人数学模型坐标变换:机器人末端在空间的位置坐标可以变换为其关节角度的大小)cos(2221222122llllyx22122212220 ,2arccosllllyxxyAtncos2221212222yxllyxl 0 ,2arccos221222122yxlllyx1第二十页,讲稿共四十八页哦College of Electrical and Information Enginee
14、ring,Hunan Univ.21动力学方程:),()(,dTFGVM2222212222221222222122212211)2(lmcllmlmcllmlmcllllmlm M2222122122122222122,sllmsllmsllm V 122211211222)(gclmgclmmgclm G第二十一页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.22机器人动力学模型的特点 n 动力学方程包含的项数多,复杂。随着机器人关节数的增加,方程中包含的项数呈几何级数增加,可达数百项;n 高度非
15、线性。方程的每一项都含有cos,sin等非线性因素 n 高度耦合。每个关节的运动都会引起其它关节的运动n 模型不确定性。当机器人搬运物体时,由于所持物件不同,负载会发生变化,同时,关节的摩擦系数也会随时间发生变化。第二十二页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.233)神经网络自适应控制第二十三页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.24n神经网络的选型:神经网络控制器控制器要求鲁棒性好,经离
16、线训练后即可投入使用,选用模糊神经网络网络的输入为四个,分别对应两个关节角的误差和误差变化率。输出为两个,对应两个关节的力矩第二十四页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.25神经网络辨识器辨识器要求能够很好地反映机器人的动态,并具有较简单的结构。选择递归神经网络第二十五页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.26n网络的训练辨识器的学习目标函数:pspssssIIkkkekJ112 2 21
17、学习算法:kWkJkWkWkWkWIIIIIII 1 第二十六页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.27控制器的学习目标函数:学习算法:pspssssCkkrkekJ11221221 soCoosssCssCCCWkukukykeWyyJWJ kWkJkWkWkWkWCCCCCCC 1 由神经网络辨识器提供第二十七页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.284)控制结果机械手具体的参数:kg
18、mkgm2,1021mlml8.0,1.121初始条件:0)0()0(210)0()0(21期望轨迹:)2sin()(1ttd)2cos()(2ttd摩擦项和扰动项:)(5.0)(signF)5cos(5)5cos(5),(tt dT第二十八页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.29 关节1的轨迹跟踪曲线 第二十九页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.30关节2的轨迹跟踪曲线 第三十页,讲
19、稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.31 RNNI的第一个输出轨迹 第三十一页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.32 RNNI的第二个输出轨迹 第三十二页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.335.2 神经网络控制神经网络控制(3)神经网络间接自校正控制 自校正调节器的目的是在控制系统参数
20、变化的情况下,自动调整控制器参数,消除扰动的影响,以保证系统的性能指标。在这种控制方式中,神经网络(NN)用作过程参数或某些非线性函数的在线估计器。假设被控对象的模型为yk+1f(yk)+g(yk)uk 则用神经网络对非线性函数f(yk)和g(yk)进行辨识,假设其在线计算估计值fd(yk)和gd(yk),则调节器的自适应控制律为uk=(yd-fd(yk)/gd(yk)此时系统的传递函数为1第三十三页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.345.2 神经网络控制神经网络控制5.2.5 神经网络
21、学习控制 神经网络学习控制系统将神经网络与常规误差反馈控制结合起来,首先用NN学习对象的逆动力学模型,然后用NN作为前馈控制器与误差反馈控制器构成复合控制器来控制对象。系统以反馈控制器的输出作为评价函数来调节神经网络的权值。这样,在控制之初,反馈控制器的作用较强,而随着控制过程的进行,NN得到越来越多的学习,反馈控制器的作用越来越弱,NN控制器的作用越来越强。第三十四页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.35例:三关节机器人视觉伺服系统神经网络学习控制n问题描述:利用摄像机观测目标小球与机器
22、人末端手爪之间的相对位置,由此构成位置反馈,由相关控制器指挥机器人进行运动,使其末端手爪到达小球。第三十五页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.36n目标小球的特征特征提取XcYcZcxy(x,y)(XP,YP,ZP)Ocf目标在成像平面的特征可以分解为:目标中心点在成像坐标系的坐标(x,y)以及目标的半径r。第三十六页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.37n控制系统:视觉伺服问题可以转
23、化为:根据目标特征与期望特征的误差,通过控制器控制机器人运动,使目标特征到达期望特征。第三十七页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.38n机器人视觉伺服控制系统的神经网络学习控制器 第三十八页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.39n神经网络结构xyr123输入层隐含层输出层第三十九页,讲稿共四十八页哦College of Electrical and Information Engine
24、ering,Hunan Univ.40n神经网络的学习:神经网络以常规控制器的输出up的最小化为目标进行学习。如果学习的目标函数定义为:J1/2(u-un)2其中u为复合控制器的输出,un为网络的输出。那么根据BP算法可得网络在线训练时的权值修正算法为:WuuWJkWnp/)(可以看出,网络在线训练的算法无需用到机械手和特征提取的模型信息,从而可以有效、快速地对神经网络进行在线学习和优化。第四十页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.41n控制结果机械手的具体参数为:L1=300cm;L2=2
25、60cm;L3=260cm。摄像机的焦距:f=50cm。目标小球的半径为:10cm。摄像机在基座坐标系的初始坐标为(490,79,337)。期望图像特征为:Xd0,Yd0,Rd10目标小球中心在基座坐标系的坐标为:(300,300,200)第四十一页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.42*为神经网络学习控制;o为常规比例控制器控制图像坐标X变化曲线 第四十二页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan U
26、niv.43*为神经网络学习控制;o为常规比例控制器控制图像坐标Y变化曲线 第四十三页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.44*为神经网络学习控制;o为常规比例控制器控制半径r变化曲线 第四十四页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.45基于神经网络学习控制的小球投影的变化曲线 第四十五页,讲稿共四十八页哦College of Electrical and Information Engin
27、eering,Hunan Univ.465.2 神经网络控制神经网络控制5.2.6神经网络PID控制 第四十六页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.47经典增量式数字PID 的控制算法为:)2()1(2)()()1()()1()(kekekekkekkekekkukudipNN 是一个三层BP 网络,有M个输入节点、N 个隐含节点、3 个输出节点。输入节点对应所选的系统运行状态量,输出节点分别对应PID 控制器的3 个可调参数kp,ki,kd。网络根据性能指标J=1/2(r-y)2进行在线学习,则可以及时更新PID控制器的参数,使系统误差在不确定严重的情况下保持最小。第四十七页,讲稿共四十八页哦College of Electrical and Information Engineering,Hunan Univ.48感谢大家观看第四十八页,讲稿共四十八页哦
限制150内