智能控制第七章神经控制系统.ppt
《智能控制第七章神经控制系统.ppt》由会员分享,可在线阅读,更多相关《智能控制第七章神经控制系统.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、智智 能能 控控 制制Intelligent ControlIntelligent Control第七章第七章 神经控制系统神经控制系统(NeuralControlSystem)7.1 神经网络神经网络 (NN)简介简介 人工神经网络人工神经网络(ANN)(ANN)的起源与发展的起源与发展自自1960年威德罗年威德罗(Widrow)和霍夫和霍夫(Hoff)率先把神经网络用于率先把神经网络用于自动控制研究以来,对这一课题的研究艰难地取得一些进展。自动控制研究以来,对这一课题的研究艰难地取得一些进展。60年代末期至年代末期至80年代中期,神经网络控制与整个神经网络研年代中期,神经网络控制与整个神经
2、网络研究一样,处于低潮。究一样,处于低潮。80年代后期以来,随着人工神经网络研究的复苏和发展,对年代后期以来,随着人工神经网络研究的复苏和发展,对神经网络控制的研究也十分活跃。这方面的研究进展主要在神神经网络控制的研究也十分活跃。这方面的研究进展主要在神经网络自适应控制和模糊神经网络控制及其在机器人控制中的经网络自适应控制和模糊神经网络控制及其在机器人控制中的应用上。应用上。用于控制的人工神经网络用于控制的人工神经网络人工神经网络的特性人工神经网络的特性:并行分布处理并行分布处理;非线性映射非线性映射;通过训练进行学习通过训练进行学习;适应与集成适应与集成;硬件实现硬件实现.(1)模式信息处理
3、和模式识别;模式信息处理和模式识别;(2)最优化问题计算;最优化问题计算;(3)复杂系统控制;复杂系统控制;(4)通信。通信。人工神经网络的应用人工神经网络的应用:7.2 人工神经网络的模型与结构人工神经网络的模型与结构 生物神经元模型生物神经元模型 神经元的主要组成部分:细胞体、轴突、树突、突触等。神经元的主要组成部分:细胞体、轴突、树突、突触等。从生物控制论的角度,神经元作为控制和信息处从生物控制论的角度,神经元作为控制和信息处理的基本单元,具有以下几个重要功能和特点:理的基本单元,具有以下几个重要功能和特点:1)1)动态极化原则;动态极化原则;2)2)时空整合功能;时空整合功能;3)3)
4、兴奋与抑制状态;兴奋与抑制状态;4)4)脉冲与电位转换;脉冲与电位转换;5)5)突触延时和不应期。突触延时和不应期。人工神经元模型及其特性人工神经元模型及其特性人工神经元由多个输入人工神经元由多个输入xi,i=1,2,.,n和一个输出和一个输出y组成,组成,中间状态由输入信号的权和表示,而输出为:中间状态由输入信号的权和表示,而输出为:(7.1)式中,式中,j为神经元单元的偏置(阈值),为神经元单元的偏置(阈值),wji为连接权系数(对于为连接权系数(对于激发状态,激发状态,wji取正值,对于抑制状态,取正值,对于抑制状态,wji取负值),取负值),n为输入信为输入信号数目,号数目,yj为神经
5、元输出,为神经元输出,t为为时间,时间,f(-)为输出变换函数,为输出变换函数,有时叫做激发或激励函数,往有时叫做激发或激励函数,往往采用取往采用取0和和1值的二值函数值的二值函数或或形函数,见下图。形函数,见下图。图图7.1神经元模型神经元模型这三种函数都是连续和非线性的。一种二值函数可由下式表示:这三种函数都是连续和非线性的。一种二值函数可由下式表示:(7.2)一种常规的一种常规的形函数可由下式表示:形函数可由下式表示:(7.3)双曲正切函数如下式所示:双曲正切函数如下式所示:(7.4)图图7.2神经元中的某些变换(激发)函数神经元中的某些变换(激发)函数(a)二值函数)二值函数(b)S形
6、函数形函数(c)双曲正切函数)双曲正切函数 人工神经网络的基本类型人工神经网络的基本类型1.人工神经网络的基本特性和结构人工神经网络的基本特性和结构人工神经网络的结构基本上分为两类,即递归(反馈)网络人工神经网络的结构基本上分为两类,即递归(反馈)网络和前馈网络。和前馈网络。基本特性基本特性ANN分类分类人工神经网络是一种具有下列特性的有向图:人工神经网络是一种具有下列特性的有向图:对于每个节点对于每个节点i 存在一个状态变量存在一个状态变量xi;从节点从节点j 至节点至节点i,存在一个连接权系统数存在一个连接权系统数wij;对于每个节点对于每个节点i,存在一个阈值存在一个阈值 i;对于每个节
7、点对于每个节点i,定义一个变换函数定义一个变换函数:对于最一般的情况,对于最一般的情况,此函数取此函数取形式形式。递归(反馈)网络递归(反馈)网络:在递归网络中,多个神经元互连以组织在递归网络中,多个神经元互连以组织一个互连神经网络,如图一个互连神经网络,如图7.3所示。有些神经元的输出被反馈所示。有些神经元的输出被反馈至同层或前层神经元。至同层或前层神经元。Hopfield网络网络,Elman网络和网络和Jordan网络是递归网络有代表性的例子。网络是递归网络有代表性的例子。前馈网络前馈网络:前馈网络具有递阶分层结构,由一些同层神经元前馈网络具有递阶分层结构,由一些同层神经元间不存在互连的层
8、级组成。从输入层至输出层的信号通过单向间不存在互连的层级组成。从输入层至输出层的信号通过单向连接流通;神经元从一层连接至下一层,不存在同层神经元间连接流通;神经元从一层连接至下一层,不存在同层神经元间的连接,如图的连接,如图7.4所示。所示。图图7.3递归(反馈)网络递归(反馈)网络图图7.4前馈(多层)网络前馈(多层)网络2.人工神经网络的主要学习算法人工神经网络的主要学习算法有师学习有师学习有师学习算法能够根据期望的和实际的网络输出(对应于有师学习算法能够根据期望的和实际的网络输出(对应于给定输入)间的差来调整神经元间连接的强度或权。有师学习给定输入)间的差来调整神经元间连接的强度或权。有
9、师学习算法的例子包括算法的例子包括Delta规则、广义规则、广义Delta规则或反向传播算法规则或反向传播算法BP以及以及LVQ算法等。算法等。无师学习无师学习无师学习算法不需要知道期望输出。在训练过程中,只要向无师学习算法不需要知道期望输出。在训练过程中,只要向神经网络提供输入模式,神经网络就能够自动地适应连接权,以神经网络提供输入模式,神经网络就能够自动地适应连接权,以便按相似特征把输入模式分组聚集。便按相似特征把输入模式分组聚集。强化学习强化学习强化学习是有师学习的特例。它不需要老师给出目标输出。强化学习是有师学习的特例。它不需要老师给出目标输出。强化学习算法采用一个强化学习算法采用一个
10、“评论员评论员”来评价与给定输入相对应的神来评价与给定输入相对应的神经网络输出的优度(质量因数)。强化学习算法的一个例子是经网络输出的优度(质量因数)。强化学习算法的一个例子是遗传算法(遗传算法(GA)。)。人工神经网络的典型模型人工神经网络的典型模型续前表:续前表:7.3 人工神经网络示例及其算法人工神经网络示例及其算法人工神经网络的许多算法已在神经控制中获得广泛采用,下人工神经网络的许多算法已在神经控制中获得广泛采用,下面对几种比较重要的网络及其算法加以简要讨论。面对几种比较重要的网络及其算法加以简要讨论。多层感知器多层感知器(MLP)多层感知器是最著名的前馈网络。图多层感知器是最著名的前
11、馈网络。图7.4给出一个三层给出一个三层MLP,即输入层、中间(隐含)层和输出层。输入层的神经元只起到缓即输入层、中间(隐含)层和输出层。输入层的神经元只起到缓冲器的作用,把输入信号分配至隐含层的神经元。隐含层的每个冲器的作用,把输入信号分配至隐含层的神经元。隐含层的每个神经元神经元j(见图(见图7.1)在对输入信号加权)在对输入信号加权wij之后,进行求和,并计之后,进行求和,并计算出输出算出输出yj作为该和的作为该和的f 函数,即函数,即(7.5)反向传播算法反向传播算法(BP)是一种最常采用的训练算法,另一种适是一种最常采用的训练算法,另一种适于训练于训练MLP的学习算法是遗传算法(的学
12、习算法是遗传算法(GA)。)。反反向向传传播播算算法法是是一一种种最最常常采采用用的的训训练练算算法法,它它给给出出神神经元经元i和和j间连接权的变化间连接权的变化,如下式所示:,如下式所示:(7.6)式中,式中,为一称为学习速率的参数,为一称为学习速率的参数,为一取决于神经元为一取决于神经元j是否是否为一输出神经元或隐含神经元的系数。对于输出神经元,为一输出神经元或隐含神经元的系数。对于输出神经元,(7.7)对于隐含神经元,对于隐含神经元,(7.8)在在上上述述两两式式中中,表表示示所所有有输输入入信信号号对对神神经经元元j的的加加权权总总和和,为神经元为神经元j的目标输出。的目标输出。另一
13、种适于训练的学习算法是遗传算法(另一种适于训练的学习算法是遗传算法(GA)该该算算法法以以某某个个随随机机产产生生的的染染色色体体群群体体开开始始,并并应应用用基基因因算算子子产产生生新新的的更更为为合合适适的的群群体体。选选择择算算子子从从现现有有群群体体选选择择染染色色体体供供繁繁殖殖用用。交交叉叉算算子子通通过过在在随随机机位位置置切切开开染染色色体体并并交交换换切切开开后后续续位位置置内内的的成成分分,从从两两个个现现存存的的染染色色体体产产生生两两个个新新的的染染色色体体。变变异异算算子子通通过过随随机机地地改改变变现现有有染染色色体体的的基基因因,产产生生新新的的染染色色体体。这这
14、些些算算子子一一起起模模拟拟一一个个导导向向随随机机搜搜索索方方法法,此此方方法法最最终终能能够够求求得得神神经经网网络络的的目目标标输出。输出。数据群处理方法数据群处理方法(GMDH)网络网络图图7.6和图和图7.7分别表分别表示一个数据群处理方法示一个数据群处理方法网络及其一个神经元的网络及其一个神经元的细节。每个细节。每个GMDH神经神经元是一元是一N-Adalilne,即,即为一含有非线性预处理为一含有非线性预处理器的自适应线性元件。器的自适应线性元件。训练网络包含训练网络包含下列过程:从输入层开下列过程:从输入层开始构造网络,调整每个始构造网络,调整每个神经元的权值,增加层神经元的权
15、值,增加层数直至达到映射精度为数直至达到映射精度为止。止。图图7.6一个受训练的一个受训练的GMDH网络网络图图7.7一个神经元的详图一个神经元的详图 自适应谐振理论自适应谐振理论(ART)网络网络1.ART-1版本版本图图7.8一个一个ART-1网络网络用于处理二值输入,从下图可以看出,一个用于处理二值输入,从下图可以看出,一个ART-1网络含有两层,网络含有两层,一个输入层和一个输出层。这两层完全互连,该连接沿着正向(自一个输入层和一个输出层。这两层完全互连,该连接沿着正向(自底向上)和反馈(自顶向下)两个方向进行。底向上)和反馈(自顶向下)两个方向进行。当当ART-1网络在工作时,其训练
16、是连续进行的,包括网络在工作时,其训练是连续进行的,包括8个步骤。个步骤。2.ART-2版本版本能够处理连续值输入。能够处理连续值输入。右图给出一个学习矢量量化网络,右图给出一个学习矢量量化网络,它由三层神经元组成,即输入转换层、它由三层神经元组成,即输入转换层、隐含层和输出层。该网络在输入层与隐含层和输出层。该网络在输入层与隐含层间为完全连接,而在隐含层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出神经输出层间为部分连接,每个输出神经元与隐含神经元的不同组相连接。元与隐含神经元的不同组相连接。图图7.9学习矢量化网络学习矢量化网络 学习矢量量化学习矢量量化(LVQ)网络网络最
17、简单的训练步骤如下:最简单的训练步骤如下:(1)预置参考矢量初始权值。预置参考矢量初始权值。(2)提供给网络一个训练输入模式。提供给网络一个训练输入模式。(3)计算输入模式与每个参考矢量间的计算输入模式与每个参考矢量间的Euclidean距离。距离。(4)更新最接近输入模式的参考矢量(即获胜隐含神经元的参考矢量)的权值。更新最接近输入模式的参考矢量(即获胜隐含神经元的参考矢量)的权值。如果获胜隐含神经元以输入模式一样的类属于连接至输出神经元的缓冲器,那如果获胜隐含神经元以输入模式一样的类属于连接至输出神经元的缓冲器,那么参考矢量应更接近输入模式。否则,参考矢量就离开输入模式。么参考矢量应更接近
18、输入模式。否则,参考矢量就离开输入模式。(5)转至转至(2),以某个新的训练输入模式重复本过程,直至全部训练模式被正确,以某个新的训练输入模式重复本过程,直至全部训练模式被正确地分类或者满足某个终止准则为止。地分类或者满足某个终止准则为止。Kohonen网络网络Kohonen网络或自组织特征映射网络含有两层,一个输入缓冲网络或自组织特征映射网络含有两层,一个输入缓冲层用于接收输入模式,另一为输出层。输出层的神经元一般按正层用于接收输入模式,另一为输出层。输出层的神经元一般按正则二维阵列排列,每个输出神经元连接至所有输入神经元。则二维阵列排列,每个输出神经元连接至所有输入神经元。连接权值形成与已
19、知输出神经元相连的参考矢量的分量。连接权值形成与已知输出神经元相连的参考矢量的分量。图图7.10Kohonen网络网络 Hopfield网络网络Hopfield网络是一种典型的递归网络(见图网络是一种典型的递归网络(见图7.3)。下图表)。下图表示示Hopfield网络的一种方案。这种网络通常只接受二进制输入网络的一种方案。这种网络通常只接受二进制输入(或或)以及双极性输入以及双极性输入(+1或或-1)。它含有一个单层神经元,每个神。它含有一个单层神经元,每个神经元与所有其它神经元连接,形成递归结构。经元与所有其它神经元连接,形成递归结构。Hopfield网络的训网络的训练只有一步。练只有一步
20、。图图7.11一种一种Hopfield网络网络 ElmanandJordan网络网络图图7.12Elman网络网络图图7.13Jordan网络网络图图7.12和图和图7.13分别示出分别示出Elman网络和网络和Jordan网络。这两种网网络。这两种网络具有与络具有与MLP网络相似的多层结构。在这两种网络中,除了普通网络相似的多层结构。在这两种网络中,除了普通的隐含层外,还有一个特别的隐含层,有时称为上下文层或状态的隐含层外,还有一个特别的隐含层,有时称为上下文层或状态层;该层从普通隐含层(对于层;该层从普通隐含层(对于Elman网)或输出层(对于网)或输出层(对于Jordan网)接收反馈信号
21、。网)接收反馈信号。小脑模型连接控制小脑模型连接控制(CMAC)网络网络CMAC网络可视为一种具有模糊联想记忆特性监督式(有导网络可视为一种具有模糊联想记忆特性监督式(有导师)前馈神经网络。图师)前馈神经网络。图7.14表示网络的基本模块。表示网络的基本模块。图图7.14CMAC网络的基本模块网络的基本模块CMAC由一系列映射组成:由一系列映射组成:(7.17)式中,式中,输入矢量输入矢量,中间变量中间变量,联想单元矢量联想单元矢量,CMAC的输出的输出 h(S),h g f e。7.4 神经控制的结构方案神经控制的结构方案 NN学习控制学习控制图图7.16给出一个给出一个NN学习控制的结构,
22、包括一个导师(监督程学习控制的结构,包括一个导师(监督程序)和一个可训练的神经网络控制器(序)和一个可训练的神经网络控制器(NNC)。控制器的输入对)。控制器的输入对应于由人接收(收集)的传感输入信息,而用于训练的输出对应应于由人接收(收集)的传感输入信息,而用于训练的输出对应于人对系统的控制输入。于人对系统的控制输入。图图7.16基于神经网络的监督式控制基于神经网络的监督式控制实现实现NN监督式控制的步骤如下:监督式控制的步骤如下:通过传感器和传感信息处理,调用必要的和有用的控制信息。通过传感器和传感信息处理,调用必要的和有用的控制信息。构造神经网络,即选择构造神经网络,即选择NN类型、结构
23、参数和学习算法等。类型、结构参数和学习算法等。训练控制器,实现输入和输出间的映射,以便进行正确的训练控制器,实现输入和输出间的映射,以便进行正确的控制。控制。NN监督式控制已被成功应用于倒立摆小车控制系统。监督式控制已被成功应用于倒立摆小车控制系统。NN直接逆控制直接逆控制下图给出下图给出NN直接逆控制的两种结构方案。在图直接逆控制的两种结构方案。在图7.17()中,中,网络网络NN1和和NN2具有相同的逆模型网络结构,而且采用同样的具有相同的逆模型网络结构,而且采用同样的学习算法。图学习算法。图7.17()为为NN直接逆控制的另一种结构方案,图直接逆控制的另一种结构方案,图中采用一个评价函数
24、中采用一个评价函数(EF)。图图7.17直接逆控制直接逆控制NN直接逆控制采用受控系统的一个逆模型,它与受控系统直接逆控制采用受控系统的一个逆模型,它与受控系统串接以便使系统在期望响应(网络输入)与受控系统输出间得串接以便使系统在期望响应(网络输入)与受控系统输出间得到一个相同的映射。到一个相同的映射。NN自适应控制自适应控制NN自适应控制也分为两类,即自校正控制自适应控制也分为两类,即自校正控制(STC)和模型参和模型参考自适应控制考自适应控制(MRAC)。STC和和MRAC之间的差别在于:之间的差别在于:STC根据受控系统的正和根据受控系统的正和(或)逆模型辨识结果直接调节控制器的内部参数
25、,以期能够(或)逆模型辨识结果直接调节控制器的内部参数,以期能够满足系统的给定性能指标;在满足系统的给定性能指标;在MRAC中,闭环控制系统的期望中,闭环控制系统的期望性能是由一个稳定的参考模型描述的,而该模型又是由输入性能是由一个稳定的参考模型描述的,而该模型又是由输入输出对输出对确定的。确定的。1.NN自校正控制(自校正控制(STC)NN直接自校正控制直接自校正控制该控制系统由一个常规控制器和一个具有离线该控制系统由一个常规控制器和一个具有离线辨识能力的识别器组成;后者具有很高的建模精度。辨识能力的识别器组成;后者具有很高的建模精度。NN直接自校正控制的直接自校正控制的结构基本上与直接逆控
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 控制 第七 神经 控制系统
限制150内