人工神经网络原理与仿真实例第2版-教学ppt课件--第6章-随机神经网络及模拟退火算法.ppt
《人工神经网络原理与仿真实例第2版-教学ppt课件--第6章-随机神经网络及模拟退火算法.ppt》由会员分享,可在线阅读,更多相关《人工神经网络原理与仿真实例第2版-教学ppt课件--第6章-随机神经网络及模拟退火算法.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、在线教务辅导网:在线教务辅导网:http:/教材其余课件及动画素材请查阅在线教务辅导网教材其余课件及动画素材请查阅在线教务辅导网QQ:349134187 或者直接输入下面地址:或者直接输入下面地址:http:/*合肥工业大学 计算机与信息学院 图像信息处理研究室第第6章章 随机神经网络及模拟退火算法随机神经网络及模拟退火算法 n6.1 Boltzmann机机n6.2 Boltzmann机的改进机的改进n6.3 模拟退火算法模拟退火算法n6.4 仿真实例仿真实例*合肥工业大学 计算机与信息学院 图像信息处理研究室前言前言n 随机神经网络是统计力学思想引入神经网络研究随机神经网络是统计力学思想引入
2、神经网络研究的结果。的结果。n统计力学是研究大系统宏观平衡性质的学科,这种统计力学是研究大系统宏观平衡性质的学科,这种大系统的组成元素服从微观机制。统计力学的主要大系统的组成元素服从微观机制。统计力学的主要目的是寻找从微观粒子(原子、电子)的运动开始目的是寻找从微观粒子(原子、电子)的运动开始的宏观物体的热力学性质,由于所遇到的自由度数的宏观物体的热力学性质,由于所遇到的自由度数目很大,因此只能使用概率的方法进行研究。目很大,因此只能使用概率的方法进行研究。*合肥工业大学 计算机与信息学院 图像信息处理研究室 随机神经网络与其他网络的比较:随机神经网络与其他网络的比较:名称名称 网络类型网络类
3、型 网络结构网络结构 学习算法学习算法BP网络网络多层前向网多层前向网络络含输入层、隐层、含输入层、隐层、输出层。层内神输出层。层内神经元无连接经元无连接网络按误差减网络按误差减少的最大梯度少的最大梯度方向调整权值方向调整权值Hopfield 网络网络反馈神经网反馈神经网络络单层神经网络,单层神经网络,层内神经元全互层内神经元全互连连网络按照其用网络按照其用途来设计或训途来设计或训练网络权值练网络权值Boltzmann 机机随机神经网随机神经网络络含输入部、输出含输入部、输出部和中间部。神部和中间部。神经元互连经元互连网络向误差减网络向误差减小的方向运行小的方向运行概率大,但也概率大,但也可能
4、向误差增可能向误差增大方向运行大方向运行*合肥工业大学 计算机与信息学院 图像信息处理研究室nBP网络是一种网络是一种“贪心贪心”算法,容易陷入局部最算法,容易陷入局部最小点。小点。nHopfieldHopfield网络很难避免出现伪状态,网络是严格网络很难避免出现伪状态,网络是严格按照能量减小的方向运行的,容易陷入局部极小按照能量减小的方向运行的,容易陷入局部极小点,而无法跳出。点,而无法跳出。n所以,在用所以,在用BP网络和网络和Hopfield网络进行最优化网络进行最优化的计算时,由于限定条件的不足,往往会使网络的计算时,由于限定条件的不足,往往会使网络稳定在误差或能量函数的局部最小点,
5、而不是全稳定在误差或能量函数的局部最小点,而不是全局最小点,即所得的解不是最优解。局最小点,即所得的解不是最优解。*合肥工业大学 计算机与信息学院 图像信息处理研究室n网络陷入局部最小点的原因主要有两点:网络陷入局部最小点的原因主要有两点:(1)网网络络结结构构上上存存在在着着输输入入到到输输出出之之间间的的非非线线性性函函数数关关系系,从从而而使使网网络络误误差差或或能能量量函函数数所所构构成的空间是一个含有多极点的非线性空间。成的空间是一个含有多极点的非线性空间。(2)在在算算法法上上,网网络络的的误误差差或或能能量量函函数数只只能能单单方向减小,不能有一点上升。方向减小,不能有一点上升。
6、*合肥工业大学 计算机与信息学院 图像信息处理研究室n随机神经网络的基本思想:随机神经网络的基本思想:网络向误差或能量函数减小方向运行的概率大,网络向误差或能量函数减小方向运行的概率大,同时向误差或能量函数增大方向运行的概率存在,同时向误差或能量函数增大方向运行的概率存在,这样网络跳出局部极小点的可能性存在,而且向全这样网络跳出局部极小点的可能性存在,而且向全局最小点收敛的概率最大。局最小点收敛的概率最大。*合肥工业大学 计算机与信息学院 图像信息处理研究室 n 20世纪世纪80年代,年代,Ackley,Hinton 和和Sejnowski等人等人以模拟退火思想为基础,对以模拟退火思想为基础,
7、对Hopfield网络引入了网络引入了随机机制,推出随机机制,推出Boltzmann机。机。n Boltzmann机是第一个受统计力学启发的多层学机是第一个受统计力学启发的多层学习机,它是典型的随机神经网络。其命名来源于习机,它是典型的随机神经网络。其命名来源于Boltzmann机在统计力学中的早期工作和网络本机在统计力学中的早期工作和网络本身的动态分布行为(其平衡状态服从身的动态分布行为(其平衡状态服从Boltzmann分布),其运行机制服从模拟退火算法。分布),其运行机制服从模拟退火算法。*合肥工业大学 计算机与信息学院 图像信息处理研究室6.1 Boltzmann机机n6.1.1 Bol
8、tzmann机的网络结构机的网络结构n6.1.2 Boltzmann机的工作原理机的工作原理n6.1.3 Boltzmann机的运行步骤机的运行步骤n6.1.4 Boltzmann机的学习规则机的学习规则*合肥工业大学 计算机与信息学院 图像信息处理研究室 6.1.1 Boatman机的网络结构机的网络结构图图6-1 boltzmann机的网络结构机的网络结构*合肥工业大学 计算机与信息学院 图像信息处理研究室n Boltzmann机由输入部、输出部和中间部构成。机由输入部、输出部和中间部构成。输入神经元和输出神经元可称为显见神经元,它输入神经元和输出神经元可称为显见神经元,它们是网络与外部环
9、境进行信息交换的媒介。中间们是网络与外部环境进行信息交换的媒介。中间部的神经元称为隐见神经元,它们通过显见神经部的神经元称为隐见神经元,它们通过显见神经元与外部进行信息交换。元与外部进行信息交换。n 每一对神经元之间的信息传递是双向对称的,即每一对神经元之间的信息传递是双向对称的,即wij=wji,而且自身无反馈即,而且自身无反馈即wii=0。学习期间,显。学习期间,显见神经元将被外部环境见神经元将被外部环境“约束约束”在某一特定的状在某一特定的状态,而中间部隐见神经元则不受外部环境约束。态,而中间部隐见神经元则不受外部环境约束。*合肥工业大学 计算机与信息学院 图像信息处理研究室Boltzm
10、ann机中单个神经元的运行特性机中单个神经元的运行特性*合肥工业大学 计算机与信息学院 图像信息处理研究室 n Boltzmann机中每个神经元的兴奋或抑制具机中每个神经元的兴奋或抑制具有随机性,其概率取决于神经元的输入。有随机性,其概率取决于神经元的输入。n 神经元神经元i的全部输入信号的总和为的全部输入信号的总和为ui为:为:式中式中bi是是该神经元的阈值。该神经元的阈值。可以将可以将bi归并归并到总的加权和中去,即得:到总的加权和中去,即得:*合肥工业大学 计算机与信息学院 图像信息处理研究室 n 神经元的输出神经元的输出vi依概率取依概率取1或或0:vi取取1的概率:的概率:vi取取0
11、的概率:的概率:n 由此可见,由此可见,vi取取1的概率受两个因素的影响:的概率受两个因素的影响:(1)ui越大越大vi则取则取1的概率越大,而取的概率越大,而取0的概的概 率越小。率越小。(2)参数参数T称为称为“温度温度”,在不同的温度下,在不同的温度下vi 取取1的概率的概率P随随ui的变化如图所示。的变化如图所示。*合肥工业大学 计算机与信息学院 图像信息处理研究室 pu的关系的关系*合肥工业大学 计算机与信息学院 图像信息处理研究室n可可见见,T越越高高时时,曲曲线线越越平平滑滑,因因此此,即即使使ui有有很很大大变变动动,也也不不会会对对vi取取1的的概概率率变变化化造造成成很很大
12、大的的影影响响;反反之之,T越越低低时时,曲曲线线越越陡陡峭峭,当当ui有有稍稍许许变变动动时时就就会会使使概概率率有有很很大大差差异异。即即温温度度高高时时状状态态变变化化接接近随机,随着温度的降低向确定性的动作靠近。近随机,随着温度的降低向确定性的动作靠近。n当当T0时时,每每个个神神经经元元不不再再具具有有随随机机特特性性,而而具具有有确确定定的的特特性性,激激励励函函数数变变为为阶阶跃跃函函数数,这这时时Boltzmann机趋向于机趋向于Hopfield 网络。网络。*合肥工业大学 计算机与信息学院 图像信息处理研究室 6.1.1 Boltzmann机的工作原理机的工作原理 Boltz
13、mann机机采采用用下下式式所所示示的的能能量量函函数数作作为为描述其状态的函数。描述其状态的函数。将将Boltzmann机机视视为为一一动动力力系系统统,能能量量函函数数的的极极小小值值对对应应系系统统的的稳稳定定平平衡衡点点,由由于于能能量量函函数数有有界界,当当网网络络温温度度以以某某种种方方式式逐逐渐渐下下降降到到某某一一特特定定值值时时,系系统统必必趋趋于于稳稳定定状状态态Boltzmann机的运行过程就是逐步降低其能量函数的过程。机的运行过程就是逐步降低其能量函数的过程。*合肥工业大学 计算机与信息学院 图像信息处理研究室nBoltzmann机机在在运运行行时时,假假设设每每次次只
14、只改改变变一一个个神神经经元元的的状状态态,如如第第i个个神神经经元元,设设vi取取0和和取取1时时系系统统的的能量函数分别为能量函数分别为0和和 ,它们的差值为,它们的差值为Ei nEi的取值可能有两种情况的取值可能有两种情况:Ei 0或或Ei 0即即 0 时,时,神经元取神经元取1的概率:的概率:神经元取神经元取0的概率:的概率:当当 Ei 0时,时,这这时神经元时神经元i的状态取的状态取1的可能性比取的可能性比取0的可能性大,的可能性大,即网络状态取能量低的可能性大。即网络状态取能量低的可能性大。*合肥工业大学 计算机与信息学院 图像信息处理研究室(2 2)同理当)同理当Ei 0,即能量
15、差即能量差Ei0,取,取vi=1为为神经元神经元i的下一状态值。若的下一状态值。若ui0,计算概率计算概率:*合肥工业大学 计算机与信息学院 图像信息处理研究室n第四步:判断第四步:判断网络在温度网络在温度Tm下是否达到稳定,下是否达到稳定,若未达到稳定,则继续在网络中随机选取另一若未达到稳定,则继续在网络中随机选取另一神经元神经元j,令,令ji,转至第二步重复计算,直至,转至第二步重复计算,直至网络在网络在Tm下达到稳定。若网络在下达到稳定。若网络在Tm下已达到下已达到稳定则转至第五步计算。稳定则转至第五步计算。n第第五五步步:以以一一定定规规律律降降低低温温度度,使使Tm+1Tm,判判断断
16、Tm+1是是否否小小于于Tfinal,若若Tm+1大大于于等等于于Tfinal,则则Tm=Tm1,转转至至第第二二步步重重复复计计算算;若若Tm+1小小于于Tfinal,则则运运行行结结束束。此此时时在在Tm下下所求得的网络稳定状态,即为网络的输出。所求得的网络稳定状态,即为网络的输出。*合肥工业大学 计算机与信息学院 图像信息处理研究室Boltzmann机学习需要注意几点机学习需要注意几点:n(1)初始温度)初始温度T0的选择方法。初始温度的选择方法。初始温度T0的的选取主要有以下方法:随机选取网络中选取主要有以下方法:随机选取网络中k个神个神经元,选取这经元,选取这k个神经元能量的方差作为
17、个神经元能量的方差作为T0;在初始网络中选取使在初始网络中选取使E最大的两个神经元,最大的两个神经元,取取T0为为Emax的若干倍;按经验值给出的若干倍;按经验值给出T0等。等。n(2)确定终止温度阈值)确定终止温度阈值Tfinal的方法。主要根的方法。主要根据经验选取,若在连续若干温度下网络状态据经验选取,若在连续若干温度下网络状态保持不变,也可认为已达到终止温度。保持不变,也可认为已达到终止温度。*合肥工业大学 计算机与信息学院 图像信息处理研究室n(3)概概率率阈阈值值的的确确定定方方法法。的的选选取取方方法法主主要要有有:在在网网络络初初始始化化时时按按照照经经验验确确定定或或在在网网
18、络络每每次次运运行行过过程程中中选选取取一一个个0,0.5之之间间均均匀匀分分布的随机数。布的随机数。n(4)网络权值)网络权值wij的确定方法。将在下一章节的确定方法。将在下一章节讨论。讨论。n(5)在每一温度下达到热平衡的条件。通常)在每一温度下达到热平衡的条件。通常在每一温度下,实验足够多的次数,直至网络在每一温度下,实验足够多的次数,直至网络状态在此温度下不再发生变化为止。状态在此温度下不再发生变化为止。*合肥工业大学 计算机与信息学院 图像信息处理研究室n(6)降降温温的的方方法法。通通常常采采用用指指数数的的方方法法进进行行降温,即:降温,即:n为加快网络收敛速度也可采用倍乘一个小
19、于为加快网络收敛速度也可采用倍乘一个小于1的降温系数的方法进行快速降温。的降温系数的方法进行快速降温。*合肥工业大学 计算机与信息学院 图像信息处理研究室6.1.4 Boltzmann机的学习规则机的学习规则nBoltzmann机机是是一一种种随随机机神神经经网网络络,可可使使用用概概率率中中的的似似然然函函数数量量度度其其模模拟拟外外界界环环境境概概率率分分布布的的性性能能。因因此此,Boltzmann机机的的学学习习规规则则就就是是根根据据最最大大似似然然规规则则,通通过过调调整整权权值值wij,最最小小化化似然函数或其对数。似然函数或其对数。n假设给定需要网络模拟其概率分布的样本集合假设
20、给定需要网络模拟其概率分布的样本集合 ,Vx是是样样本本集集合合中中的的一一个个状状态态向向量量,Vx即即可可代代表表网网络络中中显显见见神神经经元元的的一一个个状状态态,假假设设向向量量Vy表表示示网网络络中中隐隐见见神神经经元元的的一一个个可可能能状状态态,则则V=Vx Vy即可表示整个网络所处的状态。即可表示整个网络所处的状态。*合肥工业大学 计算机与信息学院 图像信息处理研究室n由由于于网网络络学学习习的的最最终终目目的的是是模模拟拟外外界界给给定定样样本本集集合合的的概概率率分分布布,而而Boltzmann机机含含有有显显见见神神经经元元和和隐隐见见神神经经元元,因因此此Boltzm
21、ann机机的的学学习习过程包括以下两个阶段:过程包括以下两个阶段:(1)主主动动阶阶段段:网网络络在在外外界界环环境境约约束束下下运运行行,即即由由样样本本集集合合中中的的状状态态向向量量Vx控控制制显显见见神神经经元元的的状状态态。定定义义神神经经元元i和和j的的状状态态在在主主动动阶阶段段的的平均关联为:平均关联为:*合肥工业大学 计算机与信息学院 图像信息处理研究室n 其中概率其中概率P(Vy|Vx)表示网络的显见神经元约束在表示网络的显见神经元约束在Vx下隐见神经元处于下隐见神经元处于Vy的条件概率,它与网络在的条件概率,它与网络在主动阶段的运行过程有关。主动阶段的运行过程有关。2)被
22、被动动阶阶段段:网网络络不不受受外外界界环环境境约约束束,显显见见神神经经元元和和隐隐见见神神经经元元自自由由运运行行,不不受受约约束束。被被动动阶阶段段的平均关联为:定义神经元的平均关联为:定义神经元i和和j的状态在的状态在*合肥工业大学 计算机与信息学院 图像信息处理研究室n P(V)为为网网络络处处于于V状状态态时时的的概概率率,vi和和vj分分别别是是神神经经元元i和和j的的输输出出状状态态。由由于于网网络络在在自自由由运运行行阶阶段段服服从从Boltzmann分布,因此分布,因此:E(V)为网络处于为网络处于V状态时的能量。状态时的能量。n 网络的权值网络的权值wij需遵循下面的调整
23、规则:需遵循下面的调整规则:*合肥工业大学 计算机与信息学院 图像信息处理研究室nwij(t)为在第为在第t步时神经元步时神经元i,j之间的连接权值,之间的连接权值,为为学习速率,学习速率,T是网络温度。是网络温度。nBoltzmann机的优点机的优点:(1)通通过过训训练练,神神经经元元体体现现了了与与周周围围环环境境相相匹匹配配的的概率分布;概率分布;(2)网网络络提提供供了了一一种种可可用用于于寻寻找找、表表示示和和训训练练的的普普遍方法;遍方法;(3)若若保保证证学学习习过过程程中中温温度度降降低低的的足足够够慢慢,根根据据状状态的演化,可以使网络状态的能量达到全局最小点。态的演化,可
24、以使网络状态的能量达到全局最小点。*合肥工业大学 计算机与信息学院 图像信息处理研究室n但但是是在在Boltzmann机机的的学学习习过过程程中中被被动动阶阶段段的的存存在具有两个很大的在具有两个很大的缺点缺点:(1)增增加加计计算算时时间间。在在外外界界环环境境约约束束条条件件下下,一一些些神神经经元元由由外外部部环环境境约约束束,而而在在自自由由运运行行条条件件下下,所所有有的的神神经经元元自自由由运运行行,这这样样增增加加了了Boltzmann机的随机仿真时间。机的随机仿真时间。(2)对对于于统统计计错错误误的的敏敏感感。Boltzmann机机的的学学习习规规则则包包含含了了主主动动阶阶
25、段段关关联联和和被被动动阶阶段段关关联联的的差差值值。当当这这两两种种关关联联相相类类似似时时,取取样样噪噪声声的的存存在在使使得得这这个差值更加不准确。个差值更加不准确。*合肥工业大学 计算机与信息学院 图像信息处理研究室6.2 Boltzmann机的改进机的改进n6.2.1 确定性确定性Boltzmann机机n6.2.2 Sigmoid置信度网络置信度网络*合肥工业大学 计算机与信息学院 图像信息处理研究室 6.2.1 确定性确定性Boltzmann机机n由于由于Boltzmann机在学习过程中需要计算网络中机在学习过程中需要计算网络中每对神经元的平均关联。可以证明每对神经元的平均关联。可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工 神经网络 原理 仿真 实例 教学 ppt 课件 随机 模拟 退火 算法
限制150内