Boltzmann神经网络模型与学习算法.ppt
《Boltzmann神经网络模型与学习算法.ppt》由会员分享,可在线阅读,更多相关《Boltzmann神经网络模型与学习算法.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、智能中国网提供学习支持智能中国网提供学习支持2.10 Boltzmann神经网络模型与学习算法 概述概述pAckleyAckley、HintonHinton等人以模拟退火思想为基等人以模拟退火思想为基础,对础,对HopfieldHopfield模型引入了随机机制,提模型引入了随机机制,提出了出了BoltzmannBoltzmann机。机。Geoffrey Hinton David H.Ackley 概述概述pBoltzmannBoltzmann机是第一个受统计力学启发的多层学机是第一个受统计力学启发的多层学习机,它是一类典型的随机神经网络,属于反习机,它是一类典型的随机神经网络,属于反馈神经网
2、络类型馈神经网络类型 p其命名来源于其命名来源于BoltzmannBoltzmann在统计热力学中的早期在统计热力学中的早期工作和网络本身的动态分布行为工作和网络本身的动态分布行为 pBoltzmannBoltzmann机结合机结合BPBP网络和网络和HopfieldHopfield网络在网络网络在网络结构、学习算法和动态运行机制的优点,是建结构、学习算法和动态运行机制的优点,是建立在立在HopfieldHopfield网基础上的,具有学习能力,能网基础上的,具有学习能力,能够通过一个模拟退火过程寻求解答。不过,其够通过一个模拟退火过程寻求解答。不过,其训练时间比训练时间比BPBP网络要长。网
3、络要长。2.10.1 Boltzmann机的网络结构pBoltzmannBoltzmann机由输入部、输出部和中间部机由输入部、输出部和中间部构成构成 2.10.1 Boltzmann机的网络结构p输入部和输出部神经元统称为显见神经元,输入部和输出部神经元统称为显见神经元,是网络与外部环境进行信息交换的媒介,中是网络与外部环境进行信息交换的媒介,中间部的神经元称为隐见神经元,它们通过显间部的神经元称为隐见神经元,它们通过显见神经元与外界进行信息交换见神经元与外界进行信息交换p每一对神经元之间的信息传递是双向对称的,每一对神经元之间的信息传递是双向对称的,即即 而且自身无反馈,即而且自身无反馈,
4、即 。p显见神经元将被外部环境显见神经元将被外部环境“约束约束”在某一特在某一特定的状态,而中间部隐见神经元则不受外部定的状态,而中间部隐见神经元则不受外部环境约束。环境约束。2.10.1 Boltzmann机的网络结构pBoltzmannBoltzmann机神经元模型机神经元模型每个神经元的兴奋或抑制具有随机性,其概率取决于神经元的输入 图中vj表示神经元 j 的输出 2.10.1 Boltzmann机的网络结构pBoltzmannBoltzmann机神经元模型机神经元模型每个神经元的兴奋或抑制具有随机性,其概率取决于神经元的输入 图中vi表示神经元i的输出 2.10.1 Boltzmann
5、机的网络结构p神经元的全部输入信号的总和由下式给出神经元的全部输入信号的总和由下式给出p 为神经元的阈值为神经元的阈值,并将其看作连接权值为并将其看作连接权值为1 1的输的输入,可以归并到总的加权和中去,即得到下式入,可以归并到总的加权和中去,即得到下式p神经元的输出依概率取神经元的输出依概率取1 1或或0 0:p 越大,则越大,则 取取1 1的概率越大,而取的概率越大,而取0 0的概率越小的概率越小 2.10.1 Boltzmann机的网络结构p神经元的全部输入信号的总和由下式给出神经元的全部输入信号的总和由下式给出p 为神经元的阈值为神经元的阈值,并将其看作连接权值为并将其看作连接权值为1
6、 1的输的输入,可以归并到总的加权和中去,即得到下式入,可以归并到总的加权和中去,即得到下式2.10.1 Boltzmann机的网络结构pui 越大,则越大,则 vi 取取1 1的概率越大,而取的概率越大,而取0 0的的概率越小概率越小 p神经元的输出依概率取神经元的输出依概率取1 1或或0 0:(1)(2)2.10.1 Boltzmann机的网络结构p温度温度T T的作用的作用如图所示,T越高时,曲线越平滑,即使ui有很大变动,也不会对vi取1的概率变化造成很大的影响;反之,T越低时,曲线越陡峭,当uj有稍许变动时就会使概率有很大差异,当T趋向于0时,每个神经元不再具有随机特性,激励函数变为
7、阶跃函数,这时Boltzmann机演变为Hopfield网络 横坐标横坐标表示神表示神经元的经元的输入总输入总和,纵和,纵坐标表坐标表示概率示概率2.10.1 Boltzmann机的网络结构p温度温度T T的作用的作用如图所示,T越高时,曲线越平滑,即使uj有很大变动,也不会对vj取1的概率变化造成很大的影响;反之,T越低时,曲线越陡峭,当uj有稍许变动时就会使概率有很大差异,当T趋向于0时,每个神经元不再具有随机特性,激励函数变为阶跃函数,这时Boltzmann机演变为Hopfield网络 2.10.1 Boltzmann机的网络结构横坐标表示神经元的输入总和,纵坐标表示概率横坐标表示神经元
8、的输入总和,纵坐标表示概率网络能量函数网络能量函数 与与Hopfield神经网络一样,神经网络一样,BM神经网络用能神经网络用能量函数作为描述网络状态的函数,能量函数采用与量函数作为描述网络状态的函数,能量函数采用与Hopfield网络相同形式网络相同形式或或 由上式可以看出,如果相应于具有相同状态的元由上式可以看出,如果相应于具有相同状态的元vi和和vj之间权值之间权值wij大多取正值,而具有相反状态大多取正值,而具有相反状态wij大多大多取负值,取负值,E才会具有最低的值;反之,才会具有最低的值;反之,E就相对较高。就相对较高。显然低能量的网络状态表达着网络的更加有序性,这显然低能量的网络
9、状态表达着网络的更加有序性,这与热力学系统是完全对应的,也是与与热力学系统是完全对应的,也是与Hebb规则相呼规则相呼应的。应的。E降至其全局最小点时,网络即达到其最佳状降至其全局最小点时,网络即达到其最佳状态,这就是我们要搜索的最优解。态,这就是我们要搜索的最优解。2.10.2 Boltzmann2.10.2 Boltzmann机学习算法机学习算法 p算法原理算法原理Boltzmann机可视为一动力系统,其能量函数的极小值对应系统的稳定平衡点将待求解优化问题的目标函数与网络的能量函数相对应,神经网络的稳定状态就对应优化目标的极小值p算法分类算法分类状态更新算法用于解决优化组合问题用于解决优化
10、组合问题 联想记忆算法 用于解决依照一定概率重现记忆的问题用于解决依照一定概率重现记忆的问题 BMBM网络状态演变的能量特征网络状态演变的能量特征 为简化讨论,假设为简化讨论,假设BMBM神经网络按异步神经网络按异步方式运行,每次只改变一个神经元的状态。方式运行,每次只改变一个神经元的状态。设设xi取取0 0和取和取1 1时系统的能量函数的差值为时系统的能量函数的差值为Ei,则,则Ei=Exi=0=0-Exi=1=1=ui.式中式中ui是是i号号神经元的净输入。神经元的净输入。在在HNNHNN中,我们很容易证明了中,我们很容易证明了E0,0,0,说明网络在其第说明网络在其第i i号神经元取号神
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Boltzmann 神经网络 模型 学习 算法
限制150内