人工神经网络7Boltzma.ppt
《人工神经网络7Boltzma.ppt》由会员分享,可在线阅读,更多相关《人工神经网络7Boltzma.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、武汉科技大学1人工神经网络(Artifical Neural Network)张凯 副教授武汉科技大学 计算机学院2要点简介要点简介1.研究背景研究背景2.随机神经网络随机神经网络3.模拟退火算法模拟退火算法4.Boltzmann机机随机神经网络随机神经网络随机神经网络是统计力学思想引入神经网络研究的结果。统计力学是研究大系统宏观平衡性质的学科,这种大系统的组成元素服从微观机制。统计力学的主要目的是寻找从微观粒子(原子、电子)的运动开始的宏观物体的热力学性质,由于所遇到的自由度数目很大,因此只能使用概率的方法进行研究。随机神经网络随机神经网络 名称 网络类型 网络结构 学习算法BP网络多层前向
2、网络含输入层、隐层、输出层。层内神经元无连接网络按误差减少的最大梯度方向调整权值Hopfield网络反馈神经网络单层神经网络,层内神经元全互连网络按照其用途来设计或训练网络权值Boltzmann 机随机神经网络含输入部、输出部和中间部。神经元互连网络向误差减小的方向运行概率大,但也可能向误差增大方向运行BP网络是一种“贪心”算法,容易陷入局部最小点。Hopfield网络很难避免出现伪状态,网络是严格按照能量减小的方向运行的,容易陷入局部极小点,而无法跳出。所以,在用BP网络和Hopfield网络进行最优化的计算时,由于限定条件的不足,往往会使网络稳定在误差或能量函数的局部最小点,而不是全局最小
3、点,即所得的解不是最优解。随机神经网络随机神经网络随机神经网络随机神经网络网络陷入局部最小点的原因主要有两点:(1)网络结构上存在着输入到输出之间的非线性函数关系,从而使网络误差或能量函数所构成的空间是一个含有多极点的非线性空间。(2)在算法上,网络的误差或能量函数只能单方向减小,不能有一点上升。6随机神经网络随机神经网络随机神经网络的基本思想:网络向误差或能量函数减小方向运行的概率大,同时向误差或能量函数增大方向运行的概率存在,这样网络跳出局部极小点的可能性存在,而且向全局最小点收敛的概率最大。模拟退火算法(Simulated Annealing)来源于固体退火原理,将固体加温至充高,再让其
4、徐徐冷却,加温时,固体内部粒子随温度升高变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。它由Metropolis算法和退火过程(Annealing Procedure,AP)组成。模拟退火算法模拟退火算法模拟退火算法的基本思路模拟退火算法的基本思路首先在高温下进行搜索,此时各状态出现概率相差不大,可以很快进入“热平衡状态”,这时进行的是一种“粗搜索”,也就是大致找到系统的低能区域;随着温度的逐渐降低,各状态出现概率的差距逐渐被扩大,搜索精度不断提高。这就可以越来越准确的找到网络能量函数的全局最小点。9模拟退火算法的基本思路模拟退火算法
5、的基本思路当使用最速下降法(gradient descent)时,系统可能陷入局部最小值(local minimum)模拟退火算法的基本思路模拟退火算法的基本思路仿真退火算法基本概念改变系统能量以组合最速下降与随机过程的方式搜寻能量函数的总体最小值在搜寻的过程中,通常以最速下降法使其解答状态在搜寻空间中往能量函数值较低处移动,但透过随机过程,偶而往能量函数值较高处移动,以跳过局部最小值模拟退火算法的基本思路模拟退火算法的基本思路最速下降 模拟退火模拟退火概念在模拟退火搜寻过程中,当次一个解的能量函数值比现行解的能量函数值低时,移至此解。反之,则允许少许机率移动到能量函数值较高的次一个解,此机率
6、通常假设为两个解间能量函数差额的Boltzmann机率分布函数。模拟退火算法的基本思路模拟退火算法的基本思路模拟退火的最初目的是寻找代表复杂系统的代价函数的全局最小值。因此,这种方法为解决凹平面最优问题提供了一个强有力的工具,其中心思想在于:在用模拟退火最优化一个复杂系统(如:一个拥有很多自由度的系统)时,误差或能量函数绝大部分的时间在下降,但不是一直下降,即误差或能量函数的总趋势向减小的方向变化,但有时也向增大的方向变化,这样可跳出局部极小点,向全局最小点收敛。模拟退火与传统迭代最优算法的比较:(1)当系统在非零温度下时,从局部最优中跳出是非常可能的,因此不会陷入局部最优。(2)系统最终状态
7、的总特征可以在较高温度下看到,而状态的好的细节却在低温下表现,因此,模拟退火是自适应的.。模拟退火算法的基本思路模拟退火算法的基本思路 1.Metropolis抽样过程 模拟退火算法原理模拟退火算法原理 1.Metropolis抽样过程 假定一随机变量在某一时刻的状态为vi。在另一时刻的状态为vj。假设这种状态的转移满足以下条件:E表示系统从状态vi转移至状态vj所引起的能量差。如果能量差E为负,这种转移就导致状态能量的降低,这种转移就被接受。接下来,新状态作为算法下一步的起始点。模拟退火算法原理模拟退火算法原理模拟退火算法原理模拟退火算法原理若能量差为正,算法在这一点进行概率操作。首先,选定
8、一个在0,1内服从均匀分布的随机数。如果e-E/T,则接受这种转移。否则,拒绝这种转移;即在算法的下一步中拒绝旧的状态。如此反复,达到系统在此温度下的热平衡。这个过程称作Metropolis抽样过程。Metropolis抽样过程就是在一确定温度下,使系统达到热平衡的过程。模拟退火算法原理模拟退火算法原理2.退火过程(降温过程)在Metropolis抽样过程中温度T缓慢的降低。模拟退火过程就是通过T参数的变化使状态收敛于最小能量处。因而,T参数的选择对于算法最后的结果有很大影响。初始温度和终止温度设置的过低或过高都会延长搜索时间。降温步骤太快,往往会漏掉全局最优点,使算法收敛至局部最优点。降温步
9、骤太慢,则会大大延长搜索全局最优点的计算时间,从而难以实际应用。因此,T可以理解为一个控制参数。模拟退火算法原理模拟退火算法原理为寻找在有限时间逼近全局最优的模拟退火算法,设置了许多控制算法收敛的参数。在退火过程中指定了有限的退火温度值和在每一温度下的转移数目。Kirlpatrick等人在退火步骤中设定的参数如下:(1)初始温度值:初始温度值T0要选的足够高,保证模拟退火算法中所有可能的转移都能被接受。18 十一月 202220模拟退火算法原理模拟退火算法原理(2)温度的下降:原先使用指数函数实现温度的下降。但是这种方法使降温幅度过小,从而延长搜索时间。在实际中,通常使用下式:此处是一小于却接
10、近于1的常数。通常的取值在0.8至0.99之间。在每一温度下,实验足够多的转移次数。18 十一月 202221模拟退火算法原理模拟退火算法原理(3)终止温度:如果在连续的若干个温度下没有可接受的新状态,系统冻结或退火停止。模拟退火尤其适合解决组合优化问题,下面以模拟退火算法解决组合优化问题来进一步介绍模拟退火算法的步骤。18 十一月 202222许多工程上和理论上的问题,其目标都是在一个很大的解空间中寻求一个最优解,这些问题统称为组合优化问题。在许多组合优化问题中,一个解通常是满足一定规则的一些离散对象的排列,所有这些解的集合叫做解空间。通常用一个“代价函数”C(x)来衡量一个解的优劣,目标就
11、是选择一个解使其代价函数C(x)最小,如TSP问题、大规模集成电路布局布线问题等。18 十一月 202223模拟退火求解组合优化问题模拟退火求解组合优化问题18 十一月 202224 模拟退火算法 组合优化问题样本问题举例状态解能量代价函数温度控制参数热平衡时的能量最小代价热平衡状态最优解模拟退火求解组合优化问题模拟退火求解组合优化问题设V=V1,V2,Vn为所有可能的组合(或状态)所构成的集合。C()是V的函数,且 ,反映取状态Vi为解的代价,目标是寻找 使模拟退火算法应用于组合优化问题的基本思想就是把每种组合状态Vi看成某一物质体系的微观状态,C(Vi)可看成该物质体系在Vi下的能量,温度
12、T为控制参数。模拟退火求解组合优化问题模拟退火求解组合优化问题让T从一个足够高的值慢慢下降,对于每个T,对当前状态V作随机扰动产生一个新状态V,计算其增量C=C(V)-C(V),并以概率e-C/kT接受V作为新的当前状态。根据统计力学的知识,当重复如此随机扰动足够次数后,状态Vi的出现概率如下:18 十一月 202226模拟退火求解组合优化问题模拟退火求解组合优化问题k为Boltzmann常数第一步:初始化。依据所要解决的组合优化问题,确定代价函数C()的表达式,随机选择初始状态V=V(0),设定初始温度T0,终止温度Tfinal,概率阈值。第二步:Metropolis抽样过程(1)在温度T下
13、依据某一规定的方式,根据当前解所处的状态V,产生一个近邻子集N(V)(可包括V,也可不包括V),在N(V)内随机寻找一个新状态S作为下一个当前解的候选解,计算C=C(V)-C(V)。18 十一月 202227模拟退火求解组合优化问题模拟退火求解组合优化问题模拟退火求解组合优化问题模拟退火求解组合优化问题(2)若C0,则计算概率e-C/T,若其大于给定概率阈值,则取下一状态为V=V,否则,保留这一状态。(3)按某一给定的收敛算法检查算法在温度T下是否应停止,若符合收敛条件则表示已达到热平衡,转向第三步的退火过程,若不符合收敛条件,则转向(1)继续迭代,直至在此温度下收敛。18 十一月 20222
14、8模拟退火求解组合优化问题模拟退火求解组合优化问题第三步:退火过程。按照一定的降温方法得到一个新的温度T,检查T是否小于给定的温度终止阈值Tfinal。若小于,则退火过程结束,当前状态V即为算法最终输出解。若温度T大于等于给定阈值,则转至Metropolis抽样过程,在新的温度下搜索状态。注意:在上述退火过程中,模拟退火算法是否能达到能量E的最小值,取决于T0是否足够高,和T下降得是否充分慢,以及对每个T时系统是否稳定。(1)T0的选择方法:a.均匀随机抽样Vi,取此时C(Vi)的方差为T0 b.在所有可能的组合状态中,选两个状态使C 最大,取T0为C的若干倍;c.按经验给出。18 十一月 2
15、02230模拟退火参数控制模拟退火参数控制模拟退火参数控制模拟退火参数控制(2)退火过程中Tfinal 的选取方法:a 依据经验确定 b 检验系统的熵是已否达到最小,若达到最小,即可认为温度已达到终止温度。c T下降n次后都没有改善,即可认为能量已降到最低,没有必要再降温。18 十一月 202231模拟退火参数控制模拟退火参数控制(3)Metropolis抽样过程的收敛算法:a.检验目标函数C()的均值是否稳定;b.继续若干步,C()变化很小(设定阈值);c.按一个固定步数抽样。(4)降温方法的确定:根据Kirlpatrick的方法令 ,模拟退火参数控制模拟退火参数控制模拟退火算法是一种通用的
16、随机搜索算法,它可用于解决众多的优化问题,并已经广泛的应用于其他领域。如VLSL设计、图像识别等。当待解决的问题复杂性较高,而且规模较大时,在对问题的领域知识甚少的情况下,采用模拟退火算法最合适。因为模拟退火算法不像其他确定型启发式算法那样,需要依赖于问题的领域知识来提高算法的性能。模拟退火参数控制模拟退火参数控制但是,从另一方面来说,已知有关待解决问题的一些知识后,模拟退火算法却无法充分利用它们,这使得模拟退火算法的优点就成了缺点。如何把传统的启发式搜索方法和模拟退火随机搜索算法结合起来,这是一个有待研究的十分有意义的课题。18 十一月 202234模拟退火参数控制模拟退火参数控制模拟退火算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工 神经网络 Boltzma
限制150内