2022年自创-分布估计算法综述资料 .pdf
《2022年自创-分布估计算法综述资料 .pdf》由会员分享,可在线阅读,更多相关《2022年自创-分布估计算法综述资料 .pdf(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、20 中 山 大 学 计 算 机 系2011 分布估计算法(EDA)综述谭维广 州 大 学 城 东 校 区名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 21 页 -摘要分布估计算法(Estimation of Distribution Algorithms,EDA),是进化计算领域兴起的一种新型的优化算法。在传统的遗传算法中,用种群表示优化问题的一组候选解,种群中的每个个体都有相应的适应值,然后进行选择、交叉和变异等模拟自然进化的操作,反复进行,对问题进行求解;而在分布估计算法中,没有传统的交叉、变异等遗传操作,取而代之的是概率模型的学习和采样。关键词分布估计算法,计算智能,统
2、计学习,概率模型目录一、分布估计算法概述二、分布估计算法的发展历史三、一个简单的分布估计算法四、分布估计算法经典概率模型比较五、分布估计算法的研究热点与应用六、总结七、参考文献名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 21 页 -一、分布估计算法概述分布估计算法(Estimation of Distribution Algorithms,EDA),是进化计算领域兴起的一种新型的优化算法。在传统的遗传算法中,用种群表示优化问题的一组候选解,种群中的每个个体都有相应的适应值,然后进行选择、交叉和变异等模拟自然进化的操作,反复进行,对问题进行求解;而在分布估计算法中,没有传统的交
3、叉、变异等遗传操作,取而代之的是概率模型的学习和采样。分布估计算法采用统计学习手段从群体宏观的角度建立一个描述解分布的概率模型,然后对概率模型随机采样产生新的种群,如此反复进行,实现种群的进化,直到满足终止条件。根据概率模型的复杂程度以及不同的采样方法,分布估计算法发展了很多不同的具体实现方法,但是都可以归纳为下面两个主要步骤:1)构建描述解空间的概率模型,通过对种群的评估,选择优秀的个体集合,然后采用统计学习等手段构造一个描述当前解集的概率模型。2)由概率模型随机采样产生新的种群,一般的,采用蒙特卡罗方法,对概率模型采样得到新的种群。分布估计算法给人类解决复杂的优化问题提供了新的工具,它通过
4、概率模型可以描述变量之间的相互关系,从而对解决非线性、变量耦合的优化问题更加有效,试验表明,分布估计算法能更加有效的解决高维问题,降低时间复杂性,例如,贝叶斯优化算法(分布估计算法的一种)可以通过与问题规模成多项式数量级的采样求得一类GA(Genetic Algorithm)难问题的最优解。分布估计算法是一种新的启发式搜索策略,是统计学习理论与随机优化算法的结合,与其他智能优化算法的混杂设计,将极大丰富混杂优化算法的研究内容,给优化算法的研究提供了新的思路。遗传算法中的交叉和变异会破坏已经优化好的个体,分布估计算法用建立概率模型和采样两大操作取代了遗传算法中的交叉算子和变异算子,以一种带有“全
5、局操控”性的操作模式解决了遗传算法存在的这一问题。遗传算法和分布估计算法的流程图对比如下:名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 21 页 -否否是是二、分布估计算法的发展历史分布估计算法的概念最先有M hlenbein 于 1996 年提出,但早在1994 年,Baluja 就提出了原始的分布估计算法模型,即PBIL(Population-Based Incremental Learning)算法。Baluja在 1994 至 1995 年间相继发表了三篇文章,系统阐述了PBIL 算法的基本原理和性能,为分布估计算法的发展打下了良好的基础。随后,M hlenbein 于
6、 1996 年提出了另一种经典的分布估计算法:UMDA(Univariate Marginal Distribution Algorithm)。UMDA 与 PBIL 的原理非常类似,只是概率模型的更新方法有所不同。早期对分布估计算法的研究都是围绕二进制编码展开的,而且集中于研究问题变量无关的情形。这类简单的分布估计算法除了PBIL 和 UMDA之外,还有Harik 于 1997 年提出的开始生成初始种群评估种群适应度选择操作交叉操作变异操作评估种群适应度达到结束条件结束开始生成初始种群评估种群适应度选择操作构建概率模型抽样产生新种群评估种群适应度达到结束条件结束名师资料总结-精品资料欢迎下载
7、-名师精心整理-第 4 页,共 21 页 -CGA(Compact Genetic Algorithm)。1997 至 2000 年是 EDA 迅速发展的黄金时期,期间出现了多种经典的研究多变量相关性的分布估计算法,如 MIMIC(Mutual Information Maximizing Input Clustering)、COMIT(Combining Optimizers with Mutual Information Trees)、FDA(Factorized Distribution Algorithm)和 BOA(Bayesian Optimization Algorithm)等。
8、其中,MIMIC由 De Bonet 于 1997 年提出,它采用了一种链式关系来描述变量之间的关系。在MIMIC的基础上,Baluja 于 1997 年提出了另一种双变量相关分布估计算法COMIT,它采用树状结构来描述变量之间的关系。由于MIMIC和 COMIT 所采用的链式和树状结构依然无法完美地表达变量之间的关系,M hlenbein 于 1998 年提出了另一种经典的分布估计算法FDA,它需要预先给定变量之间的依赖关系。BOA 则由 Pelikan 于 1999 年提出,它采用了贝叶斯网络来描述变量之间的关系。上述的几种分布估计算法都是以二进制编码的形式来描述的,最原始的实数编码分布估
9、计算法是Servet 等于 1997 年提出的一种基于均匀分布的实数编码PBIL。该算法以类似二分法搜索的形式逼近最优解,实验表明该算法在搜索过程中容易丢失全局最优解,而且一旦丢失就再也无法找回。随后,Sebag于 1998 年提出了一种基于高斯分布的实数编码PBIL,解决了全局最优解的丢失问题,因而有较好的性能(该算法被简称为PBILc)。与 UMDA对应,Larranaga 于 2000 年提出了UMDAc。此外,日本学者Tsutsui 还于 2001 年提出了一种基于直方图的实数编码分布估计算法HEDA,Ahn 则于 2004 年将 BOA 拓展到实数编码。可见,实数编码的分布估计算法在
10、2000 年前后迅速发展,而高斯分布是其中被应用得最广泛的概率模型。随着实数编码EDA 和多变量相关EDA 的迅速发展,结合 EDA 与其它进化算法的混合分布估计算法(Hybrid EDA)、自适应分布估计算法(Adaptive EDA)、并行分布估计算法(Parallel EDA)以及关于分布估计算法的理论研究都开始踏入EDA 发展的历史舞台,成为了名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,共 21 页 -当前 EDA 研究的热点。在混合EDA 反面,Pena等提出了结合遗传算法与分布估计算法的GA-EDA,Zhang 等提出了结合差分算法的DE-EDA 以及结合局部搜索算法
11、的EDA/L,Iqbal和 Wang分别提出以不同形式结合粒子群算法的PSO-EDA 等。在自适应分布估计算法方面,Lu 提出了基于聚类分析的自适应EDA,在一定程度上克服了单一高斯分布的EDA 难于求解多峰函数优化问题的缺点;Santana 则提出了采用多种概率模型产生样本的方法。在并行分布估计算法方面,近年来陆续提出了一些并行策略,主要集中于概率模型学习的并行化。随着对分布估计算法的理论研究的不断深入,许多研究者开始采用分布估计算法解决复杂的优化问题。目前,分布估计算法的主要研究领域包括函数优化、组合优化、生物信息、多目标优化和机器学习等。可以预计,拓展分布估计算法的应用将是进化计算领域的
12、又一个研究热点。经过十多年的发展,分布估计算法已经成为当前国际学术界的一个热门课题。其中,权威的国际期刊Evolutionary Computation 于2005 年出版了分布估计算法的专刊;ACM SIGEVO、IEEE CEC 等许多权威国际学术会议都设有分布估计算法的专题讨论。三、一个简单的分布估计算法下面详细描述使用UMDA 分布估计算法优化OneMax 问题的演化过程。UMDA 算法执行步骤如下:第一步:随机产生N 个个体组成一个初始种群,并评估初始种群中所有个体的适应度;第二步:按适应度从高到低的顺序对种群进行排序,并从中选出最优的Se 个个体(SeN);第三步:分析产生的Se个
13、个体所包含的信息,估计其联合概率分布p(x)。p(x)=p(x|DSe)=p(xi)(in),其中 n 为解的维数,p(xi)为每维变量的边缘分布。第四步:从构建的概率模型p(x)中采样,得到N 个新样本,构成新种群。此时,若达到算名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 21 页 -法的终止条件则结束,否则执行第二步。UMDA在估计概率模型时,认为变量之间是相互独立的,早期所提出的分布估计算法如 PBIL 和 CGA 都采用变量无关的概率模型。OneMax 问题:对于固定长度为N 的二进制串,OneMax 问题要求找到一个包含1 的个数最多的二进制串,即找到x=(x1,x
14、2,.,xN),xi0,1,使得 F(x)=xi(1iN)最大化。我们用一个简单的概率向量p=(p1,p2,p3,p4)来表示描述种群分布的概率模型,其中pi表示 xi取 1 的概率,(1-pi)则为 xi取 0 的概率。第一步:产生初始种群。为了使初始种群在定义域内符合均匀分布,我们定义初始化概率向量模型p=(0.5,0.5,0.5,0.5),然后根据p 产生规模为10 的初始种群,最后根据F(x)=x1+x2+x3+x4计算出初始种群的适应度,最终结果如下:编号x1x2x3x4f 1 2 3 4 5 6 7 8 9 10 1 1 0 0 1 0 1 0 1 1 1 0 1 1 1 1 0
15、0 0 0 0 0 0 1 0 1 1 1 0 0 1 0 0 1 1 0 0 1 0 1 3 1 1 3 3 2 2 2 1 2 第二步:按照种群的适应度从高到低进行排序。从种群中选出适应度较高的5 个个体用名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 21 页 -来更新概率向量模型p。XS表示选择后的优势群体,概率向量p 通过式 pi=P(xi=1|XS)更新,例如 p1=P(x1=1|XS)=0.6,最终得到新的概率向量模型为p=(0.6,0.8,0.6,0.6)。选择操作后的优势群体如下:编号原编号x1x2x3x4f 1 2 3 4 5 1 4 5 6 7 1 0 1
16、0 1 1 1 1 1 0 0 1 0 1 1 1 1 1 0 0 3 3 3 2 2 第三步:根据更新后的概率模型p 产生新的样本,并计算这些样本的适应度。最终得到新一代的种群如下:编号x1x2x3x4f 1 2 3 4 5 6 7 8 9 10 1 0 0 1 0 0 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 0 1 1 1 1 1 1 0 0 0 0 1 1 1 0 0 1 1 0 2 1 3 4 3 1 3 4 3 2 名师资料总结-精品资料欢迎下载-名师精心整理-第 8 页,共 21 页 -通过以上三步,分布估计算法完成了第一代的进化过程。接着重复第二步和第三步完成
17、下一代的进化,最终得到的种群平均适应度和概率模型如下表所示。我们可以看出,随着演化的进行,种群的整体质量不断提高,概率向量逐渐逼近全局最优解。进化代数概率向量种群平均适应度1 2 3 4 5(0.5,0.5,0.5,0.5)(0.6,0.8,0.6,0.6)(0.8,1.0,0.6,0.8)(1.0,1.0,1.0,0.8)(1.0,1.0,1.0,1.0)2.2 2.6 2.9 3.8 4.0 分布估计算法的总体框架如下,各种算法总体框架一样,只是所采用的概率模型(或者编码方式)存在差异。?Estimation of Distribution Algorithms do just that!
18、?Typically they operate as follows:Step 0:Randomly generate a set of individuals(t=0)Step 1:Evaluate the individuals While(not done)Step 2:Select individuals(where)to be parents?Develop a probability distribution/density function,pt,based on the parents Step 3:Create offspring using ptStep 4:Evaluat
19、e the offspring Step 5:The offspring replace the parents(t=t+1)名师资料总结-精品资料欢迎下载-名师精心整理-第 9 页,共 21 页 -Step 6:Goto While 我们再来比较看一下Basic PBIL:算法描述?P initialize probability vector(each position=0.5)?while(generations+limit)for each vector i do for each position j do generate Vi(j)according to P(j)end-do
20、evaluate f(Vi)end-do Vmax=max(f(Vi)update P according to Vmax if random(0,1 Pmutate mutate P end-if?end-while Details?Population replaced by probability vectorP=p1,p2,p?pi:Probability of 1 in the ith bit?Generate n individuals 名师资料总结-精品资料欢迎下载-名师精心整理-第 10 页,共 21 页 -?Update P using the best individual
21、 pi(t+1)=xi+pi(t)(1-),i=1,2,?Mutate P:pi(t+1)=mU0,1)+pi(t+1)(1-m)Example?t=0,P=0.5,0.5,0.5,0.5?Generate 5 individuals 1010,1100,0100,0111,0001?Fitness:2,2,1,3,1?Best individual:0111;=0.1?Update P p1=0.5*(1-0.1)=0.45 p2=p3=p4=0.1*1+0.5*(1-0.1)=0.55 四、分布估计算法经典概率模型比较经过十多年的发展,分布估计算法已经有了许多形式的改进:从求离散问题的分布
22、估计分布估计算法所采用的概率模型变量无关型双变量相关模型多变量相关模型PBIL:Baluja 1994 UMDA:M hlenbein 1996 CGA:Harik 1997 MIMIC:Bonet 1997 COMIT:Baluja 1997 BMDA:Pelikan 1999 FDA:M hlenbein 1999 BOA:Pelikan 1999 ECGA:Harik 1999 名师资料总结-精品资料欢迎下载-名师精心整理-第 11 页,共 21 页 -算法扩展到求连续问题的分布估计算法;从变量无关的分布估计算法扩展到多变量相关的分布估计算法;从单一的分布估计算法扩展到混合其它算法,甚至
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年自创-分布估计算法综述资料 2022 自创 分布 估计 算法 综述 资料
限制150内