高级人工智能13107.pptx
《高级人工智能13107.pptx》由会员分享,可在线阅读,更多相关《高级人工智能13107.pptx(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十三章第十三章 进化计算进化计算 Ev Evo olutionary Computationlutionary Computation 2023/5/132内内 容容13.1 概述13.2 进化系统理论的形式模型13.3 达尔文进化算法13.4 遗传算法13.5 遗传算法的理论基础13.6 遗传算法的改进13.7 遗传机器学习分类器系统13.8 桶链算法13.9 规则发现系统13.10 进化策略13.11 进化规划2023/5/1331 13.1 3.1 概概 述述 进化计算是通过模拟自然界中生物进化机制进行搜索的一种算法。2023/5/134发展历史发展历史进化计算的研究起源于20世纪50
2、年代。1965年,Holland首次提出了人工遗传操作的重要性,并把这些应用于自然系统和人工系统中。大约在同一时期:Rechenberg和Schwefel提出了进化策略。Fogel提出了进化规划。2023/5/135发展历史发展历史 1967年,Bagley在他的论文中首次提出了遗传算法这一术语,并讨论了遗传算法在自动博弈中的应用。1970年,Cavicchio把遗传算法应用于模式识别中。第一个把遗传算法应用于函数优化的是Hollstien。2023/5/136发展历史发展历史1975年是遗传算法研究的历史上十分重要的一年。这一年,Holland出版了他的著名专著自然系统和人工系统的适应性该书
3、系统地阐述了遗传算法的基本理论和方法,并提出了对遗传算法的理论研究和发展极为重要的模式理论(schemata theory),该理论首次确认了结构重组遗传操作对于获得隐并行性的重要性。同年,DeJong完成了他的重要论文遗传自适应系统的行为分析。他在该论文中所做的研究工作可看作是遗传算法发展过程中的一个里程碑,这是因为他把Holland的模式理论与他的计算使用结合起来。2023/5/137发展历史发展历史1989 Goldberg对遗传算法从理论上,方法上和应用上作了系统的总结。1990年,Koza提出了遗传规划(Genetic Programming)的概念。(用于搜索解决特定问题的最适计算
4、机程序)2023/5/138遗传算法与自然进化的比较遗传算法与自然进化的比较自然界染色体基因等位基因(allele)染色体位置(locus)基因型(genotype)表型(phenotype)遗传算法字符串字符,特征特征值字符串位置结构参数集,译码结构2023/5/139新达尔文进化理论的主要论点新达尔文进化理论的主要论点1)个体是基本的选择目标;2)随机过程在进化中起重大作用,遗传变异大部分是偶然现象;3)基因型变异大部分是重组的产物,特别是突变;4)逐渐进化可能与表型不连续有关;5)不是所有表型变化都是自然选择的必然结果;6)进化是在适应中变化的,形式多样,不仅是基因的变化;7)选择是概率
5、型的,而不是决定型的。2023/5/1310进化计算的三大主流板块进化计算的三大主流板块lHolland提出的遗传算法(Genetic Algorithm)。lRechenberg和Schwefel提出的进化策略(Evolutionary Strategies)。lFogel提出的进化规划(Evolutionary Programming),又称为进化程序设计。l本章将着重介绍遗传算法,对进化策略和进化规划只作简单介绍。2023/5/13111 13.2 3.2 进化系统理论的形式模型进化系统理论的形式模型 进化在个体群体中起作用。瓦铤顿(Waddington)指出基因型和表型之间关系的重要性
6、(Waddington 1974)。群体禁止异构环境。但是“后生环境”是多维空间。表型是基因型和环境的产物。然后表型通过异构“选择环境发生作用。注意,这种多维选择环境与后生环境空间是不同的。现在,适应性是表型空间和选择环境空间的产物。它经常被取作一维,表示多少子孙对下一代作出贡献。基于这种想法,莫楞贝(Muhlenbein)和肯德曼(Kindermann)提出了一种称为进化系统理论的形式模型(Muhlenbein 1989)。2023/5/1312 进化系统理论的形式模型进化系统理论的形式模型进化的主要过程后生环境遗传操作符选择环境gp2023/5/1313进化系统理论的形式模型进化系统理论的
7、形式模型 其中,g 是基因型 p 是表型。基因gi的可能值称为等位基因。在门德尔(Mendel)遗传学中,假设每个基因有有限数的等位基因。2023/5/1314进化系统理论的形式模型进化系统理论的形式模型这个变换函数给出了模型,说明表型的发展是通过基因与环境的交互作用。变换过程是高度非线性的。2023/5/1315进化系统理论的形式模型进化系统理论的形式模型质量函数q给出了具体选择环境ESi下表型的质量,其定义如下:质量定义适应度,用于达尔文选择。至今已有三种具体范例的通用模型,即 门德尔遗传学 遗传生态学 进化配子2023/5/1316 门德尔遗传学门德尔遗传学在门德尔遗传学中,基因型被详细
8、模型化,而表型和环境几乎被忽略。在遗传生态学中恰好相反。进化配子论是从社会生物学导出的模型。首先让我们讨论门德尔遗传学的选择模型。为了简单起见,我们假设一个基因具有n 等位基因a1,an。二倍基因型以元组(ai,aj)为特征。我们定义 pi,j 为总群体中基因型(ai,aj)的频度。假设基因型与表型相等。质量函数给每个表型赋值。q(ai,aj)=qi,j qi,j 可以被解释为出生率减去死亡率 2023/5/1317 门德尔遗传学门德尔遗传学假设 pi,j是下一代表型(ai,aj)的频度。然后达尔文选择根据选择方程调整表型的分布:是群体的平均适应度。2023/5/1318 门德尔遗传学门德尔遗
9、传学设 pi 是群体中等位基因的频率。如果 pi,j =pi pj那么,我们得到在 GS中的一个选择方程为 2023/5/1319 门德尔遗传学门德尔遗传学这个离散的选择方程可以用连续方程近似:如果 qi,j=qj,i,那么2023/5/1320 门德尔遗传学门德尔遗传学这个方程很容易被证明:这个结果称作菲希尔(Fisher)基本定理。它说明平均适应度随适应度的差别呈正比例增加。实际上,全部可能的基因型仅有一部分实现。这就是遗传操纵子探索基因型空间的任务,其个体数目相当小。这些操纵子是群体遗传变异性的来源。最重要的操纵子是突变和重组。2023/5/132113.3 13.3 达尔文进化算法达尔
10、文进化算法根据定量遗传学,达尔文进化算法采用简单的突变/选择动力学。达尔文算法的一般形式可以描述如下:是一代的双亲数目,为子孙数目。整数 称作“混杂”数。如果两个双亲混合他们的基因,则 =2。仅 是最好的个体才允许产生子孙。逗号表示双亲们没有选择,加号表示双亲有选择。2023/5/132213.3 13.3 达尔文进化算法达尔文进化算法1)建立原始种体。2)通过突变建立子孙。3)选择:4)返回到步骤(1)。2023/5/1323 遗传算法思想来源于生物进化过程,它是基于进化过程中的信息遗传机制和优胜劣汰的自然选择原则的搜索算法(以字符串表示状态空间)。遗传算法用概率搜索过程在该状态空间中搜索,
11、产生新的样本。13.4 13.4 遗传算法遗传算法2023/5/1324遗传算法的特点遗传算法的特点特点:通用鲁棒次优解、满意解遗传算法能解决的问题:优化NP完全NP难高度复杂的非线性问题2023/5/1325遗传算法遗传算法遗传算法先将搜索结构编码为字符串形式,每个字符串结构被称为个体。然后对一组字符串结构(被称为一个群体)进行循环操作。每次循环被称作一代,包括一个保存字符串中较优结构的过程和一个有结构的、随机的字符串间的信息交换过程。类似于自然进化,遗传算法通过作用于染色体上的基因寻找好的染色体来求解问题。2023/5/1326 遗传算法遗传算法与自然界相似,遗传算法对求解问题的本身一无所
12、知,它所需要的仅是对算法所产生的每个染色体进行评价,并基于适应值来选择染色体,使适应性好的染色体有更多的繁殖机会。在遗传算法中,位字符串扮演染色体的作用,单个位扮演了基因的作用,随机产生一个体字符串的初始群体,每个个体给予一个数值评价,称为适应度,取消低适应度的个体,选择高适应度的个体参加操作。常用的遗传算子有复制、杂交、变异和反转。2023/5/1327遗传算法与传统优化算法的主要不同遗传算法与传统优化算法的主要不同1)遗传算法不是直接作用在参变量集上,而是利用参变量集的某种编码;2)遗传算法不是从单个点,而是在群体中从一个点开始搜索;3)遗传算法利用适应值信息,无需导数或其它辅助信息;4)
13、遗传算法利用概率转移规则,而非确定性规则。2023/5/1328遗传算法的准备工作遗传算法的准备工作1)确定表示方案;2)确定适应值的度量;3)确定控制该算法的参数和变量;4)确定怎样指定结果及程序运行结束的标准。2023/5/1329基本遗传算法基本遗传算法基本遗传算法(Simple Genetic Algorithm:SGA)又称为简单遗传算法,只使用选择算子、交叉算子和变异算子这三种基本的遗传算子。其遗传操作简单、容易理解,是其它遗传算法的雏形和基础。基本遗传算法的构成要素:1、染色体编码方法:首先必须对问题的解空间进行编码,使之能用遗传算法进行操作。较常用的是二进制编码方法,现在使用非
14、二进制编码的也逐渐增多。2、适应度函数(fitness function,又称为适应值适值函数)用来评价一个染色体的好坏。2023/5/1330基本遗传算法的构成要素基本遗传算法的构成要素3、遗传算子 选择算子(selection):又称为复制算子。按照某种策略从父代中挑选个体进入下一代,如使用比例选择、轮盘式选择。交叉算子(crossover):又称为杂交算子。将从群体中选择的两个个体,按照某种策略使两个个体相互交换部分染色体,从而形成两个新的个体。如使用单点一致交叉。变异算子(mutation):按照一定的概率(一般较小),改变染色体中某些基因的值。2023/5/1331杂交操作举例杂交操
15、作举例10220201No OffspringPt.of interchangeCrossoverParentsOffspring1110#0#1#0111#0001#11#010#1000#00#110#01#10#100100100#011161711110#11#0001#0#0001#11#00#11#00#110#01#10#000#01111#01#10#2023/5/1332变异操作变异操作简单的变异操作过程如下:每个位置的字符变量都有一个变异概率,各位置互相独立。通过随机过程选择发生变异的位置:产生一个新结构 ,其中 是从对应位置 的字符变量的值域中随机选择的一个取值。可以同样
16、得到。2023/5/1333反转操作反转操作简单反转操作的步骤如下:1)从当前群体中随机选择一个结构2)从中随机选择两个数i和j,并定义 i=mini,j,j=maxi,j;3)颠倒a中位置i、j之间的部分,产生新的结构2023/5/1334基本遗传算法的构成要素基本遗传算法的构成要素4、运行参数N:群体大小,即群体中包含的个体的数量。T:遗传算法终止的进化代数。Pc:交叉概率,一般取为 0.40.99。Pm:变异概率,一般取为 0.00010.1。2023/5/1335基本遗传算法基本遗传算法1.随机产生一个由固定长度字符串组成的初始群体;2.对于字符串群体,迭代地执行下述步骤,直到选种标准
17、被满足为止:1)计算群体中的每个个体字符串的适应值;2)应用下述三种操作(至少前两种)来产生新的群体:复制:把现有的个体字符串复制到新的群体中。杂交:通过遗传重组随机选择两个现有的子字符串,产生新的字符串。变异:将现有字符串中某一位的字符随机变异。3.把在后代中出现的最高适应值的个体字符串指定为遗传算法运行的结果。这一结果可以是问题的解(或近似解)。2023/5/1336基本遗传算法流程图基本遗传算法流程图GEN=0概率地选择遗传操作随机创建初始群体计算群体中每个个体的适应值i:=0显示结果结束GEN:=GEN+1是是否(转下页)i=N?GEN=M?12023/5/1337概率地选择遗传操作根
18、据适应值选择一个个体完成交叉i:=i+1i:=i+1复制个体p(r)选择(接上页)基于适应值选择两个个体把新的两个孩子加到群体中p(c)交叉变异p(m)把新的孩子加入到群体中完成变异根据适应值选择一个个体把变异后个体加入到群体中12023/5/1338轮盘式选择轮盘式选择l首先计算每个个体 i 被选中的概率l然后根据概率的大小将将圆盘分为 n个扇形,每个扇形的大小为 。选择时转动轮盘,参考点r落到扇形i则选择个体i。.p1p2pir2023/5/1339单点一致交叉单点一致交叉l首先以概率pc从种群中随机地选择两个个体p1、p2。在1,2,.,l内随机选择一个数i,作为交叉的位置,称为交叉点。
19、然后将两个个体交叉点后面的部分交换。l例如:0110 101100 0110 011001 1100 011001 1100 1011002023/5/1340一致变异一致变异以概率pm对种群中所有个体的每一位进行变异。对于个体pi的第j位,在0,1的范围内随机地生成一个数r,如果 r pm,则对第j位取反,否则保持第j位不变。2023/5/1341遗传算法举例遗传算法举例问题:求(1)编码:此时取均长为5,每个染色体(2)初始群体生成:群体大小视情况而定,此处设置为4,随机产生四个个体:编码:01101,11000,01000,10011 解码:13 24 8 19 适应度:169 576
20、64 361(3)适应度评价:2023/5/1342(4)选择:选择概率 个体:01101,11000,01000,10011 适应度:169 576 64 361 选择概率:0.14 0.49 0.06 0.31选择结果:01101,11000,11000,10011(5)交叉操作:发生交叉的概率较大 哪两个个体配对交叉是随机的 交叉点位置的选取是随机的(单点交叉)0110 1 01100 11 000 11 011 1100 0 11001 10 011 10 000遗传算法举例遗传算法举例2023/5/1343(6)变异:发生变异的概率很小(7)新群体的产生:保留上一代最优个体,一般为1
21、0%左右,至少1个 用新个体取代旧个体,随机取代或择优取代。11000,11011,11001,10011(8)重复上述操作:说明:GA的终止条件一般人为设置;GA只能求次优解或满意解。分析:按第二代新群体进行遗传操作,若无变异,永远也找不到最优解择优取代有问题。若随机的将个体01101选入新群体中,有可能找到最优解。遗传算法举例遗传算法举例2023/5/134413.5 13.5 遗传算法的理论基础遗传算法的理论基础13.5.1 模式的定义 遗传算法的理论基础是遗传算法的二进制表达式及模式的含义。模式是能对染色体之间的相似性进行解释的模板。定义1 设GA的个体 ,记集合 则称 为一个模式,其
22、中是通配符。即模式(schema)是含有通配符(*)的一类字符串的通式表达。每个“*”可以取“1”或者“0”。2023/5/1345模式举例模式举例l模式*10101110 与以下两个字符串匹配:010101110 110101110l而模式 *1010110 与以下四个字符串匹配:010100110 010101110 110100110 1101011102023/5/1346模式的定义模式的定义l定义2 一个模式模式s s的阶的阶是出现在模式中的“0”和“1”的数目,记为o(s)。如:模式“0*”的阶为1,模式“10*1*”的阶为3。l定义3 一个模式模式s s的长度的长度是出现在模式中
23、第一个确定位置和最后一个确定位置之间的距离,记为 。如:模式“01*”的长度为1,模式“0*1”的长度为3。2023/5/1347 模式定理模式定理l假定在给定的时间步t,一个特定的模式s在群体P(t)中包含由m个代表串,记为m=m(s,t)。首先,我们暂不考虑交叉和变异操作。每个串根据适应值的大小获得不同的复制概率。串i的复制概率为:(1)2023/5/1348 模式定理模式定理l则在群体P(t+1)中,模式s的代表串的数量的期望值为:其中,表示模式s在t时刻的所有代表串的适应值的均值,称为模式s的适应值。(2)2023/5/1349 模式定理模式定理l若记P(t)中所有个体的适应值的平均值
24、为:(3)则(2)式可以表示为:2023/5/1350 模式定理模式定理l(3)式表明,模式s的代表串的数目随时间增长的幅度正比于模式s的适应值与群体平均适应值的比值。即:适应值高于群体平均值的模式在下一代的代表串数目将会增加,而适应值低于群体平均值的模式在下一代的代表串数目将会减少。l假设模式的适应值为 ,其中c是一个常数,则(3)式可写为:2023/5/1351 模式定理模式定理(4)上式表明,在平均适应值之上(之下)的模式,将会按指数增长(衰减)的方式被复制。2023/5/1352 模式定理模式定理复制的结果并没有生成新的模式。因而,为了探索搜索空间中的未搜索部分,需要利用交叉和变异操作
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 人工智能 13107
限制150内