第九章 基因算法.ppt
《第九章 基因算法.ppt》由会员分享,可在线阅读,更多相关《第九章 基因算法.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章第九章 基因算法基因算法一、概述一、概述一、概述一、概述AnEAisaniterativeprocedurewhichevolvesapopulationofindividualsEachindividualisacandidatesolutiontoagivenproblemEachindividualisevaluatedbyafitness function,whichmeasuresthequalityofitscandidatesolutionAteachiteration(generation):ThebestindividualsareselectedGeneticoper
2、atorsareappliedtoselectedindividualsinordertoproducenewindividuals(offspring)NewindividualsareevaluatedbyfitnessfunctionBasicIdeasofEvolutionaryAlgorithms(EAs)BasicFlowChartofEAscreateinitialpopulationcomputefitnessselectbestindividuals(basedonfitness)modifybestindividuals,producingoffspringcomputef
3、itnessofoffspringNstop?YReturnbestindividual(solution)一、概述一、概述What is evolution?Evolutionisagradualprocessofchangeinthegeneticcompositionofapopulation,asaresultofnaturalselectionactingongeneticvariationamongindividualsBasic Elements of an Evolutionary Process:ReproductionwithinheritanceGeneticvariat
4、ion(usuallyproducedbyrandommodifications)Naturalselection(survivalofthefittest)Evolutionary Biology一、概述一、概述 遗传学遗传学 GA 染色体(染色体(Chromosome)数据、数组、位串数据、数组、位串 基因(基因(gene)位位 等位基因(等位基因(allele)特性值特性值 基因座(基因座(locus)串中位置串中位置 基因型(基因型(genotype)解结构(基因空间)解结构(基因空间)表现型(表现型(phenotype)解结构(问题空间)解结构(问题空间)遗传算法是模拟遗传选择,优胜
5、劣汰,适者生存的生物进化过程的计算模型。它是由美国Michigan 大学的J.Holland教授于1975年首先提出的。遗传和变异是决定生物进化的内在因素。生物体通过对基因的复制和交叉的操作使其性状的遗传得到选择和控制,使生物界的物种能够保持相对的稳定;同时,通过基因组合、基因变异等操作产生丰富多样的新性状,新物种,推动了生物的进化和发展。GA是一种新的全局优化随机搜索算法。GA搜索不依赖梯度信息,简单通用、鲁棒性强,适合并行分布处理,应用范围广,尤其适用于解决传统方法难以解决的复杂和非线性问题。二、遗传算法二、遗传算法初始群体评估每个个体选择交叉结束是否优解?开始解编码评估函数遗传操作标准的
6、遗传算法标准的遗传算法是具有是具有“生成生成 +检测检测(generate-and-testgenerate-and-test)迭代过程的搜索算法。迭代过程的搜索算法。遗传算法通过遗传算法通过迭代进化,迭代进化,从一群初始解找到所期望从一群初始解找到所期望的解的解新群体变异遗传算法(遗传算法(SGA)l 爬山法或梯度法仅能到达爬山法或梯度法仅能到达局部最优解局部最优解GA versus“Traditional”search/optimization algorithmsl模拟退火算法允许以一定模拟退火算法允许以一定的概率降低到较小的适应的概率降低到较小的适应度,从而获得越过低谷,度,从而获得越
7、过低谷,爬上全局高峰的机会爬上全局高峰的机会二、遗传算法二、遗传算法l GAGA或或EAsEAs 是一种多点并行分布式全局优化搜索算法是一种多点并行分布式全局优化搜索算法二、遗传算法二、遗传算法 多点并行搜索多点并行搜索 基本上不用搜索空间的知识,仅用适应度函数来评估。适应度函数不受基本上不用搜索空间的知识,仅用适应度函数来评估。适应度函数不受 连续可谓的约束,对定义域可以任意设置。对适应函数唯一要求是输出连续可谓的约束,对定义域可以任意设置。对适应函数唯一要求是输出 为正,以便比较。为正,以便比较。GA GA不是直接处理问题参数,而是对参数集进行编码后进行处理。为此,不是直接处理问题参数,而
8、是对参数集进行编码后进行处理。为此,GA GA可直接对结构对象进行操作。如集合、序、列、矩阵、树、图、链和可直接对结构对象进行操作。如集合、序、列、矩阵、树、图、链和 表等一维或二维甚至三维结构对象,扩大了应用范围。表等一维或二维甚至三维结构对象,扩大了应用范围。通过对权矩阵的操作,通过对权矩阵的操作,GAGA可以对可以对NNNN的权甚至结构进行优化。的权甚至结构进行优化。通过对集合的操作,通过对集合的操作,GAGA可以实现规则集或知识库的自适应优化可以实现规则集或知识库的自适应优化通过对树的操作,通过对树的操作,GAGA可得到用于分类的最佳决策树。可得到用于分类的最佳决策树。GA GA不是采
9、用确定规则,而是采用概率的搜索规则。但是,不是采用确定规则,而是采用概率的搜索规则。但是,GAGA不是一种盲不是一种盲 目搜索方法,而是有明确的搜索方向。目搜索方法,而是有明确的搜索方向。增量式进化增量式进化遗传算法的特点遗传算法的特点二、遗传算法二、遗传算法尤其当:其他各种方法太慢或过于复杂求解的问题类似于GA已成功应用的问题搜索空间太大且包含相当多的局部解多目标优化变化环境或噪声环境GA应用:应用:二、遗传算法二、遗传算法三、SGAEncodingtechnique(gene,chromosome)Initializationprocedure(creation)Evaluationfun
10、ction(environment)Selectionofparents(reproduction)Geneticoperators(mutation,crossover)Parametersettings(practice and art)SGA中的关键要素13三、SGASGASGA采用二进制编码,这是最简单也较常用的个体表示采用二进制编码,这是最简单也较常用的个体表示方法方法Chromosomescouldbe:Bitstrings(0101.1100)Realnumbers(43.2-33.1.0.089.2)Permutationsofelement(E11E3E7.E1E15)Lis
11、tsofrules(R1R2R3.R22R23)Programelements(geneticprogramming).anydatastructure.nRepresentation(encoding)三、SGAEvaluationEvaluatedgenerationgenerationnEvaluation:GAGA基本上不用外部信息,仅用适应度函数来评估每个个体。基本上不用外部信息,仅用适应度函数来评估每个个体。评估时需要评估时需要decodingdecoding,即把,即把genotypegenotype解转换为解转换为phenotypephenotype解,以便利用评估函数或适应函
12、数。解,以便利用评估函数或适应函数。X(=39)Coding and decoding解(个体)在问题空间和遗传空间的转换,即解(个体)在问题空间和遗传空间的转换,即phenotypephenotype 解和解和genotypegenotype解之间的转换解之间的转换。三、SGA利用赌轮(roulette wheel)法fitnessproportionateexpectedno.ofrepresentativesofeachindividualisproportionaltoitsfitnessn选择(Selection)三、SGAf1f2f3f4f5f6f7n=7roulette whee
13、l三、SGA根据概率的大小将将圆盘分为 n个扇形,每个扇形的大小为选择时转动轮盘,参考点r落到扇形i则选择个体i。从一对父辈产生一对子辈单点交叉交叉概率pctypicallyinrange0.5,1.0Crossover是GA最本质的遗传算子:在进化中,能加速搜索能形成schemata的有效组合(subsolutionsondifferentchromosomes)nCrossover(recombination)三、SGAOne-Point Cross-Over三、SGAparentsChildrenbitwisemutationprobabilityofmutation:pmequalpr
14、obabilityforeachgene/bittypicallychosentobesmallrang:0.001,0.1fewmutationsperindividualdependsonnatureofproblemnMutation三、SGABefore:(11110110)After:(11100110)Before:(1.38-69.4326.440.1)After:(1.38-67.5326.440.1)三、SGAExamples:三、SGArepresentation eachchromosomecontain8”genes”,codingforlettersfitness-f
15、unctionfitnessbethenumberofcorrectletters example2:problem:correctly spelling“SEQUENCE”with GACrossoverandmutation三、SGATypically,the populations average fitness will initially increase rapidly,and then gradually converge四、四、GA的理论概述的理论概述 模式模式(schema)(schema)基于字符集基于字符集0,1,0,1,*所产生的能描述具有某些结构所产生的能描述具有某些
16、结构相似性的相似性的0 0,1 1字符串字符串 例:模式例:模式H 0*1 H 0*1 描述了具有相似结构的四个个体描述了具有相似结构的四个个体 0 000001 1,0 001011 1,0 011111 1,0 010101 1显然,一个个体可有包含多个模式,一个模式可显然,一个个体可有包含多个模式,一个模式可 以存在于多个个体中,以存在于多个个体中,如果说最优个体(解)对应一个明确的字符串或模如果说最优个体(解)对应一个明确的字符串或模式,那么遗传算子作用就是使群体中的个体模式不式,那么遗传算子作用就是使群体中的个体模式不断地向优解逼近。断地向优解逼近。模式阶模式阶(schema ord
17、er)(schema order)模式模式H H中有确定值的基因座个数称为模式中有确定值的基因座个数称为模式H H的阶的阶 O(H)O(H)如:如:模式模式011*1*011*1*的阶数的阶数O(H)=4 O(H)=4 模式模式0*0*的阶数的阶数O(H)=1O(H)=1 显然,一个模式的阶数越低,其生存能力越强显然,一个模式的阶数越低,其生存能力越强 定义距定义距(defining length)(defining length)模式模式H H中第一个有确定值的基因座和最后一个有确定值中第一个有确定值的基因座和最后一个有确定值 的基因座之间的距离的基因座之间的距离(H)(H)如:如:模式模式
18、011*1*011*1*的定义距的定义距(H)=4 (H)=4 模式模式0*0*的的定义距定义距(H)=0(H)=0 显然,一个模式的阶数越低,其生存能力越强显然,一个模式的阶数越低,其生存能力越强四、四、GA的理论概述的理论概述遗传算子对模式的影响遗传算子对模式的影响 着眼某个模式着眼某个模式H H,考虑遗传操作(再生、交叉和变异),考虑遗传操作(再生、交叉和变异)对包含该模式的个体数的影响对包含该模式的个体数的影响再生(再生(reproduction)reproduction)或选择(或选择(selection)selection)设第设第k k代中,包含代中,包含H H的个体数为的个体数
19、为m(H,km(H,k););这些个体的这些个体的平均适应度为平均适应度为f(H,kf(H,k),),群体中所有个体的平均适应度群体中所有个体的平均适应度为为 ,则基于平均适应度选择法得到选择或再生,则基于平均适应度选择法得到选择或再生的个体数期望值为:的个体数期望值为:What will happen if only selection is used in GAs?四、四、GA的理论概述的理论概述交叉交叉(crossover)设交叉概率为 ,由于交叉使包含H的个体被破坏的概率为:交叉结果也会有未被破坏的包含H的个体保留下来。此外,交叉也 会生成包含相同H的新个体。为此,经交叉操作后包含H的
20、个体数期 望值为:变异变异(mutation)(mutation)设变异概率为 ,经变异操作后包含H的个体数的期望值为:The crossover and mutation can generate new and possibly better individuals,they can also destroy good individuals.Do you have any idea to avoid this problem?四、四、GA的理论概述的理论概述模式定理模式定理(schema theorem)(schema theorem)Short,loworder,aboveaverag
21、eschemataaremultipliedexponentiallyinsubsequentgenerationsofageneticalgorithmshort,loworderandaboveaverageschema(goodschemata)arecalledbuildingblocks.Buildingblockswillbemultipliedveryquicklyduringevolution.UsingGAs,wecanalwaysgetgoodindividualscontaininggoodbuildingblocks考虑到群体平均适应度的作用,此式不能递归使用考虑到群体
22、平均适应度的作用,此式不能递归使用未能说明优化未能说明优化仅适用于仅适用于SGASGA四、四、GA的理论概述的理论概述Bycrossover,weexchangetheblocksthatdefinegoodsolutions:SchemaTheorem:withtheevaluationofagenotypewealsoimplicitlyevaluateallitscomponentsaboutO(n3)(Hollands estimate)schemataprocessedsuccessfullyimplicitparallelismeventhoughateachgenerationc
23、omputationproportionaltosizeofthepopulation(O(n)isperformedoneofthemainreasonsforsuccessofGAs隐并行性(隐并行性(implicit parallelism)四、四、GA的理论概述的理论概述积木块假设积木块假设(building block hypothesis)(building block hypothesis)低阶、短距且平均适应度高的模块称谓积木块低阶、短距且平均适应度高的模块称谓积木块 积积木木块块在在遗遗传传操操作作下下相相互互组组合合能能逐逐步步形形成成高高阶阶、长长距距且且平平均均适适应应
24、度度高高的的模模块块,最最终终生生成成最最优优解解或准最优解或准最优解仅仅是假设,但对于初始群体的产生有参考价仅仅是假设,但对于初始群体的产生有参考价值。值。四、四、GA的理论概述的理论概述五、五、GA算法分析算法分析编码编码l遗传算法主要是通过遗传操作对群遗传算法主要是通过遗传操作对群体中具有某种结构形式的个体进行体中具有某种结构形式的个体进行重组处理,形成并优化积木块以逐重组处理,形成并优化积木块以逐渐逼近最优解。渐逼近最优解。l通过编码和译码操作,解在两个空通过编码和译码操作,解在两个空间转换间转换l编码策略和交叉策略是互为依存的。编码策略和交叉策略是互为依存的。恰当的设计编码和交叉方法
25、对于恰当的设计编码和交叉方法对于GAGA的有效运作是十分重要的的有效运作是十分重要的l积木块原则积木块原则:编码应易于生成与所编码应易于生成与所求问题相关的短距、低阶积木快求问题相关的短距、低阶积木快l最小字符集原则:最小字符集原则:编码应采用最小编码应采用最小字符集字符集GA空间遗传空间12c12c比较一下二值编码和非二值编码(在A-Z26个字符和1-66个数字组成的字符集上),仍然以求f=x最大值为例X值二进制码非二值码适应度132481901101110000100010011N Y I T16957664561 二进制码个体的相似性易于观测,每位可提供最多的二进制码个体的相似性易于观测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 基因算法 第九 基因 算法
限制150内