第五章 机器学习优秀课件.ppt
《第五章 机器学习优秀课件.ppt》由会员分享,可在线阅读,更多相关《第五章 机器学习优秀课件.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 机器学习第1页,本讲稿共42页第五章 机器学习第二节 归纳学习一、基本含义 给定关于某个概念的一系列已知的正例和反例,从中归纳出一个一般的概念描述的过程。基本操作是泛化(Generalization)和特化(Specialization)二、分类1、实例学习 也称概念获取,确定概念的一般描述,这个描述应能解释所有给定的正例并排除所有给定的反例。这些正例和反例由信息源提供,是有教师学习。第2页,本讲稿共42页第五章 机器学习第二节 归纳学习二、分类2、观察与发现学习 也称描述的泛化,产生能解释所有或大多数观察到的事实的规律和规则。这类学习包括概念聚类、构造分类、发现定理、形成理论等。第3
2、页,本讲稿共42页第五章 机器学习第二节 归纳学习三、归纳学习方法有变型(版本)空间、决策树方法、AQ11算法等。第4页,本讲稿共42页第五章 机器学习第二节 归纳学习四、变型(版本)空间方法(Version Space)以整个规则空间为初始的假设规则集合H,依据训练例子中的信息,对集合H进行泛化和特化处理,逐步缩小集合H。Mitchell假定这个空间是一偏序结构,并将单个概念学习定义为在这个空间的搜索。泛化特化更一般更特殊没有描述GS第5页,本讲稿共42页第五章 机器学习第二节 归纳学习五、AQ归纳学习算法 生成的选择假设的析取,覆盖全部正例,而不覆盖任何反例。AQ11算法搜索规则空间,反复
3、应用消除候选元素,得到尽可能一般的规则,可包含多概念学习。注:AQ11的原理是将样本集构成一个逻辑公式。构成的方法是根据决策属性对样本集的划分,所有正样本与所有反样本构成逻辑公式EpEn,这个逻辑公式就是对正样本集的表示,其中每个样本是“属性值”对的合取连接式。六、产生与测试方法 仅通过正例学习概念,引入“概念窗口”概念。第6页,本讲稿共42页第五章 机器学习第二节 归纳学习七、决策树学习 决策树可以用来表示析取概念。1、CLS学习算法 从一个空决策树开始,通过增加决策结点,逐渐精化,直到树正确分类全部训练实例。其缺陷是学习问题不能太大。2、ID3学习算法 Quinlan 1979 采用训练实
4、例的子集(即,可选择窗口),通过属性,使用熵概念,来形成决策树。实质是构造一株熵值下降平均最快的判定树。注:ID3的数学基础是商集。第7页,本讲稿共42页第五章 机器学习第二节 归纳学习七、决策树学习3、ID4学习算法 在每个可能的决策树结点创造一系列表。每个表由全部未检测属性值和每个值的正例和反例数组构成。当处理一个新例时,每个属性值的正例和反例递增计量。即,递增概念归纳。4、ID5学习算法 抛弃旧的检测属性下面的子树,从下面选出检测属性形成树。5、C4.5和C5 处理连续属性。第8页,本讲稿共42页第五章 机器学习第二节 归纳学习八、归纳学习的计算理论 学习算法的样本复杂性和计算复杂性。G
5、old学习理论和Valiant学习理论。Valiant 关于可学习性的理论:概率地、近似地、正确地可学习的(PAC Probably、Approximately、Correct)PAC学习模型。第9页,本讲稿共42页第五章 机器学习第三节 分析学习一、类比学习1、类比 比喻 类比是人类重要的认知方法,是经验决策过程中常用的推理方式,是一种允许知识在具有相似性质的领域中进行转换的学习策略。2、类比学习 把两个或两类事物或情形进行比较,找出它们在某一抽象层次上的相似关系,并以这种关系为依据,把某一事物或情形的有关知识加以适当整理(或变换)对应到另一事物或情形,从而获得另一事物或情形的知识,称为类比
6、学习。第10页,本讲稿共42页第五章 机器学习第三节 分析学习一、类比学习2、类比学习 注:1)类比学习的核心技术是相似性的定义和度量。2)类比有多种形式,如,方法类比、概念类比、图形类比、联想型类比等等。3、类比学习主要步骤a)联想搜索匹配b)检验相似程度c)修正变换求解d)更新知识库第11页,本讲稿共42页第五章 机器学习第三节 分析学习一、类比学习4、类比学习方法a)转换类比b)派生类比c)基于案例的学习第12页,本讲稿共42页第五章 机器学习第三节 分析学习一、类比学习5、转换类比学习系统 主要由比较器、知识库、操作模块、解法栈、检验模块组成。6、派生类比 将转换类比进行扩充,对过去求
7、解的问题进行完整地派生跟踪。第13页,本讲稿共42页第五章 机器学习第三节 分析学习一、类比学习7、基于案例的学习 是基于类比的学习的进一步发展,特别适用于较难发现规律性知识、也不容易找到因果模型的领域。注:1)基于案例的学习所使用的案例库不象规则库那样有知识的不一致问题。2)基于案例的学习从其本性来说就是增量式学习。3)基于案例的学习需要保持和管理一组数量较大的案例。第14页,本讲稿共42页第五章 机器学习第三节 分析学习一、类比学习7、基于案例的学习注:4)基于案例学习的一般过程如下:第15页,本讲稿共42页输入检索信息源范例分析模型范例检索类比映射类比转换类比验证解释过程检索方法映射方法
8、转换规则源范例库范例保存范例修补修改规则新解新范例失败描述或部分解第16页,本讲稿共42页第五章 机器学习第三节 分析学习二、基于解释的学习(解释学习)给定一个具有丰富领域知识的知识库,给定一个目标概念G,输入一个实例e,使用知识库中的知识或在专家的帮助下,证明e是G的一个实例(即解释e是G的一个实例),对获得的解释进行推广,得到一个更一般的解题过程(泛化),把通过泛化得到的知识加进知识库中。注:解释可使用目标回归方法和基于解释的特化(EBS)。第17页,本讲稿共42页第五章 机器学习第四节 遗传式学习一、基本原理1、竞争机制 将竞争机制引进系统,以便不断改进和完善系统的工作性能,使系统具有自
9、适应性。注:1)若一系统在工作过程中能够根据外界的反馈信息对自己的工作方式进行调节,甚至对自己的工作机制重新组织(自组织),使整个系统工作得更好,则称该系统具有自适应性。这种调整和适应的过程,可以看作是系统的学习过程。第18页,本讲稿共42页第五章 机器学习第四节 遗传式学习一、基本原理1、竞争机制注:2)在自适应系统中引进竞争机制,就是将达尔文发现的物种竞争、适者生存的生物进化规律运用到系统的演变中来,并把它们作为一种学习的手段加以运用,以便淘汰不适用的知识,增加有用的知识。第19页,本讲稿共42页第五章 机器学习第四节 遗传式学习一、基本原理2、知识更新的随机性 系统知识的演变是不确定的,
10、方法是作各种随机的改动,然后将改动的结果应用于解题,保留成功的,抛弃失败的。注:1)这相当于在一个庞大的解空间中作随机搜索,在使用适当的启发式原则的前提下,搜索结果将收敛于一个较好的解。第20页,本讲稿共42页第五章 机器学习第四节 遗传式学习一、基本原理2、知识更新的随机性注:2)遗传算法采用的启发式原则主要是爬山法。从一个初始知识库出发,随机地选择能够改进知识库性能的某种变动,这相当于向上的高处爬了一步,结果得到一个新的知识库,然后,再以此知识库为出发点,再作改动,再向上爬一步,这样不断地改进。其中所使用的改进手段称为遗传算子。3)统计抽样是遗传算法的支柱之一。第21页,本讲稿共42页第五
11、章 机器学习第四节 遗传式学习二、基本遗传算法1、给定一个初始知识库2、计算每个知识单元u对外界环境的适应程度f(u)。注:若知识单元是规则,则称为规则强度。3、根据各知识单元对环境的适应度f(u),计算它们被选中作物种演变的概率值4、根据概率值选出一批知识单元5、运用各种遗传算子于被选中的知识单元,产生一批新的知识单元,即它们的后代6、用这批后代去代替知识库中原有的适应度最低的那些知识单元,实现知识更新第22页,本讲稿共42页第五章 机器学习第四节 遗传式学习二、基本遗传算法7、将新知识库作用于外界环境,解决新的问题,获得新的反馈信息,重新计算各知识单元对环境的适应度,转3注:1)为了便于大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五章 机器学习优秀课件 第五 机器 学习 优秀 课件
限制150内