【教学课件】第五章机器学习.ppt
《【教学课件】第五章机器学习.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第五章机器学习.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 机器学习第一节 引言一、学习 如果一个系统能够执行某个过程而改进它的性能,这就是学习。学习是获取知识、积累经验、改进性能、发现规律、适应环境的过程。其基本机制是设法将在一种情形下成功的表现行为转移到另一类似的新情形中去。二、学习分类1、基于归纳的学习(归纳学习)2、基于分析的学习(分析学习)3、基于遗传原理的学习(遗传学习)4、基于海量并行(神经网络)的学习(神经网络学习)第五章 机器学习第二节 归纳学习一、基本含义 给定关于某个概念的一系列已知的正例和反例,从中归纳出一个一般的概念描述的过程。基本操作是泛化(Generalization)和特化(Specialization)二、分类
2、1、实例学习 也称概念获取,确定概念的一般描述,这个描述应能解释所有给定的正例并排除所有给定的反例。这些正例和反例由信息源提供,是有教师学习。第五章 机器学习第二节 归纳学习二、分类2、观察与发现学习 也称描述的泛化,产生能解释所有或大多数观察到的事实的规律和规则。这类学习包括概念聚类、构造分类、发现定理、形成理论等。第五章 机器学习第二节 归纳学习三、归纳学习方法有变型(版本)空间、决策树方法、AQ11算法等。第五章 机器学习第二节 归纳学习四、变型(版本)空间方法(Version Space)以整个规则空间为初始的假设规则集合H,依据训练例子中的信息,对集合H进行泛化和特化处理,逐步缩小集
3、合H。Mitchell假定这个空间是一偏序结构,并将单个概念学习定义为在这个空间的搜索。泛化特化更一般更特殊没有描述GS第五章 机器学习第二节 归纳学习五、AQ归纳学习算法 生成的选择假设的析取,覆盖全部正例,而不覆盖任何反例。AQ11算法搜索规则空间,反复应用消除候选元素,得到尽可能一般的规则,可包含多概念学习。注:AQ11的原理是将样本集构成一个逻辑公式。构成的方法是根据决策属性对样本集的划分,所有正样本与所有反样本构成逻辑公式EpEn,这个逻辑公式就是对正样本集的表示,其中每个样本是“属性值”对的合取连接式。六、产生与测试方法 仅通过正例学习概念,引入“概念窗口”概念。第五章 机器学习第
4、二节 归纳学习七、决策树学习 决策树可以用来表示析取概念。1、CLS学习算法 从一个空决策树开始,通过增加决策结点,逐渐精化,直到树正确分类全部训练实例。其缺陷是学习问题不能太大。2、ID3学习算法 Quinlan 1979 采用训练实例的子集(即,可选择窗口),通过属性,使用熵概念,来形成决策树。实质是构造一株熵值下降平均最快的判定树。注:ID3的数学基础是商集。第五章 机器学习第二节 归纳学习七、决策树学习3、ID4学习算法 在每个可能的决策树结点创造一系列表。每个表由全部未检测属性值和每个值的正例和反例数组构成。当处理一个新例时,每个属性值的正例和反例递增计量。即,递增概念归纳。4、ID
5、5学习算法 抛弃旧的检测属性下面的子树,从下面选出检测属性形成树。5、C4.5和C5 处理连续属性。第五章 机器学习第二节 归纳学习八、归纳学习的计算理论 学习算法的样本复杂性和计算复杂性。Gold学习理论和Valiant学习理论。Valiant 关于可学习性的理论:概率地、近似地、正确地可学习的(PAC Probably、Approximately、Correct)PAC学习模型。第五章 机器学习第三节 分析学习一、类比学习1、类比 比喻 类比是人类重要的认知方法,是经验决策过程中常用的推理方式,是一种允许知识在具有相似性质的领域中进行转换的学习策略。2、类比学习 把两个或两类事物或情形进行
6、比较,找出它们在某一抽象层次上的相似关系,并以这种关系为依据,把某一事物或情形的有关知识加以适当整理(或变换)对应到另一事物或情形,从而获得另一事物或情形的知识,称为类比学习。第五章 机器学习第三节 分析学习一、类比学习2、类比学习 注:1)类比学习的核心技术是相似性的定义和度量。2)类比有多种形式,如,方法类比、概念类比、图形类比、联想型类比等等。3、类比学习主要步骤a)联想搜索匹配b)检验相似程度c)修正变换求解d)更新知识库第五章 机器学习第三节 分析学习一、类比学习4、类比学习方法a)转换类比b)派生类比c)基于案例的学习第五章 机器学习第三节 分析学习一、类比学习5、转换类比学习系统
7、 主要由比较器、知识库、操作模块、解法栈、检验模块组成。6、派生类比 将转换类比进行扩充,对过去求解的问题进行完整地派生跟踪。第五章 机器学习第三节 分析学习一、类比学习7、基于案例的学习 是基于类比的学习的进一步发展,特别适用于较难发现规律性知识、也不容易找到因果模型的领域。注:1)基于案例的学习所使用的案例库不象规则库那样有知识的不一致问题。2)基于案例的学习从其本性来说就是增量式学习。3)基于案例的学习需要保持和管理一组数量较大的案例。第五章 机器学习第三节 分析学习一、类比学习7、基于案例的学习注:4)基于案例学习的一般过程如下:输入检索信息源范例分析模型范例检索类比映射类比转换类比验
8、证解释过程检索方法映射方法转换规则源范例库范例保存范例修补修改规则新解新范例失败描述或部分解第五章 机器学习第三节 分析学习二、基于解释的学习(解释学习)给定一个具有丰富领域知识的知识库,给定一个目标概念G,输入一个实例e,使用知识库中的知识或在专家的帮助下,证明e是G的一个实例(即解释e是G的一个实例),对获得的解释进行推广,得到一个更一般的解题过程(泛化),把通过泛化得到的知识加进知识库中。注:解释可使用目标回归方法和基于解释的特化(EBS)。第五章 机器学习第四节 遗传式学习一、基本原理1、竞争机制 将竞争机制引进系统,以便不断改进和完善系统的工作性能,使系统具有自适应性。注:1)若一系
9、统在工作过程中能够根据外界的反馈信息对自己的工作方式进行调节,甚至对自己的工作机制重新组织(自组织),使整个系统工作得更好,则称该系统具有自适应性。这种调整和适应的过程,可以看作是系统的学习过程。第五章 机器学习第四节 遗传式学习一、基本原理1、竞争机制注:2)在自适应系统中引进竞争机制,就是将达尔文发现的物种竞争、适者生存的生物进化规律运用到系统的演变中来,并把它们作为一种学习的手段加以运用,以便淘汰不适用的知识,增加有用的知识。第五章 机器学习第四节 遗传式学习一、基本原理2、知识更新的随机性 系统知识的演变是不确定的,方法是作各种随机的改动,然后将改动的结果应用于解题,保留成功的,抛弃失
10、败的。注:1)这相当于在一个庞大的解空间中作随机搜索,在使用适当的启发式原则的前提下,搜索结果将收敛于一个较好的解。第五章 机器学习第四节 遗传式学习一、基本原理2、知识更新的随机性注:2)遗传算法采用的启发式原则主要是爬山法。从一个初始知识库出发,随机地选择能够改进知识库性能的某种变动,这相当于向上的高处爬了一步,结果得到一个新的知识库,然后,再以此知识库为出发点,再作改动,再向上爬一步,这样不断地改进。其中所使用的改进手段称为遗传算子。3)统计抽样是遗传算法的支柱之一。第五章 机器学习第四节 遗传式学习二、基本遗传算法1、给定一个初始知识库2、计算每个知识单元u对外界环境的适应程度f(u)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第五 机器 学习
限制150内