第4章机器学习.ppt
《第4章机器学习.ppt》由会员分享,可在线阅读,更多相关《第4章机器学习.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4章章 机器学习机器学习Machine Leanrning 4.14.1 机器学习的定义机器学习的定义I学习:学习:学习就是系统在不断重复的工作学习就是系统在不断重复的工作中对本身能力的增强或者改进,使得系中对本身能力的增强或者改进,使得系统在下一次执行同样任务或类似任务时,统在下一次执行同样任务或类似任务时,会比现在做得更好或效率更高。(人工会比现在做得更好或效率更高。(人工智能大师西蒙的观点)智能大师西蒙的观点)学习的主要表现:学习的主要表现:I1.获得新知识;获得新知识;I2.从感性认识发展到理性认识;从感性认识发展到理性认识;I3.通过反复实践。通过反复实践。对学习的对学习的4种理
2、解:种理解:I1.学习是一个系统改进其自身性能的任学习是一个系统改进其自身性能的任何过程;何过程;I2.学习是获取明显知识的过程;学习是获取明显知识的过程;I3.学习是技巧的获取;学习是技巧的获取;I4.学习是理论、假说的形成过程。学习是理论、假说的形成过程。学习的基本形式学习的基本形式I知识获取知识获取 学习的本质就是获取新的知识,包括物理学习的本质就是获取新的知识,包括物理系统、行为的描述和模型的建立,构造客系统、行为的描述和模型的建立,构造客观现实的表示。观现实的表示。I技能求精技能求精 通过实践改造机制和认知技能。这些技能通过实践改造机制和认知技能。这些技能包括意识的或机制的。这种改变
3、是通过反包括意识的或机制的。这种改变是通过反复实践和从失败中纠正错误来进行的。复实践和从失败中纠正错误来进行的。学习骑自行车。学习骑自行车。学习的一般模式学习的一般模式普通理论普通理论深层知识深层知识表层知识表层知识领域专家知识领域专家知识知识的组织程度知识的组织程度从学校和书本学习从学校和书本学习领域无关的定义、基本公式、公理、定律领域无关的定义、基本公式、公理、定律从师傅学习从师傅学习领域有关的事实、经验知识、诀窍、技能领域有关的事实、经验知识、诀窍、技能无知识无知识4.1.1 4.1.1 机器学习的定义机器学习的定义机器学习的定义机器学习的定义I顾名思义顾名思义,机器学习是研究如何使用机
4、器来机器学习是研究如何使用机器来模拟人类学习活动的一门学科。模拟人类学习活动的一门学科。I稍为严格的提法是:机器学习是一门研究稍为严格的提法是:机器学习是一门研究机器获取新知识和新技能机器获取新知识和新技能,并识别现有知识并识别现有知识的学问。的学问。I这里所说的这里所说的“机器机器”,指的就是计算机;,指的就是计算机;现在是电子计算机,以后还可能是中子现在是电子计算机,以后还可能是中子计算机、光子计算机或神经计算机等等。计算机、光子计算机或神经计算机等等。研究机器学习的研究机器学习的意义意义I1 1、机器学习速度惊人;、机器学习速度惊人;I2 2、机器学习可以把学习不断地延续下去,、机器学习
5、可以把学习不断地延续下去,避免大量的重复学习,使知识积累达到新避免大量的重复学习,使知识积累达到新的高度;的高度;I未来的计算机将有自动获取知识的能力,未来的计算机将有自动获取知识的能力,直接从书本中学习,通过与人谈话学习,直接从书本中学习,通过与人谈话学习,通过观察学习。通过实践自我完善。通过观察学习。通过实践自我完善。I3、机器学习有利于知识的传播:一台计算、机器学习有利于知识的传播:一台计算机获取的知识很容易复制给任何其他机器。机获取的知识很容易复制给任何其他机器。I4、克服人的存储少,效率低,注意力分散,、克服人的存储少,效率低,注意力分散,难以传送所获取知识等局限性。难以传送所获取知
6、识等局限性。4.1.2 机器学习的发展史机器学习的发展史机器学习的发展分为机器学习的发展分为4 4个时期个时期I第一阶段是在第一阶段是在5050年代中叶到年代中叶到6060年代中叶,年代中叶,属于属于热烈时期热烈时期。I第二阶段在第二阶段在6060年代中叶至年代中叶至7070年代中叶,年代中叶,被称为机器学习的被称为机器学习的冷静时期冷静时期。I第三阶段从第三阶段从7070年代中叶至年代中叶至8080年代中叶,年代中叶,称为称为复兴时期复兴时期。I机器学习的机器学习的最新阶段最新阶段始于始于19861986年年。I第一阶段是在第一阶段是在50年代中叶到年代中叶到60年代中叶,年代中叶,属于热烈
7、时期。属于热烈时期。I在这个时期,所研究的是在这个时期,所研究的是“没有知识没有知识”的学的学习,即习,即“无知无知”学习。学习。I其研究目标是各类自组织系统和自适应系其研究目标是各类自组织系统和自适应系统;指导本阶段研究的理论基础是早在统;指导本阶段研究的理论基础是早在40年代就开始研究的神经网络模型。年代就开始研究的神经网络模型。I在这个时期,我国研制了数字识别学习机。在这个时期,我国研制了数字识别学习机。I第二阶段在第二阶段在6060年代中叶至年代中叶至7070年代中叶,年代中叶,被称为机器学习的冷静时期。被称为机器学习的冷静时期。I本阶段的研究目标是模拟人类的概念学本阶段的研究目标是模
8、拟人类的概念学习过程,并采用逻辑结构或图结构作为习过程,并采用逻辑结构或图结构作为机器内部描述。机器内部描述。I这个时期正是我国这个时期正是我国“史无前例史无前例”的十年,的十年,对机器学习的研究不可能取得实质进展。对机器学习的研究不可能取得实质进展。I第三阶段从第三阶段从7070年代中叶至年代中叶至8080年代中叶,称为年代中叶,称为复兴时期。复兴时期。I在这个时期,人们从学习单个概念扩展到学在这个时期,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和各种学习多个概念,探索不同的学习策略和各种学习方法。习方法。I本阶段已开始把学习系统与各种应用结合起本阶段已开始把学习系统与各种应用
9、结合起来,中国科学院自动化研究所进行大量的分来,中国科学院自动化研究所进行大量的分析研究,表明我国的机器学习研究得到恢复。析研究,表明我国的机器学习研究得到恢复。I19801980年西蒙来华传播机器学习的火种后,我年西蒙来华传播机器学习的火种后,我国的机器学习研究出现了新局面。国的机器学习研究出现了新局面。I机器学习的最新阶段始于机器学习的最新阶段始于19861986年。年。I一方面,由于神经网络研究的重新兴起,一方面,由于神经网络研究的重新兴起,另一方面,对实验研究和应用研究得到前另一方面,对实验研究和应用研究得到前所未有的重视。所未有的重视。I我国的机器学习研究开始进入稳步发展和我国的机器
10、学习研究开始进入稳步发展和逐渐繁荣的新时期。逐渐繁荣的新时期。目前常用的分类方法:目前常用的分类方法:机械式学习机械式学习指导式学习指导式学习示例学习示例学习类比学习类比学习解释学习解释学习基于演绎的学习基于演绎的学习基于归纳的学习基于归纳的学习归纳学习归纳学习分析学习分析学习连接学习连接学习遗传算法遗传算法(1)按学习方法分类按学习方法分类(2)按推理方式分类按推理方式分类(3)按综合属性分类按综合属性分类2.机器学习的分类机器学习的分类I学习过程与推理过程是紧密相连的,按照学习过程与推理过程是紧密相连的,按照学习中使用推理的多少,机器学习所采用学习中使用推理的多少,机器学习所采用的策略大体
11、上可分为:机械学习、传授学的策略大体上可分为:机械学习、传授学习、演绎学习、类比学习和归纳学习。习、演绎学习、类比学习和归纳学习。I学习中所用的推理越多,系统的能力越强。学习中所用的推理越多,系统的能力越强。分类分类(由低到高)(由低到高)通过归纳总结学习通过归纳总结学习(自学习)(自学习)通过书本资料学习通过书本资料学习(独立研究)(独立研究)通过实际事例学习通过实际事例学习(启发式学习)(启发式学习)通过提问学习通过提问学习(注入式学习)(注入式学习)通过机械记忆学习通过机械记忆学习(死记硬背式)(死记硬背式)高高 低低机械学习机械学习I机械学习又称为记忆学习,是最简单的学机械学习又称为记
12、忆学习,是最简单的学习策略。习策略。I这种学习策略不需要任何推理过程。外面这种学习策略不需要任何推理过程。外面输入知识的表示方式与系统内部表示方式输入知识的表示方式与系统内部表示方式完全一致,不需要任何处理和变化。完全一致,不需要任何处理和变化。传授学习传授学习I传授学习又称指导式学习或指点学习。传授学习又称指导式学习或指点学习。I从老师或其它有结构的事物获取知识。要从老师或其它有结构的事物获取知识。要求学习者将输入语言的知识转换成它本身求学习者将输入语言的知识转换成它本身的内部表示形式。并把新的信息和它原有的内部表示形式。并把新的信息和它原有的知识有机地结合为一体。的知识有机地结合为一体。演
13、绎学习演绎学习-通过类推学习通过类推学习I学习者找出现有知识中所要产生的新概念学习者找出现有知识中所要产生的新概念或技能十分类似的部分。将它们转换或扩或技能十分类似的部分。将它们转换或扩大成适合新情况的形式,从而取得新的事大成适合新情况的形式,从而取得新的事实或技能。实或技能。I在演绎学习中,学习系统由给定的知识进在演绎学习中,学习系统由给定的知识进行演绎的保真推理,并存储有用的结论。行演绎的保真推理,并存储有用的结论。归纳学习归纳学习-从例子中学习从例子中学习I归纳学习是应用归纳推理进行学习的一类归纳学习是应用归纳推理进行学习的一类学习方法。学习方法。I给学习者提供某一概念的一组正例和反例,
14、给学习者提供某一概念的一组正例和反例,学习者归纳出一个总的概念描述,是它适学习者归纳出一个总的概念描述,是它适合于所有的正例且排除所有的反例。(目合于所有的正例且排除所有的反例。(目前研究较多的一种方法)前研究较多的一种方法)类比学习类比学习I类比学习就是在遇到新的问题时,可以学类比学习就是在遇到新的问题时,可以学习以前解决过的类似问题的解决方法,来习以前解决过的类似问题的解决方法,来解决当前的问题。解决当前的问题。I所以寻找与当前问题相似的已知问题就很所以寻找与当前问题相似的已知问题就很重要,并且必须要能够发现当前任务与已重要,并且必须要能够发现当前任务与已知任务的相似之点,由此制定出完成当
15、前知任务的相似之点,由此制定出完成当前任务的方案。任务的方案。I类比学习可以由系统已有的某一领域知识类比学习可以由系统已有的某一领域知识得到另一领域中类似的知识。得到另一领域中类似的知识。实例学习实例学习I实例学习又称为概念获取,它是通过向学实例学习又称为概念获取,它是通过向学习者提供某一概念的一组正例和反例,使习者提供某一概念的一组正例和反例,使学习者从这些正反例中归纳推理出概念的学习者从这些正反例中归纳推理出概念的一般描述,这个描述应能解释所有给定的一般描述,这个描述应能解释所有给定的正例并排除所有给定的反例。正例并排除所有给定的反例。I这些正反例是由信息源提供的,信息源可这些正反例是由信
16、息源提供的,信息源可能是已经知道概念的教师,也可以是学习能是已经知道概念的教师,也可以是学习者本身,还可能是学习者以外的外部环境。者本身,还可能是学习者以外的外部环境。观察与发现学习观察与发现学习I观察与发现学习又称为描述的一般化。这观察与发现学习又称为描述的一般化。这类学习没有教师的指导,它要产生对所有类学习没有教师的指导,它要产生对所有或大多数观察到的规律和规则的解释。或大多数观察到的规律和规则的解释。I这类学习包括概念聚类、构造分类、曲线这类学习包括概念聚类、构造分类、曲线拟合(使方程符合数据)、发现并解释观拟合(使方程符合数据)、发现并解释观察到的定律并形成理论。察到的定律并形成理论。
17、4.2 机器学习系统的基本模型机器学习系统的基本模型I以西蒙关于学习的定义作为出发点,以西蒙关于学习的定义作为出发点,建立机器学习系统的基本模型。建立机器学习系统的基本模型。环境环境学习环节学习环节知识库知识库执行环节执行环节I环境和知识库是以某种知识表示形式表达环境和知识库是以某种知识表示形式表达的信息的集合,分别代表外界信息来源和的信息的集合,分别代表外界信息来源和系统所具有的知识;系统所具有的知识;I“学习环节学习环节”和和“执行环节执行环节”代表两个过程。代表两个过程。环境环境学习环节学习环节知识库知识库执行环节执行环节I“环境环境”向系统的向系统的“学习环节学习环节”提供某些信息,提
18、供某些信息,而而“学习环节学习环节”则利用这些信息对系统的则利用这些信息对系统的“知知识库识库”进行改进,以增进系统进行改进,以增进系统“执行环节执行环节”完完成任务的效能,成任务的效能,“执行环节执行环节”根据知识库中的根据知识库中的知识来完成某种任务,同时把获得的信息反知识来完成某种任务,同时把获得的信息反馈给馈给“学习环节学习环节”。环境环境学习环节学习环节知识库知识库执行环节执行环节环境环境I环境可以是系统的工作对象,也可以包括环境可以是系统的工作对象,也可以包括工作对象和外界条件。工作对象和外界条件。I例如在医疗系统中,环境就是病人当前的例如在医疗系统中,环境就是病人当前的症状、检验
19、的数据和病历。在模式识别中,症状、检验的数据和病历。在模式识别中,环境就是待识别的图形或景物。环境就是待识别的图形或景物。I环境就是为学习系统提供获取知识所需的环境就是为学习系统提供获取知识所需的信息。信息。I信息的水平和质量,对学习系统获取知识信息的水平和质量,对学习系统获取知识的能力有很大的影响。的能力有很大的影响。学习环节学习环节I学习环节通过获得外部信息,并将这些信学习环节通过获得外部信息,并将这些信息与执行环节所反馈回的信息进行比较。息与执行环节所反馈回的信息进行比较。一般情况下环境提供的信息水平与执行环一般情况下环境提供的信息水平与执行环节所需的信息水平之间往往有差距,经分节所需的
20、信息水平之间往往有差距,经分析、综合、类比、归纳等思维过程,学习析、综合、类比、归纳等思维过程,学习环节就要从这些差距中获取相关对象的知环节就要从这些差距中获取相关对象的知识,并将这些知识存入知识库中。识,并将这些知识存入知识库中。知识库知识库I知识库用于存放由学习环节所学到的知识。知识库用于存放由学习环节所学到的知识。I影响学习系统设计的第二个因素是知识库影响学习系统设计的第二个因素是知识库的形式和内容。的形式和内容。I知识库的形式就是知识表示的形式。知识库的形式就是知识表示的形式。执行环节执行环节I执行环节是整个机器学习系统的核心。执执行环节是整个机器学习系统的核心。执行环节用于处理系统面
21、临的现实问题,即行环节用于处理系统面临的现实问题,即应用知识库中所学到的知识求解问题,如应用知识库中所学到的知识求解问题,如智能控制、自然语言理解和定理证明等,智能控制、自然语言理解和定理证明等,并对执行的效果进行评价,将评价的结果并对执行的效果进行评价,将评价的结果反馈回学习环节,以便系统进一步的学习。反馈回学习环节,以便系统进一步的学习。I执行部分是整个学习系统的核心,因执行部分是整个学习系统的核心,因为执行部分的动作就是学习部分力求为执行部分的动作就是学习部分力求改进的动作。改进的动作。总结:机器学习系统的基本结构总结:机器学习系统的基本结构 环境环境向系统的学习部分提供信息;向系统的学
22、习部分提供信息;学习学习利用信息修改知识库,以增进系统执行利用信息修改知识库,以增进系统执行部分完成任务的效能;部分完成任务的效能;知识库知识库存放指导执行部分动作的一般原则;存放指导执行部分动作的一般原则;执行执行根据知识库完成任务,并把所获信息反根据知识库完成任务,并把所获信息反馈学习部分。馈学习部分。环境环境学习环节学习环节知识库知识库执行环节执行环节7.3 机械学习1.1.机械学习模式机械学习模式 机器学习是最简单的学习方法,也是一种最基本的学习过程。机器学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理。可把机械学习系统的执行部分抽象地看成某个函可把机械学习系统
23、的执行部分抽象地看成某个函数,机械学习在存储器中简单地记忆存储对数,机械学习在存储器中简单地记忆存储对(X1,X2,(X1,X2,Xn),(Y1,Y2,Xn),(Y1,Y2,Yp),Yp)。当需要当需要f(X1,X2,f(X1,X2,Xn),Xn)时时,执行部分就从存储器中把执行部分就从存储器中把(Y1,Y2,(Y1,Y2,Yp),Yp)简单地检索出来而不是重新计算它。简单地检索出来而不是重新计算它。这种简单的学习模式如下:这种简单的学习模式如下:存储存储计算计算推导推导归纳归纳算法与理论算法与理论机械记忆机械记忆搜索规则搜索规则图图7.2 7.2 数据化简级别图数据化简级别图 LenatLe
24、nat,Hayes-RothHayes-Roth,和,和KlahrKlahr等人于等人于19791979年关于机械学习提出一种有趣年关于机械学习提出一种有趣的观点,见图的观点,见图7.27.2。机械学习就是记忆;机械学习就是记忆;学习元所做的工作仅仅是存储新的知识;学习元所做的工作仅仅是存储新的知识;需要时检索出来即可。需要时检索出来即可。例如:例如:某个计算的输入是:某个计算的输入是:(x1,x2,xn),计算后输出是:计算后输出是:(y1,y2,yn),如果经评价后得知该结果正确,则把联想对如果经评价后得知该结果正确,则把联想对:(x1,x2,xn),(y1,y2,yn)存入存入知识库,当
25、以后需要知识库,当以后需要做同样的计算时,只要从知识库中检索出来即可,而不需要重新计算了。做同样的计算时,只要从知识库中检索出来即可,而不需要重新计算了。(2)利弊利弊 机械式学习实质上是用存储空间来换取处理时间,虽然节省了计算时间,但却机械式学习实质上是用存储空间来换取处理时间,虽然节省了计算时间,但却多占了存储空间。当因学习而积累的知识逐渐增多时,占用的空间就会越来越大,检多占了存储空间。当因学习而积累的知识逐渐增多时,占用的空间就会越来越大,检索的效率也就随之下降。索的效率也就随之下降。2.机械学习的主要问题存储组织信息存储组织信息:要采用适当的存储方式,使要采用适当的存储方式,使检索速
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习
限制150内