第十讲-机器学习ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第十讲-机器学习ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十讲-机器学习ppt课件.ppt(133页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、机器学习机器学习什么是机器学习?什么是机器学习?l人工智能人工智能大师大师Herb Simon这样这样定义学习:定义学习: 学习:系统在不断重复的工作中对本身能力的学习:系统在不断重复的工作中对本身能力的增强或改进,使得系统在下一次执行相同任务增强或改进,使得系统在下一次执行相同任务或类似任务(指的是具有相同分布的任务)时,或类似任务(指的是具有相同分布的任务)时,比现在做的更好或效率更高。比现在做的更好或效率更高。机器学习:通过经验提高系统自身的性能的机器学习:通过经验提高系统自身的性能的过程(系统自我改进)。过程(系统自我改进)。机器学习的重要性机器学习的重要性l 机器学习是人工智能的主要
2、核心研究领域之机器学习是人工智能的主要核心研究领域之一一, 也是现代智能系统的关键环节和瓶颈。也是现代智能系统的关键环节和瓶颈。l 很难想象很难想象: 一个没有学习功能的系统是能被一个没有学习功能的系统是能被称为是具有智能的系统。称为是具有智能的系统。信息检索(信息检索(Information Retrieval )5机器学习的任务机器学习的任务l令令WW是这个给定世界的有限或无限所有对象的是这个给定世界的有限或无限所有对象的集合,由于观察能力的限制,我们只能获得这集合,由于观察能力的限制,我们只能获得这个世界的一个有限的子集个世界的一个有限的子集Q QWW,称为样本集。,称为样本集。l 机器
3、学习就是根据这个有限样本集机器学习就是根据这个有限样本集Q Q ,推算这,推算这个世界的模型,使得其对这个世界为真。个世界的模型,使得其对这个世界为真。机器学习的三要素机器学习的三要素l一致性假设:机器学习的条件。一致性假设:机器学习的条件。l样本空间划分:决定模型对样本集合的样本空间划分:决定模型对样本集合的有效性。有效性。l泛化能力:决定模型对世界的有效性。泛化能力:决定模型对世界的有效性。要素要素1:一致性假设:一致性假设l假设世界假设世界W与样本集与样本集Q具有某种相同的性质。具有某种相同的性质。l原则上说,存在各种各样的一致性假设。原则上说,存在各种各样的一致性假设。l在统计意义下,
4、一般假设:在统计意义下,一般假设:lW与与Q具有同分布。或,具有同分布。或,l给定世界给定世界W的所有对象独立同分布。的所有对象独立同分布。要素要素2:对样本空间的划分:对样本空间的划分l样本集合模型样本集合模型:将样本集放到一个将样本集放到一个n维空间,寻找一个超维空间,寻找一个超平面平面(等价关系等价关系),使,使得问题决定的不同对得问题决定的不同对象被划分在不相交的象被划分在不相交的区域。区域。要素要素3: 泛化能力泛化能力l泛化能力:学习的目的是学到隐含在数据对背泛化能力:学习的目的是学到隐含在数据对背后的规律后的规律, ,对具有同一规律的学习集以外的数对具有同一规律的学习集以外的数据
5、据, ,该神经网络仍具有正确的响应能力该神经网络仍具有正确的响应能力, ,称为泛称为泛化能力化能力 . .l通过机器学习方法,从给定有限样本集合计算通过机器学习方法,从给定有限样本集合计算一个模型,泛化能力是这个模型对世界为真程一个模型,泛化能力是这个模型对世界为真程度的指标。度的指标。关于三要素关于三要素l不同时期,研究的侧重点不同不同时期,研究的侧重点不同l划分划分: :早期研究主要集中在该要素上早期研究主要集中在该要素上l泛化能力泛化能力( (在多项式划分在多项式划分):80):80年代以来的近期研年代以来的近期研究究l一致性假设一致性假设: :未来必须考虑(未来必须考虑(Transfe
6、r learningTransfer learning)Transfer learninglTransfer learning 这一概念是由这一概念是由 DARPA(美国国防高级研究计划局)在(美国国防高级研究计划局)在2005年年正式提出来的一项研究计划。正式提出来的一项研究计划。lTransfer Learning 是指系统能够将在先前是指系统能够将在先前任务中学到的知识或技能应用于一个新任务中学到的知识或技能应用于一个新的任务或新的领域。的任务或新的领域。传统机器学习传统机器学习&转移学习转移学习Transfer Learning = “举一反三举一反三”l我们人类也具有这样的能力,比如
7、我们学会了我们人类也具有这样的能力,比如我们学会了国际象棋,就可以将下棋的方法应用于跳棋,国际象棋,就可以将下棋的方法应用于跳棋,或者说学起跳棋来会更容易一些;学会了或者说学起跳棋来会更容易一些;学会了C+,可以把它的一些思想用在学习可以把它的一些思想用在学习Java中;再比如中;再比如某人原来是学物理的,后来学习计算机时,总某人原来是学物理的,后来学习计算机时,总习惯把物理中的某些思想和概念用于计算机科习惯把物理中的某些思想和概念用于计算机科学中。用我们通俗的话总结,就是学中。用我们通俗的话总结,就是l传统机器学习传统机器学习 = “种瓜得瓜,种豆得豆种瓜得瓜,种豆得豆”l迁移学习迁移学习
8、= “举一反三举一反三”机器学习是多学科的交叉机器学习是多学科的交叉机器学习学科机器学习学科l19831983年,年,R.S. MichalskiR.S. Michalski等人撰写等人撰写机器学习:机器学习:通往人工智能的途径通往人工智能的途径一书一书l 19861986年,年,Machine LearningMachine Learning杂志创刊杂志创刊l19971997年以年以Tom MitchellTom Mitchell的经典教科书的经典教科书machine learning中都没有贯穿始终的中都没有贯穿始终的基础体系,只不个是不同方法和技术的罗列基础体系,只不个是不同方法和技术的
9、罗列l机器学习还非常年轻、很不成熟机器学习还非常年轻、很不成熟机器学习的分类机器学习的分类l传统上,大致可分为传统上,大致可分为4 4类:类:l归纳学习归纳学习l解释学习解释学习l遗传学习(遗传学习(GA)GA)l连接学习连接学习( (神经网络)神经网络)归纳学习归纳学习l是从某一概念的分类例子集出发归纳出一般的是从某一概念的分类例子集出发归纳出一般的概念描述。概念描述。l这是目前研究得最多的学习方法,其学习目的这是目前研究得最多的学习方法,其学习目的是为了获得新的概念、构造新的规则或发现新是为了获得新的概念、构造新的规则或发现新的理论。的理论。l这种方法要求大量的训练例,而且归纳性能受这种方
10、法要求大量的训练例,而且归纳性能受到描述语言、概念类型、信噪比、实例空间分到描述语言、概念类型、信噪比、实例空间分布、归纳模式等的影响。布、归纳模式等的影响。解释学习解释学习l(分析学习)是从完善的领域理论出发演绎出(分析学习)是从完善的领域理论出发演绎出有助于更有效地利用领域理论的规则。其学习有助于更有效地利用领域理论的规则。其学习目的是提高系统性能,而不是修改领域理论。目的是提高系统性能,而不是修改领域理论。l它与归纳学习相反,只需要少量的训练例,但它与归纳学习相反,只需要少量的训练例,但要求有完善的领域理论,而且学习效果也与例要求有完善的领域理论,而且学习效果也与例子表示形式、学习方法(
11、正例学习或反例学子表示形式、学习方法(正例学习或反例学习)、概括程度等有关。习)、概括程度等有关。机器学习面临的挑战机器学习面临的挑战l随着应用的不断深入随着应用的不断深入, ,出现了很多被传统机器出现了很多被传统机器学习研究忽视、但非常重要的问题(下面将以学习研究忽视、但非常重要的问题(下面将以医疗和金融为代表来举几个例子)医疗和金融为代表来举几个例子)l机器学习正与众多学科领域产生了交叉,交叉机器学习正与众多学科领域产生了交叉,交叉领域越多领域越多, ,问题也越多问题也越多, ,也正是大有可为处也正是大有可为处. .例子1:代价敏感问题l医疗:以癌症诊断为例,医疗:以癌症诊断为例,“将病人
12、误诊为健康将病人误诊为健康人的代价人的代价”与与“将健康人误诊为病人的代价将健康人误诊为病人的代价”是不同的。是不同的。l金融:以信用卡盗用检测为例,金融:以信用卡盗用检测为例,“将盗用误认将盗用误认为正常使用的代价为正常使用的代价”与与“将正常使用误认为盗将正常使用误认为盗用的代价用的代价”是不同的。是不同的。l传统的传统的MLML技术基本上只考虑同一代价技术基本上只考虑同一代价l如何处理代价敏感性?如何处理代价敏感性?l在教科书中找不到现成的答案。在教科书中找不到现成的答案。例子2:不平衡数据问题l医疗:以癌症诊断为例,医疗:以癌症诊断为例,“健康人健康人”样本远远样本远远多于多于“病人病
13、人”样本。样本。l金融:以信用卡盗用检测为例,金融:以信用卡盗用检测为例,“正常使用正常使用”样本远远多于样本远远多于“被盗用被盗用”样本。样本。l传统的传统的MLML技术基本上只考虑平衡数据技术基本上只考虑平衡数据l如何处理数据不平衡性?如何处理数据不平衡性?l在教科书中找不到现成的答案在教科书中找不到现成的答案例子3:可理解性问题l医疗:以乳腺癌诊断为例,需要向病人解释医疗:以乳腺癌诊断为例,需要向病人解释“为什么做出这样的诊断为什么做出这样的诊断”l金融:以信用卡盗用检测为例,需要向保安部金融:以信用卡盗用检测为例,需要向保安部门解释门解释“为什么这是正在被盗用的卡为什么这是正在被盗用的
14、卡”l传统的传统的MLML技术基本上只考虑泛化不考虑理解技术基本上只考虑泛化不考虑理解l如何处理可理解性?如何处理可理解性?l在教科书中找不到现成的答案在教科书中找不到现成的答案机器学习的最新进展机器学习的最新进展l 算法驱动算法驱动( (建模与数据分析建模与数据分析) )l 应用驱动应用驱动算法驱动算法驱动l海量非线性数据海量非线性数据(10(108-108-10) )l算法的泛化能力考虑算法的泛化能力考虑l学习结果数据的解释学习结果数据的解释l代价加权的处理方法代价加权的处理方法l不同数据类型的学习方法不同数据类型的学习方法应用驱动应用驱动l自然语言分析、网络与电信数据分析、图像数自然语言
15、分析、网络与电信数据分析、图像数据分析、金融与经济数据分析、零售业数据分据分析、金融与经济数据分析、零售业数据分析、情报分析。析、情报分析。l WebWeb信息的有效获取信息的有效获取( (新一代搜索引擎新一代搜索引擎) )。由此导。由此导 致各种学习任务:数据流学习、多实例学习致各种学习任务:数据流学习、多实例学习( (部部分放弃独立同分布条件分放弃独立同分布条件) )、RankingRanking学习、蛋白质学习、蛋白质功能分析功能分析, DNA, DNA数据分析,数据分析, . 它们需要使用各种不同方法,解决实际问题。它们需要使用各种不同方法,解决实际问题。应用驱动机器学习应用驱动机器学
16、习l 流形机器学习流形机器学习l半监督机器学习半监督机器学习l多实例机器学习多实例机器学习lRankingRanking机器学习机器学习l数据流机器学习数据流机器学习l图模型机器学习图模型机器学习l 流形机器学习流形机器学习高维数据的低维表示高维数据的低维表示l流形(流形(manifoldmanifold)就是一般的几何对象的总称。比如人,)就是一般的几何对象的总称。比如人,有中国人、美国人等等;流形就包括各种维数的曲线曲有中国人、美国人等等;流形就包括各种维数的曲线曲面等。和一般的降维分析一样,流形学习把一组在高维面等。和一般的降维分析一样,流形学习把一组在高维空间中的数据在低维空间中重新表
17、示。空间中的数据在低维空间中重新表示。l比如在基于内容的图像检索中,当特征向量的维数非常比如在基于内容的图像检索中,当特征向量的维数非常高时,建立图像特征库时的存储高维特征的空间复杂度高时,建立图像特征库时的存储高维特征的空间复杂度和度量图像之间相似性的运算复杂度都将非常的高。和度量图像之间相似性的运算复杂度都将非常的高。l线性方法线性方法l PCA (Principal Component Analysis) PCA (Principal Component Analysis)l ICA (Independent Component Analysis) ICA (Independent Co
18、mponent Analysis)l非线性方法非线性方法l LLE (Local linear Embeding)(Roweis LLE (Local linear Embeding)(Roweis, Science,2000), Science,2000)l Isomap (Tenenbaum Isomap (Tenenbaum, Science, 2000), Science, 2000)l比较常用的降维算法比如比较常用的降维算法比如PCAPCA,是针对线性分布,是针对线性分布的高维数据进行降维的算法,并且有局部最优的的高维数据进行降维的算法,并且有局部最优的问题。而问题。而LLELLE(
19、Local Linear EmbeddingLocal Linear Embedding)算法则针)算法则针对于非线性数据。对于非线性数据。 在这个例子里,用在这个例子里,用LLE LLE 进行降维成功的体现了数进行降维成功的体现了数据内在的局部分布结构,而用据内在的局部分布结构,而用PCA PCA 映射则会将高维空映射则会将高维空间里的远点映射到低维空间后变成了近邻点。间里的远点映射到低维空间后变成了近邻点。半监督机器学习半监督机器学习l半监督的学习半监督的学习: :有少量训练样本有少量训练样本, ,学习机以从训学习机以从训练样本获得的知识为基础练样本获得的知识为基础, ,结合测试样本的分结
20、合测试样本的分布情况逐步修正已有知识布情况逐步修正已有知识, ,并判断测试样本的并判断测试样本的类别。类别。多示例机器学习多示例机器学习l 传统的机器学习中,一个对象有一个描述,传统的机器学习中,一个对象有一个描述,而在一些实际问题中,一个对象可能同时有多而在一些实际问题中,一个对象可能同时有多个描述,到底哪个描述是决定对象性质个描述,到底哪个描述是决定对象性质( (例如例如类别类别) )的,却并不知道。解决这种的,却并不知道。解决这种“对象:描对象:描述:类别述:类别”之间之间1:N:11:N:1关系的学习就是多示例学关系的学习就是多示例学习习Ranking机器学习机器学习l其原始说法是其原
21、始说法是learning for rankinglearning for rankingl问题主要来自信息检索,假设用户的需求不能问题主要来自信息检索,假设用户的需求不能简单地表示为简单地表示为“喜欢喜欢”或或“不喜欢不喜欢”,而需要,而需要将将“喜欢喜欢”表示为一个顺序,问题是如何通过表示为一个顺序,问题是如何通过学习,获得关于这个学习,获得关于这个“喜欢喜欢”顺序的模型。顺序的模型。数据流机器学习数据流机器学习l在网络数据分析与处理中,有一类问题,在网络数据分析与处理中,有一类问题,从一个用户节点上流过的数据,大多数从一个用户节点上流过的数据,大多数是无意义的,由于数据量极大,不能全是无意
22、义的,由于数据量极大,不能全部存储,因此,只能简单判断流过的文部存储,因此,只能简单判断流过的文件是否有用,而无法细致分析件是否有用,而无法细致分析l如何学习一个模型可以完成这个任务,如何学习一个模型可以完成这个任务,同时可以增量学习,以保证可以从数据同时可以增量学习,以保证可以从数据流中不断改善流中不断改善( (或适应或适应) )用户需求的模型用户需求的模型研究现状研究现状l主要以任务为驱动力主要以任务为驱动力, ,学习方法有待创新学习方法有待创新l以上这些机器学习方式还处于实验观察以上这些机器学习方式还处于实验观察阶段,缺乏坚实的理论基础阶段,缺乏坚实的理论基础l实际应用效果仍有待研究实际
23、应用效果仍有待研究当前机器学习所面临情况是:当前机器学习所面临情况是:l数据复杂、海量,用户需求多样化。从而数据复杂、海量,用户需求多样化。从而, , 要求:要求:(1)(1)需要科学和高效的问题表示,以便将其学习建需要科学和高效的问题表示,以便将其学习建立在科学的基础上立在科学的基础上(2)(2)应用驱动成为必然应用驱动成为必然, , 从而针对某个或某类应用给从而针对某个或某类应用给出特定的学习方法将不断涌现出特定的学习方法将不断涌现(3)(3)对机器学习的检验问题只能在应用中检验自己对机器学习的检验问题只能在应用中检验自己(4)(4)对机器学习的结果的解释对机器学习的结果的解释, , 将逐
24、渐受到重视将逐渐受到重视 现在我们逐一讨论几种比较现在我们逐一讨论几种比较常用的学习算法常用的学习算法 7.3 机械学习机械学习l机械学习(机械学习(Rote LearningRote Learning) 又称为记忆学习或死记硬背式的学习。这种学习方法直接记忆或存储环境提供的新知识,并在以后通过对知识库的检索来直接使用这些知识,而不再需要进行任何的计算和推导。l机械学习是一种基本的学习过程,虽然它没有足够的能力独立完成智能学习,但存储对于任何智能型的程序来说,都是必要的和基本的。 记忆学习是任何学习系统的一部分,任何学习系统都要将它所获取的知识存储在知识库中,以便使用这些知识。机械学习的过程机
25、械学习的过程 l执行机构每解决一个问题,系统就记住这个问题和它的解。简单的机械学习模型: 1212(,)( ,)npXXXY YY1212(,),( ,)npXXXY YYf存储存储输入输出知识联想对执行单元例子:汽车修理成本估算系统例子:汽车修理成本估算系统 l输入:有关待修理汽车的描述,包括制造厂家、出厂日期、车型、汽车损坏的部位以及它的损坏程度l输出:该汽车的修理成本 例子:汽车修理成本估算系统例子:汽车修理成本估算系统l为了进行估算,系统必须在其知识库中查找同一厂家,同一出厂日期、同一车型、同样损坏情况的汽车,然后把知识库中对应的数据作为修理成本的估算数据输出给用户。如果在系统的知识库
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 机器 学习 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内