人工智能导论-ppt课件---第3章-机器学习.pptx
《人工智能导论-ppt课件---第3章-机器学习.pptx》由会员分享,可在线阅读,更多相关《人工智能导论-ppt课件---第3章-机器学习.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、机器学习人工智能导论机器学习第一部分第二部分第三部分第四部分第五部分机器学习概述机器学习发展机器学习范畴机器学习方法机器学习工具第六部分机器学习挑战3.1机器学习概述机器学习是用计算机程序模拟人的学习能力,从实际例子中学习得到知识和经验,不断改善性能,实现自我完善。机器学习概述 机器学习是用计算机程序模拟人的学习能力,从实际例子中学习得到知识和经验,不断改善性能,实现自我完善。它从样本数据中学习得到知识和规律,然后用于实际的推断和决策。它和普通程序的一个显著区别是需要样本数据,是一种数据驱动的方法。机器学习VS人类学习机器学习致力于研究如何通过计算机的手段,利用经验改善系统自身的性能,其根本任
2、务是数据的智能分析与建模,进而从数据里面挖掘出有用的价值。3.2机器学习发展机器学习属于人工智能中一个较为年轻的分支,可以大致分为以下三个发展历程:萌芽时期、发展时期、繁荣时期。卡内基梅隆大学的教授Tom Mitchell在机器学习的过程中起到了不可估量的作用,他是机器学习的早期建立者和守护者。机器学习发展萌芽时期发展时期繁荣时期卡内基梅隆大学的教授Tom Mitchell在机器学习的过程中起到了不可估量的作用,他是机器学习的早期建立者和守护者。机器学习发展的另一个重要的里程碑之一是统计学和机器学习的融合 萌芽时期 20世纪50年代中期60年代中期,这一时期处于萌芽时期。人们试图通过软件编程来
3、操控计算机完成一系列的逻辑推理功能,进而使计算机具有一定程度上类似人类一样的智能思考能力。然而这时期计算机所推理的结果远远没有达到人们对机器学习的期望。通过进一步研究发现,只具有逻辑推理能力并不能使得机器智能。研究者们认为,使得机器拥有人工智能的前提还必须是拥有大量的先验知识。发展时期 20世纪60年代中期80年代中期,这一时期处于发展时期。人们试图利用自身思维提取出来的规则来教会计算机执行决策行为,主流便是各式各样的“专家系统”,然而这些系统总会面临“知识稀疏”的问题,即面对无穷无尽的知识与信息,人们无法总结出万无一失的规律。因此,让机器自主学习的设想自然地浮出水面。基于20世纪50年代对于
4、神经网络的研究,人们开始研究如何让机器自主学习。繁荣时期 20世纪80年代至今,机器学习达到了一个繁荣时期。由于这一时期互联网大数据以及硬件GPU的出现,使得机器学习脱离了瓶颈期。机器学习开始爆炸式发展,开始成为了一门独立热门学科并且被应用到各个领域。各种机器学习算法不断涌现,而利用深层次神经网络的深度学习也得到进一步发展。同时,机器学习的蓬勃发展还促进了其他分支的出现,例如模式识别,数据挖掘,生物信息学和自动驾驶等等。3.3机器学习范围从范围上来说,机器学习跟模式识别,统计学习,数据挖掘是类似的,同时,机器学习与其他领域的处理技术的结合,形成了计算机视觉、语音识别、自然语言处理等交叉学科。机
5、器学习范围机器学习技术的发展促使了很多智能领域的进步,改善着我们的生活。3.4机器学习方法机器学习可以分为监督学习(supervised learning)、无监督学习(unsupervised learning)、强化学习(reinforcement learning),同时随着人工智能越来越被人们重视,深度学习(Deep learning)也成为机器学习的一个新的领域。机器学习方法深度学习也成为机器学习的新领域。机器学习方法 机器学习是建立在数据建模基础上的,因此,数据是进行机器学习的基础。可以把所有数据的集合称为数据集(dataset),其中每条记录称为一个“样本”,在面对一个新样本时,
6、可以根据样本的不同属性对样本进行相应的分类。为了学习到这一模型,相关研究者提出了不同的策略,这些不同的策略就构成了机器学习的方法,常见的有监督学习,非监督学习,强化学习以及最近兴起的深度学习。3.5监督学习监督学习就是在已知的输入和输出情况下训练出一个模型,将输入映射到输出。简单地说,监督学习就是在训练之前已经知道了输入和输出,而任务的建立就是为了组建一个输入准确映射到输出的模型,当模型输入新的值时就能预测出对应的输出。监督学习 监督学习就是在已知的输入和输出情况下训练出一个模型,将输入映射到输出。简单地说,监督学习就是在训练之前已经知道了输入和输出,而任务的建立就是为了组建一个输入准确映射到
7、输出的模型,当模型输入新的值时就能预测出对应的输出。3.5.1K-近邻算法 K-近邻算法(K-nearest neighbors,KNN)核心思想就是“站队”:给定训练集,对于待分类的样本点,计算带预测样本和训练集所有数据点的距离,将距离从小到大取前K个样本,则哪个类别在前K个数据点中的数据量最多,就认为待预测的样本属于该类别。可以使用一句谚语来说明:“近朱者赤,近墨者黑。”K-近邻算法过程1)计算测试数据与各个训练数据之间的距离;2)按照距离的递增关系进行排序;3)选取距离最小的K个点;4)确定前K个点所在类别的出现频率;5)返回前K个点中出现频率最高的类别作为测试数据的预测分类。K-近邻算
8、法缺点对参数的选择很敏感。当选取不同的K值的时候我们会得到完全不同的结果。计算量特别大,每次分类都需要计算位置数据和所有训练样本之间的距离,尤其在遇到训练集非常大的情况。3.5.2决策树决策树(decision tree)是基于树形结构来进行决策的,这恰是人类在面临决策问题时一种很自然的处理机制。一棵决策树一般包含一个根节点,让俺个内部节点和若干个叶子结点,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶子结点代表一种类别。决策树 决策树学习的关键是如何选择最优划分属性。一般而言,随着划分过程不断进行,我们希望决策树的分支节点所包含的样本尽可能属于同一类别,即节点的“纯度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 导论 ppt 课件 机器 学习
限制150内