(1.6)--第6章 机器学习概述人工智能导论.ppt
《(1.6)--第6章 机器学习概述人工智能导论.ppt》由会员分享,可在线阅读,更多相关《(1.6)--第6章 机器学习概述人工智能导论.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 机器学习概述Introduction to Machine LearningPPT模板下载: 目录CONTENTS机器学习概述一基本概念二常见分类三学习准则与优化算法四典型算法介绍五一、机器学习概述获取知识、技能、发现事物内部规律的过程。人的学习从感性到理性、表层到深层知识转换过程。改进性能、适应环境、实现系统的自我完善。一个有特地目的的知识获取过程。内在行为外部表现积累经验,复杂的推理、判断1.人的学习学习是人类获取知识的重要途径和自然智能的重要标志。朝霞不出门,晚霞行千里瑞雪兆丰年一、机器学习概述R.Shank:一台计算机若不会学习,就不能说它具有智能。机器学习(MachineLe
2、arning,ML)定义(维基百科)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。计算机能够模拟人的学习行为,自动地通过学习获取知识和技能,不断改善性能,实现自我完善。2.机器学习的定义一、机器学习概述TomMitchell在MachineLearning的定义:给定任务T(Task)、相关经验E(Experience)、性能指标P(PerformanceMetric),机器学习就是通过对经验E的学习来优化任务T完成性能指标P的一个过程。任务:根据路况确定驾驶方式经验:大量的人类正确驾驶数据指标:发生事故的概率任务:根据对手招数确定应对招数经验:大量的人类棋谱数据指标:胜率2.机
3、器学习的定义卡内基梅隆大学教授符号主义代表性人物一、机器学习概述机器学习与人类思考的类比一、机器学习概述3.机器学习与人工智能机器学习是人工智能的核心,是使计算机获取知识、具有智能的根本途径,其应用遍及人工智能的各个领域。Machine Learning-all around us一、机器学习概述8人工智能机器学习推荐系统动态规划知识表示.逻辑推理多智能体智能计算自主意识+创造力人工智能的路途还很漫长PPT模板下载: 目录CONTENTS机器学习概述一基本概念二常见分类三学习准则与优化算法四典型算法介绍五二、基本概念1.样本(Sample):一组记录好的特征值和对应的标签(标记),称为一个样本
4、或实例。(出现朝霞、没有出现晚霞、空气湿度为50%;下雨)特征(Feature)标签、标记(Label)有标记样本(出现朝霞、没有出现晚霞、空气湿度为50%)无标记样本(有斑点、长脖子、长腿、蹄、哺乳动物;长颈鹿)二、基本概念2.数据集(Dataset):一组样本构成的集合。3.训练数据集(TrainingSet):用于模型学习的样本集合。4.测试数据集(TestSet):用于测试模型性能指标的样本集合。5.模型(Model):本质上是一个函数,实现从样本特征到样本标记映射。二、基本概念6.模型拟合(ModelFitting):利用训练数据集对模型的普通参数进行拟合。7.模型评价(ModelA
5、ssessment):利用测试数据集评价模型某些指标的真实性能。8.泛化(Generalization):模型对未知数据的预测能力,可通过测试误差来评估。9.鲁棒性(Robust):模型对异常数据的抗干扰能力,衡量其对数据变化的容忍度。二、基本概念10.拟合(Fitting):模型的对数据集的拟合(逼近)曲线能否很好的描述样本。11.欠拟合(UnderFitting):模型过于简单,无法拟合训练样本。12.过拟合(Overfitting):拟合曲线过于贴近训练数据的特征,但测试集上却较差,泛化能力差。分类(Classification)回归(Regression)二、基本概念13.独热编码(O
6、ne-Hot):也称一位有效码,用序列化的数字(只有0和1)表达特征,通过N位数字对N种情况进行编码。方便计算多个样本的特征相似度。性别特征:男,女One-Hot:男=10,女=01性别特征(One-Hot编码):10,01运动特征:足球,篮球,羽毛球,乒乓球运动特征(One-Hot编码):1000,0100,0010,0001PPT模板下载: 目录CONTENTS机器学习概述一基本概念二常见分类三学习准则与优化算法四典型算法介绍五三、常见分类从训练数据集中学习一个模型,使用该模型对未知数据进行预测。学习过程:将模型的预测结果与“训练数据”的实际结果(标签)进行比较,优化调整模型,直到预测结果
7、达到预期的准确率。注意:训练/测试数据集中的样本都有标记。常见应用:分类(Classification)、回归(Regression)。输出y模型学习算法输入x训练样本(x,y)1.监督学习(SupervisedLearning)三、常见分类(1)分类(Classification):样本标签只取有限个可能值(离散值)。【例2】肿瘤性质分类【例1】手写体数字识别1.监督学习(SupervisedLearning)典型应用:过滤垃圾邮件、欺诈检测、文本识别等。常用算法:朴素贝叶斯、决策树、逻辑回归、K近邻、支持向量机等。三、常见分类(2)回归(Regression):样本标签的取值是某区间的实数
8、(连续取值)。房屋面积(平方米)价格(万$)【例1】房价预测【例2】股票价格预测1.监督学习(SupervisedLearning)典型应用:供应和销售量分析、计算时间序列相关性等。常用算法:线性回归、多项式回归、神经网络、决策树等。本质上也是“分类”算法,只不过预测的不是类别而是一个数值。(1)回归(Regression)1.监督学习(SupervisedLearning)三、常见分类实际场景中获得带标签的数据是非常困难的。样本集中的样本没有标记,学习模型目的是推断出数据的一些内在特征结构。常见应用:降维(DimensionReduction)、聚类(Clustering)等。2.无监督学习
9、(UnsupervisedLearning)三、常见分类(1)降维(DimensionReduction):采用某种映射方法,将原始高维空间中的数据特征映射到低维度的空间中,降低求解问题的复杂性。手写数字识别训练数据集MINIST的降维可视化结果28*28=784维2维难度:尽可能保留特征的主要结构及其携带的信息。2.无监督学习(UnsupervisedLearning)典型应用:推荐系统、协同过滤等。常用算法:主成分分析、奇异值分解、t-SNE等。三、常见分类(2)聚类(Clustering):基于某些特征,试图找出相似的事物。具有很多相似特征的事物聚集在一起并划分到同一个类别,每一个类别称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 1.6-第6章 机器学习概述人工智能导论 1.6 机器 学习 概述 人工智能 导论
限制150内