第9章 深度学习ppt课件.pptx
《第9章 深度学习ppt课件.pptx》由会员分享,可在线阅读,更多相关《第9章 深度学习ppt课件.pptx(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、章 节 目 录9.1 9.1 深度学习概述深度学习概述9.2 9.2 卷积神经网络卷积神经网络9.3 9.3 循环神经网络循环神经网络9.4 9.4 深度信念网络深度信念网络9.5 9.5 深度生成模型深度生成模型9.6 9.6 深度学习应用概述深度学习应用概述9.7 9.7 机器学习系统机器学习系统9.8 9.8 案例:深度学习在计算机视觉中的应用案例:深度学习在计算机视觉中的应用 李飞飞在斯坦福做的自然图像分类项目。李飞飞在斯坦福做的自然图像分类项目。20112011年,计算机对于图年,计算机对于图像的分类准确度只能达到像的分类准确度只能达到75%75%左右左右。 之后,之后,谷歌谷歌、微
2、软微软、百度百度均在进步均在进步什么是深度学习?什么是深度学习? 深度学习是一类基于神经网络的机器学习算法,网络结构包含两个以上非线性隐含层。与传统的机器学习方法不同,其丰富的层级结构为模型提供了更高的抽象层次,能够为复杂非线性系统提供建模。 典型地,一个DNN模型包括一个输入层、一个输出层及多个隐含层。多个非线性隐含层的叠加可以有效组合出高度非线性的学习模型。因而,可以从大量数据中学习高阶语义概念表示,使得深度学习可以高性能得处理复杂问题。发展历史发展历史 1943年,McCulloch和Pitts首次提出M-P神经元模型。 1958年,Roseblatt提出感知器感知器,通过计算机确定连接
3、权重。 1980年,福岛邦彦等提出神经认知机神经认知机,模拟生物视觉传导。 1986年,Rumelhart提出误差反向传播算法误差反向传播算法、多层感知器。 1989年,LeCun等提出卷积神经网络卷积神经网络,并用于手写字识别。 2006年,Hinton,Bengio等提出预训练预训练、自编码器,将逐层贪婪训练方法用于深度神经网络。 2012年,Krizhevsky等将ReLU作为激活函数作为激活函数,在图像识别基准测试中获得压倒性优势深度学习特点深度学习特点1. 使用多重非线性变换对数据进行多层抽象。2. 以寻求更适合的概念表示方法为目标。3. 形成一类具有代表性的特征表示学习方法。 神经
4、认知机(1980)结构:对比度提取G层 特征提取S层及抗变形C层卷积神经网络的内部过程卷积神经网络的内部过程Deep LearningYann LeCun, Yoshua Bengio & Geoffrey Hinton. Nature, 2015卷积层卷积层( (Convolutional Layer) ) 卷积核(convolution kernel) 在通道方向全连接,空间方向仅局部连接 共享权值参数,一个卷积核提取所有输入区域得同一特征 卷积是局部连接、共享参数版的全连接层。这两个特性使参数量大大降低。 卷积计算卷积计算 将各个位置上滤波器的元素和输入的对应元素相乘,然后再求和池化层池
5、化层( (pooling) ) 池化根据特征图上的局部统计信息进行下采样,在保留有用信息的同时减少特征图的大小。卷积网络演化脉络卷积网络演化脉络 2012年提出的AlexNet引入Dropout方法及ReLU激活函数 2015年He Kaiming等提出具有残差单元的ResNet将网络深度推向极致代表性网络结构代表性网络结构给网络增加记忆能力给网络增加记忆能力 很多现实任务中,网络的输入不仅和当前时刻的输入相关,也和其过去一段时间的输出相关。 延时神经网络延时神经网络(TDNN)是位非输出层建立额外延时单元的神经网络模型 自回归模型自回归模型(AR)是用一个变量的历史来预测自身的统计模型。 循
6、环神经网络循环神经网络(RNN)是一类具有短期记忆能力的神经网络,神经元可以接受自身的信息,形成具有环路的网络结构典型的循环神经网络典型的循环神经网络 典型的RNN有三种设计模式三种训练损失的计算图。其中,x值为输入序列,o为映射的输出值序列,损失L衡量每个o与相应的训练目标y的距离。循环神经网络的运作过程循环神经网络的运作过程循环神经网络的训练方法循环神经网络的训练方法 RNN的训练方法是基于时间的反向传播算法(BPTT)。 主要思想:通过类似前馈神经网络的BP算法来进行计算梯度。BPTT算法将RNN看作是一个展开的前馈神经网络,其中“每一层”对应循环网络中的“每个时刻”。基于门控的循环神经
7、网络基于门控的循环神经网络 为克服记忆容量问题,引入门控来控制信息累积速度。 长短期记忆网络(LSTM)网络是RNN的一个变体,可以有效地解决简单RNN的梯度爆炸或消失问题。玻尔兹曼机玻尔兹曼机( (Boltzmann machine) ) 每个随机变量是二值的 所有节点之间是全连接的卷积核 每两个变量之间的相互影响 适于解决两类问题: 搜索问题、学习问题 玻尔兹曼机可以看做是一个随机动力系统(stochastic dynamical system),每个变量的状态都以一定的概率受到其它变量的影响。玻尔兹曼机可以用概率无向图模型来描述。受限玻尔兹曼机受限玻尔兹曼机( (Restricted B
8、oltzmann Machine) ) 同一层无连接 不同层全连接 RBM是一个二分图结构的无向图模型。 RBM的变量分为隐藏变量和可观测变量,分别用可观测层和隐藏层来表示这两组变量。有七个变量的RBM深度信念网络深度信念网络( (DBN) ) 最底层为可观测变量 顶层为无向连接 DBN是一种深层的概率有向图模型,其图结构由多层节点构成。每层节点的内部没有连接,相邻两层的节点为全连接。 训练方法: 逐层预训练 精调(fine-tuning)概率生成模型概率生成模型( (generative model) ) 简称生成模型,是概率统计和机器学习中的一类重要模型,指一系列用于随机生成可观测数据的模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第9章 深度学习ppt课件 深度 学习 ppt 课件
限制150内