机器学习综述(共7页).doc
《机器学习综述(共7页).doc》由会员分享,可在线阅读,更多相关《机器学习综述(共7页).doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上机器学习综述摘要:为了对高层次结构的抽象的表示,需要有能够对深层结构学习的模型。深层结构是由非线性的多层次组成,如神经网络有许多隐藏的层。深层结构的参数优化是一项困难的任务,例如最近提出的深信念网络(DBN)学习算法很好解决了该问题并取得了一定的成功。深度学习是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络。关键词:神经网络,无监督,深度学习,AI1 引言机器学习的核心是学习。机器学习的研究主旨是使用计算机模拟人类的学习活动,它是研究计算机识别现有知识、 获取新知识、 不断改善性能和实现自身完善的方法。机器学习研究的就是如何使机器通过
2、识别和利用现有知识来获取新知识和新技能。它是人工智能的一个重要的研究领域。这里的学习意味着从数据中学习, 它包括有监督学习( Supervised Learning )、无监督学习 ( Unsupervised Learning) 和半监督学习( Semi- Supervised Learning )三种类别。目前在机器学习研究领域影响较大的是H. Simon 的观点:学习是系统中的任何改进,这种改进使得系统在重复同样的工作或进行类似的工作时,能完成得更好。学习的基本模型就是基于这一观点建立起来的。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人
3、脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。深度学习中的主要困难,特别是在模式分类运用中,在数据的维数中学习的复杂性呈指数
4、的线性增长。主流的方法是克服“维数灾难”,通过使用预处理数据的方式,这样能够降维以至于更够有效的处理。降维指的是特征提取,结果可以说是在多模式识别系统智能中转换了特征提取过程中的人类工程,非常具有挑战性并且高度依赖于相关的应用。此外,如果提取了不完全或错误的特征,分类过程本质上表示非常有限。2 浅层学习和深层学习2.1 浅层学习20世纪80年代末期,用于人工神经网络的反向传播算法(也叫Back Propagation算法或者BP算法)的发明,给机器学习带来了希望,掀起了基于统计模型的机器学习热潮。这个热潮一直持续到今天。人们发现,利用BP算法可以让一个人工神经网络模型从大量训练样本中学习统计规
5、律,从而对未知事件做预测。这种基于统计的机器学习方法比起过去基于人工规则的系统,在很多方面显出优越性。这个时候的人工神经网络,虽也被称作多层感知机(Multi-layer Perception),但实际是只含有一层隐层节点的浅层模型。但是BP算法存在一些问题:(1)梯度越来越稀疏:从顶层越往下,误差校正信号越来越小;(2)收敛到局部最小值:尤其是从远离最优区域开始的时候(随机值初始化会导致这种情况的发生);(3)一般,我们只能用有标签的数据来训练:但大部分的数据是没标签的,而大脑可以从没有标签的数据中学习;20世纪90年代,各种各样的浅层机器学习模型相继被提出,例如支撑向量机(SVM,Supp
6、ort Vector Machines)、 Boosting、最大熵方法(如LR,Logistic Regression)等。这些模型的结构基本上可以看成带有一层隐层节点(如SVM、Boosting),或没有隐层节点(如LR)。这些模型无论是在理论分析还是应用中都获得了巨大的成功。相比之下,由于理论分析的难度大,训练方法又需要很多经验和技巧,这个时期浅层人工神经网络反而相对沉寂。2.2 深层学习2006年,加拿大多伦多大学教授、机器学习领域的泰斗Geoffrey Hinton和他的学生RuslanSalakhutdinov在科学上发表了一篇文章,开启了深度学习在学术界和工业界的浪潮。这篇文章有
7、两个主要观点:(1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;(2)深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wise pre-training)来有效克服,在这篇文章中,逐层初始化是通过无监督学习实现的。深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,“深度模型”是手段, “特征学习”是目的。区别于传统的浅层学习,深度学习的不同在于:(1) 强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;(2) 明确突出了特征学习
8、的重要性,也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。2.3 深度学习过程(1)采用无标定数据(有标定数据也可)分层训练各层参数,这一步可以看作是一个无监督训练过程,是和传统神经网络区别最大的部分(这个过程可以看作是feature learning过程);(2)基于第一步得到的各层参数进一步fine-tune整个多层模型的参数,这一步是一个有监督训练过程;第一步类似神经网络的随机初始化初值过程,由于DL的第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。3 机器学习方法的新发展3.
9、1 卷积神经网络(Convolutional Neural Networks)CNNs是多层神经网络家族,特别是对两维数据设计,例如图像或视频。CNNs受到早期工作在时延神经网络(TDNN)的影响,通过在时间维度和用于语音和时间序列处理中共享权重以减少学习计算的需求。CNNs是第一个真正成功的深度学习方法,多层次的层次结构被成功的训练。CNNs是利用空间关系选择拓扑结构以减少参数的数量,它必须学习和生成前馈反向传播训练。CNNs是通过最小数据处理需要的目标而提出的一个深层学习框架。在CNNs中,一小部分图像(称为感受野)被视为对最低层输入的层次结构。信息一般通过不同的网络层传播,其中每一层运用
10、数字滤波目的是为了获得观察数据最显著的特征。该方法提供了一个水平位移、尺度、旋转不变性,由于局部感受野允许神经元和处理单元访问最基本的单元,例如定向的边缘和角落。但是,当权重太小时激活函数几乎是线性的,结果图像是模糊的,其他的权重能够引起激活输出类似于与或功能。这些输出形式是一个新的特征映射,然后通过另一个卷积序列、子采样和激活函数。在CNNs中层和空间信息的亲密关系,使得他们非常适合图像处理和理解,他们从图像中自动提取特征一般表现良好。在一些情况下Gabor滤波用来做一些初始的预处理模拟人类视觉回应视觉激发,在最近的工作中,研究人员已经运用CNNs到各种机器学习问题中,包括人脸检测,文献分析
11、,语音识别。CNNs应用在视频中训练,主要目的是找到帧与帧之间连贯性,尽管这需要特定的CNNs。3.2自动编码器(AutoEncoder)3.2.1给定无标签数据,用非监督学习学习特征在我们之前的神经网络中,我们输入的样本是有标签的,即(input, target),这样我们根据当前输出和target(label)之间的差去改变前面各层的参数,直到收敛。但现在我们只有无标签数据,我们将input输入一个encoder编码器,就会得到一个code,这个code也就是输入的一个表示,我们的目的是通过这个code来表示input。这样,我们加一个decoder解码器,这时候decoder就会输出一个
12、信息,那么如果输出的这个信息和一开始的输入信号input是很像的(理想情况下就是一样的),很明显,这个code是靠谱的。所以,我们就通过调整encoder和decoder的参数,使得重构误差最小,这时候就得到了输入input信号的第一个表示了,也就是编码code。由于是无标签数据,所以误差的来源就是直接重构后与原输入相比得到。3.2.2 通过编码器产生特征,然后训练下一层。这样逐层训练得到第一层的code,我们的重构误差最小让我们相信这个code就是原输入信号的良好表达了,或者换种方式说,它和原信号是一模一样的(表达不一样,反映的是一个东西)。第二层和第一层的训练方式就没有差别了,我们将第一层
13、输出的code当成第二层的输入信号,同样最小化重构误差,就会得到第二层的参数,并且得到第二层输入的code,也就是原输入信息的第二个表达。 AutoEncoder存在一些变体,像稀疏自动编码器(Sparse AutoEncoder)、降噪自动编码器(Denoising AutoEncoders)和压缩自动编码器(Contractive AutoEncoder)。但是,AutoEncoder不能用来分类数据,因为它没有学习如何去连结一个输入和一个类。它只是学会了如何去重构或者复现它的输入。或者说,它只是学习获得了一个可以良好代表输入的特征,这个特征可以最大程度上代表原输入信号。那么,为了实现分类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 综述
限制150内