《深度学习是否已经取代了传统的计算机视觉?.docx》由会员分享,可在线阅读,更多相关《深度学习是否已经取代了传统的计算机视觉?.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、深度学习是否已经取代了传统的计算机视觉?深度学习是否已经取代了传统的计算机视觉?网络转载导语:本文作者以为,深度学习只是一种计算机视觉工具,而不是包治百病的良药,不要由于流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,理解它们可以为你省去很多的时间和烦恼;并且把握传统计算机视觉确实可以让你在深度学习方面做得更好。这是由于你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。本文作者以为,深度学习只是一种工具,而不是包治百病的良药,不要由于流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,理解它们可以为你省去很多的时间和烦恼;并且把握传统计算机视觉确实可以让你
2、在深度学习方面做得更好。这是由于你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。本文的灵感同样来自论坛中的一个常见问题:深度学习已经取代了传统的计算机视觉吗?或者是换种讲法:既然深度学习看起来如此有效,是否还有必要学习传统的计算机视觉技术?这个问题很好。深度学习确实给和人工智能领域带来了革命性的打破。很多曾经看似困难的问题,如今机器可以比解决的比人类还好。图像分类就是最好的印证。确实,如从前所述,深度学习有责任将计算机视觉纳入行业幅员。但深度学习仍然只是的一个工具,且显然不是解决所有问题的灵丹妙药。因此,本文会对此进展具体阐述。也就是讲,我将讲明传统的计算机视觉技术为何
3、仍特别有用,值得我们继续学习并传授下去。本文分为以下几个局部/论点:深度学习需要大数据深度学习有时会做过了头传统将会提升你的深度学习程度进入正文之前,我以为有必要具体解释一下什么是传统,什么是深度学习,及其革命性。背景知识在深度学习出现以前,假如你有一项诸如图像分类的工作,你会进展一步叫做特征提取的处理。所谓特征就是图像中有趣的、描绘性的、或者是提供信息的小局部。你会应用我在本文中称之为的传统计算机视觉技术的组合来寻找这些特征,包括边沿检测、角点检测、对象检测等等。在使用这些与特征提取和图像分类相关的技术时,会从一类对象例如:椅子、马等等的图像中提取出尽可能多的特征,并将其视为这类对象的定义称
4、作词袋。接下来你要在其它图像中搜索这些定义。假如在另一个图像中存在着词袋中相当一局部的特征,那么这个图像就被归为包含那个特定对象如椅子、马等等的分类。这种图像分类的特征提取方法的难点在于你必须在每张图像中选择寻找哪些特征。随着你试图区分的种别数目开场增长,比方讲超过10或者20,这就会变得非常费事甚至难以实现。你要寻找角点?边沿?还是纹理信息?不同种别的对象最好要用不同种类型的特征来描绘。假如你选择使用很多的特征,你就不得不处理海量的参数,而且还需要自己来微调。深度学习引入了端到端学习这一概念,简而言之让机器在每个特定种别的对象中学习寻找特征,即最具描绘性、最突出的特征。换句话讲,让神经网络去
5、发现各种类型图像中的潜伏形式。因此,借助端到端学习,你不再需要手动决定采用哪种传统机器视觉技术来描绘特征。机器为你做好了这一切。()连线)杂志如此写道:举例来讲,假如你想教会一个深度神经网络识别一只猫,你不必告诉它去寻找胡须、耳朵、毛或者是眼睛。你只需展示给它成千上万的猫的图像,它自然会解决这一问题。假如它总是会将狐狸误以为是猫,你也不用重写代码。你只需对它继续进展训练。下列图描绘了特征提取使用传统计算机视觉和端到端学习之间的这种区别:以上就是背景介绍。如今接着讨论为什么传统计算机视觉仍然必不可少,而且学习它仍大有裨益。深度学习需要大量数据首先,深度学习需要数据,许很多多的数据。前文提到过的著
6、名图像分类模型的训练都基于庞大的数据集。排名前三的训练数据集分别是:ImageNet150万图像,1000个对象分类/种别;COCO250万图像,91个对象分类;PASCALVOC50万图像,20个对象分类。但是一个训练不良的模型在你的训练数据之外很可能表现糟糕,由于机器并没有对于问题的洞察力,也就不能在没看到数据的情况下进展概括归纳。而且对你来讲查看训练模型内部并进展手动调整又太过困难,由于一个深度学习模型内部拥有数以百万计的参数每个参数在训练期间都会被调整。某种程度上讲,一个深度学习模型就是一个黑箱。传统的计算机视觉完全透明,允许你更好地评估判定你的解决方案是否在训练环境之外仍然有效。你对
7、问题的深化见解可以放进你的算法之中。并且假如任何地方出现故障,你也可以更轻易地弄清楚什么需要调整,在哪里调整。深度学习有时做过了头这大概是我最喜欢的支持研究传统计算机视觉技术的理由。训练一个深度神经网络需要很长的时间。你需要专门的硬件例如高性能GPU训练最新、最先进的图像分类模型。你想在自己还不错的笔记本上训练?去度个一周的假吧,等你回来的时候训练很可能仍未完成。此外,假如你的训练模型表现不佳呢?你不得不返回原点,用不同的训练参数重做全部工作。这一经过可能会重复数百次。但有时候所有这些完全没必要。由于传统计算机视觉技术可以比深度学习更有效率地解决问题,而且使用的代码更少。例如,我曾经介入的一个
8、工程是检查每个通过传送带的罐子里是否有一个红勺子。如今你可以通过前文表达的旷日持久的经过来训练一个深度神经网络去检测勺子,或你也可以写一个简单的以红色为阈值的算法将任何带有一定范围红色的像素都标记为白色,所有其它的像素标记为黑色,然后计算有多少白色的像素。简简单单,一个小时就可以搞定!把握传统的计算机视觉技术可能会为你节省大量的时间并减少不必要的烦恼。传统计算机视觉会提升你的深度学习技巧理解传统的计算机视觉实际上能帮你在深度学习上做得更好。举例来讲,计算机视觉领域最为普遍使用的神经网络是卷积神经网络。但什么是卷积?卷积事实上是一种被广泛使用的图像处理技术比方,索贝尔边沿检测。理解这一点可以帮助
9、你理解神经网络内部终究发生了什么,进而进展设计和微调以更好地解决你的问题。还有一件事叫做预处理。你输入给模型的数据往往要经过这种处理,以便为接下来的训练做预备。这些预处理步骤主要是通过传统的计算机视觉技术完成的。例如,假如你没有足够的训练数据,你可以进展一个叫做数据增强的处理。数据增强是指对你训练数据集中的图像进展随机的旋转、挪动、裁剪等,进而创造出新图像。通过执行这些计算机视觉操纵,可以极大地增加你的训练数据量。结论本文阐述了为什么深度学习还没有取代传统计算机视觉技术,以及后者仍值得学习和传授。首先,本文将目光放在了深度学习往往需要大量数据才能表现良好这一问题上。有时并不具备大量数据,而传统计算机视觉在这种情况下可作为一种替换方案。第二,深度学习针对特定的任务偶然会做过头。在这些任务中,标准的计算机视觉比起深度学习可以更为高效地解决问题,并且使用更少的代码。第三,把握传统计算机视觉确实可以让你在深度学习方面做得更好。这是由于你可以更好地理解深度学习的内部状况,并可执行预处理步骤改善深度学习结果。总而言之,深度学习只是一种计算机视觉的工具,而不是包治百病的良药。不要由于流行就一味地使用它。传统的计算机视觉技术仍然可以大显身手,理解它们可以为你省去很多的时间和烦恼。
限制150内