计算机视觉概述.pptx
《计算机视觉概述.pptx》由会员分享,可在线阅读,更多相关《计算机视觉概述.pptx(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于课程 许多会议论文集和许多学术期刊都反映了该领域的最新进展。许多会议论文集和许多学术期刊都反映了该领域的最新进展。比如:比如:Int.Conf.on Computer Vision and Pattern Recognition(CVPR);Int.Conf.on Computer Vision(ICCV);Int.Conf.on Pattern Recognition(ICPR);European Conf.on Computer Vision(ECCV);Asian Conf.on Computer Vision(ACCV);还有许多学术期刊也包含了这一领域的最新研究成果还有许多学术期
2、刊也包含了这一领域的最新研究成果,如:如:IEEE Trans.on Pattern Analysis and Machine Intelligence(PAMI);Int.J on Computer Vision(IJCV);Image and Vision Computing;Pattern Recognition Letter;Pattern Recognition;IEEE Trans.on Image Processing.第1页/共49页计算机视觉发展简史计算机视觉发展简史计算机视觉研究内容计算机视觉研究内容计算机视觉应用状况计算机视觉应用状况计算机视觉发展讨论计算机视觉发展讨论计
3、算机视觉相关学科计算机视觉相关学科计算机视觉研究进展计算机视觉研究进展计算机视觉面临困难计算机视觉面临困难第2页/共49页计算机视觉发展简史计算机视觉发展简史计算机视觉研究内容计算机视觉研究内容计算机视觉应用状况计算机视觉应用状况计算机视觉发展讨论计算机视觉发展讨论计算机视觉相关学科计算机视觉相关学科计算机视觉研究进展计算机视觉研究进展计算机视觉面临困难计算机视觉面临困难第3页/共49页视觉信息处理概略图形工程图形工程物体建摸、造型物体建摸、造型真实感图形显示真实感图形显示动画制作动画制作场景模拟场景模拟图形用户界面图形用户界面图图形形生生成成图象工程图象工程图象处理、效果增强图象处理、效果增
4、强图象查询、分类图象查询、分类机器视觉机器视觉三维重构三维重构模模型型生生成成视觉信息处理视觉信息处理 =图象工程图象工程 +图形工程图形工程自然场景自然场景数字化场景数字化场景图形工程图形工程图象分割图象分割特征抽取特征抽取模型重构模型重构图形显示图形显示图象量化图象量化图象工程图象工程几何几何模型模型数字数字图象图象第4页/共49页计算机视觉研究 从从20202020世世纪纪50505050年年代代末末开开始始,计计算算机机开开始始被被作作为为实实现现人人类类智智能能和和人人类类感感知知的的工工具具,借借助助计计算算机机人人类类第第一一次次可可以以象象借借助助机机械械实实现现对对体体力力的
5、的延延伸一样实现伸一样实现对脑力和感知能力的延伸对脑力和感知能力的延伸。对人类视觉感知能力的计算机模拟对人类视觉感知能力的计算机模拟导致计算机视觉的产生。导致计算机视觉的产生。具体地讲,计算机视觉要达到的基本目的有具体地讲,计算机视觉要达到的基本目的有3 3 3 3个:个:根据一幅或多幅二维图像计算出观测点到目标物体的根据一幅或多幅二维图像计算出观测点到目标物体的距离距离;根据一幅或多幅二维图像计算出观测点到目标物体的根据一幅或多幅二维图像计算出观测点到目标物体的运动参数运动参数;根据一幅或多幅二维图像计算出观测点到目标物体的根据一幅或多幅二维图像计算出观测点到目标物体的表面物理特性表面物理特
6、性。计算机视觉计算机视觉要达到的最终目的可简单描述为:要达到的最终目的可简单描述为:实现对于三维景物世界的理解,即实现人的视觉系统的某些功能;实现对于三维景物世界的理解,即实现人的视觉系统的某些功能;或者从形式上讲,利用二维投影图像来重构或者从形式上讲,利用二维投影图像来重构三维物体的可视部分三维物体的可视部分。第5页/共49页计算机视觉发展简史 2020世纪世纪5050年代:用年代:用统计模式识别统计模式识别,集中在二维图像的分析和识别上,集中在二维图像的分析和识别上 如:如:光学字符识别、工件表面、显微图片和航空图片光学字符识别、工件表面、显微图片和航空图片光学字符识别、工件表面、显微图片
7、和航空图片光学字符识别、工件表面、显微图片和航空图片的分析和解释等。的分析和解释等。2020世世纪纪6060年年代代:Roberts(1965)Roberts(1965)通通过过计计算算机机程程序序从从数数字字图图像像中中提提取取出出诸诸如如立立方方体体、稧稧状状体体、棱棱柱柱体体等等多多面面体体的的三三维维结结构构,并并对对物物体体形形状状及及物物体体的的空间关系进行描述。空间关系进行描述。RobertsRoberts的研究开创了以理解三维场景为目的的计算机视觉的研究的研究开创了以理解三维场景为目的的计算机视觉的研究的研究开创了以理解三维场景为目的的计算机视觉的研究的研究开创了以理解三维场景
8、为目的的计算机视觉的研究。RobertsRoberts对对对对积积积积木木木木世世世世界界界界的的的的创创创创造造造造性性性性研研研研究究究究给给给给人人人人们们们们以以以以极极极极大大大大的的的的启启启启发发发发,许许许许多多多多人人人人相相相相信信信信:一一一一旦旦旦旦由由由由白白白白色色色色积积积积木木木木玩玩玩玩具具具具组组组组成成成成的的的的三三三三维维维维世世世世界界界界可可可可以以以以被被被被理理理理解解解解,则则则则可可可可以以以以推推推推广广广广到到到到理理理理解解解解更复杂的三维场景。更复杂的三维场景。更复杂的三维场景。更复杂的三维场景。对对对对积积积积木木木木世世世世界界
9、界界的的的的研研研研究究究究范范范范围围围围从从从从边边边边缘缘缘缘、角角角角点点点点等等等等特特特特征征征征提提提提取取取取,到到到到线线线线条条条条、平平平平面面面面、曲曲曲曲面面面面等等等等几几几几何何何何要要要要素素素素分分分分析析析析,一一一一直直直直到到到到图图图图像像像像明明明明暗暗暗暗、纹纹纹纹理理理理、运运运运动动动动以以以以及及及及成成成成象象象象几几几几何何何何等等等等,并建立了各种数据结构和推理规则。并建立了各种数据结构和推理规则。并建立了各种数据结构和推理规则。并建立了各种数据结构和推理规则。2020世纪世纪7070年代,出现了一些视觉应用系统。年代,出现了一些视觉应
10、用系统。第6页/共49页计算机视觉发展简史 7070年年代代中中期期,麻麻省省理理工工学学院院(MIT)(MIT)人人工工智智能能(AI)(AI)实实验验室室正正式式开开设设“机器视觉机器视觉”(Machine Vision)(Machine Vision)课程。课程。同同时时,MIT MIT AI AI 实实验验室室吸吸引引了了国国际际上上许许多多知知名名学学者者参参与与机机器器视视觉觉的的理理论、算法、系统设计的论、算法、系统设计的开放而轻松开放而轻松的研究。的研究。David David MarrMarr教教授授于于19731973年年应应邀邀在在MIT MIT AIAI实实验验室室领领
11、导导一一个个博博士士生生为为主主体体的的研研究究小小组组,19771977年年提提出出了了不不同同于于“积积木木世世界界”分分析析方方法法的的计计算算机机视视觉觉(Computer(Computer Vision)Vision)理理论论,该该理理论论在在8080年年代代成成为为机机器器视视觉觉研研究究领领域域中中的的一一个个十十分分重重要要的的理理论论框框架架(Marr(Marr 1982)1982)视视觉觉计计算算理理论。论。从一份刊物的名称变化可以看到计算机视觉的学科进展:从一份刊物的名称变化可以看到计算机视觉的学科进展:19721972,CGIP(CGIP(计算机图形学与图像处理计算机图
12、形学与图像处理)创刊;创刊;19831983年,改名为年,改名为CVGIP(CVGIP(计算机视觉、图形学与图像处理计算机视觉、图形学与图像处理);19911991年年,分分成成两两个个版版本本,分分别别称称CVGIP-GMIP(CVGIP-GMIP(图图形形模模型型与与图图像像处处理理)和和CVGIP-IU(CVGIP-IU(图像理解图像理解);19951995年年,转转成成两两个个期期刊刊,前前者者命命名名为为GMIP(GMIP(图图形形模模型型与与图图像像处处理理),后者命名为,后者命名为CVIU(CVIU(计算机视觉与图像理解计算机视觉与图像理解)。第7页/共49页计算机视觉发展简史
13、对对计计算算机机视视觉觉的的全全球球性性研研究究热热潮潮是是从从2020世世纪纪8080年年代代开开始始的的,到到了了8080年年代代中中期期,计计算算机机视视觉觉获获得得了了蓬蓬勃勃发发展展,新新概概念念、新新方方法法、新新理理论论不不断断涌涌现现。到到目目前前为为止止,计计算算机视觉仍然是一个非常活跃的研究领域。机视觉仍然是一个非常活跃的研究领域。许多会议论文集和许多学术期刊都反映了该领域的最新进展。比如:许多会议论文集和许多学术期刊都反映了该领域的最新进展。比如:International International Conference Conference on on Compute
14、r Computer Vision Vision and and Pattern Pattern Recognition,CVPRRecognition,CVPR;International Conference on Computer Vision,ICPRInternational Conference on Computer Vision,ICPR;International Conference on Robotics and Automation,ICRAInternational Conference on Robotics and Automation,ICRA;Workshop
15、 on Computer Vision,WCVWorkshop on Computer Vision,WCV;其它许多其它许多IEEEIEEE和和SPIESPIE等的会议。等的会议。IEEE IEEE Transaction Transaction on on Pattern Pattern Analysis Analysis and and Machine Machine Intelligence Intelligence(PAMI);(PAMI);Computer Vision,Graphics,and Image Processing(CVGIP);Computer Vision,Gra
16、phics,and Image Processing(CVGIP);IEEE Transaction on Image Processing;IEEE Transaction on Image Processing;IEEE Transaction on System,Man,and Cybernetics(SMC);IEEE Transaction on System,Man,and Cybernetics(SMC);Machine Vision and Application;Machine Vision and Application;International Journal on C
17、omputer Vision(IJCV);International Journal on Computer Vision(IJCV);Image and Vision Computing;Image and Vision Computing;Pattern RecognitionPattern Recognition;Computer Vision and Image UnderstandingComputer Vision and Image Understanding。第8页/共49页计算机视觉发展简史计算机视觉发展简史计算机视觉研究内容计算机视觉研究内容计算机视觉应用状况计算机视觉应用
18、状况计算机视觉发展讨论计算机视觉发展讨论计算机视觉相关学科计算机视觉相关学科计算机视觉研究进展计算机视觉研究进展计算机视觉面临困难计算机视觉面临困难第9页/共49页计算机视觉研究进展 从从6060年年代代初初至至今今,计计算算机机视视觉觉已已经经经经历历了了近近5050年年的的研研究究,取取得得了了一一系系列列的的研研究究成成果果,这这使使得得这这一一领领域域在在过过去去的的4040多年中成为多年中成为AIAI研究中最为活跃的一部分。研究中最为活跃的一部分。其主流研究分成三大阶段:其主流研究分成三大阶段:阶段阶段1 1:以模型世界为主要对象的视觉基本方法研究以模型世界为主要对象的视觉基本方法研
19、究以模型世界为主要对象的视觉基本方法研究以模型世界为主要对象的视觉基本方法研究;阶段阶段2 2:以计算理论为核心的视觉模型研究以计算理论为核心的视觉模型研究以计算理论为核心的视觉模型研究以计算理论为核心的视觉模型研究;阶段阶段3 3:以应用为目标的计算机视觉方法以应用为目标的计算机视觉方法以应用为目标的计算机视觉方法以应用为目标的计算机视觉方法。第10页/共49页以模型世界为主要对象的视觉方法 这个阶段以这个阶段以Roberts Roberts 的开创性工作为标志的开创性工作为标志 三维重建三维重建 19651965年年,Roberts Roberts(Machine(Machine perc
20、eption perception of of three-three-dimensional dimensional solids,1965)solids,1965)通通过过计计算算机机程程序序从从数数字字图图像像中中提提取取诸诸如如立立方方体体、稧稧状状体体、棱棱柱柱体体等等多多面面体体的的三三维维结结构构,并并对对物物体体形形状状及及物物体体的空间关系的空间关系进行描述。进行描述。在在RobertsRoberts的的工工作作中中引引入入了了三三维维物物体体与与二二维维成成像像的的关关系系,采采用用了了一一些些简单的边缘特征提取方法并引入了组合线段的方法。简单的边缘特征提取方法并引入了组合
21、线段的方法。随随后后,人人们们对对积积木木世世界界进进行行了了深深入入的的研研究究,研研究究范范围围从从边边缘缘、角角点点等等特特征征提提取取,到到线线条条、平平面面、曲曲面面等等几几何何要要素素分分析析,到到图图像像明明暗暗、纹理、运动以及成象几何纹理、运动以及成象几何等,并建立了各种数据结构和推理规则。等,并建立了各种数据结构和推理规则。Guzman Guzman(Computer(Computer recognition recognition of of three three dimensional dimensional objects in a visual scene,1968
22、)objects in a visual scene,1968)首先引入符合处理和启发式方法;首先引入符合处理和启发式方法;Huffman(Impossible Huffman(Impossible objects objects as as nonsense nonsense sentences,1971)sentences,1971)、Clowes Clowes(On(On Seeing Seeing Thing,1971)Thing,1971)和和 Waltz Waltz(Generating(Generating semantic semantic description descri
23、ption from from drawing drawing of of scenes scenes with with shadows,1972)shadows,1972)等等对对积积木木世世界界进进行行研研究究并并分分别别解解决决了了由由线线段段解解释释景景物物和和处理阴影等问题。处理阴影等问题。第11页/共49页 积积木木世世界界的的研研究究反反映映了了视视觉觉早早期期研研究究中中的的一一些些特特点点,即从简化的世界出发开始研究。即从简化的世界出发开始研究。这这些些工工作作对对视视觉觉的的发发展展起起了了促促进进作作用用,但但对对于于稍稍微微复复杂的景物便难以奏效。杂的景物便难以奏效。
24、主要原因在于:主要原因在于:这这这这一一一一时时时时期期期期的的的的工工工工作作作作虽虽虽虽然然然然建建建建立立立立在在在在三三三三维维维维空空空空间间间间关关关关系系系系分分分分析析析析的的的的基基基基础础础础上上上上,但但但但对对对对三三三三维维维维关关关关系系系系的的的的分分分分析析析析仅仅仅仅仅仅仅仅是是是是依依依依靠靠靠靠简简简简单单单单的的的的边边边边缘缘缘缘线线线线段段段段等等等等简简简简单单单单约约约约束束束束关关关关系系系系,并并并并没没没没有有有有充充充充分分分分考考考考虑虑虑虑人人人人类或其它动物视觉系统感知三维空间关系的方式类或其它动物视觉系统感知三维空间关系的方式类或
25、其它动物视觉系统感知三维空间关系的方式类或其它动物视觉系统感知三维空间关系的方式 。以模型世界为主要对象的视觉方法第12页/共49页以计算理论为核心的视觉模型 2020世世纪纪7070年年代代开开始始,对对计计算算机机视视觉觉的的研研究究进进入入更更为为理理性性化的阶段化的阶段 主主主主要要要要出出出出发发发发点点点点是是是是:从从从从生生生生理理理理学学学学、光光光光学学学学和和和和射射射射影影影影几几几几何何何何的的的的方方方方法法法法出出出出发发发发,研研研研究究究究成成成成像及其逆问题。像及其逆问题。像及其逆问题。像及其逆问题。主主主主要要要要集集集集中中中中在在在在各各各各种种种种本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 视觉 概述
限制150内