多媒体视频信息处理.ppt





《多媒体视频信息处理.ppt》由会员分享,可在线阅读,更多相关《多媒体视频信息处理.ppt(93页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体视频信息处理多媒体视频信息处理 视觉是人类感知外部世界一个最重要的途径,而计算机视频技术是把我们带到近于真实世界的最强有力的工具。在多媒体技术中,视频信息的获取及处理无疑占有举足轻重的地位,视频处理技术在目前以至将来都是多媒体应用的一个核心技术。5.1 视频基础知识 u5.1.1 视频的定义人类接受的信息70%来自视觉,其中活动图像是信息量最丰富、直观、生动、具体的一种承载信息的媒体。视频(Video)就其本质而言,实际上就是其内容随时间变化的一组动态图像(25或30帧/秒),所以视频又叫作运动图像或活动图像。从数学角度描述,视频指随时间变化的图像,或称为时变图像。时变图像是一种时-空(
2、颜色)密度模式(spatial-temporal intensity pattern),可以表示为s(x,y,t),其中(x,y)是空间变量,t是时间变量。视频信号具有以下特点:内容随时间而变化伴随有与画面动作同步的声音(伴音)图像与视频是两个既有联系又有区别的概念:静止的图片称为图像(Image),运动的图像称为视频(Video)。此外,两者的信源方式不同,图像的输入要靠扫描仪、数字照相机等设备;而视频的输入只能是电视接收机、摄象机、录象机、影碟机以及可以输出连续图像信号的设备。u5.1.2 视频的分类 按照处理方式的不同,视频分为模拟视频和数字视频。模拟视频(Analog Video)模拟
3、视频是一种用于传输图像和声音的并且随时间连续变化的电信号。早期视频的记录、存储和传输都是采用模拟方式,例如:我们在电视上所见到的视频图像是以一种模拟电信号的形式来记录的,并依靠模拟调幅的手段在空间传播,再用盒式磁带录像机将其作为模拟信号存放在磁带上。传统的模拟信号处理设备 直接广播卫星(DBS)模拟视频具有以下特点:q以模拟电信号的形式来记录 q依靠模拟调幅的手段在空间传播 q使用盒式磁带录象机将视频作为模拟信号存放在磁带上 传统上,视频都以模拟方式进行存贮和传送,然而模拟视频不适合网络传输,在传输效率方面先天不足,而且图像随时间和频道的衰减较大,不便于分类、检索和编辑。数字视频(Digita
4、l Video-DV)要使计算机能够对视频进行处理,必须把视频源-即来自与电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号,转换成计算机要求的数字视频形式并存放在磁盘上,这个过程称为视频的数字化过程(包括采样、量化和编码)。数字视频克服了模拟视频的局限性,这是因为数字视频可以大大降低视频的传输和存贮费用、增加交互性(数字视频可通过光纤等介质高速随机读取)及带来精确再现真实情景的稳定图像。如今,数字视频的应用已经非常广泛,并带来一个全新的应用局面。首先,包括直接广播卫星(DBS)、有线电视、数字电视在内的各种通信应用均需要采用数字视频。其次,一些消费产品,如VCD和DVD,数字式便携摄像机
5、,都是以MPEG视频压缩为基础的。u5.1.3 数字化视频的优点视频信号数字化后,就能做到模拟视频信号所无法实现的事情。它的主要优点有:适合于网络应用 在网络环境中,视频信息可以很方便地实现资源的共享,通过网络线、光纤,数字信号可以很方便地从资源中心传到办公室和家中。视频数字信号可以长距离传输而不会产生任何不良影响,而模拟信号在传输过程中会有信号损失。再现性好 模拟信号由于是连续变化的,所以不管复制时采用的精确度多高,失真总是不可避免的,经过多次复制以后,误差就很大。数字视频可以不失真地进行无限次拷贝,其抗干扰能力是模拟图像无法比拟的。它不会因存储、传输和复制而产生图像质量的退化,从而能够准确
6、地再现图像。便于计算机编辑处理模拟信号只能简单调整亮度、对比度和颜色等,极大地限制了处理手段和应用范围。而数字视频信号可以传送到计算机内进行存储、处理,很容易进行创造性地编辑与合成,并进行动态交互。数字视频的缺陷是处理速度慢,所需的数据存储空间大,从而使数字图像的处理成本增高。通过对数字视频的压缩,这样可以节省大量的存储空间,光盘技术的应用也使得大量视频信息的存储成为可能。u5.1.4 视频的应用领域广播电视 q地面、卫星电视广播 q有线电视(CATV:Community Antenna TV)q数字视频广播(Digital Video Broadcast)q交互式电视(ITV:Interac
7、tive TV)q高清晰度电视(HDTV)通信 q可视电话(Videophone)q视频会议(Videoconferencing)q视频点播(VOD:Video On Demand)q视频数据库 个人娱乐q录象节目 qVCD(Video Compact Disk)qDVD(Digital Versatile Disk)q电视购物 q家庭摄象 q视频游戏 5.2 电视信号及其标准 u5.2.1 彩色电视信号制式电视信号是视频处理的重要信息源。电视信号的标准也称为电视的制式。目前各国的电视制式不尽相同,不同制式之间的主要区别在于不同的刷新速度、颜色编码系统和传送频率等。目前世界上常用的电视制式有中
8、国、欧洲使用的PAL制,美国、日本使用的NTSC制及法国等国所使用的SECAM制。NTSC制 NTSC(National Television Standard Committe)是美国国家电视系统委员会在1953年制定的一种兼容的彩色电视制式,是目前常用的视频标准,在美国、日本和其他国家广为使用。它定义了彩色电视机对于所接受的电视信号的解码方式、色彩的处理方式、屏幕的扫描频率。NTSC制规定水平扫描线有625条,以每秒30帧速率传送。NTSC采用隔行扫描方式,每一帧画面由两次扫描完成,每一次扫描画出一个场需要1/60秒,两个场构成一帧。PAL制PAL(Phase Alternate Lock
9、)是联邦德国1962年制定的一种兼容电视制式。PAL意指“相位逐行交变”,我国和大部分西欧国家都使用这种制式。PAL制规定水平扫描625行、每秒25帧、隔行扫描、每场需要1/50秒。SECAM SECAM(Sequential Color and Memory)称为顺序传送彩色与存储,是用于法国、俄罗斯及几个东欧国家的彩色电视制式。但基本技术及广播方式与NTSC和PAL有很大的区别。不同制式的电视机只能接收和处理其对应制式的电视信号。也有多制式或全制式的电视机,这为处理和转换不同制式的电视信号提供了极大的方便。全制式电视机可在各国各地区使用,而多制式电视机一般为指定范围的国家生产。表5-1 三
10、种彩色电视制式的主要技术指标 TV制式NTSC PALSECAM帧频(Hz)302525行/帧525625625亮度带宽(MHz)4.26.06.0彩色幅载波(Hz)3.584.434.25声音载波(MHz)4.56.56.5u5.2.2 电视视频信号的扫描方式电视摄像机的作用就是将视频图像转换为电信号。任何时刻,电信号只有1个值,即是一维的。但视频图像通常是二维的,将二维视频图像转换为一维电信号是通过光栅扫描实现的。扫描方式主要有逐行扫描和隔行扫描两种。隔行扫描行的集合称为场。因此,一帧由两个场组成。逐行扫描有以下优点:图像垂直清晰度高,空间处理效果好,有利于电视转换和制式转换,能改善视频压
11、缩效率,等等。其缺点是:数码率高,行扫描频率增高,硬件难度加大。目前的电视系统大都采用隔行扫描,因为隔行扫描能节省频带,且硬件实现简单。但逐行扫描能获得更好的图像质量和更高的清晰度,不过这是以增加带宽和成本为代价的。奇数场 偶数场 一帧 u5.2.3 YUV与RGB彩色模型YUV模型 在PAL彩色电视制式中采用YUV模型来表示彩色图像。其是Y表示亮度,U,V用来表示色差,是构成彩色的两个分量。与此类似,在NTSC彩色电视制式中使用YIQ模型,其中的Y表示亮度,I,Q是两个彩色分量。YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、
12、V信号构成的另外两幅单色图是相互独立的。由于Y、U、V是独立的,所以可以对这些单色图分别进行编码。采用YUV模型的优点之一是亮度信号和色差信号是分离的,容易使彩色电视系统与只对亮度敏感的黑白电视机亮度信号兼容。PAL彩色电视制式中采用YUV模型来表示彩色图像YUVRGB模型RGB分别代表红(Red)、绿(Green)、蓝(Blue)三种基本颜色。电视机和计算机显示器使用的阴极射线管(Cathode Ray Tube,CRT)是一个有源物体。CRT使用3个电子枪分别产生红、绿和蓝三种波长的光(RGB三种电子束),分别产生并以相对强度轰击CRT的荧光涂层屏幕以产生颜色。并以各种不同的相对强度综合起
13、来产生颜色。组合这三种光波以产生特定颜色称为相加混色,或称为RGB相加模型。相加混色是计算机应用中定义颜色的基本方法。CRT显示器采用RGB彩色模型 A-阴极 B-导电涂层 C-阳极 D-荧光屏 E-电子束 F-荫罩板 YUV与RGB彩色空间变换 由于所有的显示器都采用RGB值来驱动,这就要求在显示每个像素之前,需要把YUV彩色分量值转换成RGB值。这种转换需要花费一定的计算时间。这是一个在设计软硬件视频处理系统要综合考虑的问题。在考虑人的视觉系统和阴极射线管(CRT)的非线性特性之后,RGB和YUV的对应关系可以近似地用下面的方程式表示:Y=0.299R+0.587G+0.114B U=-0
14、.169R-0.331G+0.5B V=0.500R-0.419G-0.081B 或者写成矩阵的形式:u5.2.4 彩色电视的信号类型 电视频道传送的电视信号主要包括亮度信号、色度信号、复合同步信号和伴音信号,这些信号或者可通过频率域,或者可通过时间域相互分离出来。电视接收机能够将所接收到的高频电视信号还原成视频信号和低频伴音信号,并能够在其荧光屏上重现图像,在其扬声器上重现伴音。根据不同的信号源,电视接收机的输入、输出信号有三种类型:高频或射频信号 为了能够在空中传播电视信号,必须把视频全电视信号调制成高频或射频(RFRadio Frequency)信号,每个信号占用一个频道,这样才能在空中
15、同时传播多路电视节目而不会导致混乱。PAL制每个频道占用8MHz的带宽;NTSC制每个频道的带宽为4MHz。有线电视CATV(Cable Television)的工作方式类似,只是它通过电缆而不是通过空中传播电视信号。电视机在接收到某一频道的高频信号后,要把全电视信号从高频信号中解调出来,才能在屏幕上重现视频图像。复合视频信号 为便于电视信号远距传输,必须把三个分量信号以及同步信号复合成一个信号,然后才进行传输。复合视频信号定义为包括亮度和色度的单路模拟信号,也即从全电视信号中分离出伴音后的视频信号,这时的色度信号是间插在亮度信号的高端。由于复合视频的亮度和色度是间插在一起的,在信号重放时很难
16、恢复完全一致的色彩。这种信号一般可通过电缆输入或输出到家用录像机上,其信号带宽较窄,一般只有240线左右的水平分解率。早期的电视机都只有天线输入端口,较新型的电视机才备有复合视频输入和输出端(Video In,Video Out),也即可以直接输入和输出解调后的视频信号。视频信号已不包含高频分量,处理起来相对简单一些,因此计算机的视频卡一般都采用复合视频输入端口获取视频信号。由于视频信号中已不包含伴音,故一般与视频输入、输出端口配套的还有音频输入、输出端口,以便同步传输伴音。图7-7 复合视频线及接口分量视频信号与SVideo为保证视频信号质量,近距离时可用分量视频信号(component v
17、ideo signal)传输,分量信号是指每个基色分量(R,G,B 或 Y,U,V)作为独立的电视信号传输。计算机输出的VGA视频信号,即为分量形式的视频信号。SVideo 是一种两分量的视频信号,它把亮度和色度信号分成两路独立的模拟信号,用两路导线分别传输并可以分别记录在模拟磁带的两路磁轨上。这种信号不仅其亮度和色度都具有较宽的带宽,而且由于亮度和色度分开传输,可以减少其互相干扰,水平分解率可达420线。与复合视频信号相比,SVideo可以更好地重现色彩。图7-8 S-VIDEO视频线及接口5.3 视频的数字化过程要让计算机处理视频信息,首先要解决的是视频数字化的问题。视频数字化是将模拟视频
18、信号经模数转换和彩色空间变换转为计算机可处理的数字信号,与音频信号数字化类似,计算机也要对输入的模拟视频信息进行采样与量化,并经编码使其变成数字化图像。u5.3.1 视频信号的采样对视频采样的基本要求 对视频信号进行采样时必须满足三个方面的要求。q要满足采样定理。对于PAL制电视信号。视频带宽为6MHz,按照CCIR601建议,亮度信号的采样频率为13.5MHz,色度信号为6.75MHz。q采样频率必须是行频的整数倍。这样可以保证每行有整数个取样点,同时要使得每行取样点数目一样多,具有正交结构,便于数据处理。q要满足两种扫描制式。数字视频信号的采样频率和格式现行的扫描制式主要有625行/50场
19、和525行/60场两种,它们的行频分别为15625Hz和15734.265Hz。ITU(国际电信联盟)建议的分量编码标准的亮度抽样频率为13.5兆赫,这恰好是上述两种行频的整数倍。按照国际现行电视制式,亮度信号最大带宽是6MHz。根据奈奎斯特抽样定理,抽样频率至少要大于2612MHz,因此取13.5MHz也是合适的。数字视频的采样格式 根据电视信号的特征,亮度信号的带宽是色度信号带宽的两倍。因此其数字化时对信号的色差分量的采样率低于对亮度分量的采样率。如果用Y:U:V来表示YUV三分量的采样比例,则数字视频的采样格式分别有4:1:1、4:2:2和4:4:4三种。电视图像既是空间的函数,也是时间
20、的函数,而且又是隔行扫描式,所以其采样方式比扫描仪扫描图像的方式要复杂得多。分量采样时采到的是隔行样本点,要把隔行样本组合成逐行样本,然后进行样本点的量化,YUV到RGB色彩空间的转换等等,最后才能得到数字视频数据。4:2:2采样格式模拟视频的数字化包括不少技术问题,如电视信号具有不同的制式而且采用复合的YUV信号方式,而计算机工作在RGB空间;电视机是隔行扫描,计算机显示器大多逐行扫描;电视图像的分辨率与显示器的分辨率也不尽相同等等。因此,模拟视频的数字化主要包括色彩空间的转换、光栅扫描的转换以及分辨率的统一。模拟视频一般采用分量数字化方式,先把复合视频信号中的亮度和色度分离,得到YUV或Y
21、IQ分量,然后用三个模数转换器对三个分量分别进行数字化,最后再转换成RGB空间。4:2:24:2:2采样格式采样格式 图7-13 4:2:2采样格式示意 为了在PAL、NTSC和 SECAM电视制式之间确定共同的数字化参数,国家无线电咨询委员会(CCIR)制定了广播级质量的数字电视编码标准,称为CCIR 601标准(现在的ITU-R标准)。在该标准中,对采样频率、采样结构、色彩空间转换等都作了严格的规定。根据实验,人眼对颜色的敏感程度远不如对亮度信号那么灵敏,所以色度信号的取样频率可以比亮度信号的取样频率低,以减少数字视频的数据量。ITU-R建议使用了4:2:2采样结构。所谓“4:2:2”是指
22、色度信号取亮度信号取样频率的一半。即此时信号是用一个亮度分量,两个色度分量来表达的。根据ITU推荐的采样率,可计算出在不同的采样格式下数字视频的数据量:由表中看出,未压缩的数字视频数据量十分巨大,对于目前的计算机和网络存储或传输都是不现实的,因此在多媒体中应用数字视频的关键问题是数字视频的压缩技术。采样格式(Y:U:V)数据量(Mbyte/s)4:2:2274:4:440u5.3.2 量化 采样过程是把模拟信号变成了时间上离散的脉冲信号,量化过程则是进行幅度上的离散化处理。因此在时间轴的任意一点上量化后的信号电平与原模拟信号电平之间在大多数情况下总是存在有一定的误差,量化所引入的误差是不可避免
23、的同时也是不可逆的,由于信号的随机性这种误差大小也是随机的,这种表现类似于随机噪声效果,具有相当宽度的频谱,因此我们又把量化误差称为量化噪声。但量化误差与噪声是有本质的区别的。如果视频信号量化比特率为8Bit,信号就有个量化值。若最大信号正好用足比特的话,小于1/256的信号就只能当零处理了。而且每二个相邻数字的差距也必需大于1/256才能分得开,当二个原来不同的数值用同一个二进制值来表示时,实际数值与记录数值之差就成为量化噪声。所以,比特率已决定了整个系统的理想状态下的最小噪声、动态范围和信噪比,模拟信号在理想状态是没有这种限制的。亮度信号用比特量化,灰度等级最多只有256个,如果RGB三个
24、色度信号都用比特量化,就可以获得25625625616777216,即近17万种色彩。5比特量化有32个灰度等级 8比特量化有256个灰度等级 量化比特率愈高,层次就分得愈细,但数据量也成倍上升。每增加一个比特,数据量就翻一翻,例如播放机视频量化位数多为10比特,灰度等级达到1024个,然而数据量是比特量化的倍。量化的过程是不可逆的,这是因为量化本身给信号带来的损伤是不可弥补的。量化时比特数选取过小则不足以反映出图像的细节,比特数选取过大则会产生庞大的数码率,从而占用大量的频带,给传输带来困难。有一种方法可以用小比特数量化而获得大比特数量化时的效果。降低量化误差的方法最直接的就是增加量化级数减
25、小最小量化间隔,但由此带来码率的增加从而要求更大的处理带宽,一般现在的视频信号均采用8比特、10比特,在信号质量要求较高的情况下采用12比特量化。正如模拟音频信号传输过程中采用不均匀量化一样。在视频信号的量化过程中也可以采用不均匀量化方式,即将模拟信号先进行对数变换,其目的是让变化量大的地方变化小,让变化量小的地方变化大,然后,再进行普通的8比特量化,经传输后再恢复出来的模拟信号可以通过指数变换予以还原,此时,信号传输的效果类似于12比特量化的效果。u5.3.3 视频信号的压缩与编码 抽样、量化后的信号转换成数字符号才能进行传输,这一过程称为编码。视频压缩编码的理论基础是信息论。信息压缩就是从
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 视频 信息处理

限制150内