静态图像信息处理课件.ppt
《静态图像信息处理课件.ppt》由会员分享,可在线阅读,更多相关《静态图像信息处理课件.ppt(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、静态图像信息处理第1页,此课件共94页哦图像处理图像处理就是将客观世界中的物体映射成数字化图像,就是将客观世界中的物体映射成数字化图像,然后用数学方法通过编程在计算机中进行处理、存储然后用数学方法通过编程在计算机中进行处理、存储和显示。与数字音频类似,数字图像的数据量一般都和显示。与数字音频类似,数字图像的数据量一般都比较大,在存储时会占用大量的空间,因此需要对图比较大,在存储时会占用大量的空间,因此需要对图像进行压缩编码。本章主要介绍色彩的基本概念和表像进行压缩编码。本章主要介绍色彩的基本概念和表示方法、图像数据压缩的基本算法、图像的存储和编示方法、图像数据压缩的基本算法、图像的存储和编辑处
2、理的基本方法。辑处理的基本方法。第2页,此课件共94页哦4.1 4.1 彩色空间表示及其转换彩色空间表示及其转换4.1.1 4.1.1 颜色的基本概念颜色的基本概念 1 1亮度、色调和饱和度亮度、色调和饱和度彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这三个特性的综彩色可用亮度、色调和饱和度来描述,人眼看到任意彩色光都是这三个特性的综合效果。合效果。亮度亮度是发射光或物体反射光明亮度程度的量度是发射光或物体反射光明亮度程度的量度色调色调是由于某种波长的颜色光使观察者产生的颜色感觉,每个波长代表不同是由于某种波长的颜色光使观察者产生的颜色感觉,每个波长代表不同的色调的色调 。它反映颜
3、色的种类,决定颜色的基本特性,例如红色、棕色等都是。它反映颜色的种类,决定颜色的基本特性,例如红色、棕色等都是指色调。某一物体的色调,是指该物体在日光照射下所反射的各光谱成分作指色调。某一物体的色调,是指该物体在日光照射下所反射的各光谱成分作用于人眼的综合效果用于人眼的综合效果,对于透射物体则是透过该物体的光谱综合作用的结果。,对于透射物体则是透过该物体的光谱综合作用的结果。第3页,此课件共94页哦1 1亮度、色调和饱和度亮度、色调和饱和度饱和度饱和度是颜色强度的度量。对于同一色调的彩色光,饱和度越深颜色越鲜明饱和度越深颜色越鲜明或者越纯。或者越纯。例如红色和粉红色的区别,虽然这两种颜色有相同
4、的主波长,但一种也许是混合了更多的白色在里面,因此显得不太饱和。饱和度还与亮度有关饱和度还与亮度有关,因为若在饱和的彩色光中增加白光的成分,这增加了光能,因而变得更亮了,但它的饱和度却降低了。通常把色调、饱和度统称为色度色度,上述内容总结为亮度表示某彩色光的明亮程度,而色度则表示颜色的类别与深浅程度。第4页,此课件共94页哦2 2三基色(三基色(RGBRGB)原理)原理 自然界常见的各种颜色光,自然界常见的各种颜色光,都可由都可由红(红(R)、绿()、绿(G)、蓝()、蓝(B)三种颜色按三种颜色按不同的比例相配而成不同的比例相配而成,这,这就是就是色度学中最基本的原理色度学中最基本的原理三基色
5、原理。三基色原理。三基色的选择必须遵循一条规律:三基色的选择必须遵循一条规律:任一种颜色都不能由其他两种颜色合成任一种颜色都不能由其他两种颜色合成。因。因为人的眼睛对红、绿、蓝这三种色光最敏感,因此,以这三种颜色作为基色相配来获为人的眼睛对红、绿、蓝这三种色光最敏感,因此,以这三种颜色作为基色相配来获得彩色得到了最为广泛的应用。得彩色得到了最为广泛的应用。第5页,此课件共94页哦把三种基色光按不同的比例相加称之为相加混色相加混色。某种颜色和这三种颜色之间的关系可用下面的式子来描述:R(红色的百分比)G(绿色的百分比)B(蓝色的百分比)颜色用公式表达如下:红色(100%)+绿色(100%)+蓝色
6、(0%)=黄色红色(100%)+蓝色(100%)+绿色(0%)=品红绿色(100%)+蓝色(100%)+红色(0%)=青色红色(100%)+绿色(100%)+蓝色(100%)=白色我们称青色、品红和黄色为红、绿、蓝三色的补色,从图4-1中还可以看出:红色+青色=绿色+品红=蓝色+黄色=白色第6页,此课件共94页哦4.1.2 色彩的空间表示色彩的空间表示 在多媒体在多媒体系统系统中常涉及到用几种不同的色彩空间表示图形和图像的颜色,如计中常涉及到用几种不同的色彩空间表示图形和图像的颜色,如计算机显示时采用算机显示时采用RGB彩色空间或彩色空间或色彩模型色彩模型;在彩色全电视数字化时使用在彩色全电视
7、数字化时使用YUV色彩色彩模型;彩色印刷时采用模型;彩色印刷时采用CMYKCMYK模式模式等。不同的彩色空间对应不同的应用场合,在等。不同的彩色空间对应不同的应用场合,在图像的生成、存储、处理及显示时对应不同的彩色空间,需要做不同的处理和图像的生成、存储、处理及显示时对应不同的彩色空间,需要做不同的处理和转换。转换。第7页,此课件共94页哦1 1RGBRGB彩色空间彩色空间 由于某种颜色可以由红(R)、绿(G)、蓝(B)三种色光按不同的比例相加混色来得到,如果将R、G、B看成三个变量,就形成RGB三维彩色空间。在多媒体计算机中,用的最多的是RGB彩色空间。不管其中采用什么形式的彩色空间表示方法
8、,多媒体系统最终的输出一定要转换成RGB空间表示。对任意彩色光F,其配色方程可写成:F=rR+gG+bB 其中r、g、b为三色系数rR,gG,bB为F色光的三色分量。任意一种色光,其色度可由相对色系数中的任意两个唯一的确定。因此,各种彩色的色度可以用二维函数表示。用r和g作为直角坐标系中两个直角坐标所画的各种色度的平面图形,就叫RGB色度图,如右图。第8页,此课件共94页哦2 2HSIHSI色彩空间色彩空间 HSI色彩空间色彩空间指从人的视觉系统出发,用色调指从人的视觉系统出发,用色调(hue)、色饱和度()、色饱和度(saturation或或chroma)和亮度()和亮度(intensity
9、或或brightrless)来描述色彩。来描述色彩。HSI色彩空间可以用一个圆锥空色彩空间可以用一个圆锥空间模型来描述,其中以亮度间模型来描述,其中以亮度I为纵轴,色调为纵轴,色调H为绕着圆锥截面度量的色环,色饱和度为绕着圆锥截面度量的色环,色饱和度S为穿过中为穿过中心的半径横轴。亮度值是心的半径横轴。亮度值是沿着沿着圆锥的轴线度量的,圆锥的轴线度量的,沿着圆锥轴线上的点表示完全不饱和的颜色。沿着圆锥轴线上的点表示完全不饱和的颜色。按照不同的灰度等级,最亮点为纯白色,最按照不同的灰度等级,最亮点为纯白色,最暗点为纯黑色。圆锥截面的圆周一圈上的颜暗点为纯黑色。圆锥截面的圆周一圈上的颜色为完全饱和
10、的纯颜色。色为完全饱和的纯颜色。第9页,此课件共94页哦人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度,当图像亮度有变化时视觉反应明显,而当颜色浓淡有变化时视觉往往没有反应。由于HSI色彩空间更接近人对色彩的认识和解释,因此采用HSI方式能够减少彩色图像处理的复杂性,提高处理速度。在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,它们可以分开处理而且是相互独立的。因此,用HSI色彩空间可以大大简化图像分析和处理的工作量。HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法,因而它们之间存在着转换关系,如公式(4-1)所示。彩色图像的获取可采用RGB空间,图像的编辑可采用
11、HSI空间。其中:(4-1)第10页,此课件共94页哦3 3YUVYUV和和YIQYIQ彩色空间彩色空间 在彩色电视制式中,图像是通过YUV和YIQ空间来表示的。PAL彩色电视制式使用YUV模型,Y表示亮度,UV用来表示色差,U、V是构成彩色的两个分量。YUV彩色空间中,三管彩色摄像机或CCD摄像机就是把拍摄的彩色图像,经分色棱镜分成R0G0B0信号,然后进行放大和校正得到RGB,再经过矩阵变换电路得到亮度信号Y、色差信号R-Y和B-Y,发送端将Y、R-Y及B-Y三个信号进行编码,用同一信道发送出去。YUV表示法中,表示法中,亮度信号(亮度信号(Y)和色度信号和色度信号(U、V)是相互独立的。
12、是相互独立的。其中其中,Y信信号分量构成黑白灰度图,号分量构成黑白灰度图,U、V信号信号构成另外两幅单色图。构成另外两幅单色图。利用利用YUV分量之间分量之间的独立性原理,黑白电视能接收彩色电视的独立性原理,黑白电视能接收彩色电视信号信号,解决了黑白电视和彩色电视的兼,解决了黑白电视和彩色电视的兼容问题容问题。YUV表示法可以利用人眼的特性来降低数字彩色图像所需要的存储容量。表示法可以利用人眼的特性来降低数字彩色图像所需要的存储容量。第11页,此课件共94页哦美国、日本等国家采用的NTSC电视制式选用YIQ彩色空间,Y仍为亮度信号,I、Q仍为色差信号,与U、V不同的是,在它们之间存在着一定的转
13、换关系。人眼的彩色视觉特性表明,人眼分辨红、黄之间的颜色变化的能力最强,而分辨蓝色与紫色之间的变化的能力最弱。通过一定的变换,I对应于人眼最敏感的色度,而Q对应于人眼最不敏感的色度。在考虑人的视觉系统和阴极射线管(CRT)的非线性特性之后,RGB和YUV的对应关系可以近似的用方程式4-2表示:Y=0.299R+0.587G+0.114BU=-0.147R-0.289G+0.436B (4-2)V=0.615R-0.515G-0.100B或者写成矩阵的形式:RGB和YIQ的对应关系用方程式4-3表示:Y=0.299R+0.587G+0.114B I=0.596R-0.275G-0.321B (4
14、-3)Q=0.212R-0.523G+0.311B第12页,此课件共94页哦4 4YCrCbYCrCb彩色空间彩色空间 YCrCb彩色空间是由YUV彩色空间派生的一种颜色空间,主要用于数字电视系统。是数字视频信号的世界标准。基本上,YCrCb代表和YUV相同的彩色空间。在这两个彩色空间中Y表示明亮度,也就是灰阶值;而U和V表示的则是色度,作用是描述影像色彩及饱和度,用于指定像素的颜色。“亮度”是通过RGB输入信号来创建的,方法是将RGB信号的特定部分叠加到一起。“色度”则定义了颜色的两个方面色调与饱和度,分别用Cr和Cb来表示。其中,Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异
15、。而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之同的差异。数字域中的彩色空间变换与模拟域的彩色空间变换不同。它们的分量使用Y、Cr和Cb来表示,与RGB空间的转换关系如公式4-4所示:Y0.299R+0.578G+0.114B Cr(0.500R-0.4187G-0.0813B)+128 (4-4)Cb(-0.1687R-0.3313G+0.500B)+128第13页,此课件共94页哦5 5CMYCMY彩色空间彩色空间 印刷机或彩色打印机就不能用RGB颜色来印刷或打印,它只能使用一些能够吸收特定的光波而反射其他光波的油墨或颜料来实现。油墨或颜料的三基色是青(cyan)、品红(mage
16、nta)和黄(yellow),简称为CMY。青色对应蓝绿色,品红对应紫红色。理论上说,任何一种由颜料表现的色彩都可以用这三种基色按不同的比例混合而成,这种色彩表示方法称CMY色彩空间表示法。由CMY混合的色彩又称为相减混色。CMY又写成CMYK。在实际应用中,一幅图像在计算机中用RGB空间或其他空间表示并处理,最后打印输出时要转换成CMY空间表示。第14页,此课件共94页哦4.2 图像数据压缩的基本算法 4.2.1 数据压缩编码简介数据压缩编码简介 图像数据压缩的主要依据图像数据压缩的主要依据 有两个:一是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就有两个:一是图像数据中有许多
17、重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个依据是人眼睛对图像细节和颜色的辨认有一个极限,把超可以减少数据量;另一个依据是人眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到了数据压缩的目的。过极限的部分去掉,这也就达到了数据压缩的目的。有损压缩技术和无损压缩技术有损压缩技术和无损压缩技术 基于数据冗余的压缩技术是无损压缩技术,而基于人眼视觉特性的压缩技基于数据冗余的压缩技术是无损压缩技术,而基于人眼视觉特性的压缩技术是有损压缩技术。实际上,图像压缩技术是各种有损和无损压缩技术的术是有损压缩技术。实际上,图像压缩技术是各种有损和无损压缩技术的综合实现。
18、综合实现。第15页,此课件共94页哦1.1.常见的图像数据冗余常见的图像数据冗余 (1)空间冗余。空间冗余。在任何一幅图像中,均有由许多灰度或颜色都相同的邻近像素组成的区域,它们形成了一个性质相同的集合块,即它们相互之间具有空间(或空域)上的强相关性,在图像中就表现为空间冗余。(2)结构冗余。结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的板图案等,我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。(3)时间冗余时间冗余。这是序列图像(电视图像、运动图像)表示中经常包含的冗余。图像序列中两幅相邻的图像有较大的相关,这反映为时间冗余。(4)视觉冗余视觉冗余
19、。人类视觉系统的一般分辨能力估计为26灰度等级,而一般图像的量化采用的是28的灰度等级。像这样的冗余,我们称之为视觉冗余。(5)知识冗余知识冗余。有些图像的理解与某些知识有相当大的相关性。例如:狗的图像有固定的结构,比如,狗有四条腿,头部有眼、鼻、耳朵,有尾巴等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。空间冗余和时间冗余是将图像信号看作为随机信号时所反映出的统计特征,因此有时把这两种冗余称为统计冗余。第16页,此课件共94页哦2 2数据压缩方法的分类数据压缩方法的分类 根据编、解码后数据是否一致来进行分类,数据压缩的方法一般被划分为两类:(1)可可逆逆编编码码(无
20、损编码)。此种方法的解码图像与原始图像严格相同,压缩比大约在2:15:1之间。主要编码有Huffman编码、算术编码、行程长度编码等。(2)不不可可逆逆编编码码(有损编码)。此种方法的解码图像与原始图像存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍调节。常用的编码有变换编码和预测编码。第17页,此课件共94页哦根据压缩的原理分为如下几种(1)预测编码预测编码。它是利用空间中相邻数据的相关性来进行压缩数据的。通常用的方法有脉冲编码调制(PCM)、增量调制(DM)、差分脉冲编码调制(DPCM)等。这些编码主要用于声音的编码(2)变换编码变换编码。该方法将图像时域信号转换为频域信号
21、进行处理。这种转换的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内能量常常集中在一起,数据处理时可以将主要的注意力集中在相对较小的区域,从而实现数据压缩。一般采用正交变换,如离散余弦变换(DCT)、离散傅立叶变换(DFT)(3)量化与向量量化编码量化与向量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为了使整体量化失真最小,就必须依据统计的概率分布设计最优的量化器。最优的量化器一般是非线性的,已知的最优量化器是Max量化器。我们对像元点进行量化时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个点的做法,这种方法称为向量量化向量量化。即利用相邻数据间的相关性,将
22、数据系列分组进行量化。第18页,此课件共94页哦(4)信信息息熵熵编编码码。依据信息熵原理,让出现概率大的信号用较短的码字表示,反之用较长的码字表示。常见的编码方法有Huffman编码、Shannon编码以及算术编码。(5)子带子带(subband)编码。将图像数据变换到频率后,按频率分带按频率分带,然后用不同的量化器进行量化,从而达到最优的组合。或者分布渐进编码,在初始时,对某一个频带的信号进行解码,然后逐渐扩展到所有频带。第19页,此课件共94页哦4.2.2 信息熵及基本概念信息熵及基本概念 1 1信息量与信息熵信息量与信息熵 信息量信息量是指从N个相等的可能事件中选出一个事件所需要的信息
23、度量或含量,也就是在辨识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj),因此定义信息量见公式4-5。定义信息量见公式4-5。如果将信源所有可能事件的信息量进行平均,就得到了信息的“熵”,即信息熵。式中,P(xj)是信源X发出xj的概率。I(xj)的含义是,信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。(4-5)第20页,此课件共94页哦信源X发出的xj(j=1,2,n)共n个随机事件的自信息统计平均,即 H(X)称为信源X的“熵”,即信源X发出任意一个随机变量的平均信息
24、量。其中:等概率事件的熵最大,假设有N个事件,由(4-6)式得此时熵为:(4-6)当P(x1)1时,P(x2)P(x3)P(xj)0,由(4-6)式得此时熵为由上可得熵的范围为:第21页,此课件共94页哦在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长,则当LcH(X)有冗余,不是最佳。LcH(X)不可能。LcH(X)最佳编码(Lc稍大于H(X))。熵值为平均码长Lc的下限。平均码长Lc的计算公式为:(j=1,2,n)(4-7)其中:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。第22页,此课件共94页哦2 2冗余度、编码效率与压缩比冗余度、编码效率与压缩
25、比 设原图像的平均码长为L,熵为H(X),压缩后图像的平均码长为Lc,则定义冗余度为(见公式4-8):(4-8)编码效率(见公式4-9):(4-9)压缩比(见公式4-10):(4-10)在数字图像通信系统中,冗余度、编码效率与压缩比是衡量信源特性以及编解码设备性能的重要指标。第23页,此课件共94页哦4.2.3 信息熵编码信息熵编码 信息熵编码也称为统计编码,是利用信息源出现的概率来进行编码,目前比较常见的信息熵编码包括哈夫曼编码、香农-范诺编码、行程编码和算术统计编码等。1 1哈夫曼编码哈夫曼编码 基本原理 依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给依据信源字符出现的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 静态 图像 信息处理 课件
限制150内