数字图像管理组织之采样量化插值傅里叶变换.ppt
数字图像处理,上海理工大学 印刷光学 秦杨,第2讲 数字图像与印刷图像的获取,2.1如何不失真获取图像,2.2印刷图像如何获取,2.1如何不失真获取图像,图像数字化 连续图像:二维坐标系中具有连续变化的,即图像画面的像点是无限稠密的,同时其灰度值(即图像从暗到亮的变化值)也是无限稠密的图像,称为连续图像。连续图像又称为模拟图像。 离散图像:是指用一个数字阵列表示的图像。该阵列中每一个元素称为像素。离散图像又称为数字图像。,2.1.1图像的获取,像素:组成数字图像的基本元素。 连续图像可以认为是由无数个像素组成的,而且没一点的灰度值都是从黑到白有无限多个可能取值。 数字图像可以认为是按某种规律(如模拟/数字转换)编成一系列二进制数码(0和1)来表示图像上每个点的信息。,获取图像就是将连续图像转化为数字图像。,2.2.2 图像的获取(Image Acquisition),图像获取即图像的数字化过程,包括扫描、采样和量化。 图像获取设备由5个部分组成:采样孔,扫描机构,光传感器,量化器和输出存储体。 关键技术有:采样成像技术;量化模数转换技术。,图像获取设备,(1) 采样孔: 使数字化设备实现对特定图像元素的观测,不受图像其它部分的影响。 (2) 图像扫描机构: 使采样孔按照预先定义的方式在图像上移动,从而按顺序观测每一个像素。 (3) 光传感器: 通过采样检测图像每一个像素的亮度。通常采用CCD阵列。 (4) 量化器: 将光传感器输出的连续量转化为整数值。典型的量化器是A/D转换电路,它产生一个与输入电压或电流成比例的数值。 (5) 输出存储装置: 将量化器产生的颜色值(灰度或彩色)按某种格式存储,以用于后续的计算机处理。,An example of the digital image acquistion process,图像数字化,图像数字化过程,图像的数字化包括采样和量化两个过程。,图像的矩阵表示,设连续图像f(x, y)经数字化后,可以用一个离散量组成的矩阵g (i, j)(即二维数组)来表示。,矩阵表示的几点说明,g (i, j)代表(i, j)点的灰度值,即亮度值。 以上数字化有以下几点说明: (1) 由于g (i, j)代表该点图像的光强度,而光是能量的一种形式,故g (i, j)必须大于零,且为有限值,即: 0g (i, j)。 (2) 数字化采样一般是按正方形点阵取样的, 除此之外还有三角形点阵、正六角形点阵取样。如图2-1所示。,(3) 以上是用g (i, j)的数值来表示(i, j)位置点上灰度级值的大小,即只反映了黑白灰度的关系。 如果是一幅彩色图像, 各点的数值还应当反映色彩的变化,可用g (i, j, )表示,其中是波长。 如果图像是运动的,还应是时间t的函数,即可表示为g (i, j, , t)。,Basic experimental setup used to characterize brightness discrimination,图2-1 采样网格 (a) 正方形网格; (b) 正六角形网格,采样,2.1.1 采样 空间上或时域上连续的图像(模拟图像)变换成离散采样点(像素)集合的操作称为采样。 由于图像基本是采取二维平面信息的分布方式来描述的,所以为了对它进行采样操作,需要先将二维信号变为一位信号,再对一维信号完成采样。换句话说就是讲二维采样转化为两次一维采样操作来实现。 图2-2是采样原理示意图。,采样,图2-2 采样示意图,采样的具体做法,具体做法是,先沿垂直方向按一定间隔从上到下顺序地沿水平方向直线扫描,取出各水平线上灰度值的一维扫描。而后再对一维扫描线信号按一定间隔采样得到离散信号,即先沿垂直方向采样, 再沿水平方向采样这两个步骤完成采样操作。 采样后得到的二维离散信号的最小单位就是像素。 一般情况下,水平方向的间隔和垂直方向的采样间隔相同。 对于运动图像(即时间域上的连续图像),需先在时间轴上采样,再沿垂直方向采样,最后沿水平方向采样由这三个步骤完成。,连续图像经过采样之后所获得的数字图像的效果与以下几个评价参数有关。 图像分辨率:采样所获得的图像总像素的多少。(如数码相机的30万像素) 采样密度:图像上单位长度所包含的采样点数。采样密度的倒数是采样间隔。 采样频率:是指一秒钟内采样的的次数。它反映了采样点之间的间隔大小,采样频率越高,丢失的信息越少,采样出的样本细腻逼真图像的质量好,但要求的存储量越大。 (图像大小:对一幅图像采样时,若每行(即横向)像素为M个,每列(即纵向)像素为N个,则图像大小为MN个像素。 ) 扫描分辨率:表示一台扫描仪输入图像的细微程度。指每英寸(1英寸=2.5cm)扫描所得到的点。单位DPI。数值越大表示被扫描的图像转化为数字化图像越逼真,扫描仪质量越好。,无论采用那种评价参数,都反映采样点间隔的选取是一个很重要的问题。显然,想要获得更加清晰的图像质量,就要提高图像采样像素点数,也就是要使用更多的像素点来表示该图像,但是相对要付出更大存储空间的代价 采样间隔的大小取决于原图像的细微亮暗变化。 从频域的角度来看采样问题:根据一维采样定理,若一维信号g(t)的最大截止频为w,以,则T<=1/2w为采样间隔进行采样,则能够根据采样结果g(nt)完全恢复g(t).,。,实际采样与理想采样,采样的时域表达,采样的实现通常是由一个图像传感元件完成的,它将每个像素位置上的亮度转换成与之相关的连续的测量值,然后将该测量值转化成与其成正比的电压值。最后,再在图像传感器后面,跟随一个电子线路的模数转换器,将连续的电压值转化成离散的整数。,采样定理,采样定理 一个频带限制在(0, fH)Hz内的时间连续信号m(t), 如果以大于或等于2fH的采样速率对它进行等间隔采样,则可以由采样序列无失真地恢复原始信号m(t)。 如采样间隔Ts=1/(2fH),则Ts被称为奈奎斯特(Nyquist)间隔。如采样频率fs=1/Ts,则fs被称为奈奎斯特(Nyquist)速率。 采样定理告诉我们,若采样速率f Ts),则会产生失真,这种失真称为混叠失真。,图像采样与数字图像质量,如图是图像采样与图像质量的关系。,图像采样与数字图像质量,1024x1024,512x512-1024x1024,128x128,64x64,32x32,256x256-1024x1024,由采样定理可知,要想无失真的恢复一幅图像,采样频率应该大于图像模拟信号最高频率的2倍。如果采样频率低于原信号最高频率的2倍,则恢复的信号中会包含原信号中不存在的低频成分,称为混淆,它会对信号造成干扰。 采样傅里叶变换,可以获得信号的频谱,并从中得知信号最高频率的数值。 在图像印刷传递过程中,依据原稿特点和采样定理进行适当的分辨率设置是很重要的,因为这一步骤决定了从原稿上采集到的原始图像频率状况,在此采样定理的指导意义是很明显的。,傅里叶变换原理,快速傅氏变换(FFT),是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。 具体算法参考相关文献。,量化,模拟图像经过采样后,在空间上离散化为像素。但采样所得的像素值(即灰度值)仍是连续量。 量化:把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。 图 (a)说明了量化过程。若连续灰度值用z来表示,对于满足ziz<zi+1的z值,都量化为整数qi。 灰度值:qi称为像素的灰度值。 误差:z与qi的差称为量化误差。 一般,像素值量化后用一个字节8 bit来表示。如图 (b)所示,把由黑灰白的连续变化的灰度值量化为0255共256级灰度值。,图像量化示意图,灰度值的范围为0255,表示亮度从暗到明,对应图像中的颜色为从黑到白.,量化的准则不同,会导致不同的量化效果。 从不同的角度将量化方法分成4类: (1)按量化级步长均匀性 均匀量化和非均匀量化。 (2)按量化对称性 对称量化和非对称量化 (3)按量化时采样点相互间的相关性分 无记忆和有记忆量化。 (4)按量化时处理的采样点数分 标量量化和矢量量化。,均匀对称量化,(a)中央上升型 (b)中央平稳型,非均匀对称量化,(a)中央上升型 (b)中央平稳型,均匀量化,等间隔量化就是简单地把采样值的灰度范围等间隔地分割并进行量化。 对于像素灰度值在黑白范围较均匀分布的图像,这种量化方法可以得到较小的量化误差。该方法也称为均匀量化或线性量化。 将z0,zk) 均分成个k子区间后,每个区间的长度 各子区间以它的中心位置作为量化值 当待量化值在区间内均匀分布时,最小:,非均匀量化,为了减小量化误差,引入了非均匀量化的方法。 非均匀量化依据一幅图像具体的灰度值分布的概率密度函数,按总的量化误差最小的原则来进行量化。 具体做法是对图像中像素灰度值频繁出现的灰度值范围,量化间隔取小一些; 而对那些像素灰度值极少出现的范围,则量化间隔取大一些。 显然,在需要以少的数据量来描述图像的场合,可以采用非均匀量化技术,以达到尽量少的数据使所描述的图像效果尽可能地好。,均匀量化和非均匀量化的效果比较,向量量化,定义:将一组采样的信号幅度向量在容许的误差范围内用更少的离散向量代替。 与标量量化相比,向量量化提供较低的失真,但运算量比标量量化大得多。 原理:一次量化2个以上采样点,量化过程需要用到一个码书。 实质就是在码书中找到输入矢量X 的最近码字,其衡量标准就是误差测度,通常采用平方误差测度 。,一维向量量化,目的:对任一输入矢量X,在码书中寻找最佳匹配码矢Xi。 常用的最佳匹配原则:寻求最小误差。 若码书尺寸为M,矢量X对应码矢Xi,信号矢量X的概率密度函数为p(X),则总的量化误差可表示为 常用的误差有 : 均方绝对值误差(MAE) 均方误差(MSE),对于一幅特定的图像,根据其灰度的分布特征,在少的量化级数下,采用非均匀量化技术的效果一定比均匀量化效果好。 但是,当允许量化级数比较多时,因为均匀量化已经足够对图像的细节进行描述,采用非均匀量化的效果不明显,只能徒增量化算法的复杂度,因此这种情况下多采用均匀量化。 实际上,由于图像灰度值的概率分布密度函数因图像不同而异,所以不可能找到一个适用于各种不同图像的最佳非等间隔量化方案,因此,实用上一般多采用等间隔量化。,最佳量化,最佳量化 使量化误差最小的量化方法为最佳量化。 最佳量化方法: 思想:计算所有可能灰度级出现的概率分布,根据灰度级出现概率的多少决定分层的疏密。对于出现次数较多的大部分灰度作精确分层,对出现次数少的灰度级做粗糙分层。(这将比均匀量化更易获取良好的图象质量) 使用均方误差测度讨论最佳量化。 设:Z和q分别代表数字图像像素幅度和其量化值;p(Z)为像素幅度概率密度函数;Z的取值范围在H1H2之间,量化总层数为K,2表示量化器量化的均方误差。 解:根据均方误差定义可得,当量化层数足够大时,每个判决层的p(Z)可以近似为均匀分布,则 上式分别对Zk和qk求导,并令等于0。,根据上述公式看出,对于保证一定的误差下,可以确定量化层数K,取得最佳K层,此时进行的量化处理就是最佳的量化。 对于非均匀分布,如高斯分布等,根据概率密度采用反复迭代逼近最佳量化层和判决层位置。,2.1.3 采样与量化参数的选择一幅图像在采样时,行、列的采样点与量化时每个像素量化的级数,既影响数字图像的质量,也影响到该数字图像数据量的大小。假定图像取MN个样点,每个像素量化后的灰度二进制位数为Q,一般Q总是取为2的整数幂,即Q=2k,则存储一幅数字图像所需的二进制位数为,b=MNQ (b),字节数为,取值范围:由于存在量化误差,原则上k越大重建图像失真越小。 对于人眼应用k取5-8; 而对于卫星图片等图像分析应用k取8-12。 对一幅图像,当量化级数Q一定时,采样点数MN对图像质量有着显著的影响。 如下图所示,采样点数越多,图像质量越好; 当采样点数减少时,图像的块状效应就逐渐明显。 同理,当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。 如下图所示,量化级数越多,图像质量越好; 量化级数越少,图像质量越差,量化级数最小的极端情况就是二值图像,图像出现假轮廓。,不同采样点数对图像质量的影响,不同量化级数对图像质量的影响,实际需要: 一般,当限定数字图像的大小时,采用如下原则,可得到质量较好的图像:(1) 对缓变的图像(如人脸),应该细量化、粗采样,以避免假轮廓。(2) 对细节丰富的图像(如球场),应细采样、粗量化,以避免模糊(混叠)。 注意:采样必须满足奈奎斯特取样定理,否则会因取样点数不够产生混淆失真。 通过以上分析,在限制描述图像数据量的情况下,需要对采样精度和量化精度进行折中,由此来获得一幅效果好的数字图像。,对于彩色图像,是按照颜色成分红(R)、绿(G)、蓝(B)分别采样和量化的。 若各种颜色成分均按8 bit量化,即每种颜色量级分别是256, 则最多可以处理256256256=16 777 216种颜色。,红,绿,蓝三分量,强度分量,2.12 彩色图像和单色图像,伪轮廓现象,在3bit以下的量化,会出现伪轮廓现象。,伪轮廓现象实例,分辨率1) 图像分辨率图像分辨率指每英寸图像含有多少个点或像素,其单位为dpi。例如250 dpi表示的就是该图像每英寸含有250个点或像素。在数字图像中,分辨率的大小直接影响到图像的质量。分辨率越高,图像细节越清晰,但产生的文件尺寸大,同时处理的时间也就越长,对设备的要求越高。因此,在制作图像时要根据需要来选择分辨率。另外,图像的尺寸、图像的分辨率和图像文件的大小三者之间有着密切的联系。图像的尺寸越大、图像的分辨率越高,图像文件也就越大。因此,调整图像的大小和分辨率即可改变图像文件的大小。,2) 屏幕分辨率显示器上每单位长度显示的像素或点的数量称为屏幕分辨率,通常以点/英寸(dpi) 来表示。显示器分辨率取决于显示器的大小及其像素设置。屏幕分辨率由计算机的显示卡决定,标准的VGA显示卡的分辨率是640480,即水平方向640点(像素),垂直方向480点(像素)。现在高性能的显示卡已支持12801024点以上的分辨率。,3) 打印机分辨率打印机分辨率又称输出分辨率,是指所有打印机输出图像时每英寸的点数(dpi),打印机分辨率也决定了输出图像的质量。打印机分辨率越高,可以减少打印的锯齿边缘,在灰度的半色调表现上也会较为平滑。 打印机的分辨率可达300 dpi,甚至720 dpi(需用特殊纸张);较老机型的激光打印机分辨率通常在300360 dpi之间。由于超微细碳粉技术的成熟,新的激光打印机的分辨率可达6001200 dpi,用于专业排版输出已经绰绰有余。,4) 扫描仪分辨率扫描仪分辨率的表示方法与打印机相类似,一般也用dpi表示,不过这里的点是样点,与打印机的输出点是不同的。一般扫描仪提供的水平分辨率比垂直分辨率高。台式扫描仪的分辨率可以分为光学分辨率和输出分辨率。光学分辨率是指扫描仪硬件所真正扫描到的图像分辨率,目前市场上产品的光学分辨率可达8001200 dpi以上。输出分辨率是通过软件强化以及内插补点之后产生的分辨率,大约为光学分辨率的34倍。市场上号称分辨率高达4800 dpi或6400 dpi的扫描仪,一般指的是输出分辨率。,最邻近插值(近邻取样法),临邻近插值的的思想:对于通过反向变换得到的的一个浮点坐标,对其进行简单的取整,得到一个整数型坐标,这个整数型坐标对应的像素值就是目的像素的像素值,也就是说,取浮点坐标最邻近的左上角点对应的像素值。可见,最邻近插值简单且直观,但得到的图像质量不高。 对于一个目的像素,设置坐标通过反向变换得到的浮点坐标为(i+u,j+v),其中i、j均为非负整数,u、v为0,1)区间的浮点数,则采用最近邻插值算法的处理方法为:f(i+u,j+v) =f(i,j);,如图所示,与P最近的点是A,所以采用最近邻插值算法得到的P点像素值为:f(P)=f(A),图像插值算法最邻近插值,例如,将一副5x5大小的图像,放大1.4倍(7x7),采用最邻近插值算法结果。,v,图像插值算法双线性内插值,f(i+u,j+v) = (1-u)(1-v)f(i,j) + (1-u)vf(i,j+1) + u(1-v)f(i+1,j) + uvf(i+1,j+1) 其中f(i,j)表示源图像(i,j)处的的像素值,以此类推。 双线性内插值法计算量大,但缩放后图像质量高,不会出现像素值不连续的的情况。,图像插值算法双线性内插值,已知:f(A)=100,f(B)=50,f(C)=200,f(D)=120,u=0.4,v=0.3 容易求出:Sa=(1-u)*(1-v)=0.42, Sb=(1-u)* v=0.18 Sc=u*v=0.12,Sd=u*(1-v) =0.28 f(P)=f(25.4,35.3)=Sa*f(A)+Sb*f(B)+Sc*f(C)+Sd*f(D)=,双三次插值,三种常用插值算法比较,比较: 速度(由快到慢): 最邻近插值法双线性插值法三次插值算法 质量(由好到差): 三次插值算法双线性插值法最邻近插值法,Thank You !,