2022年VC++数字图像处理编程 .pdf
《2022年VC++数字图像处理编程 .pdf》由会员分享,可在线阅读,更多相关《2022年VC++数字图像处理编程 .pdf(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、VC数字图像处理 编程VC数字图像处理 编程讲座之一前 言数字图像处理技术与理论是计算机应用的一个重要领域,许多工程应用都涉及到图像处理, 一直有一个强烈的愿望, 想系统的写一个关于数字图像处理的讲座,由于工作学习很忙,时至今日才得以实现。 图 是物体透射光或反射光的分布, 像 是人的视觉系统对图的接收在大脑中形成的印象或认识。图像是两者的结合。人类获取外界信息是靠听觉、视觉、触觉、嗅觉、味觉等,但绝大部分(约80% 左右)来自视觉所接收的图像信息。图像处理就是对图像信息进行加工处理,以满足人的视觉心理和实际应用的需要。简单的说,依靠计算机对图像进行各种目的的处理我们就称之为数字图像处理。早期
2、的数字图像处理的目的是以人为对象,为了满足人的视觉效果而改善图像的质量, 处理过程中输入的是质量差的图像,输出的是质量好的图像, 常用的图像处理方法有图像增强、 复原等。随着计算机技术的发展, 有一类图像处理是以机器为对象,处理的目的是使机器能够自动识别目标,这称之为图像的识别,因为这其中要牵涉到一些复杂的模式识别的理论,所以我们后续的讲座只讨论其中最基本的内容。由于在许多实际应用的编程中往往都要涉及到数字图像处理,涉及到其中的一些算法, 这也是许多编程爱好者感兴趣的一个内容, 我们这个讲座就是讨论如何利用微软的Visual C+ 开发工具来实现一些常用的数字图像处理算法,论述了图像处理的理论
3、,同时给出了VC实现的源代码。本讲座主要的内容分为基础篇、中级篇和高级篇,具体包含的主要内容有:1 图像文件的格式;2 图像编程的基础 -操作调色板;3 图像数据的读取、存储和显示、如何获取图像的尺寸等;4 利用图像来美化界面;5 图像的基本操作:图像移动、图像旋转、图像镜像、图像的缩放、图像的剪切板操作;6 图像显示的各种特技效果;7 图像的基本处理:图像的二值化、图像的亮度和对比度的调整、图像的边缘增强、如何得到图像的直方图、图像直方图的修正、图像的平滑、图像的锐化等、图像的伪彩色、彩色图像转换为黑白图像、物体边缘的搜索等等;8 二值图像的处理:腐蚀、膨胀、细化、距离变换等;名师资料总结
4、- - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 28 页 - - - - - - - - - 9 图像分析:直线、圆、特定物体的识别;10JEPG 、GIF、PCX 等格式文件相关操作;11图像文件格式的转换;12图像的常用变换:付利叶变换、DCT 变换、沃尔什变换等;13AVI 视频流的操作;图像处理技术博大精深, 不仅需要有很强的数学功底, 还需要熟练掌握一门计算机语言,在当前流行的语言中,我个人觉的Visual C+ 这个开发平台是图像开发人员的首选工具。 本讲座只是起到抛砖引玉
5、的作用,希望和广大读者共同交流。VC数字图像处理 编程讲座之二第一节 图像的文件格式要利用计算机对数字化图像进行处理,首先要对图像的文件格式要有清楚的认识,因为我们前面说过, 自然界的图像以模拟信号的形式存在,在用计算机进行处理以前,首先要数字化,比如摄像头(CCD )摄取的信号在送往计算机处理前,一般情况下要经过数模转换,这个任务常常由图像采集卡完成,它的输出一般为裸图的形式; 如果用户想要生成目标图像文件,必须根据文件的格式做相应的处理。随着科技的发展,数码像机、数码摄像机已经进入寻常百姓家,我们可以利用这些设备作为图像处理系统的输入设备来为后续的图像处理提供信息源。无论是什么设备, 它总
6、是提供按一定的图像文件格式来提供信息,比较常用的有BMP格式、JPEG格式、GIF格式等等,所以我们在进行图像处理以前,首先要对图像的格式要有清晰的认识,只有在此基础上才可以进行进一步的开发处理。在讲述图像文件格式前, 先对图像作一个简单的分类。 除了最简单的图像外,所有的图像都有颜色, 而单色图像则是带有颜色的图像中比较简单的格式,它一般由黑色区域和白色区域组成,可以用一个比特表示一个像素,1 表示黑色,0 表示白色,当然也可以倒过来表示,这种图像称之为二值图像。我们也可以用 8 个比特(一个字节)表示一个像素, 相当于把黑和白等分为256 个级别,0表示为黑, 255 表示为白,该字节的数
7、值表示相应像素值的灰度值或亮度值,数值越接近 0 ,对应像素点越黑,相反,则对应像素点越白,此种图像我们一般称之为 灰度图像。单色图像和 灰度图像又统称为黑白图像, 与之对应存在着彩色图像,这种图像要复杂一些,表示图像时,常用的图像彩色模式有RGB 模式、CMYK 模式和 HIS模式,一般情况下我们只使用RGB 模式,R 对应红色, G对应绿色,B对应蓝色,它们统称为三基色,这三中色彩的不同搭配,就可以搭配成各种现实中的色彩,此时彩色图像的每一个像素都需要3 个样本组成的一组数据表示,其中每个样本用于表示该像素的一个基本颜色。名师资料总结 - - -精品资料欢迎下载 - - - - - - -
8、 - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 28 页 - - - - - - - - - 对于现存的所有的图像文件格式,我们在这里主要介绍BMP 图像文件格式,并且文件里的图像数据是未压缩的, 因为图像的数字化处理主要是对图像中的各个像素进行相应的处理, 而未压缩的 BMP 图像中的像素数值正好与实际要处理的数字图像相对应,这种格式的文件最合适我们对之进行数字化处理。请读者记住,压缩过的图像是无法直接进行数字化处理的,如 JPEG 、GIF 等格式的文件, 此时首先要对图像文件解压缩, 这就要涉及到一些比较复杂的压缩算法。后续章节中我
9、们将针对特殊的文件格式如何转换为BMP 格式的文件问题作专门的论述, 经过转换,我们就可以利用得到的未压缩的BMP 文件格式进行后续处理。对于JPEG 、GIF 等格式,由于涉及到压缩算法,这要求读者掌握一定的信息论方面的知识,如果展开的话,可以写一本书,限于篇幅原因,我们只作一般性的讲解,有兴趣的朋友可以参考相关书籍资料。一、BMP 文件结构1. BMP 文件组成BMP 文件由文件头、位图信息头、颜色信息和图形数据四部分组成。文件头主要包含文件的大小、 文件类型、 图像数据偏离文件头的长度等信息;位图信息头包含图象的尺寸信息、图像用几个比特数值来表示一个像素、图像是否压缩、图像所用的颜色数等
10、信息。 颜色信息包含图像所用到的颜色表,显示图像时需用到这个颜色表来生成调色板,但如果图像为真彩色,既图像的每个像素用24 个比特来表示, 文件中就没有这一块信息, 也就不需要操作调色板。 文件中的数据块表示图像的相应的像素值, 需要注意的是: 图像的像素值在文件中的存放顺序为从左到右, 从下到上, 也就是说, 在 BMP 文件中首先存放的是图像的最后一行像素,最后才存储图像的第一行像素,但对与同一行的像素, 则是按照先左边后右边的的顺序存储的; 另外一个需要读者朋友关注的细节是:文件存储图像的每一行像素值时, 如果存储该行像素值所占的字节数为4 的倍数,则正常存储, 否则,需要在后端补0,凑
11、足 4 的倍数。2. BMP 文件头BMP 文件头数据结构含有BMP 文件的类型、文件大小和位图起始位置等信息。其结构定义如下 : typedef struct tagBITMAPFILEHEADER WORD bfType; / 位图文件的类型,必须为 BM DWORD bfSize; / 位图文件的大小,以字节为单位WORD bfReserved1; / 位图文件保留字,必须为0 WORD bfReserved2; / 位图文件保留字,必须为0 DWORD bfOffBits; / 位图数据的起始位置, 以相对于位图文件头的偏移量表示,以字节为单位 BITMAPFILEHEADER;该结构
12、占据 14 个字节。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 28 页 - - - - - - - - - 3. 位图信息头BMP 位图信息头数据用于说明位图的尺寸等信息。其结构如下:typedef struct tagBITMAPINFOHEADER DWORD biSize; / 本结构所占用字节数LONG biWidth; / 位图的宽度,以像素为单位LONG biHeight; / 位图的高度,以像素为单位WORD biPlanes; / 目标设备的平面数不
13、清,必须为1 WORD biBitCount/ 每个像素所需的位数,必须是1( 双色), 4(16色),8(256色)或 24(真彩色 )之一DWORD biCompression; / 位图压缩类型,必须是 0( 不压缩 ),1(BI_RLE8 压缩类型) 或 2(BI_RLE4 压缩类型 )之一DWORD biSizeImage; / 位图的大小,以字节为单位LONG biXPelsPerMeter; / 位图水平分辨率,每米像素数LONG biYPelsPerMeter; / 位图垂直分辨率,每米像素数DWORD biClrUsed;/ 位图实际使用的颜色表中的颜色数DWORD biCl
14、rImportant;/ 位图显示过程中重要的颜色数 BITMAPINFOHEADER;该结构占据 40 个字节。注意:对于 BMP 文件格式,在处理单色图像和真彩色图像的时候,无论图象数据多么庞大, 都不对图象数据进行任何压缩处理,一般情况下, 如果位图采用压缩格式,那么 16色图像采用 RLE4压缩算法, 256 色图像采用 RLE8压缩算法。4. 颜色表颜色表用于说明位图中的颜色,它有若干个表项,每一个表项是一个RGBQUAD类型的结构,定义一种颜色。RGBQUAD结构的定义如下 : typedef struct tagRGBQUAD BYTErgbBlue;/ 蓝色的亮度 (值范围为
15、0-255) BYTErgbGreen; / 绿色的亮度 ( 值范围为 0-255) BYTErgbRed; / 红色的亮度 (值范围为 0-255) BYTErgbReserved;/ 保留,必须为 0 RGBQUAD; 颜色表中 RGBQUAD结构数据的个数由BITMAPINFOHEADER 中的 biBitCount项来确定,当 biBitCount=1,4,8时,分别有 2,16,256 个颜色表项,当biBitCount=24时,图像为真彩色,图像中每个像素的颜色用三个字节表示,分别对应 R 、G 、B值,图像文件没有颜色表项。 位图信息头和颜色表组成位图信息,BITMAPINFO
16、结构定义如下 : typedef struct tagBITMAPINFO 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 28 页 - - - - - - - - - BITMAPINFOHEADER bmiHeader; / 位图信息头RGBQUAD bmiColors1; / 颜色表 BITMAPINFO; 注意: RGBQUAD数据结构中,增加了一个保留字段rgbReserved,它不代表任何颜色,必须取固定的值为0 ,同时, RGBQUAD 结构中定义的颜色值中
17、,红色、绿色和蓝色的排列顺序与一般真彩色图像文件的颜色数据排列顺序恰好相反,既:若某个位图中的一个像素点的颜色的描述为00,00,ff ,00,则表示该点为红色,而不是蓝色。5. 位图数据位图数据记录了位图的每一个像素值或该对应像素的颜色表的索引值,图像记录顺序是在扫描行内是从左到右, 扫描行之间是从下到上。这种格式我们又称为 Bottom_Up位图,当然与之相对的还有Up_Down 形式的位图,它的记录顺序是从上到下的, 对于这种形式的位图, 也不存在压缩形式。 位图的一个像素值所占的字节数:当 biBitCount=1时,8 个像素占 1 个字节;当 biBitCount=4时,2个像素占
18、 1 个字节; 当 biBitCount=8时, 1 个像素占 1 个字节; 当 biBitCount=24时,1 个像素占 3 个字节,此时图像为真彩色图像。当图像不是为真彩色时,图像文件中包含颜色表, 位图的数据表示对应像素点在颜色表中相应的索引值,当为真彩色时, 每一个像素用三个字节表示图像相应像素点彩色值,每个字节分别对应 R、G 、B分量的值,这时候图像文件中没有颜色表。上面我已经讲过了,Windows规定图像文件中一个扫描行所占的字节数必须是4 的倍数 ( 即以字为单位), 不足的以 0 填充,图像文件中一个扫描行所占的字节数计算方法:DataSizePerLine= (biWid
19、th* biBitCount+31)/8;/ 一个扫描行所占的字节数位图数据的大小按下式计算(不压缩情况下 ) :DataSize= DataSizePerLine* biHeight。上述是 BMP 文件格式的说明, 搞清楚了以上的结构, 就可以正确的操作图像文件,对它进行读或写操作了。二、GIF图像文件格式GIF图象格式的全称为Graphics Interchange Format,从这个名字可以看出,这种图像格式主要是为了通过网络传输图像而设计的。GIF 文件不支持 24位真彩色图像,最多只能存储256色的图像或 灰度 图像;GIF 格式文件也无法存储 CMY 和 HIS 模型的图像数据
20、;另外, GIF 图像文件的各种数据区域一般没有固定的数据长度和存储顺序, 所以为了方便程序寻找数据区, 将数据区中的第一个字节作为标志符;最后需要读者注意的是GIF 文件存储图像数据是有二种排列顺序:顺序排列或交叉排列。 交叉排列的方式适合网络传输,这样一来允许用户在名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 28 页 - - - - - - - - - 不完全掌握图像数据之前,获取当前图像的轮廓数据。GIF文件格式分为 87 和 89两个版本,对于87这个版本,该
21、文件主要是有五个部分组成,它,们是按顺序出现的:文件头块、逻辑屏幕描述块、可选择的调色板块、图像数据块、最后是标志文件结束的尾块, 该块总是取固定的值3BH 。其中第一和第二两个块用GIF 图像文件头结构描述:GIFHEADER: DB Signature; / 该字段占六个字节,为了用于指明图像为GIF 格式,前三个字符必须为 GIF ,后三字符用于指定是哪个版本,87或 89。DW ScreenWidth;/ DW ScreenDepth;/ 占两个字节,以像素为单位表示图像的宽、高DB GlobalFlagByte;/该字节的各个位用于调色版的描述DB BackGroundColor;/
22、代表图象的背景颜色的索引DB AspectRatio; 图像的长宽比 GIF格式中的调色板有通用调色板和局部调色板之分,因为 GIF 格式允许一个文件中存储多个图像, 因此有这两种调色板, 其中通用调色板适于文件中的所有图像,而局部调色板只适用于某一个图像。格式中的数据区域一般分为四个部分,图像数据识别区域, 局部调色板数据, 采用压缩算法得到的图象数据区域和结束标志区域。在 GIF89版本中,它包含七个部分,分别是文件头、通用调色板数据、图像数据区和四个补充数据区,它们主要是用于提示程序如何处理图像的。三、JEPG 图像文件JEPG 简称为联合摄影专家小组,作为一种技术,主要用于数字化图像的
23、标准编码, JPEG 主要采用有损的压缩编码方式,它比GIF、BMP 图像文件要复杂的多,这不是短短的几页篇幅可以将清楚的,万幸的是, 我们可以通过一些别的方法将该格式转化为BMP 格式。读者需要知道的是在对JEPG文件格式编码时,通常需要分为以下四步:颜色转化、DCT 变换、量化、编码。以上介绍了一些常用的图像文件,对比较复杂的格式,如GIF 和 JEPG ,仅仅作了极其浮浅的介绍, 后文我们会和它们作进一步的接触。实际应用中, 还有许多图像格式, 文章中都没有提到, 读者如果需要做进一步的研究,还需要参考一些关于图像格式方面的资料。VC数字图像处理 编程讲座之三BMP 图像的基本操作上一讲
24、我们主要介绍了图像的格式,其中重点说明了BMP 文件的存储格式,同时对 JEPG和 GIF 等常用格式作了简单的介绍。本节主要讲述如何操作BMP 文名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 28 页 - - - - - - - - - 件,如对其读、写和显示等。在实现数字图象处理的过程中, 主要是通过对图像中的每一个像素点运用各种图像处理算法来达到预期的效果,所以进行图像处理的第一步, 也是我们最关心的问题,是如何得到图像中每一个像素点的亮度值;为了观察和验证处理的
25、图像效果,另一个需要解决的问题是如何将处理前后的图像正确的显示出来。我们这章内容就是解决这些问题。随着科技的发展,图像处理技术已经渗透到人类生活的各个领域并得到越来越多的应用, 但是突出的一个矛盾是图像的格式也是越来越多,目前图像处理所涉及的主要的图像格式就有很多种,如TIF、JEMP 、BMP 等等,一般情况下,为了处理简单方便, 进行数字图像处理所采用的都是BMP 格式的图像文件 (有时也称为 DIB 格式的图像文件) ,并且这种格式的文件是没有压缩的。我们通过操作这种格式的文件,可以获取正确显示图像所需的调色板信息,图像的尺寸信息,图像中各个像素点的亮度信息等等,有了这些数据, 开发人员
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年VC+数字图像处理编程 2022 VC 数字图像 处理 编程
限制150内