(完整word版)多媒体信息处理技术.pdf
《(完整word版)多媒体信息处理技术.pdf》由会员分享,可在线阅读,更多相关《(完整word版)多媒体信息处理技术.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 5 章多媒体信息处理技术通过本章学习,了解多媒体信息处理技术的基本问题,包括多媒体数据的分类、多媒体信息的计算机表示、多媒体数据压缩和编码技术、音频卡和视频卡的应用。重点掌握多媒体信息处理技术的基本概念,学会音频卡和视频卡的安装与使用,了解多媒体技术中数据的压缩与编码方法。51 多媒体数据的分类媒体是承载信息的载体,是信息的表示形式。信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素,目前主要包括文本、图形、图像、声音、动画和视频等媒体。一、多媒体数据的特点多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。多媒体数据类型多,包括图形、图像、声音、文本和
2、动画等多种形式,即使同属于图像一类,也还有黑白、彩色、高分辨率和低分辨率之分,由于不同类型的媒体内容和格式不同,其存储容量、信息组织方法等方面都有很大的差异。二、多媒体数据的分类1文字在计算机中,文字是人与计算机之间信息交换的主要媒体。文字用二进制编码表示,也就是使用不同的二进制编码来代表不同的文字。文本是各种文字的集合,是人和计算机交互作用的主要形式。文本数据可以在文本编辑软件里制作,如 Word 编写的文本文件大都可以直接应用到多媒体应用系统中。但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。2音频音频泛指声音,除语音、音乐外,还包括各种音响效果。将音频信号集成到多媒体中,
3、可提供其他任何媒体不能取代的效果,从而烘托气氛、增加活力。3图形、图像凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。图形文件基本上可以分为两大类:位图和向量图。位图图像是一种最基本的形式。位图是在空间和亮度上已经离散化的图像,可以把一幅位图图像看成一个矩阵,矩阵中的任一元素对应于图像的一个点,而相应的值对应于该点的灰度等级。图形是指从点、线、面到三维空间的黑白或彩色几何图形,也称向量图。图形是一种抽象化的图像,是对图像依据某个标准进行分析而产生的结果。向量图形文件则用向量代表图中的文件,以直线为例,在向量图中,有一数据说明该元件为直线,另外有些数据注明该直线的起始坐标及
4、其方向、长度或终止坐标,图形文件保存的不是像素点的值,而是一组描述点、线、面等几何图形的大小、形状、位置、维数等其他属性的指令集合,通过读取指令可以将其转换为屏幕上显示的图像。由于大多数情况下不需要对图形上的每一个点进行量化保存,所以,图形文件比图像文件数据量小很多。图形与图像是两个不同的概念。4动画图像或图形都是静止的。由于人眼的视觉暂留作用,在亮度信号消失后亮度感觉仍可保持 120s110s。利用人眼视觉惰性,在时间轴上,每隔一段时间在屏幕上展现一幅有上下关联的图像、图形,就形成了动态图像。任何动态图像都是由多幅连续的图像序列构成的,序列中的每幅图像称为一帧,如果每一帧图像是由人工或计算机
5、生成的图形时,称为动画;若每帧图像为计算机产生的具有真实感的图像时,称为三维真实感动画;当图像是实时获取的自然景物图像时就称为动态影像视频,简称视频。用计算机制作动画的方法有两种:一种称为造型动画,另一种称为帧动画。帧动画由一幅幅连续的画面组成图像或图形序列,是产生各种动画的基本方法。造型动画则是对每一个活动的对象分别进行设计,赋予每个对象一些特征(如形状、大小、颜色等),然后用这些对象组成完整的画面。5视频影像视频是动态图像的一种。与动画一样,由连续的画面组成,只是画面图像是自然景物的图像。计算机视频图像可来自录像带、摄像机等视频信号源,这些视频图像使多媒体应用系统功能更强、更精彩。32 多
6、媒体信息的计算机表示一、文本文件格式常用的文本文件的格式有TXT、RTF 以及 WORD 格式的 DOC、DOT 文件。二、声音文件格式常用的声音文件格式有WAV、MID 和 MP3 等。1WAV 文件Windwos 使用的标准数字音频称为波形文件,文件的扩展名为WAV,记录了对实际声音进行采样的数据。在适当的硬件及计算机控制下,使用波形文件能够重现各种声音,无论是不规则的噪音还是CD 音质的音乐,也无论是单声道还是立体声。通过 Windows 的对象连接与嵌入技术,波形文件可以嵌在其他Windows 应用系统中使用。由于波形文件记录的是数字化音频信号,因此,可由计算机对其进行处理和分析。如放
7、慢或加快放音速度,将声音重新组合或抽取一些片段单独处理等等。WAV 文件还原成的声音的音质取决于声音卡采样样本的尺寸。一般来说,采样的样本尺寸越大,采样频率越高,音质就越好,但波形音频文件也就越大,开销就越大。因此,波形音频一般适用于以下几个场合:播放的声音是讲话语音,音乐效果对声音的质量要求不太高的场合。需要从CD-ROM 光盘驱动器同时加载声音和其他数据,声音数据的传输不能独占处理时间的场合。需要在 PC 硬盘中存储的声音数据在1 分钟以下以及可用存储空间足够的场合。2MIDI 文件MIDI(Musical Instrument Digital Interface)是指乐器数字化接口,MI
8、DI 文件的扩展名是 MID。MIDI 标准是数字式音乐的国际标准。把一个MIDI设备连接到PC 的主要目的是记录 MIDI 乐器产生的声音。然后,对记录的音乐进行编辑和后期处理,把它们与其他乐器的录音进行组合,以产生出类似管弦乐队演奏效果的音乐。3MP3 文件MP3 格式的音乐越来越受到人们的欢迎。MP3 文件是一种压缩格式的声音文件,其扩展名为 MP3。MP3 文件的特点是音质好、数据量小。三、图形、图像文件格式常见的图形文件的格式有如下几种:BMP、PCX、GIF、TIF、JPG、TGA 等。1GIF(Graphic Interchange Format)文件2BMP(bitmap)文件
9、3JPG 文件4TGA 文件文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6
10、T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2
11、R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码
12、:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9
13、I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H1
14、0 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B
15、10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R85TIF 文件6PCX 文件7PCD 文件四、影像文件格式影像文件通常泛指自扫描仪或视频卡读入的静态画面(影像)。在动态图像的文件格式中,常
16、用的有AVI、MOV、MPG 和 DAT 文件等。1AVI 2MOV 文件3MPG 文件格式4DAT 文件格式5DIR 文件格式五、动画文件格式多媒体应用中使用的动画文件主要有GIF、AVI、SWF 等等。1GIF 文件2SWF 文件53 多媒体数据压缩和编码技术一、多媒体的数据量、信息量和冗余多媒体计算机面临的最大难题是大量数据的存储与传送问题。在所有可能的数据库中,图像是数据量最大的数据类型。数据是用来记录和传送信息的,或者说数据是信息的载体。对于人类而言,真正有用的不是数据本身,而是数据所携带的信息。信息量与数据量的关系是:信息量=数据量+数据冗余多媒体数据中存在的数据冗余类型有:空间冗
17、余、时间冗余、编码冗余、结构冗余、知识冗余和视觉冗余等。1空间冗余空间冗余是图像数据中经常存在的一种冗余。在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性在数字化图像中表现为数据冗余。2时间冗余时间冗余是序列图像如电视图像、运动图像和语音数据中经常包含的冗余。图像序列中的两幅相邻的图像,后一幅与前一幅之间有较大的相关,反映为时间冗余。在语音中,由于人在说话时其发音的音频是一个连续渐变的过程,而不是一个时间上完全独立的过程,因而存在时间冗余。3编码冗余编码冗余也称为信息熵冗余,信息熵是指对一团数据所携带的信息量。4结构冗余有些图像从大域上看存在着非常强的纹理结构,表现为结构
18、冗余。5知识冗余对有许多图像的理解与某些背景知识使有相当大的相关性。例如,人脸的图形有固定的结构等。这类规律性的结构可由先验知识和背景知识得到,表现为知识冗余。6视觉冗余人类的视觉系统对于图像场的注意是非均匀的、非线性的,视觉系统并不能对于图像场的任何变化都有所感知。换句话说,尽管在对图像的编码和解码处理时,由于压缩或者量化引入噪声而使图像发生了一系列的变化,如果这些变化不能被视觉所察觉的话,我们仍认为图像是完好的或足够好的。事实上,人类视觉系统的一般分辨能力约为26 灰度级,而一般文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3
19、H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO
20、8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1
21、O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 Z
22、I6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3
23、L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档
24、编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3
25、A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8文档编码:CF3A9I2M3H10 HO8B10D1O1T6 ZI6T2D3L2R8图像的量化采用的是28 灰度级,这样的冗余称为视觉冗余。7其他冗余例如由图像的空间非定常特性所带来的冗余等。正是由于多媒体数据中存在各种各样的冗余,才使得多媒体数据可以被压缩。针对冗余的类型不同,人们已经提出了各种各样的方法实施对多媒体数据的压缩。二、数据压缩的基本方法数据压缩处
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整 word 多媒体信息 处理 技术
限制150内