计算机应用基础第8章多媒体技术及其应用.ppt
《计算机应用基础第8章多媒体技术及其应用.ppt》由会员分享,可在线阅读,更多相关《计算机应用基础第8章多媒体技术及其应用.ppt(96页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第8章 多媒体技术及其应用 本章要点:了解多媒体技术发展的历史、多媒体系统的基本构成、视频和音频的数字化过程、数据压缩技术及其应用的相关算法等。熟悉常见多媒体文件、典型的数据压缩标准,能正确区分多媒体的文件类型。掌握多媒体的定义及分类,能熟练使用Windows Media Player、Winamp等常用的多媒体播放器。8.1 多媒体技术概述 在计算机发展的早期阶段,人们利用计算机主要从事数据的运算和处理,处理的主要内容都是文字信息。直到20世纪80年代,随着计算机技术(尤其是硬件技术)的发展,人们除了利用计算机处理文本信息外,还处理一些简单的图像信息。到了20世纪90年代,计算机软硬件技术得
2、到了更进一步发展,其处理能力越来越强,应用领域也得到了进一步拓展,这在很大程度上促进了多媒体技术的发展和完善,计算机所能处理的内容由最初的单一的文本信息逐渐发展到文本、声音、图像、动画、视频等相结合的多种信息媒体。到目前为止,伴随着网络技术和Internet的发展,信息多媒体技术不断走向成熟,给人们的生活带来了极大的方便,使人类社会不断向信息时代迈进。8.1.1 多媒体的定义和分类 1.多媒体的定义 在认识多媒体前,首先需要认识什么是媒体。媒体(Media)在计算机中有两种含义,一种是指以实物的形式存在的,用来存储信息的物质实体,比如磁带、磁盘以及半导体存储器等;另一种与实物相对应,是指信息的
3、表现形式或者载体,比如人们日常生活中接触的各种能传播信息的载体,包括文字、图形、图像、音频、动画和视频等。那什么是多媒体呢?顾名思义,多媒体(Multimedia)就是多种媒体信息的有机集合,是多种信息的表现形式和传递方式,主要包括文字、图形、图像、音频、动画和视频等。因此可以看出,多媒体其实是媒体的第二种含义的集合,形象地说,人类在信息的交流中要使用各种各样的信息载体就是多媒体。在日常生活中,很容易找到一些多媒体的例子,如书刊、杂志、画册、电视、广播、电影等。因此,从上面的多媒体定义可以看出,多媒体技术至少能够同时获取、处理、编辑、存储和展示两种以上不同类型的信息媒体,并且具有交互性。现在人
4、们所说的多媒体技术往往与计算机联系起来,主要是由计算机的数字化以及交互式处理能力决定的,这也是计算机的多媒体技术和电影、电视的“多媒体”的本质区别。2.多媒体的分类 计算机处理的多媒体信息,大致可以分为两大类,分别如下:(1)静态多媒体。它是指不随时间变化而变化的计算机多媒体信息,主要包括文字信息、图形信息和静态图像信息等。(2)动态多媒体。它是指随着时间变化而变化的计算机多媒体信息,它与静态媒体相对应,日常生活中常见的动态媒体信息主要包括声音信息、视频信息、动画信息和影像信息等。多媒体系统的构成 多媒体系统是指能有效处理多媒体信息的系统。通常情况下,多媒体系统是由具有多媒体功能的硬件系统和软
5、件系统组成的。1.多媒体硬件系统 多媒体硬件系统指支持多媒体信息交互处理所需的硬件设备。通常情况下,多媒体硬件系统是指具有多媒体功能,能处理多媒体信息的计算机,它能够将多种媒体信息集为一体进行处理。具有多媒体功能的微型计算机习惯上被人们称为“多媒体个人计算机(Multimedia Personal Computer,MPC)”。多媒体个人计算机并不是一种全新的个人计算机,它是指具有综合处理声音、文字、图形、图像等信息功能的计算机,最早的多媒体计算机是1987年美国Commodore公司推出的Amiga计算机,它采用了该公司自行设计的用于动画制作、音响处理以及图形处理的专用芯片,因而可以有效地处
6、理相应的音频信号和视频信号。在这之后的几年里面,Apple、Philips、Microsoft、Tandy以及NEC等世界知名的公司先后加入到多媒体计算机的研发中,从而大大促进了多媒体计算机的发展。到目前为止,几乎任何一台计算机都具备了处理多媒体信息的功能,但是对于专业多媒体创作来说,普通PC是很难满足实际需求的,需要有专门硬件设备以满足各方面的需求。如果需要构造一套较完整的多媒体制作系统,只配置一些必须的硬件还达不到要求,还需要增加一些专用的多媒体信息处理设备,如激光打印机、扫描仪、视频采集卡和数码相机等。2.多媒体软件系统(1)多媒体软件系统的基本构成 对于多媒体计算机来说,多媒体软件系统
7、除基本的计算机操作系统(通常是指Windows操作系统,因为其具有多媒体信息处理的能力,即为多媒体操作系统)外,还包括多媒体信息编辑系统、多媒体数据库管理系统、多媒体压缩/解压缩软件、多媒体声像同步软件、多媒体通信软件和其他相关的多媒体编辑创作工具等。多媒体软件系统在不同的应用领域中还有多种开发工具,如图像处理软件、图形生成软件、声音编辑软件、视频处理软件和合成软件等,另外现在许多高级用户还可以根据 自己的需求,利用高级语言(如Delphi、C+Builder、Visual Basic、Visual C+以及C#等)所提供的多媒体API函数接口开发具有特定功能的多媒体应用程序和各种工具,这些资
8、源都为多媒体系统开发提供了便捷的创作途径。(2)多媒体操作系统 多媒体操作系统是多媒体软件环境的基础,目前使用最广泛的多媒体操作系统是Windows操作系统。由于Windows提供图形界面,使得用户不必再将大量时间和精力花费在不同软件的学习上,大大提高了学习和工作效率。通常情况下,购置的各种多媒体板卡和外设安装到计算机上后,必须有相应的软件驱动程序来驱动,以便系统有效地管理这些设备,使它们发挥应有的功能。一般购买声卡、视频卡、扫描仪、数码照相机等设备时,厂方或商家都会提供相应的驱动程序光盘,以满足用户在不同操作系统中的需求。(3)常用的多媒体信息处理软件 常用的多媒体信息处理软件主要有图像处理
9、软件、声音处理软件、视频处理软件等三大类,其中图像处 理 软 件 主 要 有 Photoshop、PhotoImpact、CorelDraw等;音频处理软件主要有Windows自带的录音机、录音大使、Nuendo、Cool Edit Pro等;视频处理软件主要有Adobe Premiere、Video for Windows、Ulead Media Studio Pro、CG Infinity、Video Paint、Ulead DVD Picture Show等;动画制作软 件 主 要 有 Flash、3D Studio MAX、Ulead GIF Animator Cool3D等。提示:目
10、前使用最广泛的图像处理软件是Photoshop,读者可以根据需要进行更深入的学习。8.2 多媒体技术基础 多媒体技术是用来处理多媒体信息的技术总称,是利用计算机技术把多种媒体信息综合一体化,使它们建立起逻辑关系,并能进行加工处理的技术。多媒体技术的主要特性包括信息媒体的多样性、集成性、交互性、可控性、非线性和实时性等,这些也是多媒体研究中必须要解决的主要问题。其中多样性是多媒体的主要特征,也是需要解决的关键问题;集成性是指以计算机为中心,综合处理多种信息媒体的特性;交互性是指向用户提供了更加有效地控制和使用信息的手段,是多媒体区别于传统信息交流媒体的主要特点之一;可控性是使多媒体信息最后要采用
11、适宜于人的多种感官的多种媒体表现形式;非线性改变了传统信息顺序读写的模式,使信息的组织变得更加灵活,极大地方便了用户对知识的获取;实时性要求通过多媒体技术使用户能通过操作命令实时控制相应的多媒体信息。多媒体信息可以利用计算机输出界面向人们展示丰富多彩的文字、声音和图像等信息,而计算机只能处理数字信号,因此必须先将各种多媒体信息转换成计算机能认识的二进制数字信号,计算机才能进行有效的处理和存储等操作。其中,这个转化过程就是通常所说的数字化过程,即将模拟信号转化为数字信号的过程,而 数字化则是指利用计算机信息处理技术把声、光、电、磁等信号转换成数字信号,或把语音、文字、图像等信息转变为计算机能识别
12、的数字编码,用于传输与处理的过程。在数字化的过程中,通常需要使用各种不同的技术来进行处理,在这些技术中,把以高速微型计算机为核心的数字编码、数字压缩、数字调制与解调等信息处理技术,统称为数字化技术。与非数字信号相比,数字信号具有传输速度快、容量大、抗干扰能力强、保密性好、能进行更复杂的操作和处理等优点。下面将分别介绍视觉信息的数字化、听觉信息的数字化、数据压缩技术及其应用方面的主要内容。8.2.1 视觉信息的数字化 视觉信息的数字化是指将视觉信息以数字化的形式进行存储、传输等。在多媒体技术中,最常用的视觉信息元素是图形和图像,它们可以以静态和动态两种方式存在,以表现更加丰富多彩的视觉信息。静态
13、图像根据图像生成原理的不同,可以分为光栅图像(也叫位图图像)和矢量图像两种,前者是以点阵的形式存储,而后者则是以矢量图形的形式存储;动态图像可以分为视频图像和动画图像两种,它们之间的区别在于是否是实际视觉信息的录相,因此通常把通过摄像机拍摄到的动态图像称为视频图像,而把通过计算机动画技术加工合成的动态图像称为动画图像。视觉信息的数字化主要是由视觉系统来完成的。1.视觉系统 典型的视觉系统一般包括如下部分:光源、镜头、CCD照相机、图像处理单元(或图像采集卡)、图像处理软件、监视器、通信、输入输出单元等。视觉系统的输出并非图像视频信号,而是经过不同目的运算处理之后的检测结果(比如尺寸数据)。2.
14、静态图像的数字化 通常情况下,静态光栅图像是通过视觉系统将模拟图像利用采样和量化的手段来得到的图形。对模拟视觉信号进行采样的时候,应当严格遵守采样定理,以保证图像失真度较小。量化是将采样得到的数字图像信号赋以相应的色度以及颜色值等,以实现图像的数字化。(1)光栅图像数字化。光栅图像(位图图像)是以点阵的形式进行存储的,每一个图像点(亦称像素)代表一定的色度值,当图像放大的时候,那么原来的每一个像素点将被放大,于是图像就变成由很多具有一定色度的方块所组成,这种情况常被称作马赛克现象。由于位图每个像素点可以有单独的色度值,因此位图通常被用来表现逼真的真实感图像信息,这将导致位图占用存储空间较大。如
15、下图所示是一幅简单位图图像及其放大三倍之后的位图图像,从放大图中可以清晰看到位图是由许多细小的方块组成的。实际生活中所遇见的图像大多数都是以位图的形式存储的,如人们日常生活中的数码照片、网络图片等。放大三倍 衡量位图好坏的主要指标有如下三个:分辨率。分辨率是影响图像质量的重要因素,包括屏幕分辨率、图像分辨率和像素分辨率三种。其中屏幕分辨率是计算机显示器屏幕上的像素点总数,比如通常情况下人们习惯采用1024768的屏幕分辨率;图像分辨率是指数字化图像的大小,是组成图像的所有像素点总数,即图像的高宽;像素分辨率是指像素的长和宽的比例,也称像素的长度比。颜色深度。颜色深度是用来描述图像颜色数量多少的
16、物理量,指图像的一个像素所占的二进制位个数。图像文件大小。图像文件大小是指图像文件在存储介质上所占的实际存储空间的大小,一般是以字节(Byte)为单位,可由下列公式计算得到:位图图像文件大小:(Byte)=图像分辨率图像深度/8(2)矢量图像数字化。矢量图像一般都被称作图形,它不是直接描述图形中的每一个像素点,而是利用数学公式描述生成这些点的过程。对于矢量图像来说,不论放大多少倍,都不会产生模糊的视觉效果,清晰度与放大前是一样的。对于同样大小的图像,矢量图的存储空间要比位图小,而且它可以任意放大而不改变图像的存储空间。日常生活中常用的矢量图像包括工程CAD图、剪贴画等。如下图所示的就是一幅矢量
17、图形及其放大三倍后的效果图。放大三倍 矢量图像不适合描述现实生活中图像细节特别丰富的物体,它主要适用于线框图的绘制、美术字的生成、工程图形绘制及三维图形的设计等。通常情况下,将矢量图像转化为位图图像比较简单,而将位图图像转换为矢量图像时比较困难,需要借助一些专业工具来实现,如CorelTrace软件、SuperCard软件等,但有些图像转换之后达不到用户需要的效果,有的甚至根本没办法实现完全转换。(3)数字化过程中的色彩模式。在多媒体计算机系统中,图像的颜色值是以二进制的形式来表示的,二进制位越多,则可表示的颜色范围越广,这也被称作图像的颜色深度。因此常常根据不同的颜色深度来划分色彩模式,日常
18、生活中常用到的色彩模式主要有5种:黑白色彩模式、灰度色彩模式、索引16色色彩模式、索引256色色彩模式和真彩色色彩模式。3.动态图像的数字化 动态图像包括视频和动画。人眼所接收到的现实生活中的场景信息,通过视频采集装置输入到计算机中,就可以得到视频数字信号;而动画通常是计算机合成的动态图像系列,这是用户直接在计算机上以数字的形式合成的,不需要再次进行数字化操作。因此通常所说的动态图像数字化主要是指视频信号的数字化部分。日常生活中,常用的视频信号数字化设备主要有DV卡以及视频采集卡等,其中DV卡也被称作1394卡,是直接将DV摄像机或者录像带中所记录的数字视频信号,通过数字信号的方式直接输入到计
19、算机中,如下图所示为一块典型的PCI IEEE 1394卡和笔记本用1394卡。视频卡则是将视频信号输入输出到计算机的接口功能卡的总称,如下图所示是两款不同接口的典型视频采集卡。8.2.2 听觉信息的数字化 1.声音的分类 声音可以按照内容、频谱、频率、时间等进行分类,其中根据频率声音,可以分为如下几类:(1)自然音。即大自然的声音,如水流声、风声等。(2)纯音。由人工制作的信号产生器震荡出来的声波,是一种正弦波的单一波形。(3)复合音。由不同频率的声音混合而成的声音。(4)协和音。由两个单一的纯音组合而成,但是这些音与基音有整数比的关系。(5)噪音。令人不悦的声音,如刹车声、喇叭声等。(6)
20、超音波。超过人耳所能听到的频率之外的部分声音。2.声音信息的数字化 声音信息的数字化,即研究如何将随时间连续变化的声音波形信号进行量化。从技术上说,就是将连续的模拟声音信息通过模/数(A/D)转换器,转换为计算机可以处理并识别的数字信号。对声音波形信息数字化的方法是对声音信号采样量化。一般情况下,声音信息的数字化过程都集成到了声卡中,可实现模拟声音信号到数字声音信号的转换,同时也可以实现数字声音信号到模拟声音信号的转换。8.2.3 数据压缩 1.数据压缩的必要性 由于多媒体信息信号数字化之后,将会产生很庞大的数据量,这样不但浪费存储空间,而且在多媒体计算机操作相应的文件时,容易因为数据量过大而
21、导致速度变慢甚至死机等问题。比如利用计算机连续存储分辨率为1024768的真彩色视频图像时,如果存储1分钟,显示速度为30帧/秒,则需要的数据存储空间为:1024(列)768(行)3(Byte)30(帧/秒)60(秒)=3.96 GB 2.数据压缩的应用 目前数据压缩技术广泛应用于各个领域,下面介绍如下几种主要的压缩技术应用。(1)文本压缩 文本压缩是数据压缩的一个典型应用,属于无损压缩。它的目标是通过对原始数据施加某种操作或变换之后,产生一种长度变短的压缩码,同时还必须保证原始数据能够从该压缩码中正确提取出来,以达到精确的还原。(2)JPEG标准 JPEG标准即ISO/IEC1091-1标准
22、,是the Joint Photographic Experts Group的缩写,它主要适用于连续色调、多级灰度、彩色或者单色的静态图像的压缩,但也可用于对连续运动图像进行压缩,压缩时将连续图像的每一帧看作一幅静止图像进行压缩,若压缩/解压速度足够快,还可以实时处理视频信号,构成以JPEG为基础的实时视频系统。经过JPEG标准压缩后的视频图像数据量大大减小,一般可达到101801的压缩比,对同样的硬盘可以存储更多的图像,因而在现代数字视频编辑、处理中大量运用了该编码标准,同时因特网的发展使JPEG标准得到了广泛的应用。目前各式数码相机和摄像机,大多数都使用JPEG标准进行图像的存储与显示。(
23、3)MPEG标准 MPEG(Moving Picture Expert Group)标准也称运动图像压缩标准,是目前国际上影响最大的技术标准之一。MPEG标准是先利用动态预测及差分编码的方法,去除相邻两张图像的相关性,因为对于人的视觉系统来说,运动的物体上下两帧图像之间只有不同的部分能被感受到,所以可以利用相邻两张甚至更多图像来预测每个像素点可能移动的方向和亮度值,再记录其差值。8.3 几种常见的多媒体文件 然后将这些差值利用转码或者分频式编码的方法将高低频分离,再利用一种量化的方式舍弃一些图像信息,从而可以有效地提高压缩比。最后通过一个可变长度的无损压缩得到一个最小位数据的结果,就是最终需要
24、的目标压缩图像。通过该MPEG标准压缩后,可以得到平均压缩比为5011001,最高还可达到2001,压缩效率非常高,同时图像和音质的保真度还非常高。在多媒体技术中,最常见的有声音、图形、静态图像、动态图像等几种媒体形式,每一种媒体形式都有严谨而规范的数据描述,其数据描述的逻辑表现形式是文件。8.3.1 静态图像文件 静态图像文件是指以单一(静止)图像给出的文件,如下左图所示为一幅静态图像。根据不同领域的不同需求,静态图像文件格式比较多,下面将讲述一些目前最主要的静态图像文件格式。1.BMP文件(.bmp)BMP(Bitmap)是微软公司为其Windows环境设置的标准图像格式,该格式图像文件的
25、色彩极其丰富,其彩色模式颜色为 24232种。一般情况下,BMP格式的图像文件是非压缩的,其文件尺寸比较大。2.TIFF文件(.tif或者.tiff)TIFF是Tag Image File Format的缩写。TIFF格式图像文件的特点是:支持从单色模式到32bit真彩色模式的所有图像,数据结构是可变的,文件具有可改写性,可向文件中写入相关信息;具有多种数据压缩存储方式,使解压缩过程变得复杂化。该文件是平面设计作品的最佳表现形式,可用于印刷,不适于网络传送。3.GIF动画文件(.gif)GIF格式的图像文件是全球通用的图像格式,它是一种压缩的8位图像文件。正因为它是经过压缩的,而且又是8位的,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 应用 基础 多媒体技术 及其
限制150内