多媒体系统复习.ppt
多媒体系统复习第1章多媒体技术概要1.1 多媒体是什么?多媒体是什么?超媒体是什么?多媒体与超媒体之间有什么关系?超媒体是什么?多媒体与超媒体之间有什么关系?多媒体是融合两种或者两种以上媒体的一种人机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和电视图像(video)。超媒体使用文本、图形、图像、声音和电视图像等媒体任意组合的一种交互式信息传播媒体。多媒体是超媒体系统中的一个子集。1.2 SGML是什么语言?是什么语言?HTML是什么语言?它们之间有何关系?是什么语言?它们之间有何关系?(1)1986年国际标准化组织(ISO)采用的一个信息管理标准。该标准定义独立于平台和应用的文本文档的格式、索引和链接信息,为用户提供一种类似于语法的机制,用来定义文档的结构和指示文档结构的标签。(2)HTML是万维网上的文档所用的标记语言。(3)HTML是SGML的一个子集。SGML使用标签来标志文档中的文本或图形之类的元素,并告诉Web浏览器该如何向用户显示这些元素,以及应该如何响应用户的行为,例如当用户通过按键或鼠标单击某个链接时该如何响应。1.3 有人认为有人认为“因特网就是万维网因特网就是万维网”,这种看法对不对?为什么?,这种看法对不对?为什么?(1)不对。(2)因特网是专指全球范围内最大的、由众多网络相互连接而成的、基于TCP/IP协议的计算机网络;万维网是指分布在全世界所有HTTP服务器上互相连接的超媒体文档的集合。第2章数字声音及MIDI简介2.1 音频信号的频率范围大约多少?话音信号频率范围大约多少?音频信号的频率范围大约多少?话音信号频率范围大约多少?2.2 什么叫做模拟信号?什么叫做数字信号?什么叫做模拟信号?什么叫做数字信号?(1)幅度或频率发生连续变化的一种信号。(2)以二进制代码形式表示有无或者高低的一种信号。2.3 什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?2.4 采样定律采样定律 2.5 样本精度样本精度2.6 什么叫做什么叫做MIDI?它有什么特点?产生?它有什么特点?产生MIDI乐音得方法:乐音得方法:(1)音乐合成器、乐器和计算机之间交换音乐信息的一种标准协议。(2)文件比较小;容易编辑等第3章话音编码3.1下面下面3种话音编译码器的基本想法。种话音编译码器的基本想法。波形编译码器,波形编译码器,音源编译码器,音源编译码器,混合编译码器混合编译码器(1)波形编译码器:不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。(2)企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。(3)企图填补波形编译码和音源编译码之间的间隔。波形编译码器虽然可提供高话音的质量,但数据率低于16kb/s的情况下,在技术上还没有解决音质的问题;声码器的数据率虽然可降到2.4kb/s甚至更低,但它的音质根本不能与自然话音相提并论。普通编译码器的音质和数据率,如何计算数据率?P253.4 什么叫做均匀量化?什么叫做非均匀量化?什么叫做均匀量化?什么叫做非均匀量化?(1)均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。(2)非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。第3章话音编码3.5率压扩与率压扩与A率压扩?率压扩?(1)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中,使用率压扩算法,详见“3.2.4律压扩”。(2)在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧洲电话网,使用A律压扩算法,详见“3.2.5A律压扩”对于采样频率为8kHz,样本精度为13比特、14比特或16比特的输入信号,使用律压扩编码或使用A律压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64kb/s。3.8 自适应脉冲编码调制自适应脉冲编码调制(APCM)的基本思想是什么?的基本思想是什么?根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。第3章话音编码3.9 差分脉冲编码调制差分脉冲编码调制(DPCM)的基本思想是什么?的基本思想是什么?利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。此外,它还能适应大范围变化的输入信号。什么叫做斜率过载?P343.10 自适应差分脉冲编码调制自适应差分脉冲编码调制(ADPCM)的两个基本思想是什么?的两个基本思想是什么?ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值。使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。第4章无损数据压缩4.1熵的兴义,如何计算,哈夫曼编码算法熵的兴义,如何计算,哈夫曼编码算法 4.2算术编码,LZW算法第5章彩色数字图像基础5.1 什么叫做真彩色和伪彩色?什么叫做真彩色和伪彩色?在一幅彩色图像中,每个像素值有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。例如用RGB555表示的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。现在,通常把每个像素的颜色值用24位表示的颜色叫做真彩色。24位表示的颜色总数:22416777216种颜色。RGB与CMYK之间的关系?P66图像的三个基本属性。第5章彩色数字图像基础5.5 JPEG压缩编码算法的主要计算步骤是:压缩编码算法的主要计算步骤是:DCT变换,变换,量化,量化,Z字字形编码,形编码,使用使用DPCM对直流系数对直流系数(DC)进行编码,进行编码,使用使用RLE对交流系数对交流系数(AC)进行编码,进行编码,熵编码。假设计算机的精度足够高,问在上述计算方熵编码。假设计算机的精度足够高,问在上述计算方法中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的法中,哪些计算对图像的质量是有损的?哪些计算对图像的质量是无损的?(1)DCT变换:无损(2)量化:有损(3)Z字形编码:无损(4)使用DPCM对直流系数(DC)进行编码:无损(5)使用RLE对交流系数(AC)进行编码:无损(6)熵编码:无损第7章颜色空间变换7.1 PAL制彩色电视使用什么颜色模型?制彩色电视使用什么颜色模型?NTSC制彩色电视使用什么颜色模型?计制彩色电视使用什么颜色模型?计算机图像显示使用什么颜色模型?算机图像显示使用什么颜色模型?(1)PAL制彩色电视:YUV(2)NTSC制彩色电视:YIQ(3)计算机图像显示设备:RGB7.2 用用YUV或或YIQ模型来表示彩色图像的优点是什么?为什么黑白电视机可看彩模型来表示彩色图像的优点是什么?为什么黑白电视机可看彩色电视图像?色电视图像?(1)YUV表示法的一个优点:它的亮度信号(Y)和色度信号(U,V)是相互独立的,因此可以对这些单色图分别进行编码;另一个优点:可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YIQ同样具有YUV的这两个优点。(2)黑白电视能接收彩色电视信号的道理是利用了YUV/YIQ分量之间的独立性。7.3 颜色空间的分类颜色空间的分类第10章彩色数字电视基础10.1 世界上主要的彩色电视制式是哪几种?世界上主要的彩色电视制式是哪几种?目前世界上使用的彩色电视制式主要有PAL,NTSC,SECAM三种,都是模拟彩色电视制式。10.2 隔行扫描是什么意思?非隔行扫描是什么意思?隔行扫描是什么意思?非隔行扫描是什么意思?(1)在隔行扫描中,一帧画面分两场,第一场扫描总行数的一半,第二场扫描总行数的另一半。电子束扫完第1行后回到第3行开始的位置接着扫,如图10-01(b)所示,然后在第5、7、,行上扫,直到最后一行。奇数行扫完后接着扫偶数行,这样就完成了一帧(frame)的扫描。隔行扫描要求第一场结束于最后一行的一半,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。正是这个原因,才要求总的行数必须是奇数。(2)在非隔行扫描中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。10.3 电视机和计算机的显示器各使用什么扫描方式?电视机和计算机的显示器各使用什么扫描方式?电视机通常使用隔行扫描;计算机的显示器通常使用非隔行扫描。第10章彩色数字电视基础10.6 图像子采样,对彩色图像进行子采样的理论根据是什么?图像子采样,对彩色图像进行子采样的理论根据是什么?人的视觉系统所具有的两种特性。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。子采样是压缩彩色电视信号的一种技术。第10章彩色数字电视基础10.8 一幅一幅YUV彩色图像的分辨率为彩色图像的分辨率为720576。分别计算采用。分别计算采用4:2:2、4:1:1和和4:2:0子采样格式采样时的样本数。子采样格式采样时的样本数。(1)4:4:4这种采样格式不是子采样格式,它是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、4个红色差Cr样本和4个蓝色差Cb样本,这就相当于每个像素用3个样本表示。72057631244160(2)4:2:2这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、2个红色差Cr样本和2个蓝色差Cb样本,平均每个像素用2个样本表示。7205762829440(3)4:1:1这种子采样格式是指在每条扫描线上每4个连续的采样点取4个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。7205761.5622080(4)4:2:0这种子采样格式是指在水平和垂直方向上每2个连续的采样点上取2个亮度Y样本、1个红色差Cr样本和1个蓝色差Cb样本,平均每个像素用1.5个样本表示。7205761.5622080第11章MPEG简介10.2 MPEG-1,-2,-4和和-7的目标是什么?的目标是什么?MPEG-1处理的是标准图像交换格式的电视,即NTSC制为352像素240行/帧30帧/秒,PAL制为352像素288行/帧25帧/秒,压缩的输出速率定义在1.5Mb/s以下。这个标准主要是针对当时具有这种数据传输率的CD-ROM和网络而开发的,用于在CD-ROM上存储数字影视和在网络上传输数字影视。MPEG-2标准是一个直接与数字电视广播有关的高质量图像和声音编码标准,是MPEG-1的扩充。MPEG-2提供位速率的可变性能功能,其最基本目标是:位速率为49Mb/s,最高达15Mb/s。MPEG-4是为视听数据的编码和交互播放开发算法和工具,是一个数据速率很低的多媒体通信标准。MPEG-4的目标是要在异构网络环境下能够高度可靠地工作,并且具有很强的交互功能。MPEG-7的名称叫做多媒体内容描述接口,目的是制定一套描述符标准,用来描述各种类型的多媒体信息及它们之间的关系,以便更快更有效地检索信息。这些媒体材料可包括静态图像、图形、3D模型、声音、话音、电视以及在多媒体演示中它们之间的组合关系。在某些情况下,数据类型还可包括面部特性和个人特性的表达。第12章MPEG声音12.1听觉系统的特性。听觉系统的特性。响度感知,音高感知,掩蔽效应12.2 什么叫做听阈?什么叫做痛阈?什么叫做听阈?什么叫做痛阈?(1)当声音弱到人的耳朵刚刚可以听见时,称此时的声音强度为“听阈”(2)当声音强到人的耳朵刚刚感到疼痛时,称此时的声音强度为“听阈”。实验表明,如果频率为1kHz的纯音的声强级达到120dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈”。12.3 什么叫做频域掩蔽?什么叫做时域掩蔽?什么叫做频域掩蔽?什么叫做时域掩蔽?强纯音掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽。(2)在时间方向上相邻声音之间的掩蔽,这种特性称为时域掩蔽。12.4 MPEG-1的层的层1、2和和3编码分别使用了听觉系统的什么特性?编码分别使用了听觉系统的什么特性?层1:频域掩蔽特性层2:频域掩蔽特性,时间掩蔽特性层3:频域掩蔽特性,时间掩蔽特性第12章MPEG声音12.10 什么叫做什么叫做TTS?至少列举?至少列举TTS的的3个潜在应用例子。个潜在应用例子。通过话音合成设备自动地把基于文字的数据转换为声音输出的一种技术。文语转换的最终目标是要使计算机像人一样输出清晰而又自然的声音,也就是说,根据文本的内容可以不同的情调来朗读任意的文本。TTS是一个十分复杂的系统,涉及到语言学、语音学、信号处理、人工智能等诸多的学科。尽管现有的TTS系统结构各异,转换方法不同,但是基本上可以分成两个相对独立的部分:文本分析,通过对输入文本进行词法分析、语法分析,甚至语义分析,从文本中抽取音素和韵律等发音信息。语音合成,使用从文本分析得到的发音信息去控制合成单元的谱特征(音色)和韵律特征(基频、时长和幅度),送入声音合成器(软件或硬件)产生相应的语音输出。通过电话访问信息,朗读文本,盲人计算机等。第13章MPEG电视13.1 电视图像数据压缩的依据是什么?电视图像数据压缩的依据是什么?根据人的视觉特性和电视图像数据自身的冗余特性。注:人的视觉系统具有的两种特性可以用来压缩电视图像数据。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低,利用这个特性可以把图像中表达颜色的信号去掉一些而使人不察觉;二是人眼对图像细节的分辨能力有一定的限度,利用这个特性可以把图像中的高频信号去掉而使人不易察觉。13.2 数据率的估算?数据率的估算?P238-23913.3 MPEG专家组在制定专家组在制定MPEG-1/-2 Video标准时定义了哪几种图像?哪种图像标准时定义了哪几种图像?哪种图像的压缩率最高?哪种图像的压缩率最低?的压缩率最高?哪种图像的压缩率最低?(1)MPEG专家组定义了三种图像:帧内图像I(intra),预测图像P(predicted)和双向预测图像B(bi-directionallyinterpolated)。(2)双向预测图的压缩率最高,帧内图像的压缩率最低。13.7 电视图像的空间分辨率和时间分辨率是什么意思?电视图像的空间分辨率和时间分辨率是什么意思?空间分辨率:图像的尺寸。例如,PAL制图像尺寸:720576,360288。时间分辨率:图像的帧数/每秒钟。例如,PAL制电视图像的时间分辨率为30帧/秒,NTSC电视图像的时间分辨率为25帧/秒,电影图像的时间分辨率为24帧/秒。第14章只读光盘存储器14.1 只读光盘是如何记录只读光盘是如何记录“0”和和“1”的?的?只读光盘通常是指CD/DVD系列只读光盘。在盘上压制凹坑的机械办法来记录“0”和“1”。凹坑的边缘代表“1”,凹坑和非凹坑的平坦部分代表“0”,凹坑的长度和非凹坑的长度都代表有多少个“0”。14.2 CD-DA的音乐信号的采样频率为什么选择的音乐信号的采样频率为什么选择44.1 kHz?CD得标准得标准。人耳朵(因人而异)能听到的声音信号频率范围是2020000Hz,为了避免高于20000Hz的高频信号干扰采样,在进行采样之前,需要对输入的声音信号进行滤波。考虑到滤波器在20000Hz的地方大约有10%的衰减,所以可以用22000Hz的2倍频率作为声音信号的采样频率。但是,为了能够与电视信号同步,PAL电视的场扫描为50Hz,NTSC电视的场扫描为60Hz,所以取50和60的整数倍,选用了44100Hz作为激光唱盘声音的采样标准。第17章多媒体网络应用及交换技术17.1 网络上的多媒体通信应用和数据通信应用有什么主要差别?网络上的多媒体通信应用和数据通信应用有什么主要差别?多媒体通信应用要求在客户端播放声音和图像时要流畅,声音和图像要同步,因此对网络的时延和带宽要求很高。而数据通信应用则把可靠性放在第一位,对网络的时延和带宽的要求不那么苛刻。17.6 总结线路交换、信息包交换和消息交换各有什么特点。总结线路交换、信息包交换和消息交换各有什么特点。线路交换(circuitswitching)的特点是,在开始通信之前通信双方由线路交换中心建立物理连接,维持连接的时间长短取决于消息交换的需要信息包交换不需要在收发双方建立物理连接,每个信息包都包含有目的地址,因此一个消息分装成的许多信息包不必都沿着同一条线路到达目的地,也不必同时到达目的地,到达目的地的次序也不必按照发送的次序,那条信道有空就往那里传送。消息交换把整个原始消息经有网络传送到接收方。它的时延比信息包交换长,错误处理时间也比较长。第17章多媒体网络应用及交换技术17.7 面向连接服务和无连接服务的差别是什么?面向连接服务和无连接服务的差别是什么?面向连接服务:在开始发送信息包之前发送端和接收端要进行沟通,建立直接连接,并提醒对方准备接收信息包,然后才开始进入信息包的传送过程。无连接服务:使用用户数据包协议(UDP)来调用无连接服务。发送端简单地把信息包送到网络上,在传送信息包之前发送端和接收端没有沟通的过程,也没有对方来的确认,因而也不知道目的地是否接收到。无连接服务既没有拥挤控制功能,也没有流程控制功能。第19章网际多目标广播简介18.1 什么叫做单目标广播什么叫做单目标广播(unicast)和多目标广播和多目标广播(multicast)?什么叫做网际?什么叫做网际多目标广播多目标广播(IP Multicast)?(1)目标地址只有一个的一种广播技术。如果使用单目标广播服务把相同内容的信息传输给N个目标站点,就须要传输N个拷贝,即要传输N次。(2)在数据通信网络中,将信息包同时拷贝传送到一组选定的网络地址,然后发送给每个接收终端的一种广播技术。(3)在TCP/IP网络(互联网、内联网或因特网)上,把单一数据流同时向多个接收者发送的一种广播技术。用于广播声音和电视,也用于向多个用户下载同一个文件。使用IP多目标广播可节省网络带宽,因为文件作为一个数据在主干网上传输,仅在线路终端分开向目标站点传输。18.2 多目标广播使用哪类地址?多目标广播使用哪类地址?D类地址