《多媒体技术教程》课后习题答案.pdf
多媒体技术教程课后习题答案第1章 绪 论1.多媒体信息系统和多媒体运算机有什么不同?在概念上应如何看待两者之间的关系?多媒体信息系统是新一代高度集成的、功能强大的、智能化的运算机信息系统,它是提供多媒体信息、辅助人们对环境进行操纵和决策的系统,是基于运算机、通信网络等现代化的工具和手段,服务于治理领域的信息处理系统。而多媒体运算机指的是硬件设施,多媒体运算机是多媒体信息系统得以应用的平台。2.试归纳叙述多媒体关键特性以及这些特性之间的关系。多媒体的关键特性要紧包括信息载体的多样性、交互性和集成性这三个方面,这既是多媒体的要紧特点,也是在多媒体研究中必须解决的要紧咨询题。信息载体的多样性是有关于运算机而言的,指的确实是信息媒体的多样化,有人称之为信息多维化;多媒体的第二个关键特性是交互性,多媒体系统将向用户提供交互式使用、加工和操纵信息的手段,为应用开创更加宽敞的领域,也为用户提供更加自然的信息存取手段;多媒体的集成性要紧表现在两个方面,一是多媒体信息媒体的集成,二是处理这些媒体的设备与设施的集成。信息载体的多样性是集成性的基础,没有多种信息媒体,也就无法进行多媒体信息的集成化处理;而处理多媒体的设备与设施的集成性是实现交互性的前提,没有系统、网络、软硬件设施的集成,就无法为用户交互式使用、加工和操纵信息提供平台。3.什么缘故讲多媒体缩短了人类信息交流的路径?人类与运算机进行信息交流的目的是什么?与以往的方法相比,运算机在数据处理方面有了专门大的改善。运算机所提供的功能强大的数据组织和构造技术,如传统数据结构中的数组、向量、队列、堆栈、树和堆等,为动态地加工和处理数据提供了基础。高效的算法和高速的网络通信,大大地加大了用文字和数据表示概念的能力并加速了它的传递过程。但人类并不是仅仅依靠文本这一类单一的数据形式来传递所有的信息和同意概念的,图像、声音等多媒体信息差不多上人类猎取和传递信息极为重要的渠道。图像的信息量最大,一幅画胜过千言万语,最直观、最能一目了然。而动态的影像视频和动画则更生动、更逼真、更接近客观世界的原型、更能反映事物的本质和内涵。声音和文字也是信息的重要媒体,综合应用不仅有利于同意,也有利于储备(经历)和保留。这就意味着必须同时启动大脑的形象思维和逻辑思维,才能更好地获得更多更有用的信息。因此,通过多种感受器官用多种信息媒体形式向人提供信息才确实是更好的表达方法,它不仅加速和改善了明白得,同时提升了信息同意的爱好和注意力。多媒体正是利用各种信息媒体形式,集成地用声、图、文等来承载信息,也确实是缩短信息传递的路径。人类与运算机进行信息交流的目的是为了高效的猎取、传递以及使用信息。运算机的进展使得人类的信息处理手段得到加大,高速的运算能力扩展了对数据进行重复运算的能力,大规模的储备扩展了经历信息的范畴,高速通信网使得我们能够同远在异地他乡的同事、朋友、亲人甚至生疏人进行快速的信息交换。这些机器成为我们与他人进行交流的中介。4.有人讲,在以后信息系统中运算机和电视将合为一体,这意味着产生了新一代的信息系统,是革命性的转变,而不仅仅是某种设备功能的增强。你的看法呢?1运算机和电视合为一体,是多媒体信息系统应用的一个实例,将提升家庭自动化程度,而并不是意味着新一代信息系统的产生。通过这种方式,将改变人们长久依靠被动接收信息的情形。将交互式手段融入到人们的日常生活中。交互能够增加对信息的注意力和明白得力,延长信息在头脑中保留的时刻。而在单向的信息空间中,这种接收的成效和作用就专门差。借助于交互活动,人们能够获得所关怀的内容,猎取更多的信息;用户也能够找出想看的电视节目,能够快速跃过不感爱好的部分,能够对某些所关怀的内容进行编排等,从而改变现在观看电视节目的方法。5.有人讲,多媒体是界面技术,即人机接口技术,你同意吗?什么缘故?多媒体技术包括人机接口技术,但不仅仅是人机接口技术。而人机接口技术也不仅仅在多媒体领域得到应用。人机接口技术的目的是让一样用户利用运算机完成他们在某一工作领域中的任务。随着多媒体技术及其有关技术的持续进展,人机交互的接口差不多开始向更加自然,更加人性化的方向进展。例如多模态接口,它将手势识不、语音识不、自然语言明白得甚至面部表情识不等综合应用于人机交互。因此,人机交互接口不仅仅是一个人机界面的咨询题,关于媒体的明白得和人机通信过程能够看成是一种智能的行为,它与人类的智能活动有着紧密的关系。而多媒体技术的涵盖面更加宽泛,包括多媒体数据模型、多媒体数据压缩技术、多媒体内容处理与检索技术、多媒体表现与同步技术、多媒体人机交互接口技术、多媒体通信与分布处理技术等等。略为全面的,多媒体技术能够定义为:以数字化为基础,能够对多种媒体信息进行采集、编码、储备、传输、处理和表现,综合处理多种媒体信息并使之建立起有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。2第2章媒体及媒体技术1.什么缘故讲媒体具有不同的抽象层次?对媒体的抽象层次和性质进行小结。在获得媒体语义的过程中,抽象起着十分重要的作用,这种抽象是复杂的,而且与任务有关。通常包括若干抽象层,每一个抽象层都包含着与具体的任务和咨询题域有关的模型。从接近具体感官的信息表示层到接近符号的信息表示层,信息的抽象程度递增,而数据量则递减。语义确实是在从感官数据到符号数据的抽象过程中逐步形成的。对不同媒体来讲,媒体的语义是处于不同层次上的。抽象的程度不同,语义的重点也就不同。2.媒体的空间含义是指什么?媒体的时刻含义是指什么?媒体的时空综合是指什么?什么是媒体的时空“上下文”?多媒体信息的空间意义有两种讲明。第一种是指表现空间,专门是指显示空间的安排,目前在大多数研究中指的差不多上这一类。第二种空间意义是把环境中各种表达信息的媒体按相互的空间关系进行组织,全面整体地反映信息的空间结构,而不仅仅是零散的信息片断。媒体的时刻也有两种含义。一是表现所需的时刻,这是所有媒体都需要的。第二种时刻意义即同媒体的空间一样,媒体的时刻也能够包含媒体在时刻坐标轴上的相互关系。媒体的时刻关系存在于同步、实时等许多方面。空间和时刻组成了一个三维的时空坐标系统。时刻与空间的联系构成了媒体的时空“上下文3 .媒体的结合什么缘故会产生“感受相乘”的成效?试举几个例子对此加以讲明。多媒体的作用在专门大程度上是媒体之间结合产生的阻碍。这种结合能够是低层次的,如在显示窗口中提供多种媒体信息片断,并将视觉、听觉相互结合,造成一种比较适合的媒体表现环境;也能够是高层次的,由各种媒体组成完全沉醉的虚拟空间,但应该如何结合现在还缺乏理论上的指导。媒体之间能够相互支持,也能够相互干扰。如果媒体之间是相互支持的关系,则这种媒体结合所产生的成效确实是“感受相乘”效应。“感受相乘”的例子专门多,例如以视听并举的方式传递信息,比仅仅依靠观看或者解讲能产生更好的成效;为了追求更强的沉醉感,虚拟现实环境的构建往往需要综合考虑视觉、听觉、触觉甚至嗅觉等多种感受。4.什么是媒体的语义?什么是隐喻?各种媒体的信息在最低层次上差不多上二进制位流。如果仅仅作为信息的简单通道,系统不必了解媒体的语义,但如果要多媒体系统具有对媒体进行选择、合成等方面的能力,就必须给予它媒体的语义知识,从而使得系统能在媒体之上对媒体进行比较、选择和合成。媒体被给予的媒体的语义知识即为媒体的语义。在与多媒体系统交互的过程中,人所依据的是关于这种交互的概念模型,也称心智模型(M e n t a l M o d e l)o这种概念模型的建立往往需要培训和体会,不易于被用户所同意。一种较好的方法是模拟人对其他事物的知识和技能,把它们挪到多媒体系统中使用,媒体的多样性为这种模拟提供了一个专门好的基础,这种模拟,确实是隐喻技术。5.研究声音心理学对声音的处理会带来哪些好处?试举例加以讲明。讲明掩蔽、临界频带、相位对声音的阻碍。各种声音能够互相掩蔽,也确实是讲一种声音的显现可能使得另一种声音难于听清。纸张的沙沙声、鼓掌声、咳嗽声等往往会掩盖讲话声和音乐声。一样讲来,在掩蔽音条件下,要3听清被测量的测验音,就必须提升测验音的强度。由于声音的掩蔽成效,能够欺诈人的听觉。在频率的某一临界区里,各种声音强度是相互作用的,合成声音的响度由这些频率共同决定,但在临界区内可不能改变。如果超出临界区,声音的响度不再相互作用,随频率而变。那个临界区确实是临界频带,其宽度视其中心频率而定。从声音的波形来看,声音的起点和方向也要反映声音的特性,这确实是声音的相位。当两个声音相同而相位完全相反时,它们将相互抵消;当两个声音相同而且相位也相同时,声音就会得到加大。相位的确定关于多声道声音系统的设计专门重要,它能够应用在回声的排除、会议系统的声音设计上等。6.声音的数字化过程是如何样的?什么是声音的符号化?声音在真实世界是模拟的,时刻和幅度上是连续的,声音的数字化要紧包括采样、量化、编码等步骤。波形声音能够把音乐、语音都进行数字化并表示出来,但这并没有将它看成音乐和语音。对声音的抽象化(即符号化)表示包括两种类型,一种是音乐、一种是语音。声音的符号化立即声音转变为符号序列的过程。7.声音的三维化处理所基于的原理是什么?双工理论的作用在何时体现得较为明显、何时又会失效?耳廓模型的建立是为了达到什么样的目标?声音的三维化处理基于的原理是双工理论。人耳对声音定位的特性,通过大脑的综合作用后,对有差不的声音信号进行了有关于空间位置的定位。专门明显,如果按此方法使用运算机向人耳提供不同的声音,人的大脑也会综合出声音的位置信息。双工理论过于简单,这一理论实际上是处于一个较理想的状态下,即无反射、无折射和单频率等,但实际上人耳所处的环境比双工理论描述的环境要复杂得多。按照双工理论,人耳应没有在垂直平面的定位能力,不能够区分前后,因为在这些情形下两耳间声音的到达时刻差ITD和两耳间声音的强度差HD都几乎为零;而实际上,人耳确实具有这方面的能力,这确实是耳廓的作用。耳廓模型的建立,要紧为了模拟出人耳的听觉特性,具体来讲,确实是模拟如何解析声源的本身信号特点、声源的空间三维位置、声源所处的环境这3个因素。建立正确的耳廓模型有利于制造三维的虚拟听觉空间。8.视觉心理学对视觉信息的处理辅助体现在哪些地点?如何利用这些心理学特性?尽管光的物理特性与心理知觉有关,但并不是线性的。把物理波的强度加倍,感受到的亮度却并不加倍。对光的色调和亮度的感受不仅和它的频率与强度有关,而且还和它显现的背景有关,和同时显现的周围光有关。即使是最简单的物理因素也要受到神经系统的复杂分析,从而产生出复杂的心理知觉反应。将物理性质和心理知觉区分开来,确实是十分重要的。在多媒体信息系统的设计过程中,充分考虑视觉心理学特性,能提供更好的人机交互方式。9.试完整地推导出单视点坐标系中、两眼坐标系中三维空间的一点P(x,y,z)投影到z=0平面上的二维坐标。以视点为投影中心,将三维物体的点投影于显示器的投影平面上,便在该平面上产生三维物体的像。下图所示是投影的示意,其中投影中心在坐标系的A点,其坐标为A(0,0,.d),d为视点到投影平面的距离,也确实是人眼到显示器的距离。P(x,y,z)是三维空间中一点,P在z=0平面上的投影坐标为Q(X,Y,O),设点P、Q 在y=0上的投影分不为M、N,M、N 在x=0上的投影分不为R、Oo4按照相似三角形原理有:ARAOANAMPNQM.即,zddARAOyY.从而有 Y=y/(l+z/d),同理有 X=x/(l+z/d)o投影变换原理10.如何测定手腕的转动?人体的转动和头部的转动如何测定?为了测量手部的转动,需要两个发射器,测量出两个发射器tl、t2 的空间坐标,就能够按照三角函数确定转动的角度:tg(.)=(Ytl.Yt2)/(Xtl.Xt2)tg(.)=(Ztl.Zt2)/(Ytl.Yt2)tg(r)=(Xtl.Xt2)/(Ztl.Zt2)人体的转动和头部的转动可用类似的方法测定。区不在于发射器tl、t2 安装的位置不同。11.通过系统制造出力的反馈成效和触觉成效可用于何处?试举例讲明。通过力感反馈装置,能够直截了当提供力的反馈,提供使人感受到的物理力。例:虚拟手术中,手术刀的力反馈装置,能使虚拟手术的实施者受训训练人员更加准确的实施手术;驾驶、射击、格斗等游戏中,力反馈装置的引入,能大大提升玩家的沉醉感。触觉反馈能够让人体区不出不同物体的质感和纹理结构。触觉反馈能够在商品虚拟展现、数字娱乐等多个领域得到应用。12.上网搜索有关数据手套、数据头盔、数据服装等设备及技术的有关内容,写出该设备的介绍性报告。略。5第3 章多媒体数据压缩1.如何衡量一种数据压缩方法的好坏?多媒体数据存在哪些类型的冗余?评判一种数据压缩技术的性能好坏要紧有3 个关键的指标:压缩比、图像质量、压缩和解压的速度。期望压缩比要大,即压缩前后所需的信息储备量之比要大;复原成效要好,尽可能地复原原始数据;实现压缩的算法要简单,压缩、解压速度快,尽可能地做到实时压缩解压。除此之外还要考虑压缩算法所需要的软件和硬件。一样而言,多媒体数据中存在的数据冗余类型要紧有以下几种。(1)空间冗余在同一幅图像中,规则物体和规则背景的表面物理特性具有有关性,这些有关性的光成像结果在数字化图像中就表现为数据冗余。(2)时刻冗余时刻冗余反映在图像序列中确实是相邻帧图像之间有较大的有关性,一帧图像中的某物体或场景能够由其他帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时刻冗余。(3)信息炳冗余信源编码时,当分配给第i 个码元类的比特数b(y i)=g p i 时,才能使编码后单位数据量等于其信源病,即达到其压缩极限。但实际中各码元类的先验概率专门难预知,比特分配不能达到最佳。实际单位数据量d H(S),即存在信息冗余病。(4)视觉冗余人眼关于图像场的注意是非平均的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一样辨论能力为2 6灰度等级,而一样图像的量化采纳的是2 8灰度等级,即存在着视觉冗余。(5)听觉冗余人耳对不同频率的声音的敏锐性是不同的,并不能察觉所有频率的变化,对某些频率不必专门关注,因此存在听觉冗余。(6)其他冗余包括结构冗余、知识冗余等。2.数据压缩技术可分为几大类?每类有何要紧特点?按照解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码和无失真编码两大类。有失真压缩法压缩了病,会减少信息量,而缺失的信息是不能再复原的,因此这种压缩法是不可逆的。无失真压缩法去掉或减少了数据中的冗余,但这些冗余值是能够重新插入到数据中的,因此冗余压缩是可逆的过程。有失真压缩法的冗余压缩取决于初始信号的类型、前后的有关性、信号的语义内容等。由于承诺一定程度的失真,可用于对图像、声音、动态视频等数据的压缩。如采纳混合编码的JPEG标准,它对自然景物的灰度图像,一样可压缩几倍到十几倍,而关于自然景物的彩色图像,压缩比将达到几十倍甚至上百倍。采纳ADPCM编码的声音数据,压缩比通常也能做到 4:1 8:1。压缩比最为可观的是动态视频数据,采纳混合编码的DVI多媒体系统,压缩比通常可达50:1 100:1。无失真压缩法可不能产生失真,从信息语义角度讲,无失真编码是泛指那种不考虑被压缩信息的性质的编码和压缩技术,它是基于平均信息量的技术,并把所有的数据当作比特序列,而不是按照压缩信息的类型来优化压缩。也确实是讲,平均信息量编码忽略被压缩信6息语义内容。在多媒体技术中一样用于文本、数据的压缩,它能保证百分之百地复原原始数据。但这种方法压缩比较低,如 LZW 编码、行程编码和霍夫曼(Huffman)编码的压缩比一样为2:1 5:103.DPCM、ADPCM编码的差不多原理是什么?DCT变换编码是如何压缩数据的?DPCM和 ADPCM是两种典型的推测编码。推测编码是按照原始的离散信号之间存在着一定关联性的特点,利用前面的一个或多个信号对下一个信号进行推测,然后对实际值和推测值的差(推测误差)进行编码。如果推测比较准确,那么误差信号就会专门小(通常采纳均方误差最小)。如此一来,在同等精度要求的条件下,就能够用比较少的数码进行编码,达到压缩数据的目的。DCT变换编码压缩数据有3个步骤:变换、变换域采样和量化。把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立和有序。在变换编码系统中,用于量化一组变换样值的比特总数是固定的,它总是小于对所有变换样值用固定长度平均量化进行编码所需的总数,因此量化使数据得到压缩,是变换编码中不可缺少的一步。为了取得中意的结果,某些重要系数的编码位数比其他的要多,某些系数干脆就被忽略T o在对量化后的变换样值进行比特分配时,要考虑使整个量化失真最小。4.Huffman编码有何特点?行程编码是如何编码的?Huffman编码是一种对统计独立信源能达到最小平均码长的编码方法,即最佳码,它完全依据字符显现概率来构造,各码字长度严格按照所对应符号显现概率的大小逆序排列,具有即时性和惟一可译性。行程编码有多种编码方式,关于0显现较多,1较少显现(或反之)的信源数据,能够对0的连续长度(或1的连续长度)进行编码,1 (或0)保持不变。而关于0、1交替显现的数据,能够分不对0的连续长度和1的连续长度编码。这种编码适合于0、1成片显现的数据的压缩。为了保证解压缩时保持颜色同步,所有的数据行以白色行程代码字集开始。如果实际的扫描线从黑色行程开始,那么假设起始有白色的0行程。黑色或白色行程由规定的代码字来定义。代码字有两种类型:终止代码字和组成代码字。每个行程由0个或更多的组成代码字和一个确定的终止代码字来表示。在0 63范畴内的行程由相应的终止代码字编码。64-2623(2560+63)范畴内的行程第一由组成代码字编码,它表示最接近、但不大于所要求的行程,后再跟终止代码字。行程大于或等于2624时,第一由组成代码2560编码。如果行程的剩余部分仍大于2560,则产生附加的组成代码2560,直到行程的剩余部分少于2560,再按前述方法编码。如果一行的行程总量不等于图像宽度域中的值,则被认为是不可复原的错误。5.常见的声音压缩标准有哪些?它们分不采纳什么压缩方法?常见的声音压缩标准有:(1)电话质量的语音压缩标准国际上从ITU-T最初的G711使 用 PCM编码标准开始,已制定了一系列的语音压缩编码的标准。这些压缩标准中充分利用了线性推测技术、矢量量化技术和综合分析技术,典型的标准和算法有G721采纳ADPCM、码本鼓舞线性推测编码(CELP)、短时延码本鼓舞线性推测编码(LD-CELP)、长时线性推测规则码鼓舞(RPE-LTP)、矢量和鼓舞线性推测编码(VSELP)等。下表为ITU建议的用于电话质量的语音压缩标准。7ITU建议的用于电话质量的语音压缩标准标准讲明G.711采纳PC M,采样速率为8kH z,量化位数为8bit,对应的比特流速率为64kbit/so使用了非线性量化技术G.721将64kbit/s的比特流转换成32kbit/s的流,基于ADPCM;每个数值差分用4 位编码,采样率为8kHzG.723一种以24kbit/s运行的基于ADPCM的有损压缩标准G.728采纳LD-CELP压缩技术;比特率为16kbit/s,带宽限于3.4kHz;音质与G.721标准相当(2)调幅广播质量的音频压缩标准调幅广播质量音频信号的频率范畴是50Hz 7kH z,又称“7kHz音频信号”,当使用16kHz的抽样频率和14bit的量化位数时,信号速率为224kbit/so 采纳G722标准进行压缩。(3)高保真立体声音频压缩标准目前国际上比较成熟的高保真立体声音频压缩标准为“MPEG音频6.常用的图像和视频压缩标准有哪些?它们分不采纳什么压缩方法?静止图像压缩标准有JPEG标准和JPEG 2000标准等,其中JPEG的压缩方法包括:(1)JPEG的无损推测编码算法(2)JPEG的基于DCT的有损编码算法而JPEG 2000的压缩改用以离散小波变换算法为主的多解析编码方式,还将彩色静态画面采纳的JPEG编码方式、2值图像采纳的JBIG(Joint Binary Image Group)编码方式及低压缩率采纳JPEGLS统一起来,成为对应各种图像的通用编码方式。视频压缩标准有MPEG压缩标准、H.26L视频编码标准等。MPEG压缩标准中,MPEG-1是以两个差不多技术为基础的。一是基于16X 16子块的运动补偿,能够减少帧序列的时域冗余度。二是基于DCT的压缩技术,减少空域冗余度。MPEG-2标准的压缩编码系统编码有两种方法,其编码输出包括传送流和程序流两种定义流。传送流和协议ISO/IEC11172-1系统定义的流相似;程序流是一种用来传送和储存一道程序的编码数据或其数据的数据流。MPEG-4采纳基于内容的压缩编码,将一幅图像按照内容分块,如图像的场景、画面上的物体被分割成不同的子块,将感爱好的物体从场景中截取出来,进行编码处理。H.26L是一种高效的压缩方法,它集中了以往标准的优点,并吸取了标准制定中积存的体会。H.26L提供包传输网中处理包丢失所需的工具。H.26L在系统层面上提出了一个新的概念,在视频编码 层(Video Coding Layer,V C L)和网络适配层(Network Adaptation Layer,N A L)之间进行概念性分割,前者是视频内容的核心压缩内容的表述,后者是通过特定类型网络进行传送的表述。如此的结构便于信息的封装和对信息进行更好的优先级操纵。7.JPEG标准的差不多系统中压缩过程有哪几步?每步是如何工作的?JPEG差不多系统只采纳顺序工作方式,其编码的简化框图如下图所不O有损压缩编码框图8压缩过程如下:块 预 备。块预备是将一帧图像分成8X 8的数据块。假设一个彩色图像由3种重量:光亮度Y和两个色差U和V表示,图像的大小为480行,每一行有640个像素。如果假设色度分解为4:1 :1,则亮度重量确实是一个640X480的数值矩阵,色差重量是一个320X240的数值矩阵。DCT变换。JPEG将源数据图像分成8X 8大小的子块后,进行DCT变换。量化。为了达到压缩数据的目的,DCT系数需作量化。JPEG的量化采纳线性平均量化器。DCT系数的编码。JPEG中对DC系数采纳DPCM编码,即对相邻块之间的DC系数的差值进行编码。炳编码。JPEG建议使用两种基于统计特性的炳编码:Huffman编码和自适应二进制算术编码。可任选一种编码对第一个字节进行编码,第二个幅值字节不进行编码,仍旧直截了当传送。8.MPEG标准中减少时刻冗余量的方法有哪些?为了减少时刻冗余量,MPEG将l/30s的时刻间隔的帧序列电视图像,以3种类型的图像格式表示:内 码 帧(I)、推 测 帧(P)和 插 补 帧(B)。帧间的信息用运动补偿的方法确定。运动补偿有两种算法,分不是运动补偿推测法和运动补偿插补法。(a)运动补偿推测法画面上的运动部分在帧与帧之间必定有连续性,推测法按照这一特性,将当前的图像画面看作是前面某时刻图像的位移,位移的幅度和方向在图像画面的各处可有不同。因此,利用反映运动的位移信息和前面某时刻的图像,能够推测出当前的图像。(b)运动补偿插补法用插补的方法进行运动的补偿,能够大幅度地压缩运动图像的信息。在时域中插补运动补偿是一个多辨论率技术,能够以1/lOs或l/15s的时刻间隔取出参考子图,然后对这两个参考子图之间的图像,按照运动的规律得到l/30s时刻间隔的各个插补子图。只要对参考子图及反映运动规律的信息进行编码,就能够得到帧率为3 0帧/秒的全运动视频图像。9.MPEG标准系列已有哪些压缩标准?各有什么特点?适合用于什么场合下的数据压缩?MPEG(Motion Picture Experts Group),已推出了 MPEG(或 MPEG-1)、MPEG-2,MPEG-4 等系列标准。(1)MPEG-1压缩标准MPEG-1标 准(ISO/IEC11172-II)的目标是以约1.5Mbit/s的速率传输电视质量的视频信号,亮度信号的辨论率为360X 240,色度信号的辨论率为180X 120,每秒3 0帧。MPEG-1视频压缩技术是以两个差不多技术为基础的。一是基于16X16子块的运动补偿,能够减少帧序列的时域冗余度。二是基于DCT的压缩技术,减少空域冗余度。在M PEG中,不仅在帧内使用D C T,而且对帧间推测误差也作D C T,以进一步减少数据量。MPEG-1 标准包括 MPEG 系 统(ISO/IEC11172-1),MPEG 视 频(ISO/IEC11172-2),MPEG 音 频(ISO/IEC11172-3)和测试验证(ISO/IEC11172-4)4部分内容。因此MPEG涉及的咨询题是视频压缩、音频压缩及多种压缩数据流的复合和同步咨询题。(2)MPEG-2压缩标准MPEG-2标准的系统功能是将一个或更多的音频、视频或其他的差不多数据流合成单个或多个数据流,以适应于储备和传送。MPEG-2系统支持五项差不多功能分不是:解码时多9压缩流的同步、将多个压缩流交错成单个的数据流、解码时缓冲器初始化、缓冲区治理和时刻识不。MPEG-2标准的压缩编码系统是将视频和音频编码算法结合起来开发的。MPEG-2视频体系的视频重量的位速率范畴大约为2Mbit/s 15Mbit/s。MPEG-2视频体系要求保证与MPEG-1视频体系向下兼容,同时同时应力求满足数字储备媒体、可视电话、数字电视、高清晰度电视(HDTV)、通信网络等领域的应用。辨论率有低(352X288)、中(720X480)、次 高(1440X 1080),高(1920X1080)等不同档次,压缩编码方法也从简单到复杂有不同等级。MPEG-2标准详细地叙述了数字储备媒体和数字视频通信中的图像信息的编码描述和解码过程。它支持固定比特率传送、可变比特率传送、随机访咨询、信道跨过、分级解码、比特流编辑以及一些专门功能,例如:快进播放、快退播放、慢动作、暂停和画面凝固等。MPEG-2视频标准与ISO/IEC11172-2向前兼容,并与EDTV、HDTV和SDTV格式向上或向下兼容。MPEG-2标准包括MPEG系统、MPEG视频、MPEG音频和一致性4部分内容,是运动图像及其伴音的通用编码国际标准。MPEG-2标准克服并解决了 MPEG-1标准不能满足的日益增长的多媒体技术、数字电视技术、多媒体辨论率和传输率等方面技术要求的缺陷。(3)MPEG-4压缩标准MPEG-4采纳基于内容的压缩编码,将一幅图像按照内容分块,将感爱好的物体从场景中截取出来,进行编码处理。MPEG-4具有高速压缩、基于内容交互和基于内容分级扩展等特点,同时具有基于内容方式表示的视频数据。MPEG-4在信息描述中首次采纳了对象(O bject)的概念。视频对象的构成依靠于具体应用和系统环境。MPEG-4标准满足了随着网络和通信技术的迅猛进展、交互式运算机和交互性电视的逐步应用和视频音频数据的综合服务的进展,对运算机多媒体数据压缩编码的越来越高的要求。10.H.26L标准的压缩编码有什么特点?(1)帧内推测为了提升压缩效率,在帧内编码时也提供了多种推测编码模式;关于亮度块支持两种形式的帧内推测编码,即9种4 X 4块推测模式和4种16X 16宏块推测模式,使推测更精确,编码效率更高。(2)帧间推测补偿运动补偿块的大小范畴从16X16到4X 4有多种选择;并支持1/4像素精度运动推测;支持多参考帧,最多能够到5 个参考帧,由此能够更有利于帧间推测,减少帧间推测所得残差编码的比特数,提升编码效率。(3)具有块滤波器在推测环中加入了去块效应滤波器,对相邻块的边界像素进行滤波,从而降低块的边界效应,边界处连接更自然,图像更细腻,主观质量更好。(4)变换编码采纳4X 4块的整数变换作为差不多变换编码,算法简单,速度快,无运算偏差。(5)炳编码采纳两种炳编码方式,一种是基于通用变长编码(U V LC),另一种是基于上下文的自适应二进制算术编码(CABAC),提升了压缩率。10第4 章多媒体硬件环境1.试述光储备的类型及要紧原理。常用的光储备系统有只读型、一次写型和可重写型光储备系统3 类。只读型光盘包括 LV 和 CD-ROM(Compact Disc-Read Only Memory)等。CD-ROM只读式压缩光盘,其技术来源于激光唱盘,形状也类似于激光唱盘,能够储备650MB左右的数据。用户只能从CD-ROM读取信息,而不能往盘上写信息。CD-ROM中的内容在光盘生成时就差不多决定,而且不可改变。CD-ROM盘常用于储备固定的软件、数据和多媒体演示节目。CD-ROM驱动器除了能读出CD-ROM盘外,还能够用于读取激光唱盘以及柯达激光照片的信息。一次写(Write Once Read Many,WORM)光储备系统可一次写入,任意多次读出。与CD-ROM相比,它具有由用户自己确定记录内容的优点。可重写光盘(Rewritable或Erasable,E-R/W)像硬盘一样可任意读写数据。它又分磁光型(Magnetic Optical,M O)和相变型(Phase Change,P C)两种形式。2.CD-ROM.CD-R、CD-RW三种光驱的差不有哪些?CD-ROM是只读型光盘的缩写,其驱动器由光头、聚焦伺服、道跟踪伺服、CLV伺服、EFM解调、错误检测和校正处理6个部分组成。CD-ROM驱动器除了能读出CD-ROM盘外,还能够用于读取激光唱盘以及柯达激光照片的信息。CD-R是一次写、多次读的可刻录光盘系统。CD-R刻录是将刻录光驱的写激光聚焦后,通过CD-R空白盘的聚碳酸脂层照耀到有机染料(通常是箸蓝或猷箸蓝染料)的表面上,激光照耀时产生的热量将有机染料烧熔,并使其变成光痕。CD-RW是一种可改写的C D,其中RW是Rewritable的缩写。CD-RW的改写性是其最大优点,反射率仅为15%-20%,比较小,因而旧的CD-ROM驱动器不能读出。3.什 么 是M IDI?它与波形音频的本质区不是什么?MIDI(Musical Instrument Digital Interface)是指乐器数字接口,是数字音乐的国际标准。任何电子乐器,只要有处理MIDI消息的微处理器,并有合适的硬件接口,都能够成为一个MIDI设备。MIDI消息是乐谱的一种数字式描述。与波形声音相比,MIDI数据不是声音而是指令,因此它的数据量要比波形声音少得多。MIDI的另一个特点是,由于数据量小,因此能够在多媒体应用中与其他波形声音配合使用,形成伴乐的成效。对MIDI的编辑也专门灵活,在音序器的关心下,用户能够自由地改变音调、音色等属性,直到找到自己想要的成效。波形文件就专门难做到这一点。然而,MIDI的声音尚不能做到在音质上与真正的乐器完全相似,在质量上还需要进一步提升;MIDI也无法模拟出自然界中其他非乐曲类声音。4.视频卡与音频卡的核心部件是什么?视频卡与音频卡的核心部件是编解码芯片,要紧完成视频或音频信号的模数/数模转换,压缩/解压缩等功能。从结构上分,音频卡可分为模数转换电路和数模转换电路两部分,模数转换电路负责将麦克风等声音输入设备采到的模拟声音信号转换为电脑能处理的数字信号;而数模转换电路负责将电脑使用的数字声音信号转换为喇叭等设备能使用的模拟信号。一样音频卡由下列部件组成:MIDI输入/输出电路;MIDI合成器芯片,用来把C D 音频输入与线输入相混合电11路;带有脉冲编码调制电路的模数转换器,用于把模拟信号转换为数字信号以生成波形文件;用来压缩和解压音频文件的压缩芯片;用来合成语音输出的语音合成器;用来识不语音输入的语音识不电路,以及输出立体声的音频输出或线输出的输出电路等。5.触摸屏能够分为哪几类,各自的特点是什么?触摸屏按安装方式分,可分为以下4 种。外挂式:由用户自行把它挂到显示器的屏幕前,而且随时能够拆卸。内置式:需拆卸显示器的外盖,把传感器夹在荧光屏玻璃与外盖之间。整体式:传感器本身与显示器为一体的配置。投影仪式:安装于大型投影屏前,可通过在投影屏的触摸来写字、绘图以及操纵运算机流程等。从结构特性与技术分有以下不同类型,包括红外、电阻膜、电容、表面声波、压力矢量等多种类型。红外触摸屏原理是当用户触模屏幕时,手指会挡住通过该位置的横竖两条红外线,从而利用x、y 方向上密布的红外线矩阵来检测并定位用户的触摸位置,执行该位置的图标或热点、热键。其要紧特点是清晰度好,透光性高,防刮擦能力强,但其辨论率低,反应速度慢,不够美观。电容式触摸屏的原理是用户触摸屏幕时,由于人体电场,手指与导体层间会形成一个锅台电容,四边电极发出的电流会流向触点,而电流的强弱与手指及电极间的距离成正比,位于触模屏幕后的操纵器便会运算电流的比例及强弱,准确算出触摸点的位置。其要紧特点是辨论率较高,反应速度较快,寿命较长,但怕硬物敲击,易受电磁干扰。电阻触摸屏的原理是当手指触摸屏幕时,两层导电层在触摸点位置就有了一个接触,操纵器侦测到那个接通并运算出x、y 轴的坐标。其要紧特点是反应速度快,寿命长,不受电磁干扰,但怕锐器。表层声波技术触摸屏的原理是当手指接触屏幕,便会吸取一部分声波能量,操纵器依据减弱的信号运算出触摸点的位置。其要紧特点是纯粹玻璃屏不怕刮擦和用力,寿命长,精度高,清晰透亮,还有压力轴响应。压感触摸屏是在屏幕四角装上压力感应仪,当对触摸屏施加压力时,会由此引起感应仪电阻抗的变化,通过监测这些变化,就可运算出触摸点的确切位置和用力大小。电磁感应触摸屏是基于笔输入式PC的主流技术,在笔尖上安装的一个非机械式开关将电容变化转变为频率变化,此开关还可使笔传感120级压力。6.扫描仪的要紧性能指标有哪些?扫描仪的技术指标要紧有以下一些。(1)原稿种类:透射或者反射原稿,连续调试线条稿,阳图或阴图原稿均可扫描分色。(2)扫描辨论率:决定了扫描仪的精度,辨论率越高,采样图像的清晰度也就越高。包括光学辨论率和间插辨论率。光学辨论率(采集到的图像细节数量)是要考虑的首要因素。光学辨论率取决于扫描头里的CCD数量。间插辨论率取决于扫描仪的硬件和软件。(3)色彩精度:即用灰度级表示每一基色的深浅程度。(4)扫描速度:扫描图像所需时刻。(5)其他参数:包括阶调、灰阶、鲜锐度、色彩再现能力、接口标准等。7.投影仪有哪几种差不多类型?投影仪可分为间接投影仪、直截了当投影仪两类。间接投影仪如幻灯机、传统投影机等,只能正投,适用于20人左右、100英寸以下的投影;直截了当投影仪如单枪投影仪、三枪投影仪等。单枪投影仪除了正投,也可设计成倒挂或背投,适宜于50人以下观看、60-120英寸左12右屏幕使用。三枪投影仪辨论率可达1024*768,具有正投、背投、倒挂交互设计,适用于100人左右观看,投影有效屏幕约在300英寸左右。13第5 章多媒体软件基础1.试述多媒体软件的层次结构。多媒体软件层次结构可划分为5 类4 个层次:驱动软件、多媒体操作系统、多媒体数据预备软件、多媒体编辑创作软件和多媒体应用软件。其中,多媒体驱动软件是直截了当和硬件打交道的软件,它完成设备的初始化,各种设备操作以及设备的打开、关闭,基于硬件的压缩解压,以及图像快速变换等差不多硬件功能调用等。这种软件一样随硬件提供。多媒体操作系统,又称多媒体核心系统。它具有实时任务调度、多媒体数据转换和同步操纵机制,对多媒体设备的驱动和操纵,以及具有图形和声像功能的用户接口等。一样是在已有操作系统基础上扩充、改造,或者重新设计。多媒体素材制作软件是用于采集多种媒体数据的软件,如声音录制、编辑软件;图像扫描及预处理软件;全动态视频采集软件;动画生成编辑软件等。多媒体编辑创作软件又称多媒体著作工具,是多媒体专业人员在多媒体操作系统之上开发的供特定应用领域的专业人员组织编排多媒体数据,并把它们联接成完整的多媒体应用的系统工具。多媒体应用软件是在多媒体硬件平台上设计开发的面向应用的软件系统,由于与应用密不可分,有时也包括那些用软件创作工具开发出来的应用。2.文本数据的输入方式有哪些?它们各自的特点是什么?文本数据的输入方式包括以下几种:(1)直截了当输入:利用著作工具中提供的文字工具,直截了当输入文字。直截了当输入的优