多媒体信息处理的必要性和可行性PPT讲稿.ppt
《多媒体信息处理的必要性和可行性PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《多媒体信息处理的必要性和可行性PPT讲稿.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体信息处理的必要性和可行性多媒体信息处理的必要性和可行性第1页,共26页,编辑于2022年,星期六2.1 多媒体信息的特点多媒体信息的特点 多媒体信息主要有三个特征:多媒体信息主要有三个特征:(1)数数据据量量庞庞大大:和和文文本本信信息息相相比比,语语音音、图图像像的的信信息息量量就就显显得得十十分分庞庞大大。例例如如,用用生生动动的的语语音音表表达达和和文文本本文文字字相相同同的的一一段段内内容容,语语音音所所需需要要的的数数据据量量要要比比文文本本大大10倍倍以以上上。若若要要用用图图像像来来大大体体表表示示同同样样的的意意思思,则则图图像像所所需需要要的的数数据据量量又又不知道要大
2、多少倍了。不知道要大多少倍了。第2页,共26页,编辑于2022年,星期六 (2)码码率率可可变变、突突发发性性强强:代代表表多多媒媒体体信信息息的的数数据据流流其其码码率率是是随随着着不不同同的的信信息息内内容容、所所处处的的不不同同时时间间而而不不断断变变化化的的。人人们们讲讲话话时时的的停停顿顿、所所传传场场景景图图像像中中物物体体的的运运动动等等都都会会形形成成码码流流速速率率的的波波动动,而而且且这这种种波波动动往往往往呈呈现现出出极极强强的的突突发发性性。再再加加上上采采用用了了种种种种信信息息压压缩缩编编码码的的方方法法,就就更更加剧了这种变化。加剧了这种变化。(3)复复合合性性信
3、信息息多多,同同步步性性、实实时时性性要要求求高高:多多媒媒体体通通信信系系统统中中传传输输的的往往往往是是两两种种或或两两种种以以上上媒媒体体的的复复合合信信息息,各各类类信信息息之之间间存存在在着着很很强强的的关关联联,因因此此,对对信信息息传传输输的的同同步性及实时性的要求相当高。步性及实时性的要求相当高。第3页,共26页,编辑于2022年,星期六2.2 信息压缩的必要性信息压缩的必要性 1.图像或视频信号图像或视频信号 以以彩彩色色电电视视信信号号为为例例,设设代代表表光光强强、色色彩彩和和色色饱饱和和度度的的YIQ空空间间中中各各分分量量的的带带宽宽分分别别为为4MHz、1.3MHz
4、和和0.5MHz。由由采采样样定定理理,仅仅当当采采样样频频率率2倍倍的的原原始始信信号号的的频频率率时时,才才能能保证采样后的信号可被保真地恢复为原始信号。保证采样后的信号可被保真地恢复为原始信号。设各样点均被数字化为设各样点均被数字化为8bit,从而,从而1s的数据量为的数据量为 (41.30.5)2 8 bit=92.8 Mbit 因因而而一一张张640MB的的CDROM能能够够存存放放的的原原始始电电视视数数据据(每每字字节节附有附有2位校验位位校验位)为:为:640892.8(1+0.25)=44 s 即即 一张普通光盘只能存放一张普通光盘只能存放44 s的原始数据。的原始数据。第4
5、页,共26页,编辑于2022年,星期六 2.语音信号语音信号 人人在在正正常常说说话话时时的的音音频频一一般般在在200Hz3.4kHz,即即人人类类语语音音的的带带宽宽为为3.4 kHz。同同样样依依据据采采样样定定理理,并并设设数数字字化化精精度为度为8bit,则每秒的数据量为,则每秒的数据量为 3.4 kHz28=54.4 kbit 在上述采样条件下讲一分钟话的数据量约为在上述采样条件下讲一分钟话的数据量约为400kbit。表表2.2-1列列出出了了支支持持语语音音、图图像像、视视频频等等多多媒媒体体信信号号高高质量存储和传输所必需的未压缩速率以及信号特性。质量存储和传输所必需的未压缩速
6、率以及信号特性。第5页,共26页,编辑于2022年,星期六表表2.2-1 各种信号的特性和未压缩速率各种信号的特性和未压缩速率 第6页,共26页,编辑于2022年,星期六 未未进进行行编编码码和和压压缩缩:窄窄带带语语音音信信号号需需要要128kb/s的的速速率率,即即两两倍倍于于普普通通电电话话的的速速率率。宽宽带带话话音音需需要要256kb/s的的速速率率,双声道立体声双声道立体声CD音频需要音频需要1.41 Mb/s的速率。的速率。在在保保持持原原始始信信号号质质量量的的前前提提下下压压缩缩:窄窄带带语语音音4kb/s(30 1的的压压缩缩比比),宽宽带带话话音音16kb/s(15 1的
7、的压压缩缩比比),CD音音频频64kb/s(22 1的压缩比的压缩比)。对对于于多多媒媒体体处处理理系系统统的的语语音音、图图像像、视视频频、文文本本、数数据据的的结结合合,信信号号进进行行存存储储和和传传输输之之前前,必必须须进进行行处处理理,而而最最关关键键的的处处理理方方法法是是压压缩缩。多多媒媒体体信信息息压压缩缩技技术术的的对对象象主主要要是是视视频频、音音频频和和文文本本信信息息这这三三大大类类。如如对对多多数数图图像像实实现现大大于于100 1的的压压缩缩比比,而质量没有重大损失。而质量没有重大损失。第7页,共26页,编辑于2022年,星期六2.3 信息压缩的可行性信息压缩的可行
8、性 数数据据中中通通常常包包含含很很大大的的冗冗余余,数数据据的的大大小小与与所所携携带带的的信息量的关系由下式给出:信息量的关系由下式给出:I=D-r (2.3-1)其其中中I,D,r分分别别为为信信息息量量、数数据据量量与与冗冗余余量量。以以存存储储一一本本200万万字字的的中中文文百百科科全全书书为为例例,每每个个汉汉字字以以2字字节节计计算算,该该书书的的数数据据量量为为4MB。若若使使用用Huffman算算法法,就就可可简简单单地地将将大大约约2MB左左右右的的冗冗余余数数据据寻寻找找出出来来并并压压缩缩掉掉,这这样样就就可可以以节节省省出出2MB的存储空间。的存储空间。第8页,共2
9、6页,编辑于2022年,星期六 1 空间冗余空间冗余 在在任任何何一一幅幅图图像像中中,均均有有许许多多灰灰度度或或颜颜色色都都相相同同或或相相近近的的邻邻近近像像素素组组成成的的局局部部区区域域,它它们们形形成成了了一一个个性性质质相相同同的的集集合块,合块,即它们之间具有空间上的强相关性,表现为空间冗余。即它们之间具有空间上的强相关性,表现为空间冗余。对对空空间间冗冗余余的的压压缩缩方方法法就就是是把把这这种种集集合合块块当当作作一一个个整整体体,用用极极少少的的数数据据量量来来表表示示它它,从从而而节节省省了了存存储储空空间间。这这种种压压缩缩方方法法叫叫空空间间压压缩缩或或帧帧内内压压
10、缩缩,它它的的基基本本点点就就在在于于减减少少邻邻近近像像素素之之间的空间相关性。间的空间相关性。第9页,共26页,编辑于2022年,星期六图2.3-1 空间冗余 第10页,共26页,编辑于2022年,星期六 2 时间冗余时间冗余 时时间间冗冗余余是是活活动动图图像像和和语语音音数数据据中中经经常常包包含含的的冗冗余余。活活动动图图像像中中的的两两幅幅相相邻邻的的图图像像有有较较大大的的相相关关性性,这这反反映映为为时时间间冗冗余余。同同理理,在在语语音音中中,由由于于人人在在说说话话时时其其发发出出的的音音频频是是一一个个连连续续和和渐渐变变的的过过程程,而而不不是是一一个个完完全全的的时时
11、间间上上独独立立的的过过程程,因而存在着时间冗余。因而存在着时间冗余。利利用用这这种种时时间间冗冗余余,可可实实现现数数据据压压缩缩。这这种种压压缩缩对对运运动动图图像像往往往往能能得得到到很很高高的的压压缩缩比比,这这也也称称为为时时间间压压缩缩或或帧帧间间压压缩。缩。第11页,共26页,编辑于2022年,星期六图2.3-2 时间冗余 第12页,共26页,编辑于2022年,星期六第13页,共26页,编辑于2022年,星期六 3 信息熵冗余(编码冗余)信息熵冗余(编码冗余)所谓熵就是平均信息量。所谓熵就是平均信息量。(2.3-2)图图2.3-3 结构冗余示意图(草席)结构冗余示意图(草席)4.
12、结构冗余结构冗余 第14页,共26页,编辑于2022年,星期六 5 知识冗余知识冗余 人人们们通通过过认认识识世世界界而而得得到到某某些些图图像像所所具具有有的的先先验验知知识识和和背背景景知知识识,由由此此带带来来的的冗冗余余称称为为知知识识冗冗余余。如如人人脸脸的的图图像像有有固固定定的的结结构构,嘴嘴的的上上方方有有鼻鼻子子,鼻鼻子子的的上上方方有有眼眼睛睛,鼻鼻子子位位于于正正脸脸图图像像的的中中线线上上等等等等。这这类类规规律律的的结结构构可可由由先先验验知知识识和和背背景景知知识识得得到到,因因此此这这类类信信息息对一般人来说是冗余信息。对一般人来说是冗余信息。第15页,共26页,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体信息 处理 必要性 可行性 PPT 讲稿
限制150内