欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    多媒体技术之压缩标准讲稿.ppt

    • 资源ID:87095589       资源大小:2.67MB        全文页数:45页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    多媒体技术之压缩标准讲稿.ppt

    多媒体技术之压缩标准第一页,讲稿共四十五页哦静态图象压缩标准JPEGJPEG标准的主要内容JPEG静态图象压缩算法n基于DPCM的无失真编码n基于DCT的有失真压缩编码n基于DCT的累进操作方式编码JPEG2000简介2第二页,讲稿共四十五页哦JPEG概述JPEG(Joint Photographic Experts Group,联合图片专家组)是ISO和CCITT联合工作委员会成立的,专门致力于静止图像压缩。JPEG是一种静止彩色图象和灰度图像(连续图像)的压缩标准,它分为两部分:n详细规定了操作模式、格式转换和这些模式的编码器/解码器以及实现的具体指导。n描述了符合测试,可确定编码器或解码器的实现是否符合第一部分的标准细则,以便确保与遵守JPEG标准系统的互操作性。3第三页,讲稿共四十五页哦JPEG提出的要求设计必须将图象质量控制在这样的范围:可视保真度非常高,同时编码器可以被参数化,允许用户设置压缩或质量水平。压缩标准必须可应用于实践中任何一类连续色调数字源图象,并且不受到维数、颜色、画面长宽比、类、图像或布景内容、颜色或影调范围的限制。必须是从完全无损到有损范围内都可以伸缩的,使他适应不同的存储器、CPU和显示要求。提供顺序编码。每个图象成分都以单一的从左到右、从上到下的扫描方式进行编码。4第四页,讲稿共四十五页哦JPEG提出的要求(续)必须提供渐进编码(由多次扫描得到),图像解压时,较粗糙的图像先显示,随后更多图像成分被解压并补充过来,以提供更精细的图像。必须提供分层编码(由一次扫描得到),图像压缩为多个分辨率水平,这样低分辨率水平可被低分辨率目标系统访问,不用解压全分辨率图像。必须提供无损压缩选项,图像在解压时能保证提供所选分辨率下的全部细节。5第五页,讲稿共四十五页哦JPEG三个层次的定义基本系统n必须合理地解压缩彩色图像,保持高压缩率并能处理4位/像素到16位/像素的图像。顺序模式,HUAFFMAN编码,算术编码。扩展系统n包括了各种编码方式,如长度可变编码、渐进编码以及分层模式的编码,可适用于各种应用。特殊无损功能(预测无损编码法)n确保了在图像被压缩的分辨率下,解压缩没有造成出事源图像中任何细节的损失。6第六页,讲稿共四十五页哦JPEG算法的两种方式DCT方式(非可逆编码)n包含基本系统和扩展系统。可采用的算法有:顺序算法、界进算法、分层算法,根据算法可压缩比调节在10:1100:1之间空间方式(可逆编码)n分为以DCT为基础和以二维空间DPCM为基础两类。一般不会产生误差,采用熵编码。7第七页,讲稿共四十五页哦JPEG标准的特点编码器和解码器参数化(用户可调节)适用任何一种连续色调的图像对硬件的要求都很低,不需要专用的DSP芯片提供了四种工作方式8第八页,讲稿共四十五页哦基于DPCM的无失真编码预测器熵编码器表说明无失真编码器HUFFMAN表cbax选择值预测选择值预测0123非预测abc4567a+b-ca+(b-c)/2b+(a-c)/2(a+b)/2源图像数据压缩图像数据9第九页,讲稿共四十五页哦基于DCT的有失真压缩编码量化器熵编码器表说明编码器源图像数据压缩图像数据8*8块FDCT表说明基于DCT的编码过程压缩图像数据逆量化器IDCT表说明解码器熵解码器表说明源图像数据8*8块解码过程10第十页,讲稿共四十五页哦离散余弦变换首先把原始图像分割成8*8的子块采样精度为P位(二进制),把0,2P-1范围的无符号数变换成-2p-1,2p-1范围的有符号数,作为离散余弦正变换(FDCT)的输入在输出端经离散余弦逆变换(IDCT)后又得到一系列8*8子块,需将数值范围-2p-1,2p-1变换回0,2P-1来重构图像。11第十一页,讲稿共四十五页哦离散余弦变换(续)8*8的的FDCT的数学定义为:的数学定义为:F(u,v)=C(u)C(v)f(x,y)*cos(2x+1)*u)/16)*cos(2y+1)*u)/16)8*8的的IDCT的数学定义为:的数学定义为:F(u,v)=C(u)C(v)f(x,y)*cos(2x+1)*u)/16)*cos(2y+1)*u)/16)x=0y=077x=0y=077其中:C(u),C(v)=1/1.414当u,v=0C(u),C(v)=1其他12第十二页,讲稿共四十五页哦量化处理对64个DCT系数进行量化,关键是找到最小量化失真的量化器。JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化步长,然后四舍五入取整:FQ(u,v)=Integer RoundF(u,v)/Q(u,v)Q(u,v)是量化步长,由JPEG提出参考值,作为编码器的一个输入,取值为1255。量化的作用是在一定主观保真度图像质量的前提下,丢掉那些对视觉影响不大的信息,可调节数据压缩比。13第十三页,讲稿共四十五页哦DC系数的编码64个系数经量化后,F(0,0)称为DC系数(直流分量),是64个空域图像采样的平均值,它反映了每个8*8块的直流成分,不会发生剧烈的跳变。JPEG对DC系数采用DPCM(差分编码)单独传送。Blocki-1BlockiDCi-1DCiDIFF=Dci-DCi-114第十四页,讲稿共四十五页哦AC系数的行程编码其余的63个交流系数(AC)采用行程编码。从左上方AC01开始沿对角线方向“Z”字行扫描直到AC77结束,这样可增加行程中0的个数。用两个字节表示:两个非0值间连续0的个数表示下一个非0值所需要的比特数下一个非0实际值743070例:对700000006进行行程编码0111001111015第十五页,讲稿共四十五页哦熵编码分两步进行,先把DC码和行程码转换为中间符号序列,然后给这些符号赋以变长码字。熵编码的中间格式n由两个符号组成(AC系数)n符号1:(行程,尺寸)n符号:(幅值)nDC系数n符号1:(尺寸)n符号2:(幅值)可变长度熵编码n对得到的符号1和符号2序列进行变长编码16第十六页,讲稿共四十五页哦压缩比和图像的质量压缩效果(比特/像素)质 量0.250.500.500.750.751.51.22.0中好好很好极好与原始图像分辨不出17第十七页,讲稿共四十五页哦基于DCT的累进操作方式编码累进模式是将DCT系数按照一定的顺序进行编码和传输,达到随着解码的进展,图象逐渐清晰的效果,有下列两种累进方式n频谱选择法:DCT系数被以频率高低的顺序排序,先编码和传送低频带的DCT系数,再进行高频带的编码和传输,最终达到的效果和基本算法一样n逐次逼近法:先发送DCT系数的最高位,接着再发送逐次的低位,使DCT系数的精度越来越高分层模式可以认为使累进传输的一种特殊情况,它是在累进阶段增加空间分辨率18第十八页,讲稿共四十五页哦JPEG2000简介随著多媒体应用领域的激增,传统JPEG压缩技术已无法满足人们对多媒体图像资料的要求。因此,更高压缩率以及更多新功能的新一代静态图像压缩技术 JPEG 2000 就诞生了。JPEG 2000 正式名称为 ISO 15444 该标准是由联合摄影专家组于1997年开始征集提案,把它作为JPEG标准的一个更新换代标准。它的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子图书馆、传真、Internet网上服务和保安等方面的应用。国际标准化组织的WG1小组已于2000年8月制定了最终的国际标准化草案(The Final Draft International Standard,简称FDIS)19第十九页,讲稿共四十五页哦JPEG2000工作原理JPEG 2000 与传统 JPEG 最大的不同,在于它放弃了 JPEG 所采用的以离散馀弦转换(Discrete Cosine Transform)为主的区块编码方式,而改采以小波转换(Wavelet transform)为主的多解析编码方式。小波转换的主要目的是要将图像的频率成分抽取出来。20第二十页,讲稿共四十五页哦JPEG2000特征及应用高压缩率高压缩率n由于在离散子波变换算法中,图像可以转换成一系列可更加有效存储像素模块的“子波”,因此,JPEG2000格式的图片压缩比可在现在的JPEG基础上再提高1030,而且压缩后的图像显得更加细腻平滑,这一特征在互联网和遥感等图像传输领域有着广泛的应用。无损压缩和有损压缩无损压缩和有损压缩nJPEG2000提供无损和有损两种压缩方式,无损压缩在许多领域是必须的,例如医学图像中有时有损压缩是不能忍受的,再如图像档案中为了保存重要的信息较高的图像质量是必然的要求。同时JPEG2000提供的是嵌入式码流,允许从有损到无损的渐进解压。21第二十一页,讲稿共四十五页哦JPEG2000特征及应用渐进传输渐进传输n现在网络上的JPEG图像下载时是按“块”传输的,因此只能一行一行地显示,而采用JPEG 2000格式的图像支持渐进传输(Progressive Transmission)。所谓的渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量。互联网、打印机和图像文档是这一特性的主要应用场合。感兴趣区域压缩感兴趣区域压缩n可以指定图片上感兴趣区域(Region of Interest),然后在压缩时对这些区域指定压缩质量,或在恢复时指定某些区域的解压缩要求。这是因为子波在空间和频率域上具有局域性,要完全恢复图像中的某个局部,并不需要所有编码都被精确保留,只要对应它的一部分编码没有误差就可以了。22第二十二页,讲稿共四十五页哦JPEG2000特征及应用码流的随机访问和处理码流的随机访问和处理n这一特征允许用户在图像中随机地定义感兴趣区域,使得这一区域的的图像质量高于其它图像区域;码流的随机处理允许用户进行旋转、移动、滤波和特征提取等操作。容错性容错性n在码流中提供容错性有时是必要的,例如在无线等传输误码很高的通信信道中传输图像时,没有容错性是让人不能接受的。23第二十三页,讲稿共四十五页哦JPEG2000特征及应用开放的框架结构开放的框架结构n为了在不同的图像类型和应用领域优化编码系统,提供一个开放的框架结构在是必须的,在这种开放的结构中编码器只实现核心的工具算法和码流的解析,如果需要解码器可以要求数据源发送未知的工具算法。基于内容的描述基于内容的描述n图像文档、图像索引和搜索在图像处理中是一个重要的领域,MPEG-7就是支持用户对其感兴趣的各种“资料”进行快速、有效的检索的一个国际标准4。基于内容的描述在JPEG2000中是压缩系统的特性之一。24第二十四页,讲稿共四十五页哦JPEG2000的基本框架首先对源图像数据进行离散小波变换,然后对变换后的小波系数进行量化,接着对量化后的数据熵编码,最后形成输出码流。解码器是编码器的逆过程,首先对码流进行熵解码,然后解量化和小波反变换,最后生成重建图像数据。25第二十五页,讲稿共四十五页哦JPEG2000的基本框架JPEG2000的处理对象不是整幅图像,而是把图像分成若干图像片(image tiles),对每一个图像片进行独立的编解码操作。术语“图像片”(tiling)是指原始图像被分成互不重叠的矩形块,对每一个图像片进行独立的编解码处理。在对每个图像片进行小波变换之前,通过减去一个相同的数量值对所有的图像片进行水平移位 26第二十六页,讲稿共四十五页哦JPEG和JPEG2000比较27第二十七页,讲稿共四十五页哦运动图像压缩标准MPEGMPEGn运动图象专家组MPEG成立于1988年,旨在制定运动图象及其伴音的压缩、解压缩、处理和编码表示的国际标准,已制定MPEG-1、MPEG-2和MPEG-4nMPEG-4后续版本和MPEG-7处于制定中,目前正启动MPEG-21nMPEG-4是基于媒体对象的规范,它规定了媒体对象的描述、表达、组织等问题。nMPEG-7是针对媒体内容检索而提出的多媒体内容描述接口,它的目标是建立一套视听特征的量化标准描述器、结构以及它们相互之间的关系,这被称为描述方案。28第二十八页,讲稿共四十五页哦MPEG-1的的目标n音像质量应高于可视电话,达到VHS录象机的质量n可以存储在光盘、数字录音带 DAT(Digital Audio Type)、温盘(Winchester Disk)和可读写光盘上n码率应符合当前计算机网络的传输率:1 1.5 Mbps,以 1.2 Mbps 为宜n可以适应多种通信网络,如LAN、ISDN等n满足不对称和对称应用w不对称应用指一次编码、多次解码,如电视娱乐片、电子游戏、电子出版物等,只需解码器用于播放;w对称应用指同时进行编码和解码,如可视电话、双向图象邮递、同时录放的电子图象编辑。29第二十九页,讲稿共四十五页哦MPEG-1MPEG-1标准由下列三部分组成n系统:伴音压缩数据和图象数据的复用及同步n视频:视频压缩n伴音:伴音压缩,有64、128和192kbps三种码率MPEG-1的特点n定义了一套标准语法用于编码流的表示及解码n并不限定具体的编码算法,只要求产生有效编码流n支持多种图象尺寸、宽高比、信道传输率n随机访问:通过I帧定位可以迅速解码任一帧n快进快退:实现快速交互30第三十页,讲稿共四十五页哦MPEG-1MPEG-1的数据结构n采用层次化的数据结构,分为6个层次w序列sequence:由若干图象组构成w图象组(Group Of Picture)GOP:由各种类型图象组成w图象picture,分为I、P、B、D四种类型,代表了各自地压缩模式w切片slice:宏块的集合,主要用于误差恢复w宏块macro block:和H.261中的宏块定义相同w块block:88的象素矩阵,最小的DCT编码单位31第三十一页,讲稿共四十五页哦MPEG视频数据流的结构 运动图像序列图片组图片图片切片宏块块像素8像素32第三十二页,讲稿共四十五页哦MPEG视频数据流的结构运动序列n包括一个表头,一组或多组图像和序列结束标志码图像组n由一系列图像组成,可以从运动序列中随机存取图像n由三部分组成:一个亮度信号Y由偶数个行和偶数个列组成,色度信号U,V分别取Y信号在水平、垂直方向的1/2。33第三十三页,讲稿共四十五页哦MPEG视频数据流的结构块n一个8*8的亮度信息或色度信息组成宏块n由一个16*16的亮度信息和两个8*8色度信息构成图像切片n由一个或多个连续的宏块构成123456YUV8*88*834第三十四页,讲稿共四十五页哦MPEG-1视频编码技术图像类型nI图象:使用类似JPEG算法进行帧内编码,是随机访问点nP图象:是最近的前一个I图像(或P图像)预测编码得到,进行向前预测nB图象:可以参考其它的I图象和P图象,进行前向、后向和双向预测35第三十五页,讲稿共四十五页哦运动序列流的组成I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B11630每0.5秒一祯I图像1秒参照祯之间有两个B图像编码器重新排列后得到重排后的图像组序列次序为:IPBBPBB142375636第三十六页,讲稿共四十五页哦运动补偿技术主要用于消除P图像和B图像在时间上的冗于。基于块的运动补偿技术就是在其参照祯中寻找符合一定条件限制、当前被预测块的最佳匹配块。找到后,有两种方法处理:一种是在恢复被测祯块时,用匹配块代替;另一种是对预测的误差采用ADTC技术编码,在恢复被预测块时,用匹配块加上预测误差。37第三十七页,讲稿共四十五页哦MPEG-2一种高质量的运动图象及其伴音压缩标准最初要求n图象分辨率720480,与CCIR 601演播室数字电视分辨率相同n传输码率410Mbpsn与MPEG-1兼容,发挥设备兼容能力、降低价格后来许多提案要求囊括视频通信领域的一些应用如多点电视会议、工作站窗口显示、ATM视频通信及HDTV等,支持可分级(Scalable)视频编解码,因此最终覆盖了240Mbps的许多应用,导致MPEG-3的制定中途取消。38第三十八页,讲稿共四十五页哦MPEG-2的类和级MPEG-2划分了5个类n简单类(Simple Profile):除了没有B帧外与主类相同n主类(Main Profile):不可分级,质量尽可能地好nSNR可分级类(SNR Scalable Profile):信噪比可分级n空间可分级类(Spatially Scalable Profile):空间分辨率可分级n高类(High Profile):支持4:2:2、4:4:4及全部的可分级性39第三十九页,讲稿共四十五页哦MPEG-2的类和级4个级别n低级(Low Level):对应H.261 CIF或MPEG-1 SIF。n主级(Main Level):对应常规电视。n高级-1440(High-1440 Level):对应HDTV-1440。n高级(High Level):对应HDTV-1920。40第四十页,讲稿共四十五页哦MPEG-2的类和级类与级的有效组合共有11种等级/类简单类主类SNR可分级类空间可分级类高类低级352288MPLLSNRLL主级720576SPMLMPMLSNRMLHPML高级144014401152MPH1440SSPH1440HPH1440高级19201152MPHLHPHL41第四十一页,讲稿共四十五页哦MPEG-4目标制定一个基于内容/对象(Content/Object Based)的、高效的(Efficient)、灵活的(Flexible)、通用的(Universal)、可分级/伸缩的(Scalable)、可扩展的(Extensible)视频编码标准通过定制(Customization)便于特定应用充分利用现有的乃至未来的技术。一个重要特色是支持Internet上对音视信息有效的传输和灵活的操作。42第四十二页,讲稿共四十五页哦MPEG-4的功能内容交互的功能n基于内容的多媒体访问(Access)n基于内容的操作、比特流编辑(Bit Stream Editing)n自然/合成混合编码(SNHC:Synthetic&Natural Hybrid Coding)n完善的时域访问(Temporal Access)压缩的功能n高效编码:形状、纹理与运动n多同步流编码(Multiple Concurrent Stream Coding)通用的访问功能n健壮性(Robust)n基于内容的可分级/伸缩(Scalable)43第四十三页,讲稿共四十五页哦MPEG-4的应用n基于Internet的视频流(Video Streaming)传输n多媒体制作(authoring)与展示(presentation)n可分级/伸缩:不同分辨率/帧率/质量的视频播放n低带宽、易错(error-prone)环境下(例如GSM、PDA)的多媒体传输、多媒体数据库检索n多点远程会议(Multi-Point Tele-Conferencing),可选性(Selective)传输、解码、显示n交互式家庭视频选购n视频邮件(Video Mail)n远程教育(Tele-Education)44第四十四页,讲稿共四十五页哦anexampleofanMPEG-4Scene 45第四十五页,讲稿共四十五页哦

    注意事项

    本文(多媒体技术之压缩标准讲稿.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开