欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年多媒体数据压缩算法研究报告与实现.docx

    • 资源ID:12915066       资源大小:246.94KB        全文页数:20页
    • 资源格式: DOCX        下载积分:4.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要4.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年多媒体数据压缩算法研究报告与实现.docx

    精品学习资源多媒体数据压缩算法讨论与实现摘要:多媒体数据压缩技术是实现实时有效地处理、传输和储备巨大的多媒体数据的关键技术;很多应用领域对多媒体信息的实时压缩提出了更高的要求,快速、高效的压缩算法是解决这一问题的关键;针对多媒体数据在空间、时间、结构、视觉、学问等方面所产生的冗余, 利用有损压缩和无损压缩等方法,对图像、音频、视频等多媒体数据进行压缩,以保留尽可能少的有用信息;本文主要是把所学的数据结构和算法设计的学问应用于实践,对目前普遍采纳的多媒体数据及其压缩算法加以讨论,同时介绍了数据压缩所采纳的分类、方法及其标准, 并分析每种算法的优缺点,并据此挑选设计一种多媒体数据的无损压缩算法;并以实例加以说明;关键词:多媒体;压缩;哈夫曼编码 .1. 多媒体数据类型1.1 文字在现实世界中,文字是人与运算机之间进行信息交换的主要媒体;文字主要包括西文与中文;在运算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字;1.2 音频音频 <Audio )指的是 20HZ20kHz 的频率范畴,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐;1.3 视频媒体能够利用视觉传递信息的媒体都是视频媒体;位图图像、矢量图像等都是视频媒体;1.4 动画动画是指运动的画面,动画在多媒体中是一种特别有用的信息交换工具;动画之所以成为可能,是由于人类的“视觉暂留”的生理现象;用运算机实现的动画有两种,一种是帧动画,另一种是造型动画;2. 数据压缩基本原理2.1 信息、数据和编码数据是用来记录和传送信息,或者说数据是信息的载体;真正有用的不是数据本身, 而是数据所携带的信息;数据压缩的理论基础是信息论;数据压缩技术是建立在信息论的基础之上的;数据压缩的理论极限是信息熵;而信息熵有两个基本概念作铺垫,这两个基本概念就是信息、信息量;第一第一个概念“信息”;1. 信息信息是用不确定的量度定义的,也就是说信息被假设为由一系列的随机变量所代表, 它们往往用随机显现的符号来表示;我们称输出这些符号的源为“信源”;也就是要进行讨论与压缩的对象;应当懂得这个概念中的“不确定性”、“随机”性、“度量”性,也就是说当你收到一条消息之前,某一大事处于不确定的状态中,当你收到消息后,去除不确定性,从而获得信息,因此去除不确定性的多少就成为信息的度量;比如:你在考试过后,没收到考试成果 <考试成果通知为消息)之前,你不知道你的考试成果是否及格,那么你就处于一个不确定的状态;当你收到成果通知<消息)是“及格”,此时,你就去除了“不及格”<不确定状态,占 50%),你得到了消息“及格”;一个消息的可能性愈小,其信息含量愈大;反之,消息的可能性愈大,其信息含量愈小;欢迎下载精品学习资源2. 信息量指从 N个相等的可能大事中选出一个大事所需要的信息度量和含量;也可以说是辨别N个大事中特定大事所需提问“是”或“否”的最小次数;例如: 从 64 个数 <164 的整数)中选定某一个数<采纳折半查找算法),提问:“是否大于 32?”,就不论回答是与否,都消去半数的可能大事,如此下去,只要问6 次这类问题,就可以从 64 个数中选定一个数,就所需的信息量是6<bit )我们现在可以换一种方式定义信息量,也就是信息论中信息量的定义;设从 N 中选定任一个数 X 的概率为 Px> ,假定任选一个数的概率都相等,即Px>=1/N ,就信息量 Ix> 可定义为:上式可随对数所用“底”的不同而取不同的值,因而其单位也就不同;设底取大于 1 的整数 ,考虑一般物理器件的二态性,通常 取 2,相应的信息量单位为比特 <bit );当 =e,相应的信息量单位为奈特 <Nat);当 =10,相应的信息量单位为哈特 <Hart );明显,当随机大事x 发生的先验概率 Px> 大时,算出的Ix> 小,那么这个大事发生的可能性大,不确定性小,大事一旦发生后供应的信息量也少;必定大事的Px> 等于 1, Ix> 等于 0,所以必定大事的消息报导,不含任何信息量;但是一件人们都没有估量到的大事 <Px>微小),一旦发生后,Ix> 大,包含的信息量很大;所以随机大事的先验概率, 与大事发生后所产生的信息量,有亲密关系;Ix> 称 x 发生后的自信息量,它也是一个随机变量;现在可以给“熵”下个定义了;信息量运算的是一个信源的某一个大事<X)的自信息量,而一个信源如由n 个随机大事组成,n 个随机大事的平均信息量就定义为熵Entropy> ;3. 信息熵信源 X 发出的 x j j=1,2, n>,共 n 个随机大事的自信息统计平均,即求数学期望HX>在信息论中称为信源X 的“熵” Entropy>,它的含义是信源X 发出任意一个随机变量的平均信息量;更具体的说,一般在说明和懂得信息熵时,有4 种样式:<1)当处于大事发生之前,HX>是不确定性的度量;<2)当处于大事发生之时,是一种诧异性的度量;<3)当处于大事发生之后,是获得信息的度量;<4)仍可以懂得为是大事随机性的度量;例如: 以信源 X 中有 8 个随机大事,即n=8;每一个随机大事的概率都相等,即Px1>=Px2>=Px3> Px8>=1/8 ,运算信源X 的熵;应用“熵”的定义可得其平均信息量为3 比特:香农信息论认为:信源所含有的平均信息量<熵),就是进行无失真编码的理论极限;信息中或多或少的含有自然冗余;4. 编码的概念编码是把代表特定量化等级的比较器的输出状态组合,变换成一个 n 位表示的二进制数码,即每一组二进制码代表一个取样值的量化电公平级;由于每个样值的量化电公平级由一组 n 位的二进制数码表示,所以,取样频率 f 与 n 位数的乘积 nf 就是每秒需处理和发送的位数,通常称为比特率或数码率;例如, CD音响的采样频率选用 44.1kHz ,量化位数 n16,采纳立体声,相应的比特率为:5. 熵编码的概念欢迎下载精品学习资源假如要求在编码过程中不丢失信息量,即要求储存信息熵,这种信息保持编码又叫做熵储存编码,或者叫熵编码;熵编码是无失真数据压缩,用这种编码结果经解码后可无失真地复原出原数据;2.2 数据压缩的条件在多媒体信息中包含大量冗余的信息,把这些冗余的信息去掉,就实现了压缩;数据 压缩技术有 3 个重要指标:一是压缩前后所需的信息储备量之比要大;二是实现压缩的算法要简洁,压缩、解压缩速度快,尽可能地做到实时压缩和解压缩;三是复原成效要好, 要尽可能完全复原原始数据;2.3 数据冗余1. 冗余的基本概念多媒体技术最大难题是海量数据储备与电视信号数字化后的数据量传送;数字化后的数据量与信息量的关系为:其中:信息量 ,数据量 ,冗余量由上式可以知道,传送的数据量中有肯定的冗余数据信息,即信息量不等于数据量, 并且信息量要小于传送的数据量,因此这使得数据压缩能够实现;2. 冗余的分类一般而言,图像、音频数据中存在的数据冗余类型主要有如下几种;1> 空间冗余; 这是图像数据常常存在的一种冗余;在同一幅图像中,规章物体和规章背景的表面特性具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余;2> 时间冗余; 时间冗余在图像序列中就是相邻帧图像之间有较大相关性,一帧图像中的某物体或场景可以由其他帧图像中的物体或场景重构出来,音频的一个连续的渐变过程 中,也存在同样的时间冗余;3> 信息熵冗余; 信源编码时,当安排给某个码元素的比特数使编码后单位数据量等于其信源熵,即达到其压缩极限;但实际中各码元素的先验概率很难预知,比特安排不能达到正确,实际的单位数据量大于信源熵时,便存在信息熵冗余;4> 视觉冗余; 人眼对于图像场的留意是非匀称的,人眼并不能觉察图像场的全部变68化;事实上人类视觉的一般辨论率为2 灰度等级,而一般图像的量化采纳的是2 灰度等级,即存在着视觉冗余;5> 听觉冗余; 人耳对不同频率的声音的敏锐性是不同的,并不能察觉全部频率的变化,对某些频率不必特殊关注,因此存在听觉冗余;6> 结构冗余; 图像一般都有特别强的纹理结构;如草席图像,纹理一般都是比较有规律的结构,因此在结构上存在冗余;7> 学问冗余; 图像的懂得与某些基础学问有很大的相关性;例如,人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在正脸图像的中线上等;这些规律性可 由某些基础学问得到,此类冗余为学问冗余;8> 其他冗余; 多媒体数据除了上述冗余类型外,仍存在其他一些冗余类型,如由图像非定常特性所产生的冗余等;3. 数据压缩标准数据压缩是多媒体通信中的核心技术之一, 数据压缩讨论中应留意的问题是,第一,编码方法必需能用运算机或硬件电路高速实现;其次,要符合当前的国际标准;为此, 国际上制定了很多与之相关的数据压缩标准, 主要可分为三类 : 音频压缩标准 , 二值和静止图像压缩标准, 以及视频压缩标准;欢迎下载精品学习资源3.1 音频数据的压缩标准音频信号是多媒体信息的重要组成部分;音频信号可以分为电话音频信号、调幅广播音频信号和高保真的立体声音信号;前两种单频信号的压缩技术比较成熟, 例如,ADPCM、 CELP和子带编码等;国际电报电话询问委员会<CCITT )和国际标准化组织 <ISO )先后提出一系列有关音频编码的建议, CCITT 现更名为 ITU2T>已为这两种音频信号的压缩编码制定了一些国际标准;1.G. 711标准1972年CCITT 现更名为 ITU2T>为电话质量和语音压缩制定了PCM标准 G.711;其速率为64kbit/s,使用非线性量化技术 , 其质量相当于 12比特线性量化;2.G. 721标准1984年CCITT制定了 G.721标准 , 使用自适应差分 PCM编码 ADPCM>,其速率 32kbit/s; ADPCM是一种对中等质量音频信号进行高效编码的有效算法之一, 它不仅适用于语音压缩, 而且也适用于调幅广播质量的音频压缩和CD2I音频压缩等应用;3.G. 722标准1988年CCITT为调幅广播质量的音频信号压缩制定了G.722标准 , 它使用子带编码方案 , 用滤波器将输入信号分成高低两个子带信号, 然后分别使用 ADPCM进行编码 , 经复用后形成输出码流; G.722标准也供应数据插入功能, 这样音频码流与所插入的数据一起形成比特流;G.722能将 224kbit/s的调幅广播质量的音频信号压缩为64kbit/s,主要用于视听多媒体和会议电视等;4.G. 728标准为了进一步降低语音压缩的速率,1991 年CCITT制定了 G.728标准 , 使用基于短延时码本鼓励线性猜测编码 LD2CELP>算法 , 其速率为 16kbit/s,其质量与 32kbit/s的G.721标准相当;5. MPEG21音频编码MPEG2音1 频编码是国际上制定的第一个高保真立体声音频编码标准ISO1117223> ;通过对 14 种音频编码方案的比较测试, 最终选定了以MUSICAMMaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing>为基础的三层编码结构;依据不同的应用要求, 使用不同的层来构成其音频编码器;在MPEG2中1 音频编码的 1、2层称之为 MUSICAM;MUSICAM使用了以下技术 : 子带滤波器先将输入的数字音频信号分成 32个子带;在每个子带中 , 确定一段信号中的最大电平, 由此得到比例因子这一编码参数;由于比例因子的相对变化很小, 因此采纳差分熵编码方法;依据人耳的掩蔽效应确定掩蔽门限 , 据此自适应地安排比特, 以达到高效压缩音频数据;最终, 将音频压缩数据、比例因子和比特安排信息按帧结构组合在一起, 形成音频比特流;6. MPEG22音频编码在MPEG2音1 频编码中 ,MUSICAM只能传送左右两个声道;为此,MPEG扩展了低码率多声道编码 , 将多声道扩展信息加到MPEG2音1 频数据帧结构的帮助数据段 其长度没有限制 >中;这样可将声道数扩展至 5.1, 即3个前声道 左L、中 C和右 R>、2个围绕声 左LS、右 RS>和1个超低音声道 LFE常称之为 0.1> ;由此 , 形成了 MPEG2音2 频编码标准 SO1381823;MPEG2音2 频编欢迎下载精品学习资源码能传送多路声音 , 并能确保比特流与MPEG2前1 7.AC23系统向和后向兼容;欢迎下载精品学习资源AC23系统是 Dolby 公司开发的新一代高保真立体声音频编码系统, 它继承了 AC22系统的很多优点 例如 , 变换编码、自适应量化和比特安排、人耳的听觉特性等>, 并采纳了一些新的技术 例如 , 指数编码、混合前/ 后向自适应比特安排和耦合技术等>;AC23系统的总体性能要优于目前的 MPEG2音2 频算法 称之为 MUSICAM围绕声 >;欢迎下载精品学习资源3.2 二值图象压缩标准二值图像是指只有黑、白两个亮度值的图像, 例如由文字组成的图像、地图、线路图等;灰度图像经过比特平面分解或抖动处理后也能变为二值图像;二值图像编码最常用、最典型的例子是传真;为此,CCITT 先后制定了 G3和G4标准 , 其中 ,G3使用 MR 编码算法;而 G4是G3的改进型 , 使用 MMR算法;目前 , 这两种二值图像压缩标准广泛地应用于传真通信和文档储备领域;另一个正在进展的二值图像压缩标准是JBIG,JBIG 是二值图像专家组的缩写;JBIG可望成为新一代二值图像和低像素精度图像的无失真压缩标准;虽然已有了优秀的 MMRG标4准 , 但仍是要制定 JBIG,其主要缘由是改进二值中间色调图像的压缩性能;由于二值中间色调图像与二值文字图像具有特别不同的统计特性;而G3/G4不适应于中间色调图像, 当G3/G4压缩这类图像时 , 不仅得不到压缩 , 反而有可能扩展数据量, 而使用 JBIG标准可获得约8:1 的压缩;它使用了与 JPEG标准相同的算术编码方法, 其压缩效率要比目前的传真标准 G3/G4高得多;值得指出的是, JBIG 标准虽然是针对二值图像的,但它也可以对包括灰度值 的黑白图像或彩色图像进行编码;3.3 静止图象压缩标准ISO和CCITT于 1986年底成立了“联合图片专家组”, 简称为 JPEG,讨论连续色调静止图像压缩的国际标准;从1988年至 1990 年, JPEG 进行了大量的改进工作后, 于 1991年4月形成了ISOCD10918号标准草案; JPEG标准草案 DIS> 包括两部分 , 一部分为要求和指标 , 描述连续色调静止图像编码和解码过程的要求和要实现的指标, 以及用于应用间交换压缩图像数据的编码表示 即交换格式 >;这些过程和表示是通用的, 可适用于很广的应用范畴, 例如通信和运算机系统中的彩色和灰度图像编码;另一部分描述如何确定部分1所定义的各种编码和解码过程的一样性;3.4 视频压缩标准视频是多媒体通信中最重要的媒体之一;一方面视频媒体能给人以“百闻不如一见”的感受 ,与话音相比 , 视频可以说是一种高级媒体, 能给人带来高级的视觉享受;另一方面由于视频的信息量特别大 特殊是数字化后 >, 按质量划分 , 视频可大致分为以下三类:·低质量视频 , 画面较小 , 通常为 QCIF 或CIF格式 , 帧速率低 , 通常为 5 10帧/ 秒, 既可为黑白视频也可为彩色视频;其典型的应用包括电视电话和会议电视;·中等质量的视频, 中等大小的画面 , 通常为 CIF 或CCIR 601 视频格式;帧速率为 25 30帧/ 秒, 多为彩色视频;其典型应用有CD和数字音频磁带等数字储备媒体;·高质量视频 , 其画面较大 , 通常为 CCIR 601视频格式至高清楚度电视视频格式;帧速率 25 帧/ 秒, 高质量的彩色图像;其典型应用包括广播质量的一般数字电视和高清楚度电视等;针对上述三种视频, 国际上制定了相应的视频压缩标准:H.261 、MPEG21和MPEG2;2 值得一提的是 1992年成立了一个专家组来制定特别低码率 kbit/s级>的视频标准 MPEG2;4 准备用于将来的电视电话和移动多媒体通信系统, 例如视频蜂窝电话等;1.H.261H.261是 CCITT制定的视频压缩标准 , 它是国际上第一个视频压缩标准,主要用于电视电话和会议电视 , 以满意 ISDN日益进展的需要;H.261 视频压缩算法的核心是运动估值猜测和DCT编码;由于它是第一个国际视频压缩标准, 其很多技术 包括视频数据结构, 运动估算与欢迎下载精品学习资源补偿 ,DCT变换、量化和熵编码等 >都被后来的 MPEG2和1 2.MPEG21MPEG2所2借鉴和采纳;欢迎下载精品学习资源MPEG是活动图像专家组的缩写, MPEG21 采纳 CIF视频格式 , 帧速率为 25帧/ 秒或 30帧/ 秒,码率为 1.5Mbit/s其中, 视频约 1.2 Mbit/s ,音频约 0.3Mbit/s>,图像质量略高于家用 VHS录像机 , 音频质量 双声道 >接近 CD质量;由于 MPEG2采1 用类似于 H.261 的通用编码方法 , 因欢迎下载精品学习资源此,MPEG21不仅可用于数字储备媒体,而且可用于通信和广播,其压缩数据能以文件的形式传送、治理和接收;3.MPEG22MPEG22是继 MPEG2后1 ,MPEG制定的又一视频压缩标准ISO/IEC13818> ;由于是 MPEG21的继承和进展 , 因此 ,MPEG22能适用于更广的应用领域, 主要包括数字储备媒体, 广播电视和通信 , 制定 MPEG2标2 准的动身点是保持通用性, 适用于广泛的应用领域、比特率、辨论率、质量和服务;为了适应各种不同的应用要求,MPEG22使用了可分级性 scalability>,即能供应不同的服务等级 level>;为此 , 该标准定义了几种不同的可分级性形式;基本的可分级性形式有 :数据划分、信噪比 SNR>、空间和时间的可分级性;进一步也支持这几种基本可分级性形式的组合 , 称之为混合可分级性;MPEG22标准是目前为止最重要的视频压缩标准;它对多媒体通信和广播电视等领域将会产生深远的影响;随着宽带ISDN、超大规模集成电路和运算机技术的进展, 其应用前景特别宽阔;4. 数据压缩算法各种媒体信息 特殊是图像和动态视频>数据量特别大;这么大的数据量不仅超出了运算机的储备和处理才能,更是当前通信信道的传输速率所不及的;因此,为了储备、处理和传输这些数据,必需进行压缩;相比之下,语音的数据量较小,且基本压缩方法己经成熟,目前的数据压缩讨论主要集中于图像和视频信号的压缩方面;数据压缩的核心是运算方法,不同的运算方法,产生不同形式的压缩编码,以解决不同数据的储备与传送问题;数据冗余类型和数据压缩的算法是对应的,一般依据不同的冗余类型采纳不同的编码形式,随后是采纳特定的技术手段和软硬件,以实现数据压缩;4.1 算法的分类数据压缩方法种类繁 多,可以分为无损 <无失真)压缩和有损 <有失真) 压缩两大类,无损压缩编 码采纳统计编码,而有损 压缩就采纳猜测或者变换 编码等;见图4-1 ;图 4-1数据压缩技术的基本分类欢迎下载精品学习资源1. 无损压缩算法无损压缩是指解码后的数据与压缩之前的原始数据完全一样;无损压缩利用数据的统计冗余进行压缩,可完全复原原始数据而不引起任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2:1到 5:1 ;这类方法广泛用于文本数据、程序和特殊应用场合的图像数据的压缩;由于压缩比的限制,仅使用无损压缩方法不行能解决图像和数字视频的存储和传输问题 :1> 无损压缩编码基于信息熵原理,属于可逆编码;其压缩比一般不高;2> 所谓“可逆”,是指压缩的数据可以不折不扣地仍原成原始数据;3> 典型的可逆编码有:霍夫曼编码、算术编码、行程编码、LZW编码等;2有损压缩算法有损压缩是指解码后的数据与原始数据不一样;有损压缩方法利用了人类视觉对图像中的某些频率成分不敏锐的特性,答应压缩过程中缺失肯定的信息;虽然不能完全复原原始数据,但是所缺失的部分对懂得原始图像的影响较小,却换来了大得多的压缩比;有损压缩广泛应用于语音、图像和视频数据的压缩;1> 该编码在压缩时舍弃部分数据,仍原后的数据与原始数据存在差异;有损压缩具有不行复原性和不行逆性;2> 有损压缩编码类型有:猜测编码、变换编码等4.2 猜测编码猜测编码 <Predictive Coding)是一种有失真的编码,是一种特地用作压缩冗余数据的编码技术;猜测编码主要是削减了数据在时间和空间上的相关性,因而对于时间序列数据有着广泛的应用价值;猜测编码是依据某一模型利用以往的样本值对于新样本值进行猜测,然后将样本的实际值与其猜测值相减得到一个误差值,对于这一误差值进行编码;假如模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始信 号,从而可以用较少的电平类对其差值量化得到较大的数据压缩结果;假如能精确猜测数据源输出端作为时间函数使用的样本值的话,那就不存在关于数据源的不确定性,因而也就不存在要传输的信息;换句话说,假如我们能得到一个数学模型完全代表数据源,那么在接收端就能依据这一数学模型精确地产生出这些数据;然而没有一个实际的系统能找到其完整的数据模型,我们能找到的最好的猜测器是以某种最小化的误差对下一个采样进行猜测的猜测器;猜测编码方法分线性猜测和非线性猜测编码方法;线性猜测编码方法,也称差值脉冲编码调制法,简称DPCM<differential Pulse Code Modulation);猜测编码方法在图像数据 压 缩 和 语 音 信 号 的 数 据 压 缩 中 都 得 到 广 泛 的 应 用 和 研 究 ;1;差分脉冲编码调制法差分脉冲编码调制法,简称DPCMDifferention Pulse Code Modulation>;<1)DPCM的基本原理一幅二维静止图像,设空间坐标像素点的实际灰度为,是依据以前已显现的像素点的灰度对该点的猜测灰度,也称猜测值或估量值;空间坐标像素点的实际灰度值;空间坐标像素点的猜测灰度值 实际值和猜测值之间的差值,以下式表示,=-实际值和猜测值之差将差值定义为猜测误差,由于之间有极强的相关性,所以这个猜测误差是很小的;编码时,不是对像素点的实际灰度进行编码,而是对猜测误差信号进行量化、编码、发送,由此而得名为差值脉冲编码调制法,简写DPCM;编码和解码过程见图 4-2 所示:欢迎下载精品学习资源图 4-2 DPCM 编、解码原理图系统包括,发送、接收和信道传输三个部分;发送端由编码器、量化器、猜测器和加减法器组成;接收端包括解码器和猜测器等;信道传送以虚线表示;由图可见DPCM系统具有结构简洁,简洁用硬件实现<接收端的猜测器和发送端的猜测器完全相同)的优点;图中输入信号是坐标为像素点的实际灰度值,是由已显现从前相邻像素点的灰度值对该像素点的猜测灰度值;是猜测误差;假如发送端不带量化器,直接对预 测误差进行编码、传送,接收端可以无误差地复原;这是可逆的无失真的DPCM编码,是信息保持编码;但是,假如包含量化器,这时编码器对编码,量化器导致了不行逆的信息缺失,这时接收端,经解码复原出的灰度信号,不是真正的,以表示这时的输出;可见引入量化器会引起肯定程度的信息缺失,使图像质量受损;但是,为了压缩比特数,利用人眼的视觉特性,对图像信息丢失不易觉察的特点,带有量化器有失真的DPCM编码系统仍是普遍被采纳;2自适应差分脉冲调制法ADPCM<Adaptive Differential Pulse Code Modulation,自适应差分编码)具有自适应特性, ADPCM主要用于对中等质量的音频信号进行高效率压缩;例如语音的压缩、调幅广播音质的信号压缩等;该编码包括自适应量化和自适应猜测两种形式:自适应量化 - 在肯定的量化级数下,削减量化误差或在相同误差情形下压缩数据;自适应量化必需具有对输入信号幅度值的估算才能,否就无法确定信号转变量的大小;自适应猜测 - 依据常见的信息源求得多组固定的猜测参数,将猜测参数供应应编码使用;在实际编码时,依据信息源的特性以实际值与猜测值的均方差最小为原就;自适应地挑选其中一组固定的猜测参数进行编码;猜测编码的方法能够压缩图像数据的空间和时间冗余性;特点是直观、简捷和易于实现; 在传输速度要求很高的应用中,大多项用此方法;然而,猜测方法的不足是压缩才能有限;为了更好地提高压缩才能, 可以采纳变换编码方法;4.3 变换编码变换编码的基本概念变换编码是一种有失真的编码,所谓变换是指对原始数据原先的时间或空间域进行数学变换,使得变换后能够突出原始数据中的重要部分,以便重点处理;广泛应用于单色图像、彩色图像、静止图像、运动图像,以及多媒体运算机技术中的电视帧内图像压缩和帧间图像压缩中;变换编码是指将给定的图像变换到另一个数据域 <变换域或频域)上,以便用较少的数据表示大量的信息;也就是说,它不是直接对空间域图像信号编码,而是第一将当前所表达的空间域图像信号经过变换映射到另一个正交矢量空间,得到一系列变换系数,然后对这些变换系数进行编码处理;结果,重要的系数在变换到其他空间域后,其编码的精确度高于次重要的系数;变换本身是一种无损且可逆的技术,但为了获得更好的编码成效,忽视了一些不重要的系数,因而成为有损的技术;常用的变换编码方案有离散余弦变换、离散哈达玛变换、小波变换等方法;欢迎下载精品学习资源变换编码的原理为:输入信号经过适当的正交变换到另一个频域空间,相关性就会明显降低,能量集中在频域的少数低频系数上,这样就达到了数据压缩的成效;假如保留频域中系数大的元素,忽视系数小的元素,然后辅以非线形量化来提高压缩程度,最终进行编码,可获得很高的压缩比;4.4 统计编码原理统计编码又称信息熵编码,它通过去除信源信号的冗余达到压缩的目的,属于无损编码;依据消息显现概率的分布特性而进行的压缩编码,它有别于猜测编码和变换编码;这种编码的宗旨在于 , 在消息和码字之间找到明确的一一对应关系,以便在复原时能精确无误地再现出来 , 或者至少是极相像地找到相当的对应关系, 并把这种失真或不对应概率限制到可容忍的范畴内;但不管什么途径, 它们总是要使平均码长或码率压低到最低限度;常用的编码有: Huffman 码、行程编码、算术编码等;1. 哈夫曼 <Huffman )编码<1)哈夫曼编码的方法编码过程如下: 将信源符号按概率递减次序排列; 把两个最小的概率加起来,作为新符号的概率; 重复步骤 、 ,直到概率和达到 1为止 ; 在每次合并消息时,将被合并的消息赋以1 和 0 或 0 和 1; 查找从每个信源符号到概率为1 处的路径,记录下路径上的1 和 0; 对每个符号写出“1”、“ 0”序列 <从码数的根到终节点);<2)哈夫曼编码的特点 哈夫曼方法构造出来的码不是唯独的;缘由如下: . 在给两个分支赋值时,可以是左支或上支 >为 0,也可以是右支或下支>为 0,造成编码的不唯独; . 当两个消息的概率相等时 ,谁前谁后也是随机的,构造出来的码字就不是唯独的; 哈夫曼编码码字字长参差不齐,因此硬件实现起来不大便利; 哈夫曼编码对不同的信源的编码效率是不同的;. 当信源概率是 2的负幂时 ,哈夫曼码的编码效率达到100%; . 当信源概率相等时,其编码效率最低; . 只有在概率分布很不匀称时,哈夫曼编码才会收到显著的成效,而在信源分布匀称的情形下 ,一般不使用哈夫曼编码;对信源进行哈夫曼编码后,形成了一个哈夫曼编码表;解码时,必需参照这一哈夫曼编码表才能正确译码;在信源的储备与传输过程中必需第一储备或传输这一哈夫曼编码表在实际运算压缩成效时 ,必需考虑哈夫曼编码表占有的比特数;在某些应用场合,信源概率听从于某一分布或存在肯定规律 这主要由大量的统计得到>,这样就可以在发送端和接收端固定哈夫曼编码 表,在传输数据时就省去了传输哈夫曼编码表,这种方法称为哈夫曼编码表缺省使用;使用缺省的哈夫曼编码表有两点好处: . 降低了编码的时间,转变了编码和解码的时间不对称性; . 便于用硬件实现 ,编码和解码电路相对简洁;这种方法适用于实时性要求较强的场合;虽然这种方法对某一个特定应用来说不肯定最好,但从总体上说,只要哈夫曼编表基于大量概率统计 , 其编码成效是足够好的;<3)哈夫曼编码举例假设一个文件中显现了 8 种符号 S0,S1,S2,S3,S4,S5,S6,S7 , S0 到 S7 的显现频率分别为 4/14 , 3/14 ,2/14 , 1/14 , 1/14 , 1/14 ,1/14 , 1/14 ,就进行 Huffman 编码的过程为图4-3 所示 : 其中圆圈中的数字是新节点产生的次序;欢迎下载精品学习资源图 4-3 Huffman编码的示意图哈夫曼提出的这种编码也称为正确变长码,其优点是编码的效率高,但这种编码依靠于信源的统计特性;并且,假如消息数很大,需要储备的码表也要很大,因而会影响储备量、编码以及译码速度等各个方面的性能;2. 算术编码算术编码把一个信源集合表示为实数线上的0到 1之间的一个区间;这个集合中的 每个元素都要用来缩短这个区间;信源集合的元素越多, 所得到的区间就越小, 当区间变小时, 就需要更多的数位来表示这个区间, 这就是区间作为代码的原理;算术编码第一假设一个信源的概率模型 , 然后用这些概率来缩小表示信源集的区间;<1)举例说明算术编码过程例 设英文元音字母采纳固定模式符号概率安排如下:设编码的数据串为eai;令 high为编码间隔的高端, low 为编码间隔的低端, range 为的编码间隔长度, rangelow为编码字符安排的间隔低端,rangehigh为编码字符安排的间隔高端;初始 high=1 , low=0 , range high-low,一个字符编码后新的low 和 high按下式运算:low =lowrange × rangelow high =lowrange ×rangehigh在第一个字符 e 被编码时, e 的 rangelow 0.2 , rangehigh=0.5,因此:low 0 + 1× 0.2 0.2high=0 + 1× 0.5 0.5 range=high low=0.5 0.2=0.3此时安排给e的范畴为 0.2,0.5; 第 二 个 字 符rangehigh=0.2,a编 码 时 使 用 新生 成 范 围 0.2,0.5, a的rangelow=0,因此: low=0.2+ 0.3× 0=0.2 high=0.20.3× 0.2=0.26range=0.06范畴变成 0.2,0.26; 对下一个字符 i编号, i 的 rangelow=0.5, rangehigh=0.6,就:low=0.2 0.06× 0.5=0.23 high=0.2 0.06× 0.6=0.236即用 0.23,0.236表示数据串 eai ,假如解码器知道最终范畴是0.23,0.236 欢迎下载精品学习资源这一范畴,它立刻可解得一个字符为e ,然后依次得到惟一解a ,即最终得到 eai;<2)算术编码的特点 不必预先定义概率模型,自适应模式具有特殊的优点; 信源符号概率接近时,建议使用算术编码,这种情形下其效率高于Huffman编码; 算术编码绕过了用一个特定的代码替代一个输入符号的想法,用一个浮点输出数值代替一个流的输入符号,较长的复杂的消息输出的数值中就需要更多的位数; 算术编码实现方法复杂一些,但JPEG 成员对多幅图像的测试结果说明,算术编码比 Huffman 编码提高了5% 左右的效率,因此在JPEG 扩展系统中用算术编码取代Huffman编码;3;行程编码行程编码 Run Length Coding>主要检测信源中重复显现的符号序列,用它们的显现次数进行编码;通过运算信源符号显现的行程长度,然后将行程长度转换成代码;例如,对于二值符号序列 0000000000000001111111000000000 可以编码为 1507190,它代表 15 个 0后续 7 个 1 再后续 9 个 0;假如商定全部的符号序列都以0 开头,其编码可进一步简化为1579;由于符号 0 和 1 交叉排列,所以没有必要指出是何种符号的行程长度;行程编码是一种无损压缩;其压缩成效取决于压缩的内容;例如在黑白二值图像<传真)中存在大量的重复像素,采纳行程编码可以有效地压缩数据;然而,对于一些各种像素分布匀称的特殊的图像,采纳行程编码会使数据量不降反增,显现所谓的负压缩;这是行程编码的局限;4.5 LZW 压缩编码LZW<LempelZivWelch)压缩编码是一种先进的数据压缩技术,属于无损压缩编码,该编码主要用于图像数据的压缩;对于简洁图像和平滑且噪声小的信号源具有较高的压缩比,并且有较高的压缩和解压缩速度;1977 年,两

    注意事项

    本文(2022年多媒体数据压缩算法研究报告与实现.docx)为本站会员(Che****ry)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开