数据压缩基础学习教案.pptx
《数据压缩基础学习教案.pptx》由会员分享,可在线阅读,更多相关《数据压缩基础学习教案.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1数据压缩数据压缩(sh j y su)基础基础第一页,共81页。2主要主要(zhyo)内容内容n n数据压缩概述数据压缩概述n n数据压缩编码数据压缩编码n n统计统计(t(t ngj)ngj)编码编码霍夫曼编码霍夫曼编码n n算术编码算术编码n n预测编码预测编码n n行程编码行程编码n n变换编码变换编码n n词典编码词典编码n n分析综合编码分析综合编码第1页/共81页第二页,共81页。3什么什么(shn me)是数据压是数据压缩缩 数据压缩就是在一定的精度(jn d)损失条件下,以最少的数码表示信源所发出的信号信源编码信道编码信道信道译码信源译码信源信宿第2页/共81页第三页,
2、共81页。4多媒体信源引起了“数据爆炸(bozh)”如果不进行数据压缩 传输和存储都难以实用化。多媒体数据数据压缩数据压缩(sh j y su)的必要性的必要性第3页/共81页第四页,共81页。5分钟数字音频信号(xnho)需要的存储空间1第4页/共81页第五页,共81页。6分钟数字(shz)视频信号需要的存储空间1第5页/共81页第六页,共81页。7常见(chn jin)的图像数据冗余(1)空间冗余。在任何一幅图像中,均有由许多灰度或颜色都相同的邻近像素组成的区域,它们形成了一个性质相同的集合块,即它们相互之间具有空间(或空域)上的强相关性,在图像中就表现为空间冗余。(2)时间冗余。这是序列
3、图像(电视图像、运动图像)表示中经常包含的冗余。图像序列中两幅相邻(xin ln)的图像有较大的相关,这反映为时间冗余。(3)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的板图案等,我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。第6页/共81页第七页,共81页。8(4)知识冗余。有些图像的理解与某些知识有相当大的相关性。例如(lr):狗的图像有固定的结构,比如,狗有四条腿,头部有眼、鼻、耳朵,有尾巴等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。(5)视觉冗余。人类视觉系统的一般分辨能力估计为26灰度等级,而一般图像的量化
4、采用的是28的灰度等级。像这样的冗余,我们称之为视觉冗余。空间冗余和时间冗余是将图像信号看作为随机信号时所反映出的统计特征,因此有时把这两种冗余称为统计冗余。第7页/共81页第八页,共81页。9时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储(cn ch)费用能量域压缩降低发射功率数据压缩数据压缩(sh j y su)的好处的好处第8页/共81页第九页,共81页。10压缩比要大恢复后的失真小压缩算法要简单、速度快压缩能否用硬件(yn jin)实现数据压缩数据压缩(sh j y su)技术实现技术实现的衡量标准的衡量标准第9页/共81页第十页,共81页。11 无损压缩是指使
5、用压缩后的数据(shj)进行重构(或者叫做还原,解压缩),重构后的数据(shj)与原来的数据(shj)完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。有损压缩是指使用压缩后的数据(shj)进行重构,重构后的数据(shj)与原来的数据(shj)有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。数据压缩数据压缩(sh j y su)技术的分类技术的分类第10页/共81页第十一页,共81页。12根据压缩(y su)原理的分类(1)预测编码。它是利用空间中相邻数据的相关性来进行压缩(y su)数据的。通常用的方法有脉冲编码调制(P
6、CM)、增量调制(DM)、差分脉冲编码调制(DPCM)等。这些编码主要用于声音的编码(2)变换编码。该方法将图像时域信号转换为频域信号进行处理。这种转换的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内能量常常集中在一起,数据处理时可以将主要的注意力集中在相对较小的区域,从而实现数据压缩(y su)。一般采用正交变换,如离散余弦变换(DCT)、离散傅立叶变换(DFT)第11页/共81页第十二页,共81页。13(3)统计编码(信息熵编码)。依据信息熵原理,让出现概率大的信号用较短的码字表示,反之用较长的码字表示。常见的编码方法有Huffman编码、Shannon编码以及算术编码
7、。(4)量化与矢量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为了使整体量化失真最小,就必须依据统计的概率分布设计最优的量化器。最优的量化器一般是非线性的,已知的最优量化器是Max量化器。我们对像元点进行量化时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个点的做法,这种方法称为矢量量化。即利用相邻数据间的相关性,将数据系列分组进行量化。(5)子带(subband)编码。将图像数据变换到频率(pnl)后,按频率(pnl)分带,然后用不同的量化器进行量化,从而达到最优的组合。或者分布渐进编码,在初始时,对某一个频带的信号进行解码,然后逐渐扩展到所有频带。第12页/共81页第十三页
8、,共81页。14算法(sun f)概要 JPEG(Joint Photographic Experts Group)是一个由 ISO和CCITT两个组织机构联合组成的一个图像专家小组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,并且成为国际上通用的标准。JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩,电视图像的帧内图像的压缩编码,也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。标准主要采用了两种基本的压缩算法,一种是采用以离散余弦变换(DCT)为基础的有损压缩算法,另一种是
9、采用以预测(yc)技术为基础的DPCM无损压缩算法。JPEG编码标准编码标准第13页/共81页第十四页,共81页。15JPEG编码标准编码标准n n基于基于DPCMDPCM的无损编码模式:压缩比可以达到的无损编码模式:压缩比可以达到(d(d do)2:1do)2:1。n n基于基于DCTDCT的有损顺序编码模式:压缩比可以达到的有损顺序编码模式:压缩比可以达到(d(d do)10:1do)10:1以上。以上。n n基于基于DCTDCT的递增编码模式的递增编码模式n n基于基于DCTDCT的分层编码模式的分层编码模式JPEG规定了4种运行(ynxng)模式,以满足不同需要:第14页/共81页第十
10、五页,共81页。16JPEG有损顺序编码算法(sun f)的主要计算步骤如下:1.将源图像分成几个颜色平面(分量图像)。2.分成88数据块进行正向离散余弦变换(FDCT)。2.量化(quantization)。3.Z字形排列量化结果(zigzag scan)。4.使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。5.使用行程长度编码(run-length encoding,RLE)对 交流系数(AC)进行编码。6.熵编码(entropy coding)。JPEG编码标准编码标准第15页/共81页第十六页,共81页。
11、17JPEG编码标准编码标准第16页/共81页第十七页,共81页。18译码或者叫做解压缩(y su)的过程与压缩(y su)编码过程正好相反。IDCTJPEG编码标准编码标准第17页/共81页第十八页,共81页。19正向(zhn xin)离散余弦变换 对每个单独的彩色图像分量,把整个分量图像分成(fn chn)88的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。DCT变换(binhun)使用下式计算逆变换使用下式计算JPEG编码标准编码标准第18页/共81页第十九页,共81页。20量化 对于有损压缩算法,JPEG算法使用如图所示的均匀(jny
12、n)量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。JPEG编码标准编码标准第19页/共81页第二十页,共81页。21量化 因为人眼(rn yn)对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。此外,由于人眼(rn yn)对低频分量的图像比对高频分量的图像更敏感,因此图中的左上角的量化步距要比右下角的量化步距小。JPEG编码标准编码标准第20页/共81页第二十一页,共81页。22DC系数DPCM编码和AC系数Z形排列(pili)之后采用RLE编码JPEG编码标准编码标准第21页/共81页第二十二页,共81页。23熵编码(bin m)使用熵编
13、码(bin m)还可以对DPCM编码(bin m)后的直流DC系数和RLE编码(bin m)后的交流AC系数作进一步的压缩。JPEG标准规定了两种熵编码(bin m)算法:哈夫曼编码(bin m)和自适应算术编码(bin m)。哈夫曼编码(bin m)采用的一般是固定的哈夫曼编码(bin m)表,而不是临时统计出来的,并且对亮度分量和色度分量采用了不同的哈夫曼表。JPEG编码标准编码标准第22页/共81页第二十三页,共81页。24基于DPCM的无损编码模式:主要采用(ciyng)了三邻域二维预测编码和熵编码。无失真(sh zhn)编码器源图像(t xin)数据压缩的图像数据预测器熵编码器表说明
14、DPCM预测编码框图JPEG编码标准编码标准第23页/共81页第二十四页,共81页。25JPEG编码标准编码标准基于DCT的递增编码模式:此模式与顺序模式编码步骤基本一致,不同之处在于递增模式每个图像分量的编码要经过多次扫描才完成(wn chng)。第一次扫描只进行一次粗糙的压缩,然后根据此数据先重建一幅质量低的图像,以后的扫描再作较细的扫描,使重建图像质量不断提高,直到满意为止。递增模式分为两种:(1)按频段累进。(2)按位累进。第24页/共81页第二十五页,共81页。26JPEG编码标准编码标准基于DCT的分层编码模式:(1)降低原始图像的空间分辨率。(2)对已经降低分辨率的图像按照顺序编
15、码模式进行压缩并存储或传输。(3)对低分辨率图像进行解码(jim),然后用插值法提高图像的分辨率。(4)将分辨率已经升高的图像作为原图像的预测值,并把它与原图像的差值进行基于DCT的编码。(5)重复步骤3、4直到图像达到完整的分辨率。第25页/共81页第二十六页,共81页。27统计统计(tngj)编码编码1信息(xnx)量与信息(xnx)熵 信息(xnx)量是指从N个相等的可能事件中选出一个事件所需要的信息(xnx)度量或含量,也就是在辨识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj)
16、,因此定义信息(xnx)量见公式4-5。定义信息(xnx)量见公式4-5。如果(rgu)将信源所有可能事件的信息量进行平均,就得到了信息的“熵”,即信息熵。式中,P(xj)是信源X发出xj的概率。I(xj)的含义是,信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。(4-5)第26页/共81页第二十七页,共81页。28熵(熵(Entropy)n n事件集合(样本空间)事件集合(样本空间)X X中每个事件的自信息中每个事件的自信息量量I(x)I(x)是定义在这个样本空间上的一个随机变是定义在这个样本空间上的一个随机变量,所以我们要研究它的统计特性。其数学量,所以我们要研究它的统计特性
17、。其数学期望为:期望为:n nH(X)H(X)表明了集合表明了集合X X中随机事件的平均中随机事件的平均(pngjn)(pngjn)不确定性,或者说平均不确定性,或者说平均(pngjn)(pngjn)信息量。信息量。n n称称H(X)H(X)为一阶信息熵或者简称为熵为一阶信息熵或者简称为熵(Entropy)(Entropy)第27页/共81页第二十八页,共81页。29熵(熵(Entropy)n n在符号出现之前,熵表示符号集中的符号出现的平均不确定性;在符号出现之后,熵代表接收一个(y)符号所获得的平均信息量。n n根据直觉,信源编码的数据输出速率(平均码长)与信源熵之间应该有某种对应关系。第
18、28页/共81页第二十九页,共81页。30信源的概率分布与熵的信源的概率分布与熵的关系关系(gun x)n n熵的大小与信源的概率分布模型有着密切的关系。n n最大离散熵定理:当与信源对应的字符(z f)集中的各个字符(z f)为等概率分布时,熵具有极大值log2m。m为字符(z f)集中字符(z f)个数。第29页/共81页第三十页,共81页。31二进制信源的熵二进制信源的熵n n二进制信源输出一个二进制数码(shm)所携带的平均信息量最大为1bit。pH10.501第30页/共81页第三十一页,共81页。32最大离散熵定理最大离散熵定理(dngl)的应用的应用n n对于同一个信源其总的信息
19、量是不变的,如果能够通过某种变换(编码),使信源尽量等概率分布,则每个输出符号所独立携带的信息量增大,那么传送相同信息量所需要的序列长度就越短。n n离散无记忆(jy)信源的冗余度隐含在信源符号的非等概率 分布之中。只要H(X)小于log2m,就存在数据压缩的可能。第31页/共81页第三十二页,共81页。33编码编码(bin m)信源 X1,X2,XL a1,a2,a3,aK编码器 Y1,Y2,YN b1,b2,b3,bD0,1信源字母表码元表消息(xio xi)分组码字第32页/共81页第三十三页,共81页。34平均平均(pngjn)码长与码长与熵熵n n如果采用如果采用(c(c iyng)
20、iyng)单字符二进制编码方式,单字符二进制编码方式,设字符设字符aj aj的编码长度为的编码长度为LjLj,则信源字母表的平,则信源字母表的平均码长为:均码长为:n n根据前面对二进制信源的分析,有:根据前面对二进制信源的分析,有:在Lj log2pj时,平均(pngjn)码长取得极小值H(X)第33页/共81页第三十四页,共81页。35关于关于(guny)离散无记离散无记忆平稳信源的结论忆平稳信源的结论n n一阶熵即为离散无记忆平稳信源的压缩极限。一阶熵即为离散无记忆平稳信源的压缩极限。(基本极限)(基本极限)n n只要只要(zh(zh yo)yo)信源不是等概率分布,就存在着信源不是等概
21、率分布,就存在着数据压缩的可能性。数据压缩的可能性。n n数据压缩的基本途径之一:使各字符的编码长数据压缩的基本途径之一:使各字符的编码长度尽量等于字符的信息量。度尽量等于字符的信息量。第34页/共81页第三十五页,共81页。36联合联合(linh)熵与条件熵与条件熵熵n n设随机变量设随机变量(su j bin lin(su j bin lin)X)X和和Y Y分别取值于分别取值于符号表符号表a1,a2,ama1,a2,am和和b1,b2,b3,bnb1,b2,b3,bnn n定义定义X X与与Y Y的联合熵为:的联合熵为:n n定义定义X X关于关于Y Y的条件熵为:的条件熵为:第35页/
22、共81页第三十六页,共81页。37离散离散(lsn)有记忆信有记忆信源的冗余源的冗余联合熵与其可能达到的最大值之间的差值反映了该有记忆信源所含的冗余(rn y)度,这种冗余(rn y)是由于随机变量序列之间的相关性造成的。第36页/共81页第三十七页,共81页。38关于离散有记忆平稳关于离散有记忆平稳(pngwn)信源的结论信源的结论n n离散有记忆平稳信源的压缩极限为:离散有记忆平稳信源的压缩极限为:n n压缩的基本途径之二:尽量去除各分量之间压缩的基本途径之二:尽量去除各分量之间的相关性,再对各分量进行独立的相关性,再对各分量进行独立(dl)(dl)编码。编码。n n压缩的基本途径之三:可
23、利用条件概率进行压缩的基本途径之三:可利用条件概率进行编码,阶越高越有利。编码,阶越高越有利。n n压缩的基本途径之四:可将多个分量合并成压缩的基本途径之四:可将多个分量合并成向量,利用其联合概率进行编码,联合的分向量,利用其联合概率进行编码,联合的分量越多越有利。量越多越有利。第37页/共81页第三十八页,共81页。39统计统计(tngj)编码(熵编码(熵编码)编码)n n统计编码(熵编码)包括香农范诺编码、霍夫曼编码和算术编码,其宗旨在于找到一种编码使得平均码长到达熵极限,基本思想就是(jish)对出现概率较大的符号取较短的码长,而对出现概率较小的符号取较大的码长。第38页/共81页第三十
24、九页,共81页。40霍夫曼编码霍夫曼编码(bin m)n n具体步骤:具体步骤:n n(1 1)初始化)初始化n n(2 2)合并概率最小的两个事件)合并概率最小的两个事件(shjin)(shjin)n n(3 3)排序)排序n n(4 4)如果事件)如果事件(shjin)(shjin)个数大于个数大于2 2则重复(则重复(2 2)和)和(3 3)n n(5 5)赋值)赋值n n(6 6)编码)编码第39页/共81页第四十页,共81页。41霍夫曼编码霍夫曼编码(bin m)举例举例符号S1S2S3S4出现概率1/21/41/81/8等长编码00011011霍夫曼010110111H(X)=1.
25、75 L1=2 L2=1.75源S1S2S1S3S2S1S1S4等0001001001000011霍01001101000111第40页/共81页第四十一页,共81页。42霍夫曼编码霍夫曼编码(bin m)的局限性的局限性n n利用霍夫曼编码利用霍夫曼编码(bin m(bin m),每个符号的编码,每个符号的编码(bin m(bin m)长度只能为整数,所以如果源符号长度只能为整数,所以如果源符号集的概率分布不是集的概率分布不是2 2负负n n次方的形式,则无法次方的形式,则无法达到熵极限。达到熵极限。n n输入符号数受限于可实现的码表尺寸输入符号数受限于可实现的码表尺寸n n译码复杂译码复杂
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据压缩 基础 学习 教案
限制150内