《现代通信理论第二章精品文稿.ppt》由会员分享,可在线阅读,更多相关《现代通信理论第二章精品文稿.ppt(103页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现代通信理论第二章第1页,本讲稿共103页 2.1 引言-关于信源编码数字通信系统因具有许多优点而成为当今通信的发展方向。n在数字通信系统中,信道传输的是数字信号。n但是在自然界中,很多信源输出的是模拟量,如话音、图像等。因此在利用数字通信系统进行信息传输时,首先需先对信号(模拟的)数字化,即A/D。n模拟信号的数字化属于信源编码的范畴。第2页,本讲稿共103页数字通信中的编码概念n编码和译码是数字通信发送与接收设备的重要组成部分。第3页,本讲稿共103页数字通信中的编码概念(续)数字通信系统中包含编码和译码,编码的逆过程是译码。数字通信中的编码涉及两部分,含义完全不同:n信源编码n信道编码第
2、4页,本讲稿共103页信源编码的作用 n作用之一是设法减少码元数目和降低码元速率,即通常所说的数据压缩。码元速率将直接影响传输所占的带宽,而传输带宽又直接反映了通信的有效性。我们所熟悉的典型的压缩:音频压缩MP3 图像压缩JPEG、MPEG等n 作用之二是当信息源给出的是模拟信号时,信源编码器将其转换成数字信号,以实现模拟信号的数字化传输。模拟信号数字化传输的方式有脉冲编码调制(PCM)和增量调制(M)、ADPCM等。n作用之三是加密第5页,本讲稿共103页信道编码n信道编码是为了降低误码率,提高数字通信的可靠性而采取的编码。n信道编码技术的基本思想是通过对信息序列作某种变换,使原来彼此独立,
3、相关性极小的信息码元产生某种相关性,从而在接收端利用这种规律检查或纠正信息码元在信道传输中所造成的差错。n具体做法是信道编码器对传输的信息码元按一定的规则加入保护成分(监督元),组成所谓“抗干扰编码”。接收端的信道译码器按一定规则进行解码,从解码过程中发现错误或纠正错误,从而提高通信系统抗干扰能力,实现可靠通信。n与信源编码相反,信道编码提高了可靠性。第6页,本讲稿共103页本章涉及内容n语音信号的编码问题-重点讨论语音编码的基本方法,包括波形编码(脉冲编码调制(PCM),对增量调制(M)、自适应差分脉码调制(ADPCM)、参数编码(线性预测LP)、混合编码(码激励线性预测CELP等。n图像信
4、号的编码问题-压缩编码,如静态图像压缩方法JPEG、动态图像压缩方法MPEG等。第7页,本讲稿共103页 2.2 音频信号编码n语音编码概述n时域波形编码n变换域编码n参数编码n混合编码n各种音频信号编码方法的比较n现代语音处理技术及应用第8页,本讲稿共103页语音编码概述n 语音是人类进行交流的重要手段,通信系统中最常见的数据形式就是语音。语音通信是人类通信最基本、最重要的方式之一。随着移动通信与互联网的飞速发展,语音通信技术也在不断地进行更新并与之相融合。n语音信号的数字化传输和存储,在可靠性、抗干扰语音信号的数字化传输和存储,在可靠性、抗干扰能力、快速交换等方面远胜于模拟化,且灵活方便,
5、易于保密,价格低廉,所以从20世纪50年代以来,数字化语音在通信系统中所占的比重越来越大。语音编码是数字语音通信中的一项重要技术。n为了压缩数字语音传输的比特率,以使同样的信道容量能传输更多路的语音信号,节省存储空间,语音压缩编码也有了很大的发展,并在有线无线电话的话带语音信号、会议电视的宽带语音信号、HDTV和高保真音乐等的音频信号等领域有广泛的应用。第9页,本讲稿共103页语音编码算法语音编码大致分为四种方式:n时域波形编码-不基于声学模型只针对语音波形进行编码n变换域编码-不基于声学模型的编码方法n参数编码-参数编码是基于声学模型的编码方法n混合编码-结合上述几种编码方式的优点 有时也将
6、时域的波形编码和变换域编码统称波形编码,因此也可以称语音编解码算法分为波形编码、参数编码(声码器)和混合编码三类。第10页,本讲稿共103页 2.2.1 时域波形编码n 时域波形编码不基于声学模型只针对语音波形进行编码。这种方法在降低量化每个语音样本比特数的同时,又保持了相对良好的语音质量。n波形编码主要有脉冲编码调制(PCM)、增量调制(M)、自适应增量调制(ADM)、自适应差分脉码调制(ADPCM)等。第11页,本讲稿共103页一、采用PCM的模拟信号数字传输系统m(t)模拟随机信号mo(t)模拟随机信号ak数字随机序列ak数字随机序列模拟信息源受信者数字传输系统抽样、量化和编码译码和低通
7、滤波第12页,本讲稿共103页PCM数字化的过程一般分三步:抽样量化编码m(t)akn“抽样”指抽取样值,或抽取样点,抽样的多少对通信的性能指标有决定影响。0,“1”0,“0”段落序号段落码C2 c3 c4876543211 1 11 1 01 0 11 0 00 1 10 1 00 0 10 0 0电平序号段内码电平序号段内码c5c6c7c8c5c6c7c8151413121110981 1 1 11 1 1 01 1 0 11 1 0 01 0 1 11 0 1 01 0 0 11 0 0 0 765432100 1 1 10 1 1 00 1 1 00 1 0 10 0 1 10 0 1
8、 00 0 0 10 0 0 0第25页,本讲稿共103页(三)(三)编码方法逐次比较法原理图:第26页,本讲稿共103页PCM码流速率计算:第27页,本讲稿共103页PCM系统的抗噪性能第28页,本讲稿共103页3)总信噪比:第29页,本讲稿共103页二、自适应差分脉冲编码调制(ADPCM)64kb/s的A律或律的对数压扩PCM编码已经在大容量的光纤通信系统和数字微波系统中得到了广泛的应用。但PCM信号占用频带要比模拟通信系统中的一个标准话路带宽(3.1kHz)宽很多倍,这样,对于大容量的长途传输系统,采用PCM的经济性能很难与模拟通信相比。以较低的速率获得高质量编码,一直是语音编码追求的目
9、标。通常,人们把话路速率低于64kb/s的语音编码方法,称为语音压缩编码技术。第30页,本讲稿共103页语音压缩编码方法很多,其中,自适应差分脉冲编码调制是语音压缩中复杂度较低的一种编码方法,它可在32kb/s的比特率上达到64kb/s的PCM数字电话质量。近年来,ADPCM已成为长途传输中一种新型的国际通用的语音编码方法(G.721)。ADPCMADPCM是在差分脉冲编码调制(DPCM)的基础上发展起来的,为此,下面先介绍DPCM的编码原理与系统框图。第31页,本讲稿共103页 由于相邻样值的差值比样值本身小,可以用较少的比特数表示差值。这样,用样点之间差值的编码来代替样值本身的编码,可以在
10、量化台阶不变的情况下(即量化噪声不变),编码位数显著减少,信号带宽大大压缩。这种利用差值的PCM编码称为差分PCM(DPCM)。在PCM中,每个波形样值都独立编码,与其他样值无关,这样,样值的整个幅值编码需要较多位数,比特率较高,造成数字化的信号带宽大大增加。然而,大多数以奈奎斯特或更高速率抽样的信源信号在相邻抽样间表现出很强的相关性,有很大的冗余度。利用信源的这种相关性,一种比较简单的解决方法是对相邻样值的差值而不是样值本身进行编码。1、DPCM如果将样值之差仍用N位编码传送,则DPCM的量化信噪比显然优于PCM系统。实现差分编码的一个好办法是根据前面的k个样值预测当前时刻的样值。编码信号只
11、是当前样值与预测值之间的差值的量化编码。第32页,本讲稿共103页DPCM系统原理框图第33页,本讲稿共103页式中,(S/N)q是把差值序列作为信号时量化器的量化信噪比,与PCM系统考虑量化误差时所计算的信噪比相当。Gp可理解为DPCM系统相对于PCM系统而言的信噪比增益,称为预测增益。如果能够选择合理的预测规律,差值功率Ee2n就能远小于信号功率Ex2n,Gp就会大于1,该系统就能获得增益。对DPCM系统的研究就是围绕着如何使Gp和(S/N)q这两个参数取最大值而逐步完善起来的。通常Gp约为611dB。因此DPCM系统总的量化信噪比可表示为第34页,本讲稿共103页可见,DPCM系统总的量
12、化信噪比远大于量化器的信噪比。因此,要求DPCM系统达到与PCM系统相同的信噪比,则可降低对量化器信噪比的要求,即可减小量化级数,从而减少码位数,降低比特率。第35页,本讲稿共103页2、ADPCM值得注意的是,DPCM系统性能的改善是以最佳的预测和量化为前提的。但对语音信号进行预测和量化是复杂的技术问题,这是因为语音信号在较大的动态范围内变化。为了能在相当宽的变化范围内获得最佳的性能,只有在DPCM基础上引入自适应系统。有自适应系统的DPCM称为自适应差分脉冲编码调制,简称ADPCM。第36页,本讲稿共103页ADPCM的主要特点是用自适应量化取代固定量化,用自适应预测取代固定预测。自适应量
13、化指量化台阶随信号的变化而变化,使量化误差减小;自适应预测指预测器系数可以随信号的统计特性而自适应调整,提高了预测信号的精度,从而得到高预测增益。通过这两点改进,可大大提高输出信噪比和编码动态范围。如果DPCM的预测增益为611dB,自适应预测可使信噪比改善4dB;自适应量化可使信噪比改善47dB,则ADPCM比PCM可改善1422dB,相当于编码位数可以减小3位到4位。因此,在维持相同的语音质量下,ADPCM允许用32kb/s比特率编码,这是标准64kb/sPCM的一半。因此,在长途传输系统中,ADPCM有着远大的前景。相应地,CCITT也形成了关于ADPCM系统的规范建议G.721、G.7
14、26等。ADPCM(续)(续)第37页,本讲稿共103页三、增量调制(M或DM)1、与PCM区别PCM码表示样值大小,N位码,M代码表示相邻样值的关系,一位码,是DPCM的特例。2、M基本原理(1).编码第38页,本讲稿共103页M波形示意e(ti)=m(ti-)-m(ti-)0e(ti)=m(ti-)-m(ti-)0输出1,上升一个台阶s输出0,下降一个台阶s第39页,本讲稿共103页波形编码小结PCM、M、ADPCM是基于时域的波形编码技术,不基于声学模型。波形编码器作用于所有输入信号,因此会产生高质量的样值。然而,波形编码器工作在高比特率。例如:ITU-G.711规范(PCM)用的比特率
15、为64kbps。*引出其它编码,目的是降低比特率,提高有效性。第40页,本讲稿共103页 2.2.2 变换域编码-频域编码变换域编码方式也是不基于声学模型的编码方法,但对信号进行频域处理,再编码。典型的变换域编码有子带编码(SBC)第41页,本讲稿共103页子带编码(subband coding,SBC)SBC利用带通滤波器将语音频带分成若干子带,并且分别进行采样、编码,编码方式可以用ADPCM或ADM,SBC速率可以达到96kbs。可变SBC可使子带的设计不固定,而是随共振峰变化,使编码效率进一步提高,这种方式在码率为48kbs时可具有相当于72kbs的固定SBC的语音质量。第42页,本讲稿
16、共103页SBC原理框图(a)编码器(b)解码器 第43页,本讲稿共103页子带编码应用n1976年子带编码技术首次被美国贝尔实验室的R.E.Crochiere等人应用于语音编码。n子带编码器SBC愈来愈受到重视。在中等速率的编码系统中,SBC的动态范围宽、音质高、成本低。使用子带编码技术的编译码器已开始用于话音存储转发(voice store-and-forward)和话音邮件,采用2个子带和ADPCM的编码系统也已由CCITT作为G.722标准向全世界推荐使用。n1986年Woods等将子带编码又引入到图像编码,此后子带编码在视频信号压缩领域得到了很大发展。目前,已经研制出采用子带编码技术
17、的具有演播室质量的140Mbps HDTV硬件编解码系统。第44页,本讲稿共103页 2.2.3 参数编码(参量编码)n与波形编码不同,参量编码又称为声源编码(声码器),是将信源信号提取特征参量,并将其变换成数字代码进行传输。解码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。n具体说,参量编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可靠性,即保持原语音的语意,但重建信号的波形同原语音信号的波形可能会有相当大的差别。n这种编码技术可实现低速率语音编码,比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特
18、别是自然度较低,连熟人都不一定能听出讲话人是谁。线性预测编码(LPC)及其它各种改进型都属于参量编码。第45页,本讲稿共103页声码器n声码器(vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接收端,用来导出语音产生模形。第46页,本讲稿共103页声码器质量n在电话系统中使用声码器,语音质量不够好。第47页,本讲稿共103页n对于语音数据,人们已经找到了较合理的声道模型,声音数据的参数编码方法就是基于声音参数的分析与合成来实现的。声道模型在声音合成等领域也有成功应用。n统计表明,语音过程是一个近似的短时随机过程。所谓短时,是指在1030ms的范围。由于这一性质,使一帧
19、一帧地处理语音信号成为可能,每一帧的信号近似满足同一模型,提取模型参数即可再现信号。这是方法假设的基本前提。实际应用中,每帧取20ms。语音参数编码原理第48页,本讲稿共103页n语音生成机构模型:声源。声源分三类:元音:由声带的自激振动所产生;摩擦音:靠声道变窄时气流所产生的喘流噪声产生;爆破音:由闭合的声道急速打开时形成的脉冲波所产生的喘流噪声所产生。模型中用基音周期基音周期参数描述声源。共鸣机构,也称声道。由鼻腔、口腔与舌头组成。模型中用共振峰共振峰参数描述。放射机构:由嘴唇和鼻孔组成,其功能是发出声音并传播出去。模型中用语音谱和声强语音谱和声强参数描述。常用语音参数-基音周期、共振峰、
20、语音谱、声强等。第49页,本讲稿共103页 分帧:声音变为帧序列f1,f2,。计算每一帧fi的参数向量(基音周期,共振峰,语音谱,声强)i。直接传送参数向量或对参数向量进行矢量量化。语音参数编码过程:第50页,本讲稿共103页LPCn线性预测编码(LPC)用来获取一时变数字滤波器的参数。这个滤波器用来模拟说话人的声道输出。n由图一中所示,声音的产生被模拟成声源和声道两个部分构成。声源为噪声和脉冲两种,声道相当于一个滤波器,气管口腔形状不同相当于声道滤波器的参数不同,最后就生成不同声音。第51页,本讲稿共103页参数编码小结n参数编码数据量小,但计算量很大。n由于声音从发声模型出发,不是从波形出
21、发仿真,保真难度大,目前的保真度还很差。例如,某人说了一句话,分析出参数再由参数合成的声音,能听出这段话的字句就合格了,听起来不是机器语言,即自然度好一些已相当不错了,要能听出谁在说话就不容易。n由于压缩比高,成本低,很多低档的学习机就是采用了这种语音压缩方式,出来的声音生硬、含混不清、毫无语感,对英语的语音学习不但毫无帮助,而且会误导正确的语音学习。第52页,本讲稿共103页 2.2.4 混合型编码n混合编码则是在波形编码和参数编码的基础上,以相对较低的比特率上获得较高的语音质量,所以其数据率和音质介于二者之间。n当波形编码的比特率每声道低于16kbps后,音质下降很快。而参数法由于机理本身
22、就是一种模拟,比特率上升到10kbps以上后再上升音质也没有多少改善。n所以,两者结合的混合编码法就被消费类电子公司开发出来。第53页,本讲稿共103页发展与应用n计算机的发展为语音编码技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现,则为语音编码的实现提供了基础。n80年代以来,语音编码技术有了实质性的进展,产生了新一代的编码算法,这就是混合编码。它将波形编码的高质量和参量编码的低数据速率组合起来,克服了原有波形编码和参量编码的弱点,结合各自的长处,力图保持波形编码的高质量和参量编码的低速率,在4-16Kbit/s速率上能够得到高质量的合成语音。n目前较为成功的混合型编码方案有多
23、脉冲激励线性预测编码(MPLPC)和码激励线性预测编码(CELP)。n很显然,混合编码是适合于数字移动通信的语音编码技术。第54页,本讲稿共103页LDCELPn低时延码激励线性预测编码 是Low Delay-Code Excited Linear Prediction的缩写。16kbits LDCELP是CCITT G.728语音编码标准算法,这种法在CELP算法的基础上,采用后向自适应线性预测、50阶合成滤波、短激励矢量(5个样值)等改进方法,从而达到高质量和低时延的目的,总的编码时延小于2ms。第55页,本讲稿共103页RPE/LTPn规则脉冲激励长时预测线性预测编码 是Regular
24、Pulse Excited-Long Term Predition-Linear Predictive Coding的缩写。这种算法是MPE-LPC的改进算法,除了增加长时预测功能外,激励脉冲的位置具有一定的规律。这种算法是欧洲900MHz数字蜂窝移动电话的语音编码标准(GSM),也为数字蜂窝系统DCS1800所采用。MPE-LPC(多脉冲线性预测编码)n多脉冲线性预测编码 是Multi-Pulse Excited LPC的缩写。这种算法在一帧语音中选择几十个典型脉冲作为激励信号。INMARSAT的9.6kbits语音编码航空标准采用这种算法。第56页,本讲稿共103页VSELPVSELP(矢
25、量和激励线性预测编码)n矢量和激励线性预测编码 是Vector Sum Excited Linear Prediction的缩写。这种算法采用三个码本作为激励信号,其中两个是随机码本,一个是自适应码本,最终的激励信号是三个激励矢量的和。美国电信工业协会(TIA)选择8kbits VSELP算法作为北美第一代数字蜂窝移动电话的编码标准(IS54)。日本的全速率数字移动电话也采用VSELP算法作为语音编码标准(JDC),速率为6.7kbits。第57页,本讲稿共103页 2.2.5 各种音频信号编码方法的比较编码方法传输速率(kb/s)最小基带带宽(kHz)质量PCMADPCMSBC+ADPCMM
26、SBC(子带)RPE/LTP(规则脉冲激励)LD-CELP(低延迟码激励)MPE/LPC(多脉冲)CELP(码本激励)LPC(线性预测)LPC+VQ(矢量量化)6432643216161684.82.41.23216321688842.41.20.6长途电话质量长途电话质量广播质量通信质量通信质量通信质量接近长途质量通信质量通信质量合成质量合成质量第58页,本讲稿共103页电话质量的音频(0.3-3.4K kHz)G728,LD-CELP 16kb/s,GSM,RPE/LTP,13kb/s,(欧洲移动)GTIA,VSELP,8kb/s(美国移动)NSA,CELP,4.8 kb/s NSA,LP
27、C,2.4kb/s 第59页,本讲稿共103页调幅广播质量的音频n50Hz-7kHz n采样率16KHz,14bit 量化,PCM码率224Kb/s,采用G.722(子带)标准可压缩到64Kb/s,适于ISDN的B信道,传输高质量语音。第60页,本讲稿共103页高保真立体声音频压缩标准n即CD音质音频20Hz-20KHzn采样率44.1kHz,,16位量化,立体声n数据量为 44.1*16b*2=1411.2kb/s=176.4KB/sn1小时为 176.4KB/s*3600s=635MB n目前,采用MPEG音频标准,有三层(第三层MP3),采用子带及熵编码技术,可压缩到每声道32kb/s-
28、448kb/s第61页,本讲稿共103页MP3及其基本原理nMP3就是采用国际标准MPEG中的第三层音频压缩模式,对声音信号进行压缩的一种格式,中文也称电脑网络音乐。MPEG中的第三层音频压缩模式比第一层和第二层编码要复杂得多,但音质最高,可与CD音质相比。第62页,本讲稿共103页多媒体视听业务音频 nITU关于电视电话系统和终端设备的技术标准针H.320用于ISDN网,不适合窄带电话网,而H.324既适合高速数字网,也适合在普通电话之类的窄带网上使用,H.323标准用于质量不能保证的局域网LANn在H.320中,语音编码标准为G.711(64 kb/s)、G.722(64 kb/s)、G.
29、728(16 kb/s),nH.324分配给语音带宽6.5 kb/s(高采用MP-MLQCELP)和5.3K(低采用ACELP),采用的语音压缩标准为G.723nH.323系统语音压缩方法有6种,即G.711(64 kb/s)、G.722(64 kb/s)、G.728(16 kb/s)、G.723、G.729、MPEG AUDIO 第63页,本讲稿共103页 2.2.6 现代语音处理技术及应用第64页,本讲稿共103页 2.3 图像信号的压缩n图像信号压缩的必要性n图像信号压缩基础n图像压缩编码方法n图像压缩编码标准第65页,本讲稿共103页 2.3.1图像信号压缩的必要性n与文字信息不同,图
30、像信息占据大量的存储容量,而且传输的带宽有限n例1:一张A4(210mm297mm)大小的照片,若用中等分辨率(300dpi)的扫描仪按真彩色扫描,其数据量为多少?(注:dpi表示每英寸像素,1英寸25.4mm)n若按每像素3个字节计算,上述结果为约26Mn例2:目前的WWW互联网包含大量的图像信息,如果图像信息的数据量太大,会使本来就已经非常紧张的网络带宽变得更加不堪重负(World Wide Web变成了World Wide Wait)第66页,本讲稿共103页图像信号压缩的必要性(续)n视频数据量:n对于电视画面的分辨率640*480的彩色图像,每秒30帧,则一秒钟的数据量为:640*4
31、80*24*30=221.12Mbit/s=28MB/sn实时传输:在10M带宽网上实时传输的话,需要压缩到原来数据量的0.045n存储:1张CD可存640MB,如果不进行压缩,1张CD则仅可以存放20几秒的数据n可见,单纯依靠增加存储器容量和改善信道带宽无法满足需求,必须进行压缩第67页,本讲稿共103页 2.3.2 图像压缩编码基础图像数据的压缩机理来自两个方面:n一是利用图像中存在大量冗余度可供压缩;n二是利用人眼的视觉特性。第68页,本讲稿共103页(1)空间冗余在一幅图像中规则的物体和规则的背景具有很强的相关性。(2)时间冗余电视图像序列中相邻两幅图像之间有较大的相关性。(3)结构冗
32、余和知识冗余图像从大面积上看常存在有纹理结构,称之为结构冗余。(4)视觉冗余人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。1图像数据的冗余度第69页,本讲稿共103页(1)亮度辨别阈值 当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。2人眼的视觉特性第70页,本讲稿共103页n(2)视觉阈值视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。n(3)空间分辨力空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨
33、力,视觉对于不同图像内容的分辨力不同。n(4)掩盖效应“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。第71页,本讲稿共103页图像压缩的可能性与基本思想n各种冗余和视觉特性就是压缩图象数据的出发点和依据。图象编码的目的就在于采用各种方法去除冗余和不太重要的部分内容,以尽量少的数据量来表示个重建图象。n压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一。第72页,本讲稿共103页 2.3.3 图像压缩的方法n图像压缩方法有很多种,而且很多方法还在不断地发展和完善。从不同的角度出发有不同的分类方法
34、。1.根据解压重建后的图像与原始图像是否有误差,可分为无损压缩与有损压缩两大类;第73页,本讲稿共103页图像压缩的方法(续)2.根据实施编码所在的数据域可分为空间域和变换域编码第74页,本讲稿共103页(1)基于图像信源统计特性的压缩方法,有预测编码、变换编码、矢量量化编码、子带小波编码和神经网络编码法等。(2)基于人眼视觉特性的压缩方法,有基于方向滤波的图像编码法和基于图像轮廓纹理的编码法等。(3)基于图像景物特征的压缩方法,有分形编码法和基于模型的编码方法等。3.根据压缩机理的不同,数据压缩编码方根据压缩机理的不同,数据压缩编码方法大致可以分成三类法大致可以分成三类第75页,本讲稿共10
35、3页图像压缩的方法图像压缩有损压缩无损压缩行程编码LZW编码哈夫曼编码算术编码无损预测编码位平面编码有损预测编码分形编码模型编码子带编码神经网络编码变换编码K-L变换Haar变换Walsh.Hadamard变换离散余弦变换离散傅立叶变换斜变换小波变换第76页,本讲稿共103页衡量一个压缩编码方法优劣的重要指标n(1)压缩比要高,有几倍、几十倍,也有几百乃至几千倍;(2)压缩与解压缩要快,算法要简单,硬件实现容易;(3)解压缩的图像质量要好。n需要说明的是选用编码方法时一定要考虑图像信源本身的统计特征;多媒体系统(硬件和 软件产品)的适应能力;应用环境以及技术标准。第77页,本讲稿共103页几种
36、典型的图像压缩方法原理n霍夫曼(Huffman)编码n游程编码n预 测 编 码n变换编码n混合编码第78页,本讲稿共103页 1.霍夫曼(Huffman)编码 霍夫曼(Huffman)编码是一种可变长编码,编码方法如下图所示。(1)将输入信号符号以出现概率由大至小为序排成一列。(2)将两处最小概率的符号相加合成为一个新概率,再按出现概率的大小排序。(3)重复步骤(2),直至最终只剩两个概率。(4)编码从最后一步出发逐步向前进行,概率大的符号赋予“0”码,另一个概率赋予“1”码,直至到达最初的概率排列为止。第79页,本讲稿共103页霍夫曼(Huffman)编码将最常出现(概率大的)的符号用最短的
37、编码,最少出现的符号用最长的编码。第80页,本讲稿共103页n游程编码(RLC,Run Length Coding)是一种十分简单的压缩方法,它将数据流中连续出现的字符用单一的记号来表示。例如,字符串5310000000000110000000012000000000000可以压缩为5310-10110-08120-12,其中,“-”后面两个数字是“-”前面数字的连续个数。游程编码的压缩率不高,但编码、解码的速度快,仍被得到广泛的应用,特别是在变换编码后再进行游程编码,有很好的效果。2.游程编码第81页,本讲稿共103页3.预 测 编 码n(1)预测编码基本原理n预测编码是根据某一模型利用过去
38、的样值对当前样值进行预测,然后将当前样值的实际值与预测值相减得到一个误差值,只对这一预测误差值进行编码。-DPCM第82页,本讲稿共103页n(2)预测方法n1)帧内预测n帧内预测利用图像信号的空间相关性来压缩图像的空间冗余,根据前面已经传送的同一帧内的像素来预测当前像素。n2)帧间预测n电视图像在相邻帧之间存在很强的相关性。3.预 测 编 码(续)第83页,本讲稿共103页n图像变换编码是将空间域里描述的图像,经过某种变换(如傅立叶变换、离散余弦变换、沃尔什变换等)在变换域中进行描述。这样可以将图像能量在空间域的分散分布变为在变换域的相对集中分布,便于用“Z”(zig-zag)字形扫描、自适
39、应量化、变长编码等进一步处理,完成对图像信息的有效压缩。4.变换编码第84页,本讲稿共103页n 变换编码将被处理数据按照某种变换规则映射到另一个域中去处理,图像编码采用二维正交变换的方式,若将整个图像作为一个二维矩阵,变换编码的计算量太大。所以将一幅图像分成一个个小图像块,通常是88或1616小方块,每个图像块可以看成为一个二维数据矩阵,变换编码以这些小图像块为单位进行,变换编码把统计上密切相关的像素构成的矩阵通过线性正交变换,变成统计上较为相互独立,甚至完全独立的变换系数所构成的矩阵。第85页,本讲稿共103页n在常用的正交变换中,DCT(Discrete Cosine Transform
40、)变换的性能接近最佳,是一种准最佳变换。DCT变换矩阵与图像内容无关,是因为它构造成对称的数据序列,避免了子图像轮廓处的跳跃和不连续现象。DCT变换也有快速算法(FDCT),在图像编码的应用中,大都采用二维DCT变换。典型的变换编码方法-离散余弦变换(DCT)第86页,本讲稿共103页图像块的DCT变换(a)背景部分图像块的DCT;(b)细节部分图像块的DCT第87页,本讲稿共103页Z字形扫描第88页,本讲稿共103页n混合编码是近年来广泛采用的方法,这种方法充分利用各种单一压缩方法的长处,以期在压缩比和效率之间取得最佳的平衡。如广泛流行的JPEG和MPEG压缩方法都是典型的混合编码方案。5
41、.混合编码第89页,本讲稿共103页 2.3.4 图像压缩编码标准n制定图像标准的国际组织是ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)n静止图像:JPEG(Joint Photographic Expert Group,联合图像专家组)n通常为有损压缩(采用DCT变换编码),JPEG是目前静态图像压缩比最高的,但失真的程度非常小n也支持无损压缩(采用预测编码),但压缩比降低(无损压缩的压缩比总有个极限)n运动图像:MPEG(Moving Picture Expert Group,运动图像专家组)第90页,本讲稿共103页1.JPEG压缩流程n编码流程:n解码流程:量化器DC
42、T变换构造8x8的子图输入图像符号编码器压缩数据量化表码表压缩数据符号解码器DCT逆变换反量化器量化表输出图像码表(从压缩数据中得到)第91页,本讲稿共103页颜色空间转换nJPEG使用的颜色空间不是RGB空间,而是YCbCr空间,在进行DCT变换之前完成,这是因为人眼对亮度信息更敏感,相互之间的转换为:R=Y+1.40200(Cr 128)G=Y 0.34414(Cb 128)0.71414(Cr 128)B=Y+1.77200(Cb 128)Y =0.299R+0.5870G+0.1140BCb=0.1787R 0.3313G+0.5000B+128Cr=0.5000R 0.4187G 0
43、.0813B+128第92页,本讲稿共103页量化nY为亮度分量,需要细量化,CbCr为色度分量,可以粗量化,因此量化表有2张),从而提高压缩比nDCT变换之后n低频分量集中在左上角,代表直流(DC)系数,由于两个相邻的子块DC系数相差很小,采用差分编码(DPCM),可以提高压缩比n后面的63个元素为高频分量,代表交流(AC)系数,采用行程编码,通过“之”字型(Zigzag)排列方法来保证低频分量先出现,高频分量后出现第93页,本讲稿共103页JPEG压缩前后的比较nCompression Ratio 8.9124:1第94页,本讲稿共103页2.运动图像压缩标准n连续帧图像的定义n由多幅尺寸
44、相同的静止图像组成的图像序列,被称为连续帧图像。n与静止帧图像相比,连续帧图像多了一个时间轴,成为三维信号,因此连续帧图像也被称为三维图像第95页,本讲稿共103页运动图像压缩标准n基本思想:n基于如下基本假设:各连续帧之间存在着相关性。n帧内编码:针对一帧进行编码n帧间编码技术:根据前后帧的像素来编码,通过减少帧间图像数据冗余,来达到减少数据量、压缩连续帧图像体积的目的:n将连续帧图像序列,分为参考帧和预测帧,参考帧用静止图像压缩方法进行压缩(帧内编码),预测帧对帧差图像进行压缩(帧间编码)n由于帧差图像的数据量大大小于参考帧的数据量,从而可以达到很高的压缩比第96页,本讲稿共103页帧间运
45、动补偿预测编码技术第97页,本讲稿共103页帧间预测编码nI 帧:不进行预测、进行帧内编码(参考帧)nP帧:通过向前预测得到的误差编码帧nB帧:通过双向预测得到的误差编码帧,因图像序列存放在存储器中,可以使用下一帧n向前预测n双向预测前一帧前一帧当前帧当前帧前一帧前一帧当前帧当前帧下一帧下一帧第98页,本讲稿共103页运动补偿n物体在空间上的位移,用有限的运动参数(如运动矢量)加以描述,并和预测误差一同参与编码n实现时,画面一般划分成一些不连接的像素块(在MPEGl和MPEG2标准中一个像素块为1616像素),对于每一个这样的像素块,只估算一个运动矢量K帧K+l帧块查找窗口第99页,本讲稿共1
46、03页3.国际信源编码标准的制定 目前,国际上音视频编解码标准主要有两大系列:n ISOIECJTC制定的MPEG系列标准,数字电视采用的是MPEG系列标准;MPEG(Moving Picture Expert Group)运动图像专家小组是一个专门研究与制订活动图像以及相应音频编码标准的组织。它成立于1988年,到现在为止已陆续公布了一系列的规则与标准。如 MPEG-1、MPEG-2、MPEG-4 MPEG-7、MPEG-21,其中MPEG-2似乎已为公众公认的一种压缩规则了。n ITU针对多媒体通信制定的H.26X系列(H.261、H.263、H.263+、H.264)视频编码标准和G.7
47、系列(G.721、G.728、G.723)音频编码标准。第100页,本讲稿共103页4.国内信源编码标准的制定关于关于“数字音视频编解码技术标准工作组数字音视频编解码技术标准工作组”(简称(简称AVS工作组)工作组)数字音视频编解码技术标准工作组由国家信息产业部科学技术司于2002年6月批准成立。工作组的任务是:面向我国的信息产业需求,联合国内企业和科研机构,制(修)订数字音视频的压缩、解压缩、处理和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编解码技术,服务于高分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。第101页,本讲稿共103页本章小结n信源编码研究的内容n*音频信号编码方法-三种语音编码方法的特点、性能比较n*图像信号压缩编码方法-JPEG、MPEG第102页,本讲稿共103页练习1.信源编码的作用有哪些?2.语音信号编码方法有哪些?各自的优缺点?3.一路采用PCM编码的语音信号速率为多少?4.要传输数字语音信号,若实际信道的容许速率低于64kbit/s,可采用的编码方法有哪些?5.图像信号的压缩编码方法和标准有哪些?第103页,本讲稿共103页
限制150内