基于matlab的数字图像预测压缩编码-本科论文.doc
-
资源ID:88291088
资源大小:1.79MB
全文页数:44页
- 资源格式: DOC
下载积分:10金币
快捷下载
![游客一键下载](/images/hot.gif)
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
基于matlab的数字图像预测压缩编码-本科论文.doc
摘 要摘 要 随着时代的发展,人们可以通过Internet获取大量的信息。这些信息中包含着大量的图像信息,它们占据了很大的数据量,这给信息的存储和传输带来了极大的挑战。图像压缩的目的就是用尽量少的字节来表示图像,并且要求重建图像具有较好的质量。利用图像压缩, 可以减轻图像存储和传输的负担, 使得图像在网络上实现快速传输和实时处理成为现实。通常,图像中局部区域的像素是高度相关的,因此可以利用先前像素的有关知识来对当前像素的灰度值进行估计,这就是预测。本文介绍了数字图像的预测压缩编码。首先,将图像分成8×8大小的像素块。接着,对每一像素块均采用AR模型,利用Burg算法确定最佳线性预测系数。然后,通过线性差分方程计算得到预测值,最后对实际像素值和预测值之间的差值量化后进行算术编码。从而实现数字图像的预测压缩编码。本文采用MATLAB提供的图形用户界面工具对三幅典型的标准灰度图像进行了预测压缩编码仿真,并用客观标准和主观标准综合评价重建图像的质量。仿真结果表明:重建图像与原始图像几乎没有任何差异,能够满足人们的视觉需求。另外,数据压缩比较高且峰值信噪比均在20dB-40dB之间。因此,采用MATLAB实现数字图像的预测压缩编码是一种较好的压缩编码方法,能够在实际中得到广泛的应用。关键词:图像压缩,线性预测,算术编码,MATLAB,图形用户界面IAbstractAbstractPeople can obtain a great amount of information from the Internet with the development of times and it includes a great amount of image information. The image information occupies huge data and it gives great challenge to information storage and transmission. The aim of image compression is to donate image with bytes as few as possible. The reconstructed image is of relatively good quality is also required. The burden of image storage and transmission can be alleviated by image compression and it turns fast transmission and real-time process of an image in internet into reality.Generally, the pixel in the partial region of an image is highly correlated. So the correlated knowledge of foregoing pixel can be used to estimate the gray value of current pixel. This is called prediction. The paper introduces the predictive compression coding. Firstly, the image is divided into several sub-images of size 8×8. Secondly, AR model is used to each sub-image and then Burg algorithm is used to determine the optimum linear prediction coefficient. Thirdly, linear differential equation is used to calculate the predictive value. Finally, the difference between real pixel value and predictive value is quantized before doing arithmetic coding. Then the predictive compression coding of a digital image is realized.The paper simulate the predictive compression coding as to three typical and standard gray images by using graphic user interface tools offered by MATLAB. Objective and subjective standard is adopted to evaluate the quality of reconstructed image.The results of simulation demonstrate that there is no difference between reconstructed image and original image and reconstructed image can satisfy human visual requirements. Additionally, compression ratio is relatively high and peak signal-to-noise ratio is between 20dB to 40dB. Therefore, the realization of predictive compression coding using MATLAB is a relatively good method and it can be widely used in practice.Key words: image compression, linear prediction, arithmetic coding, MATLAB, graphical user interfaceI目 录目 录第1章 引 言11.1 图像压缩的课题来源与发展现状11.1.1 课题来源11.1.2 发展现状21.2 论文结构3第2章 数字图像概述与图像压缩评价标准42.1 数字图像文件存储42.2 数字图像的文件格式42.3 图像压缩的评价标准52.3.1 客观保真度准则52.3.2 主观保真度准则6第3章 预测编码73.1 脉冲编码调制73.2 差分脉冲编码调制8第4章 AR模型104.1 时间序列的概率模型104.1.1 时间序列的参数表征104.1.2 平稳过程114.1.3 纯随机过程114.1.4 自回归过程(AR模型)114.2 AR模型的参数估计124.2.1 AR模型参数的最小二乘估计124.2.2 AR模型参数估计的格型算法134.2.3 AR模型阶数p的确定17第5章 算术编码195.1 一般算术编码195.1.1 算术编码过程195.1.2 算术解码过程205.2 改进的算术编码215.2.1 算术编码过程215.2.2 小结22第6章 MATLAB概述及仿真结果236.1 MATLAB概况236.2 MATLAB的语言特点236.3 MATLAB图形用户界面设计246.3.1 图形用户界面的创建与组成246.3.2 图形用户界面编程266.3.3 图形用户界面编程过程286.4 MATLAB仿真结果28第7章 结论及展望327.1 结论327.2 展望32致 谢33参考文献34附 录35基于MATLAB的数字图像预测压缩编码第1章 引 言1.1 图像压缩的课题来源与发展现状1.1.1 课题来源21世纪,人类已经进入信息化时代,计算机在处理各种信息中发挥着巨大的作用。而大部分信息都具有海量性,因此数据压缩技术就成了解决信息的传输与存储问题的重要方法。现今,数据压缩技术已经走进人们的日常生活中。你在使用任何一种智能电子产品的时候,数据压缩技术都在忙碌地为你服务。数据压缩(Data Compression),是指在一定的数据存储空间要求下,将相对庞大的原始数据,重组为满足前述空间要求的数据集合,使得从该数据集合中恢复出来的信息能够与原始数据相一致, 或者能够获得与原始数据一样的使用品质。早在Shannon信息理论建立之前,数据压缩的研究就已经有了成果。但是理论研究还是在Shannon的信息论基础上开始的。20世纪40年代Claude Shannon首创了信息论,Shannon借用了热力学中的名词“熵”( Entropy)来表示一条信息中真正需要编码的信息量:考虑用0和1组成的二进制数码为含有n个符号的某条信息编码,假设符号在整条信息中重复出现的概率为,则该符号的熵也即表示该符号所需的位数位为:。整条信息的熵也即表示整条信息所需的位数为:。对字符串: aabbaccbaa,字符串长度为10,字符a b c 分别出现了5,3,2次,则a b c 在信息中出现的概率分别为0.5,0.3,0.2,它们的熵分别为:。整条信息的熵也即表达整个字符串需要的位数为:位。如果使用计算机中常用的ASCII编码,则表示上面的字符串需要80位。用较少的位数表示较频繁出现的符号,这就是数据压缩的基本准则。图像压缩作为数据压缩的一个分支也在迅猛发展。人类从自然界获取的信息中,视觉信息占据了2/3。“百闻不如一见”,很多花大量语言不能描述清楚的场景,利用一幅图片就可以很直观生动地表现出来。可见,在当代高度信息化的时代,图形和图像在信息的传播中起的作用越来越大。但是,图像信息占用的存储空间也是非常巨大的,由此不得不考虑图像压缩。一幅二维数字图像可以由一个二维亮度函数通过采样和量化后而得到的一个二维数组表示。这样一个二维数组的数据量通常很大,从而对存储、处理和传输都带来了许多问题,提出许多新的要求。为此人们试图采用对图像新的表达方法以减少表示一幅图像需要的数据量,这就是图像编码所要解决的主要问题1。压缩数据量的主要方法是消除冗余数据,从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集。这个转换要在图像进行存储、处理和传输之前进行, 然后将压缩了的图像解压缩以重建原始图像,即通常所称的图像编码和图像解码。1.1.2 发展现状1948年Olive提出了第一个编码理论脉冲编码调制(Pulse Coding Modulation, 简称PCM)理论。同年Shannon的经典论文“通信的数学原理”中首次提出并建立了信息率失真函数概念。1959年他又进一步确立了码率失真理论,从而奠定了信息编码的理论基础。此后,图像压缩编码理论和方法都有很大发展。主要的编码方法有预测编码,变换编码,统计编码, 也称为三大经典编码方法2。1985年Kunt等人提出了“第二代”图像编码技术。他们认为,“第一代”图像编码技术是指以信息论和数字信号处理技术为理论基础,旨在去除图像数据中的线性相关性的一类编码技术。这类技术去除客观和视觉的冗余信息的能力已接近极限,其压缩比不高,大约在101 左右。而“第二代”图像编码技术是指不局限于信息论的框架,要求充分利用人的视觉生理心理和图像信源的各种特征,能获得高压缩比的一类编码技术,其压缩比多在301 至701 之间,有的甚至高达成10013。 “第二代”图像编码方法包括子带图像编码、基于方向性分解的图像编码技术、基于区域分割与合并的图像编码技术等。此后,图像压缩编码技术逐渐向标准化方向发展。国际远程通讯联合会ITU (International Telecommunication Union) 和国际标准化组织ISO(International Organization for Standardization)及国际电工委员会IEC(International Electrotechnical Commission)近年来在全世界范围内积极工作,已经制定并在继续制定一系列静止和活动图像编码的国际标准,这些标准和建议是在相应领域工作的各国专家合作研究的成果和经验的总结。由于这些国际标准的出现,图像编码尤其是视频图像编码压缩技术得到了飞速发展。目前基于小波变换技术的新的静止图像压缩标准JPEG2000已经公布。常用的运动图像标准是MPEG-4于1998年11月公布,同年10月国际标准化组织又推出了MPEG-7的构想,最终于2001年初完成并公布。现今,图像压缩编码的新技术也层出不穷。例如分形图像编码是在分形几何理论的基础上发展起来的一种编码方法。分形几何是欧氏几何理论的扩展,它描述了了自然界物体的自相似性,这种自相似性可以引入迭代函数来刻画,并将其用于图像编码。基于分形(Fractal)的压缩方法的应用十分广泛,与多媒体领域相关的应用有不规则几何造型、图像处理等方面。小波变换在图像压缩中的应用也取得了很大的进展,小波(Wavelet)分解编码本质上是一种变换编码技术。简单地说,小波变换就是将原图像信号分解成不同的频率区域,对不同的频率区域采用不同的压缩编码手段,从而使数据量减少。这种方法非常适合满足视觉要求的图像压缩编码方法,并且压缩比可以达到100左右。同傅立叶变换相比,小波变换在频率精度上差一些,在时间的分析能力上好一些,而且对时间和频率可以同时分解,这是傅立叶变换无法做到的。随着计算机技术的发展与普及,更完善的图像压缩标准的制定以及高性能数字图像信号处理器的出现,图像编码技术尤其是数字视频图像压缩编码技术作为一门高技术,必将越来越显示出它在社会发展中的重要地位。它既是当代信息高速公路、高清晰度电视(HDTV)、多媒体、可视电话和图文传真等技术的关键,又在航空侦察遥感、资源勘探及生物医学工程等领域起着非常重要的作用。1.2 论文结构本论文共分为7章。第1章讲述了论文课题的来源及图像压缩的发展现状,并对整篇论文的结构进行了概括。第2章简单介绍了数字图像的表示方法、存储格式及常用的数字图像的格式,给出了评价图像压缩效果的客观保真度准则和主观保真度准则。第3章叙述了预测编码的原理,介绍了应用线性预测来进行数据压缩编码的一种实现图像与语音信号的DPCM编码方法。第4章详细描述了用来进行线性预测的一个数据模型,即AR模型。第5章介绍了本设计系统中的量化编码算法算术编码。第6章对设计中使用的仿真软件MATLAB进行了介绍,特别是其图形用户界面设计部分,最后给出了仿真的结果。第7章得出了结论,然后展望数字图像压缩技术的发展前景。31第2章 数字图像概述与图像压缩评价标准用计算机对图像进行存储和传输时的前提是图像必须是以数字的形式存储的,我们以数字格式存储的图像称为数字图像。在计算机中,图像被分割成若干像素(Pixel),各像素的灰度值用整数表示。一幅像素的数字图像,其像素灰度值可以用M行、N列的矩阵G表示,即2.1 数字图像文件存储数字图像文件存储方式有:(1)位映射图像。以点阵形式存取文件,读取时候按点排列顺序读取数据。(2)光栅图像。也是以点阵形式存取文件,但读取时候以行为单位进行读取。(3)矢量图像。用数学方法来描述图像。2.2 数字图像的文件格式数字图像的文件格式有很多种,主要有:(1) BMP图像文件格式 BMP是一种与硬件设备无关的图像文件格式,使用非常广泛。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。(2) PCX图像文件格式PCX是最早支持彩色图像的一种文件格式,现在最高可以支持256种彩色。PCX图像文件中的数据都是用PCXREL技术压缩后的图像数据。PCX是PC机画笔的图像文件格式。PCX的图像深度可选为lbit、4bit、8bit。由于这种文件格式出现较早,它不支持真彩色。PCX文件采用RLE行程编码,文件体中存放的是压缩后的图像数据。因此,将采集到的图像数据写成PCX文件格式时,要对其进行RLE编码;而读取一个PCX文件时首先要对其进行 RLE解码,才能进一步显示和处理。(3) GIF文件格式GIF(Graphics Interchange Format)的原义是“图像互换格式”。 GIF文件的数据是一种基于LZW算法的连续色调的无损压缩格式,其压缩率一般在50左右,它不属于任何应用程序。GIF的图像深度从lbit到8bit,也即GIF最多支持256种色彩的图像。GIF格式的另一个特点是其在一个GIF文件中可以存储多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。(4)JPEG文件格式JPEG是Joint Photographic Experts Group(联合图像专家组)的缩写,文件后辍名为"jpg"或"jpeg",是最常用的一种有损压缩的图像文件格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低。但是,JPEG是一种很灵活的格式,具有调节图像质量的功能,允许用不同的压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在10:1到40:1之间,压缩比越大,品质就越低。2.3 图像压缩的评价标准图像压缩的实质是在一定质量条件下,以最少比特数来表示一幅图像。为了比较各种压缩方法的效率,定义了压缩比。通用的压缩比可定义为: (2.1)式中为原图像每像素使用的比特数;为压缩后平均每像素使用的比特数。(2.1)式中给出了原信息率和压缩后信息率之间的关系。图像质量的评价是对图像压缩与处理系统优劣的检验。一般地,允许图像压缩后再恢复的图像具有一定的误差,因此需要某种准则来评价压缩后的图像质量。保真度准则就是这样一种压缩后评价图像质量的准则。保真度准则有两种:客观保真度准则和主观保真度准则。前者以压缩前后图像的误差来度量,后者则取决于人的主观感觉4。2.3.1 客观保真度准则客观保真度准则是原图像和压缩后图像之间的均方误差或压缩后恢复图像的信噪比或峰值信噪比。对于灰度图像,设原始图像为,压缩后恢复的图像为,且图像尺寸为 ,A为中的最大值,则均方误差为: (2.2)归一化均方误差为: (2.3)信噪比定义为: (2.4)式中:为原始图像的方差,为失真图像的方差。失真图像定义为原始图像和恢复图像的差: (2.5)也即 (2.6)峰值信噪比PSNR定义为: (2.7)2.3.2 主观保真度准则具有相同客观保真度的不同图像,在人的视觉中可能引起不同的视觉效果。这是因为客观保真度准则是一种统计平均意义下的度量准则,对于图像的细枝末节无法反映出来。而且人的视觉还有很多特性,如对光强敏感度呈对数特性,使得图像暗区的误差比其亮区误差影响更重要;对灰度突变特别敏感性,使得发生于图像边缘轮廓附近的误差,比发生在一般背景上的误差对图像质量有更坏的影响等。这些因素用客观保真度是无法表示出来的,因此需要根据人的主观感觉来评价。主观评价的任务就是要把人对图像质量的主观感觉与客观参数和性能联系起来,只要主观评价正确,就立刻用相应的客观参数作为评价图像质量的依据。表2.1给出了主观保真度的6级评价准则。表2.1 主观保真度准则评分评价说明1优秀图像质量非常好2良好图像质量高,观看舒服,有干扰但不影响观看3可用图像质量可接受,有干扰但不太影响观看4刚可看图像质量差,干扰有些影响观看,希望改进5差图像质量很差,干扰严重妨碍观看6不能用图像质量极差,不能使用第3章 预测编码预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。预测编码中典型的压缩方法有脉冲编码调制(PCM,Pulse Code Modulation)、差分脉冲编码调制(DPCM,Differential Pulse Code Modulation)、自适应差分脉冲编码调制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它们较适合于声音、图像数据的压缩,因为这些数据由采样得到,相邻样值之间的差相差不会很大,可以用较少位来表示。3.1 脉冲编码调制 对模拟信号进行抽样并把样值量化,通过编码转换成数字信号的调制方式,称为脉冲编码调制,简称脉码调制。脉码调制包括抽样、量化和编码三个过程。每隔一定时间从连续变化的话音模拟信号中取出一个瞬时值,从而得到一系列电平幅度不同的脉冲信号,即脉幅调制(PAM)信号,这个过程称为抽样。抽样后,各脉幅调制信号的电平幅度用量化级来衡量。量化级分为有限数目的幅度间隔。在某一级幅度范围内的抽样脉冲都取同一值。这个过程称为量化。经过量化的脉冲幅度只是近似于脉幅调制信号,由此产生的误差,称为量化失真。最后,将量化后的每一脉冲幅值用一组二进制数字代码表示。这个过程称为编码。标准的脉码设备,其量化级为256级,因此要用8位二进制数字编码()。在量化和编码时,用来规定各个量化级的相对数值的规律,称为编码律。具有压缩扩展特性的折线编码律,较为常用。国际上,现有的标准编码律有A律和律两种,前者采用13折线近似,后者采用15折线近似。编码数字脉冲沿线路传输时会受到衰减和噪声干扰。因此,每传送一定距离,必须对脉冲进行识别和再生,使其幅度和波形恢复原状。这个过程称为再生。在接收端,把编码的数字脉冲重新变换为量化的脉幅调制信号,称为译码。然后脉幅调制信号经低通滤波器还原成原来的连续变化的话音信号5。PCM通信系统框图如图3.1所示。 图3.1 PCM通信系统框图图中,输入信号m(t)经抽样、量化、编码后变成了数字信号(PCM)信号,经信道传输到达接收端,先由译码器恢复抽样值序列,再经滤波器滤出模拟基带信号6。3.2 差分脉冲编码调制在PCM系统中,原始的模拟信号经过采样后得到的每一个样值都被量化成为数字信号。为了压缩数据,可以不对每一样值都进行量化,而是预测下一样值,并量化实际值与预测值之间的差值,这就是DPCM(Differential Pulse Code Modulation,差分脉冲编码调制)。1952年贝尔(Bell)实验室的C. C. Cutler取得了差分脉冲编码调制系统的专利,奠定了真正实用的预测编码系统的基础。DPCM的组成如图3.2所示,其中编码器和解码器分别完成对预测误差量化值的熵编码和解码。图3.2 DPCM系统原理框图DPCM系统工作时,发送端先发送一个起始值,接着就只发送预测误差值,而预测值可记为 (3.1)式中表示的时序在之前,为所谓因果型预测,否则为非因果型预测。接收端把接收到的量化后的预测误差与本地算出的相加,即得恢复信号。如果没有传输误差,则接收端重建信号与发送端原始信号之间的误差为: (3.2)这正是发送端量化器产生的量化误差,即整个预测编码系统的失真完全由量化器产生。因此,当已经是数字信号时,如果去掉量化器,使,则,即。这表明,这类不带量化器的DPCM系统也可用于无损编码。但如果量化误差,则,为有损编码7。如果预测方程式的右方是各个的线性函数,即 (3.3)即得常用的线性预测,又称线性预测编码(LPC,Linear Predictive Coding)。LPC在语音处理中得到广泛应用,并在此基础上发展了许多算法,典型的有:多脉冲线性预测编码(MPLPC),规则脉冲激励编码(RPE),码激励线性预测(CELP),代数激励线性预测(ACELP),矢量和激励线性预测(VSELP),QCELP(Qualcomm CELP,变速率CELP),低延时码激励线性预测(LD-CELP),共轭结构代数激励线性预测(CS-ACELP),混合激励线性预测(MELP),间隔同步更新码激励线性预测(PSI-CELP),松弛码激励线性预测(RCELP),残差激励线性预测(RELP),规则脉冲激励长时预测(RPE-LTP)等。为了能够正确恢复被压缩的信号,不仅在接收端有一个与发送端相同的预测器,而且其输入信号也要相同(都是,而不是),动作也与发送端的预测器环路(即发送端本地的反量化和解码部分)完全相同。在图像信号中应用DPCM时,用作预测的像素和被预测的像素可以在同一行,也可以在不同行(同一帧),甚至在不同帧,分别称为一维预测、二维预测和三维预测。声音信号中的预测只是一维预测8。DPCM的优点是算法简单,容易硬件实现,缺点是对信道噪声很敏感,会产生误差扩散。即某一位码出错,对图像一维预测来说,将使该像素以后的同一行各个像素都产生误差;而对二维预测,该码引起的误差还将扩散到以下的各行。这样,将使图像质量大大下降。同时,DPCM的压缩率也比较低。随着变换编码的广泛应用,DPCM的作用已很有限。第4章 AR模型4.1 时间序列的概率模型根据信息论的观点,载有信息的信号总是含有随机因素的。从数学上说,随机过程可定义为随机变量的一个集合,其中T为定义随机过程时间点的集合。如果T是连续的,则用表示在时刻t的随机变量;如果T是离散的,则用表示在时刻t的随机变量。由于我们主要讨论离散随机变量,为区别起见,常用记离散时刻,用表示离散随机变量。因此,随机过程是按时间顺序排列的随机变量的集合。对于随机过程的一次实现来说,每个随机变量只有一个确定的的观察值(用表示),这些观察值按概率规律在时间轴上分布,组成一个时间序列。我们可以把这个时间序列看成可能观察到的时间序列的无限集合中的一列。这个无限的时间序列的集合称为总体。总体中的每一个元素叫做随机过程的一个可能的实现或样本函数9。4.1.1 时间序列的参数表征描述随机过程的一种比较简单有用的方法是确定被称作矩的参数,特别是均值(一阶矩)、方差和自协方差函数(二阶矩)。(1)均值均值函数的定义为 (4.1)(2)方差方差函数的定义为 (4.2)(3)自协方差自协方差的定义为 (4.3)这里的和是同一时间序列两个不同时刻的随机变量。当自协方差函数就是方差函数。(4)自相关自相关函数的定义为 (4.4)从数值上可认为它是归一化了的自协方差函数,因而与的度量无关。从物理意义上来看,它表征了序列在不同时刻的取值的相关程度。4.1.2 平稳过程一个随机过程,如果对所有的及,随机变量的联合分布与相同,则该随机过程是严格平稳的,即严格平稳随机过程的联合分布不受时间原点的影响,而只取决于之间的间隔。特别是当N=1时,与的分布相同,取任意值。所以,它们都是与t无关的常数。严格平稳过程有时也叫强平稳过程。若一个过程的均值为常数,则自协方差函数只与时延有关,即 (4.5) (4.6)则该过程成为弱平稳过程。4.1.3 纯随机过程若集合中的随机变量是一列相互独立、相同分布的随机变量,则称随机过程为纯随机过程。因为分布不因时间不同而改变,显然该过程为严格平稳过程。于是有 (4.7)及 (4.8)把纯随机过程称为白噪声或白噪声序列,因为该序列功率谱密度为 (4.9)是一个常数,即序列的普密度在各个频率上具有相同的分量。4.1.4 自回归过程(AR模型)假设是一个均值为0,方差为的纯随机过程。如果有一个过程满足 (4.10)则称此过程为p阶回归过程,记为AR(p)或称为AR模型。AAR(1)模型(Markov过程)1阶自回归过程简写为AR(1)过程,也叫Markov过程,即每个当前信号值只与前一时刻信号值有关,其表达式为 (4.11)应用后移算子B为 (4.12)上式改写为 (4.13)因而有 (4.14)这就是MA()的表达式。也就是说,1阶自回归过程可用无限多阶MA过程来表示。BAR(p)过程AR(p)过程的表达式见(4.10),其所对应的系统稳定的充分必要条件是系统的特征根多项式 (4.15)的根在复平面的单位圆内。其中为AR(p)模型系数。用AR(p)模型来作线性预测,从物理意义上来说,是只用信号的P个过去值来预测当前值。尽管这种预测并不总是十分合理,但在允许某些失真条件下,还是得到了广泛的应用。4.2 AR模型的参数估计对于时间序列,其AR(p)模型为, (4.16)参数估计就是按照一定方法估计出这个参数。由于有 (4.17) (4.18)则一旦估计出,就可以按式(4.18)估计出,因此AR(p)模型的参数估计即指对 这p个参数的估计。参数估计的方法分为直接法和间接法两类:直接法包括最小二乘法、解Yule-Walker方程法等,间接法包括LUD法、Burg法等。4.2.1 AR模型参数的最小二乘估计设AR(p)模型表达式为 (4.19)该式改写成矢量形式为 (4.20)其中。给出t时刻的n组观测值或信号样值 则有 (4.21)其中 写成矩阵形式为 (4.22)式中与为待估计的未知量,故有 (4.23)与是由观测值确定的已知矢量与矩阵 (4.24)则对的最小二乘估计为 (4.25)4.2.2 AR模型参数估计的格型算法APARCOR系数对于,建立Yule-Walker方程为 (4.26)称 序列为的部分相关系数或PARCOR系数,并记作。方程组(4.26)中的表示第j个参数的第k次迭代结果。 可以从开始逐次推出,直至时得到。其递推公式为 (4.27) B格型结构用AR(p)模型进行信号的线性预测的基本关系式为 (4.28)这里为一组观测值,为模型参数。而为时刻的预测值。预测误差为 (4.29)采用Durbin递推算法,在第k次迭代后,产生的预测误差为 (4.30)进行Z变换得 (4.31)定义一个误差滤波传递函数A(Z)为 (4.32)则(4.31)传递函数可写为 (4.33)改写后有 (4.34)该式代表了误差滤波器的递推结构10。若时刻信号通过以为传递函数的滤波器,则该滤波器的输出便为时刻的第次迭代预测误差值。为了得到的递推式,可用乘式(4.34)两边,然后作反变换,即对 (4.35)作反变换。等式左边与右边第一项的反变换显然为与。令 (4.36)从两方面考虑它的反变换。一方面将 作为误差滤波器的传递函数;另一方面当作递推形式,作出反变换的递推结果。首先,作为传递函数。将(4.33)中换成,得到,并代入式(4.36)则有 (4.37)其反变换可表示为(对应于时刻) (4.38)从形式上看,也代表着一个预测误差,参与预测信号的样值为时刻的个样值,定义为后向预测,相应地把称为后向预测误差。相应地为前向预测误差。其次,考虑的递推形式。将式(4.34)中换成后,将代入式(4.36),得 (4.39)其反变换可表示成 (4.40)右边第一项是由是(4.36)推出来的,因为只要改写 (4.41)对照式(4.36),将换成,为单位时延,便有的形式。若对式(4.35) 作反变换,应用上面结果,便有 (4.42)式(4.41)与(4.42)是一对交叉递推关系式,据此可以直接画出递推结构,即所谓的格型滤波结构,如图4.1所示。图中n代表离散时间变量,而与 则表示第0次迭代。图4.1 格型结构流图CPARCOR系数的计算