《《高阶谱分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《高阶谱分析》PPT课件.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 高阶谱分析 6.1三阶相关和双谱的定义及其性质 6.2累量和多谱的定义及其性质 6.3累量和多谱估计 6.4基于高阶谱的相位谱估计 6.5基于高阶谱的模型参数估计 6.6利用高阶谱确定模型的阶 6.7多谱的应用第六章 高阶谱分析6.0 引言我们先回顾一下前面的所学的知识。维纳Filter,自适应信号处理,现代谱估计等,都是用信号模型分析法,代替了信号波形分析法。在这些理论中,认为:一个平稳随机信号是由图6-1所示信号模型产生:V(n)u(n)y(n)x(n)H(z)h(n)图6-1 随机信号的模型其中:是均值为零,方差为的高斯(正态)白噪声。是线性时不变系统,具有最小相位。则信号的谱与
2、模型参数有如下关系:(6.1)模型中,还假设:加性测量噪声是高斯白噪声,其均值为0,方差为1,且与信号统计无关,即不影响信号的谱形状,即:(6.2)从上面的式子,可以看出,功率谱(及相应的自相关函数)是不含信号的相位信息的被称为“盲相”的。而在实际中,往往非高斯,不是最小相位,甚至是非线性的,也往往不是白色的。这就需要用高阶谱来分析信号。6.1 三阶相关和双谱的定义及性质一、定义 设为零均值,三阶实平稳随机序列,其三阶相关函数为:(6.3)(2nd-order它的二维付里叶变换就是双谱(Bi-spectrum)。bi-spectrum (6.4)二、性质 三阶相关函数的对称性(symmetry
3、 Properties)(6.5)这可以通过定义式,直接证明。0003210 1 2 31/8平面内值!意义:只要知道图中由,两直线在第一象限中所限定的无限三角形内的,就可以得知整个平面内所有的的值。双谱的对称性,周期性和共轭性:当为实序列时,由定义和三阶相关函数的对称性很易证明!说明意义:(共轭性:Conjugate Symmetric Properties)双谱的对称性和周期性说明,只要知道如图中的阴影部分内的,就可知道整个平面内各点的值。确定性序列的双谱 设为有限长确定性序列,其双谱为:(6.6)其中:0-平面内的值可以这样来证明:的三阶相关函数为 其双谱为:双谱中的相位信息 由 ,并设
4、:则有:(6.7)例:求一正弦波 和含直流分量的正弦波 的双谱。解:的频谱 是两个 的函数 由双谱定义式(确定序列):的双谱,只在 的公共交点上有非零值(即三个因子全不为0时,)有三组线:,0三组线没有共同交点 的频谱 为 同理,只是这时每组直线变成三根:0 从上例可见,双谱可以显示一个系统的对称性,即输出中有无直流分量。实际上,一双谱还可以显示系统是否显现非线性,输出将含有高次谐波,如 等。若 除了含有 外还有 ,则每组直线将含四根,他们有六个公共交点。利用这个特点,即可监测机械系统是否发生损坏而产生高次谐波振动。6.2 累量和多谱的定义及其性质 前面讨论了三阶相关及其付里叶变换双谱。它不是
5、将K阶相关or K阶矩定义为K阶谱,而是将与高阶矩相关的参数累量作为高阶谱的付氏变换对。只是特别的,三阶累量正好与三阶相关等同。6.2.1 随机变量的累量(probability density function)设随机变量x的概率密度函数为 ,则 的特征函数为:(6.8)Taylor Series(泰勒)展开:这里:,为 的 阶累量例:考察具有特殊地位的高阶随机变量 的累量 解:的概率密度函数 为其特征函数 :结果表明,高斯随机变量的二阶以上的累量为零。这是因为二阶以上的矩不提供新的信息。二、累量与矩的关系 先将按泰勒级数展开 代入 写成:(6.10a)又由累量定义式,还可写成:(6.10b
6、)比较这两个式子:项次:可见:二、三阶累量分别就是二、三阶中心矩。当均值为零时,就是二、三阶相关。但四阶及其更高阶累量相应的中心矩。累量的物理意义:一阶累量是随机变量的数学期望,大致地描述概率分布的中心。二阶累量是方差,描述了概率分布的离散程度。三阶累量是三阶中心矩,描述了概率分布的非对称性。定义:(无量纲)为偏态系数,或偏态(歪斜度)。显然,正态随机变量 的偏态 ()设 ,对四阶累量的分析(正态随机变量)而正态随机变量的四阶矩为:说明:累量是任意随机变量的矩与正态随机变量的同阶矩的差。用均方差的四次方 除四阶累量,记为 Kurtosis峰度 为峰态,显然正态分布 =0 正态分布比正态分布尖锐
7、的直线 比正态分布平坦的曲线x0f(x)6.2.2 随机过程的累量 考虑随机序列 的 阶累量。设矢量 ,是随机矢量;矢量 ,是 的特征函数的自变量。的 阶累量 定义为累量生成函数 的泰勒级数展开式中 的系数。其中累量生成函数为 即 (6.11)随机过程的累量与前面讨论的随机变量的累量类似,只是用矢量代替了标量,所以它们所用的运算方法和所得到的结论都是类似的。多普的定义 设 为平稳随机过程,其 阶累量 是绝对可和的,则 的 阶谱 定义为 阶累量的 重傅里叶变换,即 通常把 的 称为高阶谱或多谱,特别地,将三阶谱 称为双谱,四阶谱 称为三谱。6.2.4 累量和多谱的性质1、累量具有对称性 2、相互
8、独立的两随机序列的组合序列的累量等于零3、随机信号通过线性系统后的累量等于随机信号的累量系统冲激响应的累量的卷积4、信号的高阶累量能够决定模型的冲激响应6.3 累量和多谱估计 在信号模型中,信号 的累量可根据式(6.17b)由信号模型的冲激响应 来计算。但在许多实际应用中,信号的累量只能够由测量到的有限长数据序列 来估计。结合第四章中自相关函数的估计式(4.5),也可以用时间平均代替统计平均,来求得累量 的估计 称为取样累量。例如均值为零的信号的三阶取样累量为 (6.30)式中,是在区间R内的取样数。四阶取样累量要复杂一些,根据式(6.12)可知,四阶累量与四阶相关和二阶相关有关,因此,四阶取
9、样累量定义为 (6.31)式中,二阶累量的估计 就是第四章中式(4.5)所表示的自相关函数的估计取样自相关。累量估计的计算量比自相关估计大得多,而且估计方差也大得多。通常应用分段、加窗等平均、平滑技术来减少估计的方差。6.4 基于高阶谱的相位谱估计 自相关函数丢失了信号的相位信息,而由累量可以得到信号的相位谱。在图6.1所示的信号模型中,把随机信号 看成是由白噪声 激励线性系统 产生的。设非最小相位系统表示为 ,其中 是相位谱。在实际应用中,使用与三阶累量对应的双谱 和四阶累量对应的三谱 就够了。根据式(6.18b),它们与系统频率特性 有如下关系:(6.32)(6.33)根据式(6.32)或
10、式(6.33),可由估计得到的 或 推算出系统 的相位谱 。一般有迭代算法和矩阵伪逆算法两种估计相位谱的方法,下面介绍矩阵伪逆算法。(1)由 推算 在实际应用中,都是用离散值进行计算。式(6.32)的离散形式为 (6.34)式中的 对应于 。这里,是 和 的取样间隔,即假设它们的取样间隔相等,表示为 。当 或 等于N时,对应的 或 等于 。取初值 。因此,和 离散化后分别用整数 和 表示 。在图6.2(b)的阴影区域所表示的双谱的主值区域中,的取值为 ;的取值为 。由式(6.34)可以得到方程组 将以上方程组写成矩阵形式式中 可以证明,的秩等于N-1,可以消去 中与 有关的最后一行,便得到一组
11、满秩方程 式中,矩阵 的维数决定于N是奇数还是偶数。当N是奇数时,维数为 ;当N是偶数时,维数为 最后,通过伪逆求解,得到 (2)由 推算 式(6.33)的离散形式为 定义 取 ,初值 ,有 写成矩阵形式 式中,且矩阵 是 的正定矩阵,对其直接求逆便得到相位谱 6.5 基于高阶谱的模型参数设计6.0 引言 根据已知的有限长的数据序列来估计图6.1所示的随机信号模型的参数,称为模型参数估计。模型可以是AR模型、MA模型和ARMA模型,估计它们的参数时,要依据一定的准则,例如通常比较多地采用最小均方差准则。第四章讨论基于自相关函数的模型参数估计问题。在那里,估计得到的模型参数仅与信号的自相关函数或
12、功率谱包络相匹配,只适合于高斯随机信号(因为高斯过程仅用二阶统计量就能够完全加以描述)。基于自相关函数的模型参数估计存在以下几个问题。(1)若要估计非高斯信号的模型参数,那么仅仅考虑与自相关函数相匹配,就不可能充分获得隐含在数据中的信息。(2)若信号不仅是非高斯的而且还是非最小相位的,那么采用基于自相关函数的估计方法所得的模型参数,由于它只能是最小相位的,所以反映不出原信号的非最小相位的特点。(3)当测量噪声较大,尤其当测量噪声是有色噪声时,基于自相关函数方法所得的模型参数有较大的估计误差。基于高斯谱的模型参数估计方法能够有效地解决上述三个问题。考虑图6.1所示的信号模型,现在假设,图中的 是
13、平稳非高斯白噪声序列,;是高斯有色噪声;是有理传输函数,其差分方程如式(6.24)所示。将式(6.25)、式(6.26)和式(6.28)合写成一个公式如下:该式在形式上类似于式(4.8)。考虑到 ,是因果的,即当 时上式右端等于零,便可从上式得到所谓高阶Yule-Walker,方程如下:,(6.35)下面分别讨论基于高斯谱的AR、MA和ARMA模型参数及阶数的估计。对各种算法的复杂程度、抗噪能力及它性质则不作深入讨论。6.5.1 AR模型参数估计令ARMA模型的差分方程式(6.24)中的 ,就得到模型。这种情况下,高阶Yule-Walker方程式(6.35)成为 式中,是一个取任意值的参量,是
14、信号 阶 累量的一维“切面”,即在 中,仅有 是自变 量,其它参数均 为固定值。上式中取 个线性方程联立,令 ,则上式可表示成 其中 和 矩阵 具有Toeplitz性质,参数 的选择应保证 的秩为 ,从而可解出 个变量 。但这个问题的求解尚无一般性结论。通常为“安全”起见,取 个一维切面,即取 ;取 ;将对应的线性方程联立求解,得到 。在常用的三阶和四阶累量Yule-Walker方程中,系数分别为 和由于基于累量来估计AR模型参数的方法,也归纳为求解Yule-Walker方程,因此,这种方法与基于自相关函数估计AR模型参数的方法具有类似的估计性质,同时也同样存在着估计的稳定性问题。与4.6节中
15、讨论的AR谱估计性质相类似,AR过程的多谱估计与已知的多谱相匹配程度,也可以用线性预测误差的多谱来度量,同样也可以用多谱的平坦度来衡量。若用前 个 值作线性预测(见式4.42)即 则预测误差为 根据式(6.18b)可写出预测误差 的多谱为若线性预测系数 ,使得上式中 为一常量,则有 (6.36)即确实是由的非正态白噪声激励一个参数为的AR过程所 产生的。因此,预测误差的多谱的平坦程度可以作为AR过程与实际多谱接近程度的度量。另一方面,用多谱来估计AR模型参数,也存在着稳定性问题。在用功率谱估计AR模型参数时,为解决稳定性问题,只要把不稳定的极点替换成其倒数极点(它们关于园是对称的)就行了,因而
16、用多谱来估计AR模型参数时,却不能作这种替换(即将 换成 ),因为以双谱为例,而,可以看出 与 并不相等。对其它高阶谱也是一样。因此,用多谱估计AR模型参数时,必须用合适的方法把非稳定极点变换成非因果AR过程。实际上,非因果AR模型在一些特殊情况下,例如,在天文信号、空间信号、地质信号以及被污染了的图像信号的处理中大量得到应用。非因果AR模型估计方法通常有三种:全搜索法,优化计算法和转换为MA模型法。6.5.2 MA模型参数估计对于由第四章中的式(4.11)所表示的MA模型,已有不少用累量方法估计模型参数 的方法。这些方法大致可分为三类:闭合解方法,线性代数方法和非线性优化方法。式(6.22)
17、或式(6.23)就是闭合解方法的公式。这种方法抗噪音能力差,而且没有提供任何关于估计误差和修正方差的信息,因此难以实际使用。但它有理论分析价值。比较而言,线性代数方法最为实用。优化方法涉及非线性问题。因而实现起来比较困难。但近年来,有人提出用类人工神经网络的并行结构解非线性规划问题,从而可以实现优化方法。下面讨论后两类算法。线性代数法 为了得到基于累量的关于变量 的线性方程,需要利用信号的二阶统计量与高阶统计量之间的关系。先考察累量 的一维切面 :式中,m为参量,取任一数值。例如,当 时,是 的一维对角切面 。的傅里叶变换记为 ,其Z变换记为,即 根据累量计算公式(6.17b)以及Z变换的性质
18、,上两式可分别表示成 上式代入式(6.38),得到 (6.39)式(6.39)给出了高阶谱与二阶谱之间的关系,它对应的时域表达式为 (6.40)根据累量的对称性,可以只取其主区域(参见图6.2(b)的阴影区域),即取 。若取 ,则式(6.40)的右端仅有一项是非零值,于是得到线性方程组 和 (6.38)式(6.38)中,是 的Z变换,实际上 符号*表示复卷积。再考虑二阶谱 即功率谱 ,由式(4.9)得知:或写成 常用的三阶和四阶累量线性方程组分别为 利用最小二乘法即可由上两式的任一式子解出式中的q+1个变量值 和 。当存在测量噪声时,在此情况下,若,则可不需要知道。2、非线性优化算法 优化算法
19、有全搜索法和非线性最小二乘法两种方案。全 搜索法与前面介绍的AR模型的全搜索法相同,只是需要 将代之以。现在讨论非线性二乘法。以三阶累量为例,首先由N个已知数据 来估计三阶累量,得到 利用累量的对称性质,只需要计算图6.2(b)的阴影区域(即主区域)中的累量,即上式中的 和 只取以下点上的值:然后,调整q+1个参数 和 使下式所示的代价函数 最小:(6.41)调整参数可以采用迭代算法,如最陡下降法、牛顿法或Marqnardt-hevenberg等。例如,用最陡下降法式中,是增益常量,由式(6.40)得到 这是一个非线性最小二乘方问题,Mendel等人提出用人工神经网络来实现这个问题的求解。人工
20、神经网络将在本书第八章中讨论。6.5.3 ARMA模型参数估计人们已提出不少基于累量的ARMA模型参数估计方法。下面介绍其中的三类方法:剩余时间序列法、非线性优化法和相位恢复法。1、剩余时间序列法 实际上这就是第四章4.10.2节中的方法。这种方法分成三步来完成。第一步:估计ARMA模型中的AR系数 ,可采用最小二乘方或AR模型参数估计等真法来求解超定线性方程组式(6.35),其中取 第二步:求剩余时间序列 ,其中 是由ARMA模型差分方程决定的信号,即 是对 的估计:式中,是 的估计值。现在假设 ,则有 就是说,剩余时间序列 是一个MA 模型;第三步:用前面介绍的任何一种MA模型参数估计方法
21、估计 。2、非线性优化法 该方法与MA模型参数估计的非线性二乘法相同,也分两步进行。第一步:根据测量数据 估计自相关函数 (式(4.5)和累量 (式(6.30)或式(6.31)。第二步:设矢量求最佳估计 ,使下式表示的代价函数 最小 式中,为一常数。3、相位恢复法 首先,基于二阶统计量(即功率谱)估计出一个最小相位的参数模型,然后,用各种技术恢复相位信息。下面介绍三种恢复相位的技术。第一,全搜索法。这种方法前面已经讨论过。其具体步骤是:首先,基于二阶统计量估计出最小相位模型 ;然后,将若干零点映射到单位圆外,极点不动,使代价函数(式(6.37)最小,从而得到非最小相位系统 。值得注意的是,这种
22、方法丢失了系统 中的全通因子,称为盲全通因子的方法。这是因为第一步处理中采用的是相关函数的信息(即二阶统计量)。设某一系统的 为 式中,是全通因子,它对幅度特性没有任何贡献,但却提供了部分相位信息。只要采用了相关处理,全通因子就会被丢掉。第二,相位估计法。首先基于二阶统计量估计出 的模 ,即由 得出 。然后基 于高阶谱估计 的相位谱 。第三,系统级联法。将最小相位系统 分解成一个最小相位系统 与一个全通系统 的级联。基于二阶统计量来进行估计,然后用作相位校正。与 的功率谱相同。6.6 利用高阶谱确定模型的阶 由于累量含有相位信息,且具有抗有色高斯噪声的能力,所以基于高阶谱来确定模型的阶,比基于
23、功率谱要可信。但信息论中的一些准则,如AIC等是以二阶统计为基础,而且应用了高斯过程的似然函数,所以这些准则对于有色高斯测量噪声的干扰便不适用。下面讨论基于高阶谱来确定 模型的阶的方法。至于 模型和 模型的阶的确定问题,只不过是 模型的特例。高阶Yule-Walker方程式(6.32)描述了ARMA模型。为了书写方便,以三阶累量为例,并注意到 ,变量 ,将方程写成以下矩阵形式:记为 (6.42)若 矩阵 的秩为 ,则式(6.42)可唯一确定AR系数 。因此,选择适当的 ,可使得 为满秩。但是,可以找到某些ARMA模型,对所有的 都不是满秩的。因此,取累量的 个切面:得出个联立方程:为:上式左端
24、的 的矩阵记为 。可以证明,矩阵 有满秩 。将 更加一般化地表示为 ,上述结论仍然成立,这里 (6.43)即是说,的秩为 ,或者说,的非零奇异值有 个(关于奇异值分解,见附录6.3)。根据上述原理,ARMA 模型的阶 的确定,可按以下步骤进行。第一步:由先验知识给出 和 的上限和。例如,在语音分析中,可以证明,声道的AR模型的阶 的上限 ;第二步:写出矩阵 ,取 。根据测量数据 估计累量 ;第三步:对 作奇异值分解,非零奇异值的个数即为阶数 。实际上,由于用估计值 代替真值 ,所以所有的奇异值 从大到小排列,都不为零。选择有效的AR模型 的方法是找出差值最大的奇异值 ,以确定阶数 。实际上,奇
25、异值分解法还可以同时被用来估计AR参数 ,它具有保留全通因子的特点。但这里不进行讨论,可参阅本章参考文献6。关于MA模型的阶的确定,有几种不同的方法,如:由高阶谱相位得到极零点阶数差的方法,直接计算累量法等.下面介绍直接计算累量法。对于ARMA模型,可先确定AR模型的阶 ,并估计AR模型系数 ,再用剩余时间序列方法得到 模型,这个模型由方程式(6.20)描述。很明显,最后一个非零累量的时延就是阶数 。以三阶累量式(6.21)为例,有 6.7多谱的应用 多谱已广泛地应用于海洋学、地球物理学、生物医学、机械学等学科领域,用于经济时间序列分析,细菌迁移分析,激光脉冲模式分析,用于声呐信号、天文信号、
26、图像信号、语音信号、雷达信号的处理。对于信号处理技术 领域来讲,多谱可用于自适应信号处理。阵列信号处理和多维信号处理。应用多谱的动机大致有以下几点:(1)从非正态信号中提取信息。这是基于累量描述了信号与正态分布偏离的程度。实际上,任何周期信号、准周期信号都是非正态的。例如,复杂的机械系统自身“辐射”的信号都是非正态的。(2)检测盒定性分析一个系统的非线性特征。根据多谱的相位与谐波的关系,可检测和分析机械系统、电子系统或其他物理系统,以及一些检测系统,如水下传感器、空间传感器、心电信号传感器、脑电信号传感器等所具有的非线性特征。图6.3(c)所示的就是非线性检测的例子。(3)从有色正态测量噪声中
27、提取信号。实际上,水下信号、空间信号等的测量噪声都是有色的高斯噪声。高姐谱对正态噪声是零响应,或称为是盲正态的。因此,可以较好地从噪声中分离出信号。例如,在声呐、雷达、地球物理及光学等领域中,都用到了时延估计技术。设接收到的两个信号序列为 和 ,他们分别被描述为 和 。若假设 是正态信号,测量噪声 和 是互相独立的正态噪声,那么很显然,和 的最佳匹配发生在时移等于 时,因为它们的互相关为其峰值出现在 处。但实际上,和 是有色的。由于数据记录是有限长的,可被认为是非正态的。这时,于是 的峰值并不出现在 处。但若采用三阶量 ,那么峰值将出现在 上。(4)提取非正态信号的相位信息。这时基于,高阶谱含有信号的相位信息。这对于非最小相位系统的识别和解逆滤波的问题十分有效。系统识别和逆滤波是很多领域中人们关心的问题,这些领域大到人类系统、经济系统、生物系统,小到控制系统和通信系统。在3.12节中讨论过的自适应滤波器的应用,都是基于自相关的,但实际中常涉及到非最小相位系统,而且其相位信息非常重要。
限制150内