地球物理学中的反演问题.doc
《地球物理学中的反演问题.doc》由会员分享,可在线阅读,更多相关《地球物理学中的反演问题.doc(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、地球物理学中的反演问题1、 介绍物理科学的一个重要的方面是根据数据对物理参数做出推断。通常,物理定律提供了计算给定模型的数据值的方法,这就被称为“正演问题”,见图-1。在反演问题中,我们的目标是根据一组测量值重建物理模型。在理想情况下,存在一个确定的理论规定了这些数据应该怎样转换从而重现该模型。从选择的一些例子来看,这样一个存在的理论假定了(我们)所需要的无限的、无噪声的数据是可以获得的。在一个空间维度中,当所有能量的反射系数已知时,量子力学势能可以被重建Marchenko,1955; Brurridge,1980。这种手法可以推广到三维空间Newton,1989,但是在那样的情形下要求有多余
2、数据组,其中的原因并不是很理解。在一条一维的线上的质量密度可以通过对它的所有本征频率的测量来构建Borg,1946,但是因为这个问题的对称性,因而只有偶数部分的质量密度可以被确定。如果(地下的)地震波速只和深度有关,那么根据地震波的距离,运用阿贝尔变换,这个速度可以通过测定震波的抵达时间来精确构建Herglotz,1907;Wiechert,1907。从数学上看,这个问题和构建三维空间中的球对称量子力学势是相同的Keller et al.,1956。然而,当波速随着深度单调增加时,Herglotz-Wiechert的构建法只能给出唯一解Gerver and Markushevitch,1966
3、。这种情况和量子力学是相似的,在量子力学中,当电势没有局部最小值时,径向对称势只能被唯一建立Sabatier,1973。(量子力学相关概念不熟悉,翻译起来有点坑)图-1尽管精确非线性反演法在数学表达上是美妙的,但它们的适用性是有限的。原因有很多。第一,精确的反演法通常只在理想状态下适用,这在实际中可能无法保持。比如,Herglotz-Wiechert反演假定了地下的波速只依赖于深度并且随着深度单调增加。地震层析成像显示这两点要求在地幔层都不满足Nolet et al.,1994。第二,精确反演方法常常很不稳定。Dorren et al1994已经清楚地展示了Marchenko方程解中这种不稳定
4、性的存在。然而,第三个原因是最根本的。在很多反演问题中,我们要确定的模型是空间变量的一个连续函数。这意味着该模型有无穷多的自由度。然而,在实际实验中,能够用来确定模型的数据数量通常都是有限的。通过变量的简单计算表明这些数据不能承担足够的信息来唯一确定模型。在线性反演问题的背景下,Backus 和 Gilbert1967,1968提出了这一观点,之后Parker1994也提出来这点。这个问题对于非线性反演问题同样相关。在实际实验中有限多的数据可以用来重建具有无穷多自由度的模型这样的事实必然表明反演问题不是唯一的,在这个意义上讲,有很多模型同样可以很好地解释这些数据。因此,从数据反演中得到的模型不
5、一定等于我们想要的真实模型。这意味着图1中展示的反演问题的观点太简单了。对于现实问题,反演实际上包含两步。用表示真实模型,表示数据。由数据我们得到一个估计的模型,这一步称为估计问题(estimation problem),看图2。除了估计一个和数据一致的模型,我们也需要探究估计模型和真实模型具有什么关系。在评价问题中,我们会确定估计模型获得了真实模型的哪些性质以及附带了哪些误差。这部分讨论的实质就是反演=估计+评价。当我们作出一个物理解释却不承认模型中存在误差的事实以及有限的精度,这是没有多少意义的 Trampert, 1998。图-2通常来说,有两个原因可以解释为什么估计模型跟真实模型不同。
6、第一个原因是反演问题的非唯一性,这使得一些(通常是无穷多的)模型满足这些数据。从技术上来讲,这个模型因为模型空间的不充分取样所以零空间存在。第二个原因是实际数据(以及物理理论比我们想要的更频繁)总是受到误差的污染,所以估计模型也受到这些误差的污染。所以模型评价有两个方面,非唯一性和误差传播。模型估计和模型评价对于具有有限自由度的离散模型和具有无穷多自由度的连续模型在根本上是不同的。而且,模型评价的问题只有在线性反演问题上得到很好的解决。因此,离散模型和连续模型的反演是分开处理的。线性反演和非线性反演的情况也是分开处理的。在第2节将讨论有限数量模型参数的线性反演。在第3节中将推广为处理带有无穷多
7、自由度的连续模型的线性反演问题。实际上,很多反演问题都不完全是线性的,但是这些问题常常可以通过做一些适当的近似来线性化。在第4节中将推导出单次散射近似。这种方法形成了运用于反射地震学中的成像工具的基础。Rayleigh原理将在第5节介绍,它是关于线性化的,构成了使用正则模态频率对地球结构进行反演的基础。地震波传播时间层析的线性化方法是基于Fermat原理的,这将在第6节介绍。非线性反演问题要明显难于线性反演问题。第7节将会说明非线性可能是不适定性的一个来源。目前,对于非线性反演问题的评价问题还没有令人满意的理论。在第8节将会介绍三种可用于非线性评价问题的方法。然而,这些方法没有一个是非常令人满
8、意的,表明非线性反演理论是一个有重要研究挑战的领域。2、 解有限的线性方程组在前面的章节中讨论过,反演问题将有限的数据映射到一个模型上。在地球物理学大多数实际应用中,该模型是空间坐标的一个连续函数,因此具有无穷多的自由度。我们暂时忽略这点并假定该模型的特征可以由有限个参数确定。我们将回到这些模型的重要情形,在第3节中这些模型会是无限维的。2.1 线性模型估计对于一个有限维的模型,模型参数可以规定为向量,类似地,数据可以规定为向量。矩阵通过乘积将数据关联到模型上。这个矩阵常常被称为理论算子。确实,在给定的问题上,它包含了我们选择给模型的所有物理和数学信息。实际上,这些数据包含了误差,因此记录的数
9、据和该模型的关系应该是: (1)有一点需要经常注意的是,我们对于包含在模型向量中的模型参数的选择有某种武断性。例如,若想要描述地球的密度,我们可以选择一个模型,在该模型中,地幔和地核具有均匀密度,在这种情况下存在两个模型参数。或者,我们可以把大量定义在球体上的特征方程中的地球密度展开,比如描述横向变化的球谐函数以及描述深度方向变化的多项式,这种情况会有更多的模型参数。在同一个模型上的这两种不同参数化方法对应于不同的模型参数和不同的矩阵。这个例子表明模型m不一定是真实的模型,但是对模型参数的选择通常包含了对于所能构建的模型的等级的限制。以下我们将把认为是真模型,虽然对于它的定义存在很多困难。由记
10、录的数据我们得到模型的一个估计。因为这个估计实际上跟真模型是不同的,我们用来表示估计模型。有很多方法来设计一个逆运算将数据映射到估计模型上e.g. Menke,1984;Tarantola,1987;Parker,1994。无论选择什么估计量,从数据到估计模型之间最一般的线性映射可以写做 (2)算子称为矩阵的广义逆。一般来说,数据的数量不等于模型参数的数量。因此,通常是一个非方阵矩阵,所以它的正常逆矩阵是不存在的。随后我们将说明广义逆矩阵如何来选择,但目前并不需要作详细说明。被估计模型与真模型之间的关系遵循如下表达式(将等式(1)代入等式(2) (3)矩阵称为精度矩阵(resolution k
11、ernel),这个算子被定义为 (4)表达式(3)可以写成下列形式来进行解释 (5)在理想情况下,估计模型等于真模型向量:表示我们选择的参数(列在向量中)可以被相互独立估计。等式(5)中最后两项分别解释了估计模型中的模糊度(blurring)和伪差(artifacts)。描述了估计模型向量的元素是真模型向量不同元素的线性组合。我们只能取得模型估计中的参数平均值和模糊度,因为我们无法映射出最完美的细节。在理想情况下,这一项是为零的,此时等于单位矩阵。由(4)可知,对于完美解决的模型参数,精度矩阵为单位矩阵,即 (6)如前所述,通常定义向量的模型参数的定义存在某种歧义。精度算子告诉了我们在估计过程
12、中我们可以独立获得的模型参数的程度。但是,精度矩阵并没有完全告诉我们估计模型和真实的潜在物理模型之间的关系是什么,因为它没有考虑模型参数的选择对于在估计过程中能够得到的模型的限制程度。表达式(5)中的最后一项描述了误差是怎样映射到估计模型上去的。这些误差并不确知,否则它们就能从数据中减去。因为数据中存在误差,所以需要一个统计分析来描述估计模型中的这些误差。当数据不相关且有标准差,则根据数据误差传播,模型估计中的标准差表达为 (7)理想上来看,我们希望同时获得:一个完美的精度,以及不存在误差的估计模型。不幸的是,实际上这是不可能实现的。比如,使用广义逆阵完全抑制了误差传播。这导致(荒谬的)估计模
13、型,这样确实不受误差的影响。但是,这个特殊的广义逆阵对应的精度矩阵是,显然这和理想的精度矩阵相去甚远。因此,实际上我们需要在误差传播和精度限制之间找到一个可接受的平衡点。2.2 最小二乘估计我们现在来考虑这样的情况:独立数据的数量多于未知数的数量。在这种情况下,等式不总是对任意给定的模型都满足,因为数据向量中包含的可能误差使得方程左右矛盾。例如,我们来考虑下面的问题。我们有两个物块质量分别是和。第一个物块的称重得出1千克质量。某人测量第二个物块,结果得出2千克质量。接下来,某人把两个物块放在一起称重,结果发现总质量是2千克。这个问题中测量的结果可以用下列方程组表示 (8)相应的矩阵表示为 (9
14、)显然,这个方程组是不能满足的。不可能第一个物块质量是,第二个物块的质量是,而它们的质量之和。显然测量中存在误差,但是没理由舍弃三个方程中的一个而去支持另外两个。图3(略)生动地阐述了这个问题。在平面中,三个方程对应三条实线。三条线不相交于同一点表示这个线性方程组存在矛盾。所以,采用合理的方法调和这些方程是确定两个物块质量的反演问题的一部分。通常估计模型的一种方法是寻找一个能够最佳拟合数据的模型,在这个意义上,数据向量和再估算数据之间由范数(即欧几里德距离,延伸阅读泛函分析)计量的差值要尽可能小。这表示由模型给出的最小二乘解最小化下列目标函数图-3 (10)详细说明了这个量由下列模型估计最小化
15、 (11)在图3的例子中,最小二乘解是平面中到三条实线距离最短的点,这个点用一个黑色方块来表示。使用矩阵(9),我们很容易得出问题(8)的最小二乘估计量由下式给出 (12)代入数据向量,分别得到估计模型 (13)2.3 最小范数估计在一些问题中,未知量的数量少于参数的数量。例如,考虑这样一个情形:有两个物块和,某人只测量了它们的总质量 (14)相应的矩阵表示为 (15)这个问题被形象地表示在图4(略)中。显然,任何位于该实线上的模型向量都严格满足等式(14)。因此,考虑到质量是正值,则存在无限多完全满足数据的解。一个模型估计可以通过选取一个完全满足数据且具有最小范数的模型来定义,这个模型在图4
16、中用黑色方块表示。图-4对于一个一般的欠定(under-determined 证据不足地说明)方程组系统,最小范数解定义为完全满足数据,即,且最小化的模型。使用拉格朗日乘数法我们能得出最小范数解 (16)给出了详细推导。我们很容易得出系统(14)的最小范数解 (17)2.4 混定问题(mixed determined problems)在最小二乘估计中,我们假定即使由于测量误差导致出现矛盾,我们仍然有足够的信息来求出所有模型参数。所以,这就变成一个完全超定(over-determined 多因素决定)的问题,作为结果是正则的。在最小范数解中,我们假定在可用的信息中不存在矛盾,但是我们没有足够的
17、方程求出所有模型参数。这就是一个完全欠定的问题,这里的是正则的。然而,最一般的情况是我们在一些模型参数上有矛盾的信息,而另一些则因为缺乏信息而无法评估出来。这时,无论还是都不能求逆(invert),这个问题是不适定的(ill-posed)。即使逆矩阵是正式存在的,它们通常也是病态(ill-conditioned)的,这意味着数据向量中很小的变化会导致模型估计中很大的变化。这表示数据中的误差在模型估计中将会被放大。显然,我们需要一点技巧来寻找一个模型,让它对数据中的小变化不那么敏感。带着这个目的,引入一个阻尼最小二乘解。从数学的观点来看,不适定性和病态解是由的零或接近于零的奇异值引起的。(这一句
18、可能不准确)假设我们有一个矩阵,它的特征值(eigenvalue)为,特征向量为,则有 (18)我们容易得到矩阵的特征值为,则有 (19)这表示矩阵的特征值可以通过向原矩阵添加一个乘了系数的单位矩阵来获得。这个性质可以用来定义阻尼最小二乘解 (20)因为矩阵具有正的特征值,则当常数为正时,的特征值将在正方向离零更远(以便消除不适定性和病态)。这样,(20)的解可通过最小化下面的价值方程得到 (21)这个表达式清楚地表明阻尼在当中的作用。最小化(21)式的第一项实际上是寻找最满足数据的模型。最小化(21)式的最后一项相当于寻找有最小范数的模型。一般地,我们不能同时最小化这两项,但是在最小化(21
19、)式时,我们采取折衷的办法去找一个模型既能够合理满足数据又能够获得不太大的模型尺度。参数控制着我们对这两个相互冲突的要求的侧重,因此它被称为权衡系数(trade-off parameter)。对许多应用来说,下面的矩阵性质是非常有用的 (22)在这个表达式中,和是正则方阵,然而并不需要是方阵。这个表达式可以证明当采用加阻尼或者正则化时,最小二乘解和最小范数解(两者都采用了一个阻尼项)是完全相同的。为了理解这点,我们令(22)式中,则有 (23)左手边相当于加阻尼的最小二乘解,右手边是(16)式最小范数解的加阻尼形式。这表明加阻尼后最小二乘解和最小范数解释完全相同的。2.5 最小二乘解的一致性问
20、题最小二乘解看似为寻求超定问题的解提供了一个客观的方法。不过,后面还存在问题。要理解这一点,我们来考虑方程组(8)超定系统。从数学角度看,当我们在最后一个方程左右乘上2,这个方程组系统不会改变。以下这两个方程组系统是完全等价的 (24)原系统矩阵和新的等价系统矩阵可以表示为,以及 (25)在这部分,无撇号的量表示原方程组系统,而有撇号的量则表示变换后的方程组系统。我们容易得到原系统以及变换后系统的最小二乘解(11),如下,以及 (26)代入原数据向量和变换后数据向量的数字值,可以得到下列模型的估计值,以及 (27)问题是,关于同一个模型的这两个估计量是不同的。这很奇怪,因为在(14)式中原方程
21、组系统和变换后的系统在数学上是完全等价的。这两个解不相等是因为原数据空间和变换后数据空间的量度在变换过程中被改变了。这是一种不同的说法,即在使用最小二乘准则解决这两个方程系统的过程中,距离是用不同方法测量出来的。因为最小二乘解最小化了距离,所以当数据空间的量度(或称测量单位)改变后最小二乘解随之发生改变是说得通的。这表明最小二乘解并不像乍看之下那么客观,因为任意变换方程系统会导致不同的最小二乘解!对于最小二乘解,其广义逆表达为。我们很容易推导出原系统和变换后系统的精度矩阵都等于单位矩阵,即:以及。因此,两个系统都具有完美的精度!读者也许有兴趣停下来解释一下(27)式中不相等的估计模型是怎么被调
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 地球物理学 中的 反演 问题
限制150内