用于评估放射性废物储存库的数值模型的实用验证:一个视角.docx
《用于评估放射性废物储存库的数值模型的实用验证:一个视角.docx》由会员分享,可在线阅读,更多相关《用于评估放射性废物储存库的数值模型的实用验证:一个视角.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、用于评估放射性废物储存库的数值模型的实用验证:一个视角抽象放射性废物处理库的平安案例在很大程度上依赖于通过评估工程和天然屏隙系统长期性能的数值模型获得的结果,鉴于垂要的 工程和公共政策决策基于这些模型,我们必须批判性地评估它们的能力和局限性.从而证明我们对从建模中得出的推论的信心 水平是合理的,在本文中,我们将讨论围绕建模者尝试测试、证实、确认和验证数值模型的一些何题,此过程有时称为模型验 证.通过首先检查其在科学哲学和假设检验中的深厚根基来接近这个广泛的主题。然而,将这些原那么应用于放射性废物隔离需 要一种更务实的方法,其越圉更窄,即证实特定地点的模型及其对特定目的的有用性。我们专注于验证水
2、文地质模型的实际方 面,这些模型用于了解存储库系统的演变。我们将证明,负货任地使用数值模型需要充分了解模拟结果的质量和稳健性,这直 接影响到如何解绛这些结果.以及如何(或不能)使用它们来支持重要的政策决策。关键字:实用模型验证;平安评估;放射性废物隔离;模拟1.引言评估处置放射性废物的地质处置库的绩效是一项复杂的工作.要检查的系统由与工程组件相互作用的各种白然特征组成. 必须考虑多种物理、化学、生物和热过程的耦合,因为它们可能影响放射性核素从废物罐的择放,以及它们通过工程屏障系统 和地圈运输到可进入的环境。与平安相关的特征和过程延伸到广泛的空间尺度一从分子到位点再到区域尺度。此外,它们 包括短
3、期事件以及随地质时代演变的过程。由于空间和时间尺度的这种广泛的范围,以及存储库将建在地卜.深处,理想情况卜 将场地的扰动降至最低,因此iT多属性无法用高分辨率测量。数值建模是我们了解处置系统演变及我可能对人类和环境构成的风险的重要工具,基于既定的物理原理以及相关的站点表 征数据,特定于站点的模型可以深入了解许多链接蛆件和耦合流程之间的交互及其对存储库行为的影响。它还允许人们计算无 法直接观察到的变量,预测存储库系统的演变,并检查替代或不太可能的情况.据了解.模拟结果和关丁暴就风险的推断陈述 (或任何其他性能指标)本质上是不确定的;这种不确定性必须得到适当的管理,并传达给决策者、利益相关者和公众
4、。成认任何存储库性能估计中的不确定性自然会导致这样一个问题.即我们对模型结果的信心是否有足够的基础,以及需要 提供哪些证据来支持可以依赖特定模型来做出重要设计,工程或公共政策决策的断言。为了解决这个问题,这样的模型应该经 历一个称为“模型验证”的正式过程。在这方面使用的其他术语包括1核实、11核实、t证实”、“确认”和“建立信任”等用语。这些术 语通常放在引号中,以说明它们不是字面意义上的意思,因为它们暗示模型对物理系统的绝对直理做出了明确的陈述.我们省 略了引号,因为本次讨论的目的是在描述绩效评估研究中使用的模型的质城时澄清这些术语的含义和局限性(我们同意作苕的 说法,即术语“峻证可能具有误
5、导性,应怦换为更中性的术语,例如“评估”).然而,虽然“模型评估可能更可取,但现有的建 模从业者文献和指南几乎完全使用术语1验证工因此,我们继续使用这一既定术语,也是为了说明本文中提出的“务实模型验证” 概念试图解决目前在核废料隔离背景下讨论的验证问题)。国际原子能机构(IAEA) 1提供的模型验证的一个经常被引用的定义是:“树燧阻”通过符模型的臻涵与对其实系统的 观察结果进行比较,确定模型是否充分表示被建模的真实系统的过旌.此定义不仅声明r模型验证的主要目的是什么,而且还 明确说明了应使用哪种方法。验证的其他定义在它们所包含的关键要素上是相当一致的,包括:(a)模型与实际系统之间的关 系;(
6、b)模里与实际系统之间的关系;(c)模型与实际系统之间的关系。(b)需要对模型预测和测量:数据进行比较;(c)该 模式的适用范圉有限;(d)不确定性址化的重要性.一些定义强调一个方面而不是另一个方面,或者对需要提出以满足验证验收 标准的证据或多或少具有规定性。本文介绍了我们在放射性货物管理高度监管环境中用丁决策支持的定量评估背毙下模型验证的实用性的观点。我们首先简 要回顾了讨论的哲学根源和一些批判性评论(第2节),然后,我们强调仔细模型评估的必要性(第3节),并概述了务实模 模型目的的定义:务实的模型评估的目的是确定模型是否足以到达目的:模型是否对手头问题的解决做出了有价值的 贡献?必须明确指
7、定模笈目的,因为它决定了关徙评估的基准、标准和验收标准。关键方面确实定:出实用性、有效性和效率的原因,必须确定模型的哪些方面需要特别注意,因此褥变有针对性的 审查和测试工作.这些方面可徙特定于预期用途,并且是对关键模型结果影响最大的方面.此外,模型评估应他或于 不确定的方面子噪,或者建模人员对其在模型中的正确或准确表示缺乏信心的方面。绩效指标和标准的定义:为了能够评估模型是否适合目的.需要定义适当的性能措施和躲收标准.它们必须可由模型 直接计算或从建模结果间接推断。好关键的是,它们必须与最终用途相关。用于模型评估的信息、观测或测试数据应 尽可能接近性能度量,包括影响因索、过程和规模.模型输出和
8、数据的准确性必须足够高,以便在评估验收标准时具 有鉴别性。影响因素的敏感性和不确定性分析:选择影响因素是模里开发过程中的重要步骤,小时干模型评估来说更是如此。影 响因素是特定于模型的,尽管它们可能对多个模型是通用的.在模型开发期间确定的影响因素(特别是模型校设)与 被确定为对热终模型使用有影响的因素之间的差异说明,当将模里用于模型开发期间可能没有预见到的目的时所进行 的外推程度,并且没有密切相关的校准数据可用.预测结果练习:实用评估的个术要方面是模型预测的测试1。虽然通常不可能根据感兴磔的现实直接浏试模型懂 测,但关健方面和重要影咱闪素应成为设计和评估预泄结果测试的基础。影响因素中的不确定性需
9、要通过模型传播到 性能度量中,以便可以对系统行为做出有意义的陈述,以解择相关的不确定性,模型评估、文档编制和模型 由于所有模型预测都是外推(空间、时间、参数以及需要考虑的特征和过程),并 且测试数据从未完全对应于最终性能指标,因此模型的置信度不能完全依赖于模型输出和测殳值之间的比较相反. 每个模型开发步骤都必须清楚地记录下来。特别是,需要审查概念模型及其假设,因为它们通常最有可能偏向建模结 果11。记录和审查用于拒绝模型的标准或要求更新模型时使用的标准也很重要。模叁评审者之间的任何共识,特别 是任何分歧,都应该得到成认。6.结论本文阐述了我们对批判性评估用于支持亚要政策决策的数值模型的必要性的
10、看法,特别是那些与放射性废物处置库许可相 关的决策。这种需要深深植根于任何概念和数值模电的基本性质。虽然我们成认模型本质卜.是不确定的,如果不是错误的,但 我们拒绝任何验证工作都是徒劳的观念.相比之下,我们将这一认识视为对尽职调查的呼吁,这涉及对模型(或多个模型), 模拟结果及其解糅的仔细评估。我们不是因为不可能知道或脸证真相而辞职,而是建议采取务实的观点,解决采用模登的实际 情况的挑战.实用验证旨在证明模型适合目的。这可能会降低对模型需要完成的任务的期望:预计模型不能在任何条件卜做出任何类型 的准确陈述或预测;模型只需要在有限的适用范围内执行.另一方面,该模型有望提供有用的信息来解决特定问题
11、.而不仅仅是 有关一般系统行为的见解。应根据替代概念化开发多个模型。如果这些模型对感兴趣的行为得出一致的结论,那么可以获得性旌指标可以以稳健方式计 算的信心411这说明结果并不很大程度上取决于不确定因素,这些因素在每个模型中可能已经以不同的方式实现,但是般的 系统理解以及站点表征数据提供的信息足以约束预测,相反,模型比较也可能指出需要修改的概念方面。在组合或比较替代概念模型时,每个模型在校准和验证阶段的性能都被 考虑在内57.这种组合分析没有说明哪个(如果有的话)首代模型是真实系统的最正确表示口即;相反,它评估每个模型在支持总 体目标方面所做的贡献,并务实地结合从每种方法中获得的见解。虽然存在
12、许多支持验证过程某些步骤的计算I:具臾58).但很明显.无论应用领域如何,都不存在最正确的单一验证方法。 即使在特定领域,例如核废料隔离,也必须调用该方法以适应模型,模型预期要回答的问题以及其使用的总体目标。虽然验证 具行根本和实际的同限性,但袈试测试模型以试图找到其弱点的练习是项有价值的(如果不是必要的)工作。型验证的概念第4节)。在总结和总结(第6节)之前,我们提供了可以作为这种实用验证方法(第5节)的一局部应用的 元素列表。2.对可验证性和模型验证的批评关于建立任何命题的真理的基本(不)可能性的哲学话语,特别是关于物理系统的命理,有着悠久的历史,一直持续到今 天。在科学哲学中,如何验证科
13、学陈述、假设或理论的真实性的问题己经扩展到一个更基本的问题,即这种验证是否在原那么上 是可能的。有些人认为,一个理论(或模型)充其量只能保存不无效”的地位。波普尔2提出的可证伪性概念说明,要使一个理 论被认为是科学的,人们必须能够以种可以证明它是错误的方式来检脸它。可证伪性不仅被表述为与可核查性的明确对立面. 而且还被表述为科学与非科学之间划分的标准,并作为研究的方法论指导规那么。虽然人们普遍认为理论无法得到验证,但可证 伪性也受到质疑。从本质上讲,将观察和预测之间的差异作为证伪理论(或模型)的充分标准可能会产生误导,因为任何观察 本身都充满了辅助假设.库恩口认为,实验和观察是由流行的范式决定
14、的,相反,观察数据和预测之间的差异并不一定反驳基础理论,因为相互 竞争的理论可能本质上是不可比较的.因此,科学真理不能由客观标准确定,而是由科学共识决定,在范式转变期间,科学共 识可能会发生相当突然的变化,豫恩4还建议检以卜五个特征作为理论选择的标准,并指出对这些标准的评估仍然是主观的: 理论应该是(1)准确的.即经验上与观察相一致;(2)内外均与其他理论一致;(3)范闱广泛,超出最初设计的解释范围;4) 最简单的解释(“奥卡姆剃刀);5)富有成果,因为它揭示了新的现型或现象之间的关系,关于理论的可验证性或可证伪性的辩论从发人深省到有争议;总结这场辩论或采取立场钮出了本评论的范围,除了成认验
15、证数位模型的尝试很可能面临与科学理论所遇到的困难类似的根本困难.Oreskesetal. (1994)在一篇有影响力的文章中 讨论了理论和模型之间的异同,他们在地球科学的数值模中中研究了验证,验证和确认的问题-经常提到为评估放射性废物储 存库的平安性而开发的模型的险证工作。Oreskes等人(1994)得出的结论假设日然京统就优微型的驳法和破是不用熊次他们通过观察所有臼然系统都是开 放的,其分布式输入参数不完全或在概念上与定义和尺度不一致来得出这陈述.这些定义和尺度可以使用辅助假设,模 型和偿设直接测址或推断它们,即使不是以建立真理的声明为目标(正如术语“5佥证所暗示的那样),也无法确定特定于
16、应用程 序的模皇的合法性。通过将预测与观测值进行比较来验证数值模皇仅表示一致性,但不能确保模型代表自然现象6。虽然校准 数值模型可能意味着它在经验上是充分的,但在但测未来时,再现过去的观测数据并不能保证模型的性能,因为任何外推都需 要改变模型结构,这反过来又会影响过程,时间和空间尺度,输入参数的影响以及输出变量的敏感性。即使未用于模型校准的 数据被合理地再现.也不能认为模型是经过骗证的。这被称为“肯定结果”的诿识,其中必要条件(与数据匹配-被误认为是 充分条件-确认模型的其实性,虽然在模型计和数据和测质数据之间实现经验一致性可能会增加模型的置信度,但它并不能确 认特定模型是否捕获了它试图表示的
17、自然世界。这种确认总是局部的,即它仅支持模型相对于为获得见解或做HI预测而提出的 替代模型的效用概率.Oreskes等人(1994 ) 5认为这个术语-验证,验证和确认-可能具有误导性,特别是当用于说明数值模型的结果足够 可靠以支持重要的公共政策决策时。他们成认,模型可能有助于证实假设,揭示其他模型中的差异,进行故感性分析.并指导 进一步的研究。他们的结论是,模型应该用于挑战现有的公式,而不是验证或验证它们对物理系统进行预测的能力。另一个批评来自直接比较-作为审计后的一局部-将相关观察结果与专门为进行这些预测而开发的“经过脸证的”模型所 做的预测进行比较,例如,在一系列文章7, 8, 9, 1
18、0, 11中,Bredehoeft和Konikow发现,由于概念建模僭误,很大一局部 模型做出了糟糕的预测,在这些情况下,新的数据说明,流行的概念模型是无效的,即这些模型不仅需要对输入参数进行微小 的调整,而且需要对它们如何表示自然系统的关键方面进行根本性改变。他们专门讨论了“水文惊”,这使得拟议的废物处置场 的初始概念模型无效11。请注意,其中一些论点己被反驳12, 13, 141使用替代模型可能会掏示这种概念模型不确定性的影响“例如,Selroos等人15研究了预测地下水流动和放射性核素从 废物谶到生物圈的迁移的模型的不确定性,其中使用普代建模方法模拟断裂的结晶母岩,例如防机连续体,离散裂
19、缝网络和通 道网络方法。这三种建模方法在可变性方面产生了差异,但息体上相似的行程时间、择放通量和其他性能指标。他们指出,概 念不确定性的影响可能被低估,因为本研究的参与者提供了一个共同的参考案例,可能会限制流动建模.同样,根据一套一致的特性数据,作为SKB工作队任务8的一局部,开发了裂缝流动和膨涧土水化的多种替代概念模型。 不仅完全膨润土水化的预测时间在相对广泛的范闱内变化,建模团队还对影响整体系统行为的关键因素提出r不同的看法,因 此,对研究和场地表征需求提出了不同的建议16,现实与其在数值模型中的表示之间的差异或不一致是建模过程中固有的,因此是不可防止的。任何模型都是对真实系统的 抽缭.这
20、意味着它基于概念决策,简化假设的选择以及具有不同不确定性水平的输入参数的选择.这种简化和缺陷所带来的错 误是否可以被认为是可以接受的,从根本上取决于模型的预期目的,这就是为什么概念化是模型开发的关键步骤,也是关德模 型验证工作的主要目标的原因。正如这个简短的摘要所示,仪仅基于哲学,历史和实践考虑,模型验证的可能性就受到了质疑。虽然这些论点的细节取决 于术语验证”的定义和归因于肢证模型”的主张,但各种批评者得出r类似的结论和建议:从根本上说,不可能确认特定地点的模型是否正确代表了自然系统5, 6, 7, 17, 18, 19;模型不应用于预测目的,除非预测域与校准域相称;然而,模型可用于挑被概念
21、理解,检查慑设,探索假设场兔以及 执行敬感性分析5, 7, 20, 21, 22;不应使用术语验证和类似术语,因为它们给人一种预测模型功能的误导性印象5, 7, 9, 19, 20, 23。 *尽管上面总结了基本的挑战和批评,但显然需要仔细定义开发和评估数值模型的方法,并建立对用于决策支持的性能预测 的信心。注意到批评者的警告性言论,我们忒图开发-种务实的方法来验证模型。3 .模型评估的必要性模型的本质模型是实际处置系统的有目的的简化表示.在概念模型的开发过程中,系统的每个方面都在迭代过程中适当地抽象化,考 虑每个因素对存储库性能的影响,以及理论或特定于站点的数据可以支持的程度。对于特定于站点
22、的仿真,必须实现适当级别的模型笈杂性,这是在实际系统的攵杂性(就其可观察或推断而言)与需要与 模型要求相称之间的权衡。模型可以过于简化或过于复杂(即过度参数化).过度简化的模型无法捕获要建模的系统的显着特 征,这可能导致系统性的错误或过度自信的预测。相反,虽然过度参数化模型从根本上能够更好地拟合数据(存在过度拟合的 风险),但它会导致高度相关、而度不确定的参数估计,从而导致模型预测也商度不确定和不可靠24L虽然敏感性分析可以帮 助评估适当的狂杂程度,但它们显然无法识别未在过度简化的模型中实现的潜在相关特征或过程,并只它们不能轻易检查参数 相关性及其对过度参数化模型中出现的估计和预测不确定性的影
23、响.虽然建模者通常从一个简单的模型开始.然后在新的见解 或数据可用时增加复杂性,但人们可能会争辩说,适当的模型复杂性最好从相对丰京,复杂的模型开始-至少在概念层面上-然 后使用筛选过程或带方子空间方法的名义倒置来箍选出不相关或不支持的模型组件以得出更简单的模型25, 26. 27上水文地质过程模型通常基于公认的经验定律。此外,对于物理和概念边界,对于实际目的来说,给定的定律可以被认为是 可以接受的,这是相对容易理解的。这些定律及其彼此之间的相互作用由数学模型描述,并使用适当的数字方案在计算机代码 中实现。将数学模型的正确实现测试到软件包中通常称为验证此外,通常执行收敛研究以确认所选的空间和时间
24、底微化具有 足够的分辨率,并且所有计算参数都已正确设置以得出准确的解决方案。在本讨论的其余局部,我们假设代码已经过正确验证, 并且仿真结果不会出现不可接受的数字伪影.3.2. 校准数学模型通常由一组耦合偏微分方程组成,这些控制方程包含的系数是经验定律从物理或化学过程的更基本描述中推导出 来或升级的。班着支持等级的增加,可能会出现新参数。这些新参数反映的属性在较小比例下不存在,而较小比例的属性可能 会随着它们被归入新参数而消失.通过进一步增加刻度,参数的值可能会发生变化,从而导致与刻度相关的参数。这在高度异 构的系统中尤其如此,这些系统不能确定性地描述,而只能用统计学来描述。除非遍历性占上风,并
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 用于 评估 放射性 废物 储存库 数值 模型 实用 验证 一个 视角
限制150内