《基于核主成分分析的多输出模型确认方法-胡嘉蕊.pdf》由会员分享,可在线阅读,更多相关《基于核主成分分析的多输出模型确认方法-胡嘉蕊.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2017年 7月 北京航空航天大学学报 July 2017第43卷第7期 Journal of Beijing University of Aeronautics and Astronautics V0143 No7http:ff bhxbbuaaeducn jbuaabuaaeducnDOI:1013700jbh1001596520160519基于核主成分分析的多输出模型确认方法胡嘉蕊,吕震宙。(西北工业大学航空学院,西安710072)摘 要:目前对于不确定性环境下多个相关的复杂计算模型进行确认的方法存在计算困难及稳定性较差的问题。针对这类复杂计算模型,提出了一种新的基于核主成分分析(KPC
2、A)的多输出模型确认方法。该方法将核主成分分析与面积法的思想相结合,构造了一个新的易于计算且稳定性高的模型确认指标。所提方法通过核主成分分析将相关的输出变量转化为不相关的核主成分,再对每一核主成分进行模型与实验的对比,从而避免了传统多输出模型确认方法中需要求解多个输出的联合累积分布函数的困难。由于核主成分分析(PCA)方法能够有效提取分析对象的非线性成分,因此基于核主成分分析的多输出模型确认方法较基于主成分分析的模型确认方法更为稳定,这表现在相同的实验样本数据下核主成分分析的方法具有更低的出错率。另外核主成分分析通过核主成分提取,可以实现多输出模型的降维,从而降低多输出模型确认的复杂度。所提方
3、法既可以用于一般的多输出模型的确认,也可以用于多确认点的输出模型的确认。最后通过数值算例和工程算例证明了该方法的正确性与有效性。关 键词:模型确认;多输出;相关性;核主成分分析(KPCA);面积指标中图分类号:02124;TP3919文献标识码:A 文章编号:1001-5965(2017)07147011随着现代科学技术的发展,工程研究人员面临的工程系统日益庞大和复杂。考虑到对大型复杂系统进行物理实验的难度和实验所需的昂贵费用,工程研究人员试图通过建模与仿真技术来代替这些大型复杂系统的物理实验。通过对所建计算模型的分析来代替昂贵复杂的真实物理实验。但是,由于计算模型是由真实物理过程抽象近似而得
4、到的,所以会存在一些模型信息与真实的物理过程不尽相同。模型和真实物理实验之间存在的差异使得工程研究人员对计算模型的准确性和可信度产生了质疑,在这种情况下,模型确认工作应运而生。3。模型确认是指“从模型预期用途的角度客观评估模型在多大程度上反应真实物理的过程H。,简单来说就是要准确且定量地描述计算模型与实验结果之间的差异。目前为止,已有的模型确认方法基本可分为四大类旧1:经典假设检验法。、贝叶斯因子法o。3。、频率指标法14。51和面积指标法16。经典假设检验法主要关注于对原假设(峨:模型正确)和备择假设(口,:模型不正确)的接受或拒绝,没有定量地评估模型的准确性。贝叶斯因子法则是在考虑了先验信
5、息后给出了模型正确的概率(置信度),但同样未能定量地评估模型的准确性。与前2种方法不同,频率指标法给出了模型与实验间的定量差异,但这一方法只考虑了均值这一特征量,对不确定情况下的离散程度等其他收稿日期:2016-06-15;录用日期:2016-09-30:网络出版时间:2016-1114 09:12网络出版地址:WWWcnkinetkemsdetail1 12625V20161 1 140912007html基金项目:国家自然科学基金(51475370);中央高校基本科研业务费专项资金(3102015BJ(II)CG009)通讯作者:E-mail:zhenzhoulonwpueduen引用格式
6、:胡嘉蕊8震宙基f核i成分分析的多输出模型确认方法J北京航空航天大学学报。2017,43(7):14701480HU J R,LYU Z Zj Model validation method with multivariate output based on kernel principal component analysisjJournal ofBe圻ng University of Aeronautics and Astronautics,201 7,43(7):14701480(in Chinese)万方数据第7期 胡嘉蕊,等:基于核主成分分析的多输出模型确认方法 1471特征量没有考
7、虑。基于以上问题,Ferson等通过对比计算模型输出量的累积分布函数与物理实验结果的经验分布函数,提出了面积指标法和Upooling法。该方法能够定量且客观地衡量模型与实验间的差异,但是该方法仅适用于一维或多维独立的模型。而工程中建立的模型常常是多维且相关的,此时上述方法就不再适合。所以,在此方法的基础上李维等又提出了基于概率积分转换(Probability Integral Transformation,PIT)的指标法和t-pooling法171。这二者分别用于解决相关多输出情况下的单个确认点和多个确认点的模型确认问题,该方法的主要优点是在模型确认时考虑了多个输出的相关性,但PIT指标法和
8、tpooling法需要求解模型输出的联合累积分布函数,这在输出维度很高时是很难准确求得的。对于以上模型确认方法所存在的各种问题,本文提出了一种新的模型确认方法。该方法使用核主成分分析(KPCA)的思想,并将其与面积指标方法相结合,给出了易于求解的模型确认指标,较好地解决了相关多输出情况下的模型确认问题。本文首先回顾了面积指标和upooling指标,并指出了upooling法存在的问题;其次详细叙述本文所提出的新的模型确认方法;接着给出算例证明方法的正确性及有效性;最后对该方法的特点做出总结。1面积指标法与n-pooling法在文献16中,对于单输出的模型确认问题分别给出了用于单个确认点的面积指
9、标法和用于多个确认点的u。pooling法,面积指标法是通过定量比较单个确认点处模型输出量Y的累积分布函数(CDF)F(Y)和实验观测值的经验分布函数S:(Y)的差异来评价模型与实验的一致性的,F(Y)和S:(Y)的几何关系见图1。F(Y)和|s:(Y)的差异可以用数学表达式描述:嗣1 单个确认点处的面积指标q(F,S。)=l F(Y)一S:(Y)I d), (1)J一不同模型确认问题中面积指标的数值大小与所研究问题的输出量本身值的大小有关,但对于同一个确认问题,面积指标的大小则能较为准确且客观地反映出模型的好坏。由于S:(Y)依赖于实验样本,因此该方法的结果不可避免地会受到实验值样本量的影响
10、。对于多个确认点,如果分别对每个确认点进行面积指标的求解,则会得到多个模型确认结果且不能合理地将这些结果进行统一,所以文献16提出了u-pooling法来解决多确认点问题。upooling法使用概率积分转换使得多个确认点的信息能够融合起来,从而得到一个合理的模型确认结果。将k个确认点处的模型输出量记作(Y,Y:,Y。),它们在各自确认点处的模型累积分布函数记为(F?,F?,F?)。k个确认点的实验观测值记为(Y;,Y;,y:),其中任意一个向量Y;=(yi,y;,y:)(,=l,2,k)代表了第J个确认点处的n个实验观测值。upooling法首先将第J(J=l,2,k)个确认点处的实验观测值Y
11、;通过对应的模型累积分布函数F?进行概率积分转换,从而由计算模型累积分布函数得到转换的概率值zi=F?(),:)(i=l,2,n;=1,2,k)。由实验样本y;得到转换值M。后,就可以由i得到其经验分布函数5(u)。由概率积分转换定理可知,单变量分布函数的概率分布为标准均匀分布U(0,1),那么在模型输出分布与实验分布完全一致的假设条件下,每个确认点的实验观测值进行转化后的u,值均是服从标准均匀分布的,那么由所有确认点处得到的所有转换值也应该是服从标准均匀分布的,这也就意味着在模型与实验完全一致的条件下,s(u)应该是标准均匀分布的累积分布函数。则模型和真实物理过程的差异就可以用s(“)和标准
12、均匀分布的累积分布函数F。(M)rI的面积差q(F。,S)=J F。,(“)一s(“)I du来定J 0量衡量,这就是upooling法对多个确认点问题进行模型确认的核心思想。图2给出了当每个确认点只有一个实验观测值(n=1),共3个确认点(J|=3)时的几何示意图,其中,为累计概率位。upooling法将不同确认点处的实验观测信息通过相应确认点处的计算模型的累积分布函数进行融合,并且0g(F,|s)05。与面积指标相同,对于同一个确认问题,u-pooling指标的大小也能够直接反映出多个确认点的情况下计算模型的万方数据北京航空航天大学学报f 1 23 13 0u(o,1)的累积分布函数一”,
13、(户l=I2,3)fl,J经验分布函数0 y;I y;。 y;。 J,一35确认点处模型输出的累积分布函数孵(,21,J212,3),第,个确认点的第i个观测值图2 多个确认点处的upooling模型确认过程Fig2 Validation process of upooling model atmuhiple validation sites好坏。在上述u-pooling法的实现过程中,可以看出该方法并没有考虑多个确认点处输出之间的相关性,而对于时间或空间上的多个确认点处的输出,它们之间往往具有非常强的相关性,因此u-pooling法这样处理多个确认点的模型确认是不合理的。本文将考虑多个确认点
14、处输出间的相关性,并将多个确认点的模型确认与多输出的模型确认统一起来,将多确认点看作是多输出的一个特例,在这种情况下完成多输出模型确认工作。2 多输出模型的核主成分分析确认方法21 主成分分析与核主成分分析核主成分分析是在主成分分析的基础上发展起来的一种多元数据统计方法,为清晰起见,先对主成分分析进行简要说明,然后对核主成分分析与主成分分析进行对照,最后建立基于核主成分分析的多输出模型确认方法。211主成分分析主成分分析(Principal Component Analysis,PCA)“2叫的目的是将相关性较强的多维变量转化为彼此不相关的新变量。考虑一个相关d维输出模型Y=Y,(X),Y:(
15、X),Y。(X),其中X为输入变量组成的向量。主成分分析能够将这些相关的多个输出J,=Y。(X),Y:(X),Yd(X)转化为线性不相关的主成分。其具体实现过程如下:假设得到了组上述d维模型Y=y(X),Y:(X),Y。(X)的输出实现值Y,=yy口,y坷(,=l,2,),将其记作一个Nd的矩阵Y=y。,),:,Y。1。然后计算这一组数据y的协方差矩阵,记作三,则三的表达式如下:三=专y:y。 (2)其中:y。是将矩阵y的每一列进行中心化和标准化后得到的。主成分是通过对协方差矩阵三进行分解得到的。d三=A。p。p: (3)ji式中:A为矩阵三的第k个特征值,且A。A:A d;tp。为d1维与A
16、对应的特征列向量,且(p。,p:,钆)为相互正交的单位向量。由向量(p。,p:,p。)构成了一个主成分空间,将原始数据投影到该主成分空间中得到的新数据就是所求的主成分:PI=y。p (4)这些主成分彼此间线性无关,且每一个主成分的方差等于其对应的特征值。第一主成分的方差最大,依次往后方差越来越小,所有主成分的方差之和与原始变量的方差之和相等。每一个主成分的方差占总方差的比例称为该主成分的贡献率C。(k=I,2,d)如下:,dc=AyA k=1,2,d (5)7怎在实际应用中,经过主成分提取后,前几个主成分已经包含了大部分原始变量的变异信息,所以选取累计贡献率达到85(一般取85,可根据具体问题
17、而改变)的主成分进行分析,剩余贡献率很小的主成分可以忽略其影响,从而达到降维的效果。通过主成分提取不仅将原始的相关性问题转化为不相关问题,而且可以在降维的同时得到与分析原始变量相近的结果,所以这一方法很适合被用于相关多输出的模型确认问题。212核主成分分析上述主成分分析是一种基于线性相关的转换方法心0。21|,而相关多输出模型确认问题中多个输出之间一般不仅是简单的线性相关关系,此时主成分分析就不能完全提取模型中的非线性特征,而核主成分分析则可以弥补主成分分析的这种局限性。核主成分分析心1241是指基于核函数的主成分分析,其本质是将原始数据通过某种非线性映射将其投影到高维特征空间,使其在高维特征
18、空间中被线性化,然后在该高维特征空间中再使用主成分分析方法,从而达到提取具有复杂非线性相关性数据的主成分这一目的。假设得到了组上述d维模型y=Y。(x),Y:(X),Y。(X)的输出实现值Y,=Yj。,y。,),。(,=1,2,),将其记作一个Nd的矩阵Y=Y。,j,:,Y。1。之后定义一个映射西:y。一嚆万方数据第7期 胡嘉蕊,等:基于核主成分分析的多输出模型确认方法 1473F。,其中为原变量空间,Fo为高维特征空间,D为高维特征空间的维数(Dd)。将原始空间的模型输出实现值Y,Y:,Y川。映射到高维特征空间后变为垂(Y)=垂(Y。),函(Y:),中(Y。)1,每一个映射后的西(Yj)都是
19、一个l xD维的行向量,再将每一个向量中心化记为中。(Y,)。这样在变化后的新空间中,协方差矩阵可表示为1 三=专西。(y,)7少。(j,) (6)1=1与主成分分析类似,也对该协方差矩阵进行矩阵分解。D三=A椿p。垆:女=1(7)式中:A。为矩阵三的第五个特征值且A。A:A。;。p。为D x 1维与A。对应的特征列向量,且(。p。,。p:,。p。)为相互正交的单位向量。由向量(。p。,Kp:,Kp。)构成了一个核主成分空间,将原始数据投影到该核主成分空间中得到的新数据就是所求的核主成分:妒I=y。K纸 (8)然而原始空间到高维特征空间的映射并非显式关系,而是需要通过核函数得到,所以需要通过以
20、下推导将核函数引入上述过程从而求得核主成分,具体推导过程如下。由式(7)可知,三是一个D xD维的矩阵,对于其中每一个特征值A。和与之对应的特征向量。p;式(9)均成立:AtK妒=三K妒 矗=1,2,D (9)同时,对于每一个特征向量。妒。又可以表示为西。(y,)7的线性组合,d可为对应的相关系数:。妒。=仅酊中。(j,川 (10)将式(6)与式(10)代人式(9)中,则式(9)等价于:A。a衄空。(j,)7= 古善西。(J7,)I T中c(y,)荟“H中c(y川(11)可以将(1 1)式写成如下形式:A。d衄函。(j,川7=d可空。(j,。)7多。(yi)空。(y,)(12)式(12)中,西
21、。(Y。)中。(Y,)可看作是中。(Yi)与咖。(Yi)的内积,可以用核函数K(yi,Yi)来表示:K(J,;,Y,)=多。(Y。)rI)。(Y,)。式(12)又可以写成如下核函数表达的形式:NA。a町咖。(y川7=J 21 Nd可中。(yi)7K(y;,y) (13)定义一个N x维的新矩阵K,称为核矩阵,核矩阵中的每一个元素可用核函数的形式表达如下:Kii=多(J,)多(Yj) i,J=1,2, (14)则式(13)等价于如下表达式:NA=地 (15)其中:吼=(dn,0c)1为N x 1维的列向量。通过求解式(15)可以得出特征值A;和对应的特征向量毗,再结合式(10)可以求出矩阵三的特
22、征向量。饥=d可西。(j,)T o由此可知,对于高维特征空间中的数据西(Y)=中(Y。),中(J,:),痧(J,)1,最终核主成分的计算公式如下:一女=西(Y)K9=中(Y1)K9中(Y2)K9k西(Y)K妒td衄j=1理酊KJ=1仅酊翰j=1a酊(中(J,)中(j,一)J=1dH(函(j,)垂(j,z)“可(函(J,)少(y。)J=1(16)上述推导过程均是基于将中(Y,)进行中心化处理后而得到的,但实际应用中并不知道多(Y,)的显式表达,也就无法对其中心化,此时要使用K,来代替K进行上述求解过程,K。的表达式如下:K。=K一1KK1+1K1 (17)其中:1。为NN的矩阵,每一个元素都是1
23、N。通过以上核主成分分析后,就可以得到核主成分。与主成分分析相同,同样保留累计贡献率万方数据1474 北京航空航天大学学报达到85(一般取85,可根据具体问题而改变)的核主成分进行之后的分析求解。核主成分分析法是一种非线性主成分分析法,它将原始变量通过某种非线性映射转化为高维特征空间内的线性问题。这一非线性映射没有直接的表达式而是通过核函数完成的,因此称为核主成分分析。可以看出此分析方法考虑问题更为全面,比主成分分析所包含的原始变量信息更多,而且同样能起到对原始数据的替代和简化作用。22 多输出模型的核主成分分析确认方法具体流程基于核主成分分析建立多输出模型确认方法的基本思想是:利用核主成分分
24、析将相关的多输出问题转成不相关的核主成分,通过模型核主成分与实验核主成分的分布差异来识别模型与实验之间的一致性。具体的实现过程包括:模型输出数据核主成分分析;实验数据在模型核主成分空间投影得到实验核主成分;模型、实验核主成分的差异求解。以下将对基于核主成分分析的模型确认方法进行详细说明。设d维相关模型输出为Y”(z,z,0)=y?(x,Z,0),y:m(z,Z,0),),;(X,Z,0),其中Z为确认点变量,Z=(彳。,z:,气)(P为确认点的数目,P1),0为模型参数。对于具有P个确认点的问题,模型最终总的输出维数为却。若该模型有计算模型Y”伍,Z,0)运行模型得到模型数据矩阵l,。及其协方
25、差矩I坞zdaKPCA得到模型核主成分及贡献率。卵,k=l,2, ,。q=以兰lkl个输出样本y,=蛸,癌,蝶如)(J=1,2,),则可以得到一个N X(却)的模型输出矩阵Y“=y?,J,;,j,:1。同样,设实验输出为J,。(X,Z,0)=Y:(X,z,0),y;(工,Z,0),),;(z,Z,0),若实验有n个输出样本Y;=),;,y;,y;(J=1,2,n),则可以得到一个凡X(却)的实验输出矩阵Y。=Y:,j,;,Y:。得到了模型与实验的所有原始数据后,该方法的主要流程可用图3描述。1)模拟产生组模型数据运行次模型得到模型在给定的确认点Z=(z。,=:,z。)处的组输出数据,然后将数据
26、记作一个N(dp)的模型输出矩阵l,“。2)实验产生n组实测数据重复n次实验得到和模型相同确认点处的n组实验数据,然后将数据记作一个n X(dp)的实验输出矩阵r。3)对l,进行核主成分分析对模型输出矩阵y”进行核主成分分析,得到模型核主成分。p?(k=1,2,),和与之对应的特征值A,A:A。,并计算每一核主成分N的贡献率。c。=AyA。 罱4)投影得到实验数据的核主成分将实验输出数据投影到模型的核主成分空间,得到与模型核主成分。p?对应的实验核主成物理实验J。伍,z,功得到实验数据矩阵l,。将实验数据进行转化得到实验核主成分。群,k=1,2,J选取二。qI85的J个核主成分。1分别得到每个
27、模型核主成分的CDFP(。聍),k21,2,JI,个模型分布函数曰(。)的分布印()为标准均匀分布U(O,1)将每一实验核主成分的数据代人对应的P(。所)中化为一系列“值n?,k=1,2,由?,k=1,2,J得到J个核主成分转化的经验分布函数艰”)J个核主成分面积指标qk(。,。胙)=印()一譬(”)J du,k=l,2,Jj J加权平均得到最终的确认指标g(。P“,。p。)2_。吼(。p,。Pt),=。lk=1 kI图3 基于核主成分分析的多输出模型确认指标求解流程Fig3 Validation metric solving flow of multivariate output model
28、 based Oil KPCA万方数据第7期 胡嘉蕊,等:基于核主成分分析的多输出模型确认方法 1475分:。当模型与实验一致时,这二组数据应该也是一致的;反之,当模型与实验有差异时,这二者之间的差异则可以用来进行模型确认。5)选取贡献率大的,个核主成分进行降维选取。c。c,即累计贡献率达到c的J个核主成分进行后续模型确认(一般C取85)。6),个模型核主成分分布函数的分布由概率积分转换定理可知,所选取的,个模型核主成分。p?的分布函数F:()的分布为标准均匀分布,即S。m()=u。7)求得实验核主成分的转换样本的经验分布函数Js:(M)将每一实验核主成分。P:的n个数据代人对应的模型核主成分
29、。p?的累积分布函数(CDF)雕(妒:)中,得到这几个数据的概率值H:,计算H:的经验分布函数s:(u)。8)求得每个核主成分模型与实验的差异对选出的,个核主成分,可以得到转化后的,条经验分布函数S;(M),将每一条分别和标准均匀分布U(0,1)进行对比,得到指标:q。(?,。P;)=r1J s:(u)一S;(u)I du k=l,2,(18)9)基于核主成分分析的模型与实验的总差异将这I,个面积指标进行加权平均得到一个总J的指标,加权系数“=A。yA。,该总指标的表 息达式如下:Jq(。P“,。P8)=“g。(。p。m,。P:) (19)fj需要说明的是:在进行模型核主成分。p:与实验核主成
30、分。p;的对比时,没有直接使用面积指标而是将其做了类似u-pooling法中的转化,其目的是为了规范化差异的取值范围,避免不同输出模型量纲不同而造成的影响。转化后的指标具有明确的范围0,05,且该指标值越大,表示模型与实验之间的差异越大。最后对各个核主成分得到的指标进行汇总,该方法采用按照核主成分贡献率的大小加权平均,不同核主成分对指标的贡献可以通过加权系数体现。这一方法既解决了upooling法以及t-pooling法存在的多确认点间相关性的问题,也避免了求解多个输出间的联合概率分布函数,还具有降维的功能以便进一步简化分析过程,对于有多个确认点或多输出模型确认都可以使用,是对面积指标的延伸和
31、拓展。在上述基于核主成分分析的相关多输出模型确认方法的求解流程中,如果将数据的核主成分分析替换为主成分分析,其余步骤均保持不变,也是一种模型确认方法。但如同上述主成分分析所存在的问题,基于主成分分析的相关多输出模型确认方法对于非线性相关模型的确认效果则不如基于核主成分分析的确认方法好,在第3节的算例中会予以证实。3 算例分析31数值算例将基于核主成分分析的相关多输出模型确认方法运用于一个数值算例中。假设该数值算例的实验输出如下:Jye=Ol(2眠z)sin X2 (20)【Y;=sin(05,rrxl+。)+z02COS戈2式中:Y:和Y;代表2个具有相关性的实验输出;z为模型确认点,在本算例
32、中假设有20个不同的确认点,z分别取1,2,20;戈。和z:为该算例的输入变量,均为服从标准正态分布(0,1)的随机变量;(0。,0:)为该算例的参数,其真值均为15。最终该算例是一个含有随机变量的具有40维相关输出的模型确认问题,假设了3个备选的计算模型见表1。表1数值算例的3个备选的计算模型Table 1 Three alternative computational models ofthe numerical example1)方法的正确性验算首先通过此算例验证所提方法的正确性。模型1与实验完全一致,是正确的模型,模型2和模型3与实验的差异依次增大。所以模型确认结果应是模型1优于模型2
33、优于模型3。由式(20)生成1000组实验观测数据,表1中的模型通过仿真分别得出10000组模型响应数据,按照22节所提出的模型确认方法和步骤,得到每个模型的指标值,结果见表2。万方数据1476 北京航空航天大学学报表2数值算例的模型确认结果Table 2 Model validation results ofthe numerical example模型 模型1 模型2 模型3指标值00120 0063 6 0101 2模型1的指标值小于模型2小于模型3,这一结果说明模型l优于模型2优于模型3,结论与定性分析相符,证明了该指标的正确性和有效性。图4给出了该数值算例确认结果的图形表示。从图中也
34、可以直观地看出3个模型的优劣。在该算例中模型1、2和3分别使用核主成分分析得到了2个核主成分,每一个模型的每一个核主成分的贡献率以及对应的面积指标g。(。p:,。p:)都标在图中。由于3个模型的累积分布函数的分布均为标准均匀分布,所以在3个图中表示相同。而实验数据经过不同模型转化则得到不同的经验分布函数,通过与标准均匀分布u(0,1)的对比就可以表示出不同模型与实验间的差异。对于模型1,由于它和实验完全一致,所以在图中可以看出,对于模型l的各个核主成分,实验数据转化后所得的经验分布曲线与由模型数据转化所得的标准均匀分布曲线几乎完全重合。而对于模型2和模型3,实验数据转化后所得的经验分布曲线与由
35、模型数据转化所得的标准均匀分布曲线的差异则越来越大。从表2与图4都可以看出,该方法可以给出实验与模型间的差异,并且能得到正确的模型确认结果,即模型1优于模型2优于模型3。2)方法的稳健性验算证明了此方法的正确性后,再来分析此方法的稳健性,将该方法与基于主成分分析的模型确认方法进行对比,从指标的离散程度与错误率两方面对其进行比较。所谓离散程度是指多次计算模型确认指标后得到指标值的标准差,它能够从一定程度上描述指标的变异情况;而错误率则是指多次计算该指标后模型确认结果排序出现错误的频率。由式(20)分别生成10、100、l 000组实验观测数据,由表1中的模型通过仿真分别得出10000组模型响应数
36、据。按照22节所提出模型确认方法和步骤,在实验数据样本量不同的情况下,分别将2种方法求解指标的程序运行100次,l, “ 村模型1的第1个核主成分 一一一模型2的第】个核主成分 模型3的第1个核主成分由模型I转换的实验数据由模型2转换的实验数据由模型3转换的实验数据(a)模型1与实验任第1个核生成分上的燕异 (b)模型2与实验在第1个核主成分上的差异 (c)模型3与实验住第1个核主成分上的差异一一一模型1的第2个核主成分由模型1转换的实验数据“模型2的第2个核主成分由模型2转换的实验数据(d)模型I与实验住第2个核主成分上的后异 (e)模型2与实验在第2个核主成分上的差异模型3的第2个核主成分
37、由模犁3转换的实验数据(f)模型3与实验在第2个核主成分上的差异网4 数值算例实验与模型每一核主成分的对比Fig4 Comparison of each kernel principal component between experiments and models of the numerical example万方数据第7期 胡嘉蕊,等:基于核主成分分析的多输出模型确认方法 1477计算这100个指标的标准差和错误率,计算结果见表3。从表3可以看出,随着实验数据样本量的增加,2种方法所求得的指标值的标准差和错误率都呈现下降趋势。但无论实验样本量为多少,基于核主成分分析的模型确认指标值的标
38、准差和错误率总是低于基于主成分分析的。表3Table 3这一结果不难理解,由于核主成分分析比主成分分析多考虑了输出间的非线性相关性,所以获得原始数据的信息更为完整,最终使得基于核主成分分析的方法在结果中体现出一定的优势。由以上两部分说明本文所提出的基于核主成分分析的模型确认方法是正确且较为稳健的。数值算例的实验数据分别为10、100和1 000组时与10000组模型数据确认结果对比Validation results of the numerical example of comparing 10,100,1 000 experimentalobservations and 10 000 mo
39、del responses32 工程算例如图5所示为一汽车前轴示意图,危险截面常发生在工字梁上,其截面形状如图6所示。已知危险截面的最大正应力为盯和丁,其中肘和71分别为前轴所受的弯矩和转矩,M(3 500000,175 0002),丁(3】00 000,155 0002),二者均为正态分布,单位为Nm。工字梁的几何参数为。、b、h、t,其中h服从正态分布hN(85,425 2)mm;=12mm,b=65 mill可以看作该算例的参数;t=14,15,16,17,18 mm,为该算例的确认点。则该工程问题的输出如下:同理,分别假设如下3个备选的计算模型如表4所示,其中模型1与实验一致,是正确的
40、模型,模型2和模型3与实验的差异依次增大。所以模型确认结果应是模型1优于模型2优于模型3。由式(21)生成1 000组实验观测数据,表4中的模型通过仿真分别得出10 000组模型响应数据,按照22节所提出的模型确认方法和步骤,得到每个模型的指标值,结果见表5。表4工程算例的3个备选的计算模型Table 4 Three alternative computational models ofthe engineering example模型 公式。学_护”2f)3, 模型。 r、 模型丁2 0忑8bt瓦0码4 2+f3型蠡模型2图5 汽车前轴示意图Fig5 Schematic of automob
41、ile front axle 模型3图6工字梁截面Fig6 Joist steel section。I 717 2蕊订i函口百丽口=J2t1tl b=6511I。一:二一丛型6h+上6h一(一2f)3一 !。一08bt2+04 E n3(一2)=10mill b=65mm表5 工程算例的模型确认结果Table 5 Model validation results ofthe engineering example_IIIl。滥万方数据1478 北京航空航天大学学报从表5的结果可知,模型1的指标值小于模型2小于模型3,这一结果说明模型1优于模型2优于模型3,结论与定性分析相符,再次证明了该指标的
42、正确性和有效性。图7给出了这一确认结果的图形表示。从图中也可以直观地看出3个模型的优劣。在该算例中模型1、2和3分别使用核主成分分析得到了一个核主成分(因为第1个核主成分的贡献率已经高于85),模型1的第1个核主成分的贡献率。p?1为9622,模型2的第1个核主成分的贡献率。p?2为9634,模型3的第1个核主成分的贡献率。p?3为9646,所以该算例中仅计算了模型与实验的第1个核主成分间的差异。由于核主成分分析结果只选择了第1个核主成分,所以加权系数为1,即第1个核主成分的指标值就是最终指标值。由于3个模型的累积分布函数的分布均为标准均匀分布,所以在图中三者表示相同。而实验数据经过不同模型转
43、化则得到不同的经验分布函数,经过与标准均匀分布u(0,1)的对比就可以表示出不同模型与实验间的差异。从表5和图7都可以看出该方法可以给出实验与模型间的差异,并且能得到正确的模型确认结果,即模型1优于模型2优于模型3。4 结 论1)方法将核主成分分析与面积法进行结合,将相关的模型输出与实验的输出通过核主成分分析变为不相关的核主成分,并用面积指标的思想定量描述二者间的差异。2)指标求解借鉴了upooling法的转化方法,将指标的范围规范在0,05区间,避免了输出模型量纲不同所造成的影响。3)通过数值算例与工程算例证实了该方法的正确性和有效性,并与基于主成分的确认方法进行对比,证实了所提方法具有较好
44、的稳健性。4)相比与多输出模型确认的PIT指标法和t-pooling法,该方法避免了求解多输出的联合分布函数,使得该方法在计算的难度上大大降低;同时该方法考虑了多个确认点间的相关性并使用核主成分分析处理了这一问题,使得该方法在理论上也更加完善。另外,该方法还利用核主成分分析对多个输出问题进行了降维,对于具有强相关性的高维输出模型确认问题,可以在保证分析精度的情况下大大降低分析的复杂度。5)本文提出的指标也有一定的局限性,首先,核主成分分析只是一种数学上处理问题的方法,它分析出的每一个核主成分物理意义不够明确,在工程使用中比较难理解。其次,虽然方法避免了求解多输出的联合分布函数,但是在核主成分分
45、析中核函数构成的矩阵和样本量是成正比的,所以当样本量过大时,该方法的计算量较大。处理具有相关性多输出模型的确认方法还有很多,可以进一步探索,提出更简洁高效的指标来解决工程中的模型确认问题。参考文献(References)1OBERKANPF W L,ROY C JVerification and validation in scientitle computingMNew York:Cambridge University Press,2010:3713722郭勤涛,张令弥,费庆国结构动力学有限元模型修正的发展模型确认J力学进展,2006,36(1):3642GUO Q T,ZHANG L M
46、,FEI Q GFrom FE model updating tomodel validation:Advances in modeling of dynamics tructuresJAdvances in Mechanics,2006,36(1):3642(in Chinese)3刘翠翠建模与仿真的VV&A方法研究D哈尔滨:哈尔滨工程大学,2012:12异莽的验。摈型摸比对的分吱勰性螂妒。实型屿模型与模验实的洌算程工霹=畀雄的验实型漠万方数据第7期 胡嘉蕊,等:基于核主成分分析的多输出模型确认方法 1479LIU C CResearch on VV&A methods ofthe mode
47、ling and sim nal of Computational Physics,2006,217(1):536ulationDHarbin:Harbin Engineering University,2012: 15OBERKAMPFW L,TRUCANO T GVerification and validation1-2(in Chinese) in computational fluid dynamicsJProgress in Aerospace Sci【4OBERKAMPF W L,SINDIR M N,CONLISK A TGuide for the enees,2002,38(2):209-272verification and validation of computational fluid dynamics sire一 16FERSON S,OBERKAMPF W,GINZBURG LModel validationulationsMReston:AIAA,1998:8889 and predictive capabilityforthethermal challenge problemJ5OBERKAMPF W L,TRUCANO T G,HIRSCH CVerification, Co
限制150内