结构模型在统计模型分析中的应用.pdf
1999年10月系统工程理论与实践第10期结构模型在统计模型分析中的应用常戈群,刘义(清华大学自动化系C I M S,北京100084)摘要:在综合统计中使用系统工程方法之一结构模型方法进行统计模型的分析,可以使统计工作有序可靠,对统计结果用户能方便地进行分析.关键词:统计模型;结构模型;邻接矩阵;道路矩阵中图分类号:N 32The Application of StructuralM odelin StatisticM odelA nalysisCHAN G Ge2qun,L I U Yi(Dept.of A utomation,T singhua U niversity,Beijing 100084)Abstract:The structural model method can be applied to comprehensive statistics.The statistical job could be processed orderly and reliably if you analyze the statisticalmodelw ith the structuralmodelmethod.This paper studies themethod of applying thestructural model to analyze the statistical model.Firstly we build the correspondingstructuralmodel of statisticalmodel and get the statistical level of every statistical itemby processing this structuralmodel.Then we calculate the path matrix and analyze therelativity of statistical item s in order to check errors and analyze statistical results.Keywords:statisticalmodel;structuralmodel;adjacency matrix;path matrix1前言随着计算机技术的广泛应用,综合统计电算化已成为统计工作的一个发展方向,综合统计电算化的一种实现方法是:构造能接受各统计模型的计算环境,一旦统计条件成熟(基础数据收集完备、准确,统计模型构造正确等),就可以启动统计计算,实现自动统计.这种环境需要支持:1)确定各模型的计算顺序,以便按数据统计层次进行统计;2)当统计结果有误或要了解某统计结果是如何统计得到的,就需要检查各层次的模型定义和各层次的统计结果(含基础数据);3)当修改模型或基础数据时,选择相关的统计项重新计算.其中,确定各模型的计算顺序是第一步.笔者探索了下列三种方案:事先确定顺序的计算方法、迭代计算方法、结构模型分析方法,最后使用大系统理论中的结构模型解决了该问题.使用该方法,也能相应地解决上述的第二和第三个问题.收稿日期:1998203218 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.2三种方案的比较211事先确定顺序的计算方法进行电算化统计工作的第一步就是对各统计项目和基础数据项目进行编码,在此基础上给出统计模型;本方法就是通过编码规则的制定,使得统计模型计算顺序隐含在统计项目编码的码值大小中,这就要求编码的码值大小顺序符合统计模型计算顺序的要求.这种方法有如下不足:增加了编码的难度,降低了编码灵活性;用户不能使用旧的编码,多套编码体系同时使用,增加了编码及其使用的复杂性;编码不利于维护,增加新的统计项往往很困难;统计模型变化,导致相关的统计项的编码需要调整,以满足编码的码值大小顺序符合统计模型计算顺序的要求,这些方面同构造能接受各统计模型的计算环境,提高灵活性和可维护性的目的是相悖的;不能辅助完成统计模型语义和基础数据的排错,不能辅助用户了解某统计结果是如何统计得到的涉及到哪些统计模型和基础数据.笔者在实践中就体会过用这种方法编码的系统带来的教训,由于统计要求的不断变化,原系统经过两年的勉强运行,不得不重新编码.212迭代计算方法本方法将统计计算看成的是求解由各统计模型构成的方程组,求解方程组的一种数值方法就是迭代计算,直到结果收敛到方程组的解.采用这种方法避免了对统计项目编码的额外要求,从而克服了第一种方法的缺点,但也带来了新的矛盾:需要反复的迭代运算,不能一步求解得到最终统计结果,计算时间长,效率低;迭代步数不能事先确定;模型定义有环(在模型中,直接或间接地引用了统计项目自身)时,如果不加限制的话,就会出现无限迭代.笔者曾经将上述两种方法结合使用,取得一定的效果,但没有从根本上克服这两种方法的缺点,并且统计模型和基础数据的正确性是靠人来保证,排错和统计结果分析工作量很大.213结构模型分析方法这种方法的思路是:用户按编码要求完成项目编码(也可使用原有的编码体系),按照统计要求完成统计模型建立;在统计计算之前,通过模型结构分析,确定各模型的计算顺序;统计计算时,就按照这种确定的顺序进行;当发现统计结果有错或要分析该统计结果的统计过程时,借助于结构模型分析结果,找到相关的基础数据和统计模型;排除错误后,只需要重新统计相关的统计项即可,而不必重新统计全部的统计项.由于编码和统计方法变化频度极低,而统计工作几乎是每天都要进行,所以事先确定统计模型的计算顺序和相关关系,可以从根本上克服第一和第二种方法的缺点;并且由于本方法可以由计算机自动完成,利用计算机的计算能力,当改变编码、模型或增加统计项时,在极短的时间内就可以重新确定计算顺序和相关关系.下面详细介绍结构模型用于统计模型分析的过程.3建立结构模型根据统计模型建立结构模型邻接矩阵.例如有如下一组统计公式:X4=X1+X2X6=X3+X4+X5X9=X7+X8相应的邻接矩阵为:001系统工程理论与实践1999年10月 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.X1X2X3X4X5X6X7X8X9A=X1X2X3X4X5X6X7X8X9000000000000000000000000000110000000000000000001110000000000000000000000000000110一般地,对应统计模型的邻接矩阵A有如下特点:1)A是一个稀疏矩阵,即零元素特多;2)全零行表示该行所代表的数据项目是一个基础数据,这样的行一般比较多;3)对A阵,通过适当的行列变换,可能变换成一个对角块阵.其实际意义是:某块内对应的统计项目只与该块内的其它基础数据项目和?或统计项目相关;4)主对角线上的元素一般为零,否则就有自环,这在统计上一般是不允许的,因为它表示该统计项目需由它自身和其它项统计而得.在实践中,手工建立邻接矩阵,其工作量显然是很大的,并且易出错,为此可将该工作交给计算机完成,计算机根据统计模型分析出统计项目的引用关系,建立邻接矩阵.笔者使用词法分析工具L EX来完成此项目,有关L EX介绍请参考文献1.4计算各统计项目的统计层次统计项目的统计层次表明了处理各统计模型的先后顺序,相同层次的统计项目,其处理顺序无关紧要,比如上例中,直观上看X4和X9处于同一层次,先计算X4还是计算X9都可以,但只有先处理X4=X1+X2得到X4以后才能再计算X6=X3+X4+X5,这里就称X6层次比X4层次高.显然,计算出各项目的统计层次,就确定了模型的处理顺序.利用邻接矩阵(A阵)的第二个特点,就可以计算统计层次,该过程是一个反复迭代的过程.1)首先将A阵的全零行标记出来.显然,这些行对应的统计项目是基础数据,其层次最低,这里设为零层.记录下这些统计项目的层次,设i=0,A(i)=A(0)=A;2)去掉A(i)阵中的全零行及相应列,剩下的统计项目在层次上比这次去掉的统计项目至少高一层.A(i)经过这样处理后的矩阵记为A(i+1);3)标记A(i+1)阵中的全零行,记录下这些统计项目的层次为i+1,令i=i+1;反复进行2)和3)操作,直到A(i)阵不再存在全零行.下面讨论剩下的A(i)的二种情况:1)A(i)不含任何行列元素,这表明所有统计项目的层次都已确定,这是模型定义不存在环路的情况,即不存在引用自身的情况;2)A(i)不是00的方阵,即还存在统计项目在模型中直接或间接引用自身的情况,这一般是不允许的,出现这种情况,就是模型定义有错,通过下面介绍的道路矩阵的计算,可以全面地了解具体的统计项目在模型中的自身引用情况,以便修改模型定义.5计算各统计项目的相关性这里统计项目的相关性是指统计项目的引用情况,道路矩阵反映了这种相关性,参见文献2.下面101第10期结构模型在统计模型分析中的应用 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.通过计算邻接矩阵A的道路矩阵P来说明.邻接矩阵A的道路矩阵P的定义如下:P=AA2 An其中:Ah=Ah-1Ah=2,3,na(h)ij=nk=1(a(h-1)ikakj);、分别代表逻辑或、逻辑与运算;n为邻接矩阵A的行列数(邻接矩阵为方阵,行列数相同)道路矩阵P的行列元素取值意义为:Pij=1:表示第i个项目数据是由第j个项目数据与其它项目数据直接或间接 统计而得;反过来,第j个项目的数据影响第i个项目的数据0:表示第i个项目与第j个项目在统计上无关.其中:i=1,2,n;j=1,2,n;特别地,当i=j,并且Pij=1时,表示有自环.对于第i行,与之对应的第i个统计项目只与本行中那些元素值为1的列所代表的项目有关;对于第j列,与之对应的第j个统计项目只影响本列中那些元素值为1的行所代表的项目;对本例:X1X2X3X4X5X6X7X8X9A=X1X2X3X4X5X6X7X8X9000000000000000000000000000110000000000000000001110000000000000000000000000000110X1X2X3X4X5X6X7X8X9P=X1X2X3X4X5X6X7X8X9000000000000000000000000000110000000000000000111110000000000000000000000000000110这里考察一下道路矩阵P的第1列和第6行向量的情况:1)对于P的第1列向量,p41=p61=1,p11=p21=p31=p51=p71=p81=p91=0,说明X1的改变影响且只影响X4和X6,对其它没有影响;2)对于P的第6行向量,p61=p62=p63=p64=p65=1,p66=p67=p68=p69=0,说明X6只是由X1、X2、X3、X4、X5直接或间接统计而得的,如果X6出错,其错误只能是基础数据X1、X2、X3、X5或统计项目201系统工程理论与实践1999年10月 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.X4的统计模型有错.显然,通过对道路矩阵的分析,就可以容易排除统计模型和基础数据错误、了解统计过程和重新执行有错误的统计模型.对本例,如果发现X6有错,结合它的统计层次,检查X3、X4、X5的数据或X6的统计公式是否发生错误;如果X4有错,再分析X1、X2中的数据或X4的统计公式是否发生错误.与上述过程类似,也可以分析X9的统计过程.另一个方面,如果发现X1有错,由于X1只影响X4和X6,排除X1的错误后,只需重新计算X4和X6,而不必无选择地重新进行一遍统计工作.有关道路矩阵的各种数值计算方法,请参考文献2.6结束语本篇比较了统计模型处理的三种方法,由此选择灵活且没有盲目性的结构模型方法.最后探讨了结构模型方法用于统计模型分析的过程,即建立统计模型的相应结构模型,处理该结构模型得到各统计项目的统计层次;通过计算道路矩阵,分析统计项目的相关性,以辅助统计工作的错误检查和统计结果的分析.参考文献:1UN IX SYSTEM V 410技术丛书之九 程序员指南 1 北京:北京希望电脑公司,199112戴一奇 1 图论及其应用 1 北京:水利电力出版社,19881(上接第54页)与国外相比,不同的是,陶瓷、医药(制药)、仪表仪器、电子、食品等行业表现出较高的资本结构;而电信、冶金、建材、纺织、电力表现出中等水平的资本结构;相同的有:石油开采、服装、矿采、公共事业、等行业.参考文献:1Franco M odigliani&M erton H.M iller.The cost of capital,corporation finance and the theory ofinvestment.American Econom ic Review,1958.2Black,F&ScholesM.The pricing of options and corporate liabilities.Journalof Political Economy,1973,81:637654.3Jense M&M eckling W.Theory of the firm:M anagerial behavior,agency costs,and ownershipstructure.Journal of Financial Econom ics,1976,3:305360.4M erton H.M iller.Debt and Taxes.The Journal of Finance,1974,29:449470.5Harris,M ilton,A rtur Raviv.The Theory of Capital Structure.The Journal of Finance,1991,46:297355.6中国上市公司资料大全(1998).北京:人民邮电出版社,1998.7中国诚信证券评估有限公司主编.中国上市公司基本分析.中国科学技术出版社,1997.8中国证券报公司部等编.98 上市公司资料速查手册.北京:新华出版社,19981301第10期结构模型在统计模型分析中的应用 1995-2005 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.