应用于化工事故推理的案例库系统.pdf
《应用于化工事故推理的案例库系统.pdf》由会员分享,可在线阅读,更多相关《应用于化工事故推理的案例库系统.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 7 0石油与天然气化工C H E M f C A LE N G I N E E 只J N GO FO I L&G A S应用于化工事故推理的案例库系统李潇张贝克马昕(北京化工大学信息科学与技术学院)摘要针对化工事故的推理,开发了化工事故案例库系统,为H A Z O P 等依赖人工推理的方法提供可靠性依据。介绍了应用于化工事故推理的案例库的系统结构、案例表达方法以及案例库的检索系统设计。其中,案例属性的表达是依据对化工事故的分类思想,案例检索采用了局部属性与全局属性相结合的方法,并着重研究了数字属性和语义属性的匹配以及相似度的算法。实际案例的应用结果表明本系统有效地提高了事故推理的自动化程度
2、,具有很高的实际意义。关键词化工事故推理案例检索匹配算法D O I:1 0 3 9 6 9 j i s s n 1 0 0 7 3 4 2 6 2 0 0 9 0 2 0 2 3针对化工安全问题,目前国际普遍采用H A Z O P 1 1(H a z a r da n d0 p e r a b i l i t y,危险和可操作性分析)对事故进行调查分析。在H A Z O P 的过程中专家要分析异常状态原因,并提出有效的处理和预防措施。传统的H A Z O P 是依赖人工的推理,有一定的片面性。本文将化工事故智能检索案例库引入到H A Z O P 分析中,建立面向安全评价的化工事故智能推理系统,
3、为异常状态分析提供可靠性依据,给出启发性分析,具有重要的应用价值。数据库是指长期存放在计算机内、有组织的、可共享的数据集合 2 。本案例库依靠数据库技术将案例分类储存起来建立成一个可扩充可检索的智能系统。目前国内的相关事故案例库多为固定形式,缺乏内容的可扩展性,而随着案例的增多需要不断地扩充原有的案例信息,保持数据的新与全。本案例库实现了案例扩展和更新的功能,另外本案例库检索功能的设计提高了检索结果的准确度,能够使用户快捷、准确地得到所需的案例信息。1 案倒库系统结构的设计根据实际应用的需要,案例库的设计分为三个方面,包括案例信息、功能和帮助。其中案例信息部分包含每个案例的设备类型、设备材料、
4、物料组成、单元操作条件、工艺条件和工艺类型等信息。功能模块是案例库所要实现的具体功能,包括用户对所需案例的检索以及管理员对案例的添加、修改和存储。帮助模块是提供使用该案例库的帮助信息。本案例库前台为面向用户的界面,在N E T 环境下用C#语言编写,后台用于案例数据存放和调用,采用S Q Ls e r v e r2 0 0 0 数据库支持。案例库在系统结构上分为三层:表现层、应用层和中间层。其中表现层为案例库提供给用户的搜索和阅读界面,以及管理者的输入案例界面,表现层通过界面与应用层进行数据交换。应用层则通过一些服务器端组件连接数据库,与数据库进行数据交换。数据层是在服务器端的S Q LS e
5、 r V e r 数据库系统,存放的是案例库的案例数据信息。系统有效地将这三层隔离开来,可以保证数据 万方数据第3 8 卷第2 期应用于化工事故推理的案例库系统的安全性和有效性,并且让用户在任何地方都可以方便快捷地查询和更新下载案例库中的数据 3 ,因此使得该案例库具备可扩展性。用户在本地设有查询界面和本地数据库,随着服务机上数据库中案例的增加,可定期向服务机下载,更新本地数据库。2 案例库的案倒表示化工事故案例库中的案例来自于网络、期刊、图书以及来自于多家石化企业的事故信息。案例信息可分解为多个属性来描述,可表示为:c a s e f i e l d=该案例库的系统中,案例信息表示为:事故案
6、例=每项属性又做了进一步分类,如表1 所示。单元操作类型流体流动过程流体输送、过滤、固体流态化等传热过程热传导、蒸发、冷凝等传质过程警暑墓尊芸搿吸收、蒸热力过程蓑鬻妣舭私铺液一机械过程固体输送、粉碎、师分等一设备类型坌徽嚣茹;槲潞潦非黻i 艺条雨一j 艺的操作温度、操柜压万等相矣信i 一设备材料鬈簇:蓑裟溴虾翩濑斛确钒物料硫化氢、氯气、氨气、乙烯类、环氧乙烷、氯胺、(常见)石脑油、酒精、氡水、硝基苯、醇,丙烯类、氢气描述案例的属性分为数字属性和文字属性,这些值由用户根据案例实际情况在每个属性表格里填写。其中属性的描述又可以描述如下:事故属性描述=管理者可以通过管理界面按照此分类的划分向数据库中
7、不断补充新的案例,以及对已给的类型进行扩充,不断地满足用户需要。3 案仞库的检索系统设计本案例库的核心是案例库的检索系统,通过该系统实现目标案例的检索,为实际需要提供重要的案例信息。这里的案例检索系统由4 个模块组成:权值确定模块、数字属性相关度计算模块、文字属性相关度计算模块和全局相关度计算模块。本案例库的检索策略是以先分后总的步骤进行,先进行局部属性的相似度计算(包括数字属性、文字属性),之后再根据权值进行多属性的加总处理,得到总的相似度。根据总的相似度对结果进行排序。3 1 数字属性相关度计算模块对于数字属性,有多种测量两者之间距离差值的方法,但是最常用的是欧几里德和海明距离 5 。本系
8、统采用的是海明距离法:d(x i,y i):掣(1)式中:X i 和y i 分别是目标案例和源案例的第i个属性值,J 峨表示在该属性最大值与最小值之间的区域内求积分J 譬IX i(z)一E(z)l d z。两个案例间的相似度是:5 i 初(x i,y i)=1 一掣(2)3 2 文字属性相关度计算模块该系统语义属性采用基于专业词典分词的方法进行词语检索。相关度计算的过程包括:首先删除虚字(如的、了),之后依照专业词典进行分词,再根据检索词计算源案例相关度,最后按照相关度大小排列检索结果。首先进行关键词的提取。基于词典的分词方法的三个要素为分词词典、文本扫描顺序和匹配原则。该系统采用正向最大匹配
9、法。其目的是将最长的复合词分离出来。先假定最大复合词长度为L,进行 万方数据石油与天然气化工C H E M I C A LE N G l N E E R I N GO FO f L&G A S匹配,如果词典里有这样的字,则将这个匹配字段作为一个词切分出来;若不能匹配,则将这个匹配字段的最后一个字去掉,剩下的字符串作为新的匹配字段,进行再次匹配6。,最终提取到该案例的若干关键词。第二步是计算相关度并进行结果排序。本系统利用关键词在文档中出现的频率和位置排序,该方法是搜索引擎最早期排序的主要思想,其技术发展最为成熟。基本原理是:关键词词频越高的文档和关键词出现的位置越重要的文档优先排在检索结果的前
10、面 7 。该算法简单、易实现,比较适用于结构化文档数据,排序的因素大致如下:关键词在正文中出现的频率;关键词在案例信息中出现的位置,例如出现在标题、摘要和正文在重要性上有所差别。3 3 全局相关度计算模块局部属性的相关度计算完成后,将进行全局相关度的计算,将每个部分按照不同的权值进行加和,最终确定每条索引案例的相关度大小。计算公式如式(3):砌(x,y)一圣巫掣(3)“袱x,y)一垫罨:掣(3)相似参考案例式中:c t,。为各个属性的权值。3 4 权值确定模块权值是对属性重要程度的一种主观评价和客观反映的综合度量,本系统的权值由多个化工安全专家共同给出。在必要情况下,也可以根据实际情况的变化随
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用于 化工 事故 推理 案例 系统
限制150内