采用数据仓库技术的中药实验药理库14754.docx
《采用数据仓库技术的中药实验药理库14754.docx》由会员分享,可在线阅读,更多相关《采用数据仓库技术的中药实验药理库14754.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于数据仓库技术的中药科学实验信息数据库陆嘉明中药实验数据仓库是科技部基础性课题-“中医药科技信息数据库”的子课题之一。收录范围是自1990年以来公开出版在中文医学期刊上的有关中药单味药、方剂、化学成份在药理、临床药理、毒理方面的一次实验文献。课题总周期三年,目前已经进行了两年。1. 概况:本数据库采用计计算机数据仓仓库技术,在在忠实于原文文献内容的基基础上,按照照中药学研究究的特点,建建立了十五个个空间维,将将收录内容进进行编辑和结结构化存储,实实现了对中医医药文献资料料中出现的术术语进行规范范表达以及术术语间的相互互关系的多重重组合形式,用用户可以进行行研究数据的的统计和相关多多维的频次统
2、统计,作为药厂、临临床、科研、管管理、教学工工作者必需的的查询工具,将将为启发科研研思路,发掘掘出具有突出出疗效的新药药提供依据。 在科技技部领导的关关怀,中医研研究院领导的的支持下,我我们采用远程程建库的新模模式,在浙江江大学计算机机系的技术支支持下,由全全国六家省级级中医药学院院和研究院的的50余位中中药专业人员员通过互联网网进行建库工工作。经历了了基础工作准准备阶段、人人员培训与程程序测试阶段段、大量数据据加工阶段,经经过课题组全全体人员近两两年的共同努努力,克服了了多重困难,解解决了多项技技术难点,到到目前为止,数数据已经做到到2002年,文献量量已经达到220000余余篇,数据量量达
3、到389900余条,原原文图片达到到55000余张。整整体工作已经经基本完成,可可以提供网上上数据查询与与服务。部分分数据已经投投入使用与应应用,实现了了网上科技实实验数据的便便利检索与精精确统计分析析利用。2. 目标与计划:2.1 目标:依据中医药药科技期刊文文献科学实验验数据,利用用数据仓库技技术,建立中中医药科学实实验信息数据据仓库,为中中药新药开发发、科研创新新及中医临床床决策提供科科研数据与思思路。2.2 任务计计划:初步完完成中药药理理、毒理、临临床药理数据据库的整体结结构的设计,合合理搭建结构构关联型数据据库字段。在在完成数据库库应用程序的的设计与开发发的基础上,完完成上述数据据
4、库19900-20022年约20000条条数据的存储储与加工,提供网上数数据查询与服服务。3. 课题设计思路与与理念:3.1 关于数数据仓库的概概念:数据仓库(Daata Waarehouuse)是一一个面向主题题的、集成的的、相对稳定定的、反映历历史变化的数数据集合,用用于支持管理理决策。对于于数据仓库的的概念我们可可以从两个层层次予以理解解,首先,数数据仓库用于于支持决策,面面向分析型数数据处理,它它不同于企业业现有的操作作型数据库;其次,数据据仓库是对多多个异构的数数据源有效集集成,集成后后按照主题进进行了重组,并并包含历史数数据,而且存存放在数据仓仓库中的数据据一般不再修修改。中药药理
5、数据仓仓库就是针对对结构不同的的药理学文献献数据源,进进行抽取、清清理,并有效效集成,按照照主题进行组组织编辑,最最后达到可以以进行数据统统计和分析的的目的。3.2 数据仓仓库的建模方方式:数据仓库建立的的基础是Orracle Warehhouse Buildder,而逻逻辑建模是其其实施中的重重要一环,因因为它能直接接反映出技术术需求,同时时对系统的物物理实施有着着重要的指导导作用。本数数据仓库采用用了两种建模模方法,即第三范式式和星型模式式。范式是数据库逻逻辑模型设计计的基本理论论,一个关系系模型进行无无损分解的过程称为规规范化。在数数据仓库的模模型设计中目目前一般采用用第三范式,它有非常
6、严严格的数学定定义。即必须具有三三个条件:属属性量值唯一一,不具有多多义性;非主主属性必须完完全依赖整个个主键;非主主属性不能依依赖于其他关关系中的属性性。星型模式由一个个事实表(FFact TTable)和一组维表表(Dimeensionn Tablle)组成,是一种多维维的数据关系系。事实表主键键的每个元素素都是维表的的外键。事实实表的非主属属性称为事实实(Factt),它们一般都都是数值或其其他可以进行行计算的数据据;而维大都是是文字、时间等类型型的数据实体体。4. 课题设计策略与与原则:4.1 依照中药药理学学科分类,筛筛选中药实验验药理数据归归类;根据中药药理学学科分类特点点,按照中
7、药药药理学范围围进行实验药药理数据归类类;选择主要要数据项,利利用结构化形形式,表达数数据特征与数数据关联方式式。4.2 依照数据特点与与现状,设计计中药药理实实验仓库的结结构;利用数据仓库的的概念和技术术,从一般数数据库中抽取取相关主题所所需要的数据据。找出中药药科学实验数数据分布特点点,研究数据据的主题信息息抽取数量,是是构思数据仓仓库的基础。在在前期对中药实实验药理血瘀瘀证专题的数数据进行分析析与统计时,发现实验验方法种类繁繁多,实验角角度各有不同同,数据值表表达分散、涉涉及范围广泛泛,数据具有有“高维、小样本”的特点,过分分细化结构很很难发现共性性规律;因而而针对中药药药理实验数据据的
8、现状,降降解难度,减减少实验数据据仓库的建模模方式,筛选选了有一定分分析与统计意意义的十五个个数据维(文文献出处、单单味药、化学学成分、方剂剂、剂型、疾疾病、证候、症症状、病理生生理、效应部部位、微生物物、药理分类类、临床药理理分类、毒理理分类、指标标),十五个个维基本全面面表达了中药药科学实验数数据的内涵值值,可以支撑撑数据统计与与分析。4.3 依照数据仓库建建模方法,编编辑加工中药药药理实验数数据仓库数据据;中药药理数据仓仓库共建立了了十五个维,每每个维具有独独立属性,通通过后台的相相互关联,共共同组成事实实表达方式。由由于数据仓库库需要数据值值的标准化与与术语用语的的规范化;因因而,在总
9、体体构架实现的的基础上,必必须研制中药药药理学科涉涉及的常用术术语与标准化化加工方法。同时建立了十四张标准数据表格,便于数据加工与利用。根据中药科学实验数据的特点,对选择的数据进行结构化处理,对中药科学实验的对象、主要内容、方法与研制指标等数据进行抽取与加工。5. 研制标准技术规规范:5.1 科技基础数据收收集范围与原原则:收录范围是自11990年以以来公开出版版在中文生物物医学期刊上上的有关中药药单味药、方方剂、化学成成份在药理、临临床药理、毒毒理方面的一一次实验项目目。收录原则则:全面收录录中药实验研研究的一次文文献数据,转转载或综述性性文章均不在在收录范围内内。5.2 科技基础数据编编辑
10、加工流程程: 课题组制定良良好的工作流流程:中心组组文献初筛与与加工人员二二次复筛主题抽取标准数据表表数据编辑辑加工、全文文图片上传数据初审审数据二审审总审数据拆分分修改补充充标准表5.3 数据编辑加工标标准与细则: 建立与研制了了中药药理理数据仓库的的编辑流程和和技术要求、全全文图片扫描描技术标准、中药药理实验仓库的质量考核标准等一系列操作手册和质控标准。5.4 研制并建立了中中药实验数据据仓库标准表表: 研制并并建立了单味味药、化学成成分、方剂、剂剂型、疾病、证证候、症状、病病理生理、效效应部位、微微生物、药理理分类、临床床药理分类、毒毒理分类、指指标等十四张张标准表。6. 研制应用程序:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 采用 数据仓库 技术 中药 实验 药理 14754
限制150内