数据仓库和数据挖掘在医院信息系统中的应用44499.docx





《数据仓库和数据挖掘在医院信息系统中的应用44499.docx》由会员分享,可在线阅读,更多相关《数据仓库和数据挖掘在医院信息系统中的应用44499.docx(151页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、摘 要 随着信息化的迅猛发展,各医院都在建立自己的信息系统,数据库规模不断 扩大,复杂程度度日益增加,从从大量的数据据中提取有用用的信息供医医院的决策服服务就 显得尤为重要。 目前前医院信息系系统(HISS)的实现,绝绝大部分采用用的是传统数数据库技术,数数据 处理以操作型处处理为主,即即联机事务处处理(OLTTP)。尽管管产生了大量量的业务数据据, 但真正对决策有有用的信息却却很少,而且且也造成了历历史数据和当当前数据、操操作数据 和分析数据的利利用与管理的的冲突。为了了解决这一问问题,数据仓仓库技术应运运而生。 北京肿肿瘤医院有其其自身的特殊殊性,治疗上上不同于其它它医院,因此此对于信息统
2、统 计、分析和管理理决策上有其其特殊要求。本本论文以FF在建设的肿肿瘤医院数据据仓库为 例,首先介绍了了数据仓库(Dw)和数数据挖掘(DDM)在肿瘤瘤医院应用课课题的来源;其次, 阐述了数据仓库库和数据挖掘掘的基本概念念,数据挖掘掘的方法、算算法,还有数数据挖掘、 在线分析(OLLAP)和决决策支持(DDSS)的差差异。最后,介介绍了肿瘤医医院数据仓库库建 立和应用的全过过程。包括阐阐述了医院信信息系统(HHIS)的基基本概念、医医院分析数据据 的历史方法及医医院信息管理理中存在的问问题。肿瘤医医院HIS数数据库的结构构设计,数 据仓库建立过程程中的数据准准备,数据仓仓库的架构、存存储,维度和
3、和粒度设计,主主题 抽取和确定,建建立多维数据据模型及多维维数据分析,数数据仓库和数数据挖掘的主主要功 能及医院实际应应用。 关键词:医院信信息系统;数数据仓库;数数据挖掘 Abbstracct Withh the fast devellopmennt of inforrmatioontechhnologgy,hosspitalls havve esttablisshed their own iinformmationn systtemsAAnd thhe scaale oof dattabasee hass beenn conttinuouusly extendiing anndthe co
4、mpllexityy beenn drammaticaally iincreaasing sincee the daythhe sysstem wwas builtUUnder this circuumstannce,too seleect thhe rigght innformaation from a masss of data for thehosppitalS deccisionnmakinng is ofuttter immportaance Theese daays thhe traaditioonal ttechniique,nnamelyy Online Trannsactii
5、on Prrocesssing (OUTP),is tthe prrimaryy waytto reaalize theHoospitaal Infformattion SSystemm(HIS)Althhou曲 a lot ofdatta cann be aacquirred byy thiss way,few oof theem aree usefful foor makking ddecisiions WhatS more,iin terrms off utillizatiion annd mannagemeent,itt causses thhe connfusioon bettwee
6、n historiical ddata aand cuurrentt dataa and the cconfliict beetweennoperaation data and aanalyssis daata To solvve thiis prooblem,tthe teechnollogy oof Datta Warrehousse(DW)emergges ass the timess requiree Commparedd withh otheer hosspitalls,Beiijing Canceer Hosspitall has its oownparrticullarityy,
7、 adoptiing ddifferrent methoods iin trreatmeentsFFor thhis reaason,iit haas soome sspeciffic requireementss on tthe sttatisttic,annalysiis andd manaagemennt of inforrmatioonThiis papper taakes the daata waarehouuse off Beijjing Canceer Hosspitall,whicch is beinng esttablisshed,aas ann examplle to in
8、trroducee:firsstly,tthe orrigin of DData WWarehoouse(DDW)andd Dataa Miniing (DM)inn the appliicatioon suubjectts of the ccancerr hosppital;Seconndly,tthe ffundammentall conceppt of DWandd DM,tthe meethod and aarithmmetic of DMM,and the ddifferrence amongg DM,OLAPP and DSS;llastlyy,the entirre couurs
9、e aabout howthhewareehousee was estabblisheed and ussed,inncludiing thhe bassic coonceptt of HHIS,thhe hisstoriccal meethod of annalyziing daata, the prroblemms invvolvedd in tthe maanagemment oof infformattion,tthe sttructuure deesign of thhe warehouuse,daata prreparaation dudngg the estabblishiing
10、 peeriod,tthe frramewoork annd stoorage of thee DW,ddesignn of ddimenssionallity aand ggranullarityy,absttractiing aand coonfirmming subjeccts,buuildinng mulltidimmensioonal ddata mmodel and aanalyzzing mmultiddimenssionall dataa, themaiin funnctionn ofDWW andDDMand someppractiical uuses iin hosspit
11、alls KeyWorrds:Hoospitaal InfformattionSyystem;Data Warehhouse;Data Mininng 图21多维立立方体9 图22企业中中数据仓库结结构10 图23大肠癌癌的决策树示示意图13 图31 医院信息息化的层次20 图32医院HHIS中四个个表的关系图图25 图33数据仓仓库所需要的的4个表的关关系27 图34费用随随时间变化的的过程图28 图35医院数数据仓库的架架构29 图36星型模模型30 图37肿瘤医医院多维立方方体的关系图图33 图38 多维数据据分析33 图39费用分分布图36 图310胃癌癌病人外科手手术的术前准准备天数
12、36 图3,11 200012004病病人数量的分分析图388 图312多维维立方体结构构图38 图313所有有诊断的费用用分布39 图314树形形显示的效果果39 图315饼图图显示效果40 图316病人人职业构成40 图317 Anaalysiss Servvices中中的聚集441 图318决策策树的树形表表示方法42 图319决策策树的公式表表示方法42 图320大肠肠癌术后决策策树部分图45 11引言 本章章主要是文献献综述,并介介绍了数据仓仓库、数据挖挖掘技术应用用于肿瘤医院院进 行的研究工作,最最后给出论文文的内容安排排。 111文献献综述 随着着计算机应用用的网络计算算的发展,
13、计计算正向两个个不同的方向向拓展:一个个是 广度计算,二是是深度计算。广度计算算是把计算机机的应用范围围尽量扩大,同同时实 现广泛的数据交交流。深度计计算是人们对对以往计算机机的简单数据据操作。目前前,深度 操作己提出了更更高的要求,希希望计算机能能够更多的参参与数据分析析与制定决策策的工 作。传统的数据据库技术是单单一的数据库库资源,它适适合操作型事事务处理,但但分析型 处理(或信息型型处理)能力力较弱【2】。数数据仓库(DDataWaarehouuse。DWW)的出现,将将 操作型环境和分分析型环境进进行了分离,划划清了数据处处理的分析型型环境与操作作型环 境之间的界限,从从而由原来的的以
14、单一数据据库为中心的的数据环境发发展为一种以以数据 仓库为中心的新新的体系化环环境【3】。 近十十几年,随着着科学技术飞飞速的发展,社社会和经济都都取得了极大大的进步,与与 此同时,在各个个领域产生了了大量的数据据,如人类对对太空的探索索,银行每天天的巨额 交易数据。显然然在这些数据据中的信息非非常的丰富,如如何处理这些些数据得到有有价值 的信息,人们进进行了有益的的探索。44】计算机技技术的迅速发发展使得处理理数据成为可可 能,这就推动了了数据库技术术的极大发展展,但是面对对不断增加的的如潮水般的的数据, 人们不再满足于于数据库的查查询功能,提提出了深层次次的问题:能能不能从海量量数据中 提
15、取信息或者知知识为决策服服务。仅就数数据库技术而而言已经显得得无能为力了了,同样, 传统的统计技术术也面临着极极大的挑战【551。这就急急需有新的手手段、新的技技术来处理 这些巨量数据。于于是,人们结结合统计学、数数据库、机器器学习等技术术,提出数据据挖 掘(Data Mininng,DM)来解决这一一难题【6。 11111国内外现状状 在国国外,数据挖挖掘已经有不不少成功案例例。数据挖掘掘首先在金融融、证券、电电信、 零售业等数据密密集型行业实实施,因为这这些行业信息息化程度比较较高,数据库库中已经 保留了大量数据据资源。例如如,总部位于于美国阿肯色色州的世界著著名商业零售售连锁企业 沃尔玛
16、(Wall Martt)的”尿布与啤酒酒”的故事。沃沃尔玛拥有世世界上最大的的数据仓库 系统,通过数据据挖掘工具,得得到了一个意意外发现:跟跟尿布一起购购买最多的商商品竟 然是啤酒。进一一步的分析,揭揭示了隐藏在在”数据关联”背后的行为为模式,”啤酒与尿 布”的著名故事事,可谓是数数据挖掘产生生巨大价值的的经典案例。当当企业拥有大大量的数 据之后,如何从从这些数据中中”攥出油水”,才是企业业信息化价值值体现的最终终目的。 有数数据表明,进进入二十世纪纪90年代,人人类积累的数数据量以每月月高于15的速 度增加,如果不不借助强有力力的挖掘工具具,仅依靠人人的能力来理理解这些数据据是不可 能的。
17、数据据挖掘的前景景被人们普遍遍看好。国际际知名调查机机构Garttner GGroup在在高级 技术调查报告中中,将数据挖挖掘和人工智智能列为“未来三到五五年内将对工工业产生深 远影响的五大关关键技术”之首,还将将并行处理体体系和数据挖挖掘列为未来来五年内投 资焦点的十大新新兴技术前两两位【”。Garttner的调调查报告预计计:到20110年,数据据挖 掘在相关市场的的应用将从目目前少于5增加到超过过80。美美国银行家协协会预测数据据 仓库和数据挖掘掘技术在美国国商业银行的的应用增长率率是1499。 与国国外相比,国国内对知识发发现的研究较较晚,而且较较为分散,没没有形成整体体力 量。90年
18、代,国国家自然科学学基金曾支持持过对该领域域项目的研究究,但实际应应用不多。 目前,国内的的许多科研单单位和高等院院校竞相开展展知识发现的的基础理论及及其应用研 究,这些单位包包括清华大学学、中科院计计算技术研究究所、空军第第三研究所、海海军装 备论证中心等【881。其中,北北京系统工程程研究所对模模糊方法在知知识发现中的的应用进 行了较深入的研研究,北京大大学也在开展展对数据立方方体代数的研研究,华中理理工大学、 复旦大学、浙江江大学、中国国科技大学、中中科院数学研研究所、吉林林大学、北京京理工 大学等单位开展展了对关联规规则开采算法法的优化和改改造;南京大大学、四川联联合大学 和上海交通大
19、学学等单位探讨讨、研究了非非结构化数据据的知识发现现以及Webb数据挖掘。 虽然然国内有很多多大学和研究究机构从事数数据仓库技术术的研究,但但到目前为止止, 国内基本上没没有成熟的数数据仓库解决决方案。在医医疗行业的应应用更是少之之又少。 目目前提供数据据挖掘产品的的厂商非常多多,如著名的的产品有SAAS Entterpriise Miner、NNCR TTeradaata WWarehoouse Minerr、SPSSS Clemmentinne 70、IBMM DB22 Intellligentt Minee、SQL Serveer 20000数据挖掘掘组件、Orracle99i Datt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 医院 信息系统 中的 应用 44499

限制150内