《医学决策支持系统课件.pptx》由会员分享,可在线阅读,更多相关《医学决策支持系统课件.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章医学决策支持系统第一节概述一、基本概念决策支持系统:以管理学、运筹学、控制论和行为科学为基础,以计算机技术、仿真技术和信息技术为手段,针对半结构化的决策问题,支持决策活动的具有智能作用的人机系统。医学决策支持系统:指将医学知识应用到某一患者的特定问题,提出具有最佳费用/效果比的解决方案的计算机系统医院信息系统的决策支持医学决策支持:医疗工作中的计算机辅助决策支持管理决策支持:计算机辅助管理决策支持决策支持基础统计学数据仓库人工智能医学决策支持:临床医生经常为病人的诊断、治疗作出决定。这些临床决定亦即临床决策(clinical decision)。决策(decision making)就是
2、为达到同一目标在众多可以采取的方案中选择最佳方案。临床决策支持系统:指帮助医务人员制定临床决策的计算机程序。二、医学决策基本过程逻辑推理:如A能推出B、B能推出C,则A一定能推出C。由于医学中没有严格的规则,所以用得少。归纳推理:启发式推理:上一次推理得出的结论,做为第二次循环推理的前提,循环推理,逐步求精。临床上的鉴别诊断:不同的疾病为不同的概念集合,而不同疾病之间有很多交集。鉴别诊断:区分交集部分的不同集合。疾病A疾病B交集交集划分非确定性的交集划分疾病A疾病B交集决策分析的基本步骤:供临床选择的治疗方法有时很多,此时要筛除一些“劣”的决策,有利于下一步的分析。确定各决策可能的后果,并设置
3、各种后果发生的概率。确定决策人的偏爱,并对效用赋值。在以上三步基础上去选择决策人最满意的决策,即期望效用最大的决策。三、医学决策支持系统的类型建立目的划分:更好了解患者状况的系统试图提供最佳的治疗决策的系统工作方式划分被动系统半自动系统主动系统四、医学决策系统的功能用药指导传递行政信息医师指令的饿自动评价自动报警、提示和警戒诊断帮助五、医学决策支持的基本方法(一)贝叶斯公式和决策理论1)事件及其相互关系必然事件:必然事件:在一定条件下必须出观的现象 不不可可能能事事件件:在一定条件下必然不出现的现象。随随机机事事件件:在一定条件下,可能出现也可能不出现。“两事件A,B中至少有一个出现”也是一事
4、件,称此事件为A,B的和,记作AUB;事件“A1,A2,A3,.An中至少有一出现称为Al,A2An的和,记为Al UA2Un。若“n个事件A1,A2,A3,.An都出现也是一事件,则称为A1,A2,An的交,记作:A1A2A n。2)概率与频率概概率率:可用一个小于或等于1的正数P(A)来表示事件A出现的可能性,P(A)就称为事件A的概率。较大的可能性用较大的数字来标志较小可能性的就用较小的数字来标志频频率率:当概率值不易求出时我们往往取频率作为概率的近似值,频率的概念比较简单可以很方便地求出。3)贝叶斯定理条件概率条件概率:有时除了要知道事件的概率P(A)外,还需要知道在“事件B已出现”的
5、条件下,事件A出现的条件概率P(A|B)。例如,我们需要知道在某疾病B发生条件下,症状A出现的概率时就要计算条件概率 P(A|B)。贝叶斯定理nP(Di|S)=P(Di)P(S|Di)/P(Di)P(S|Di)i=1D1,D2,Dn分别表示n种互斥的疾病,Di为第i个疾病;P(Di)为Di的先验概率(疾病发生的概率)。S为用于这些疾病鉴别诊断的某一临床表现或检验结果的组合(症候)P(S|Di)为疾病Di的症状S发生的概率;P(Di|S)为症状S提示疾病Di发生的概率(后验概率)先验概率,表示医生在具体诊断某患者前所掌握的疾病Di的发病情况。P(S|Di)为在已知疾病Di条件下,各症状S出现的“
6、条件概率”,即某临床症候A的可能性,它可以通过收集足够数量的病例容易地得到。P(Di|S)称为后验概率,表示在患者症状S出现时,患疾病Di的可能性。对于两个或更多个症状存在的情况,仍可用贝叶斯(Bayes)公式计算。在各个症状彼此独立前提下,则各个症状同时出现的概率是各自单独出现时其概率的乘积。因此假设各症状互相独立,贝叶斯(Bayes)公式可写为:在运用贝叶斯模型时须要注意的问题模型中j种疾病互斥,先验概率之和要为l(即要构成一个完整的疾病群).先验概率的确定。参考文献报道和历史资料统计频率作为近似估计。条件概率的确定。用于鉴别诊断的症候指标是互相独立无关的。当计算出各后验概率P(Hj|A)
7、后,作为临床判断的依据只有当P(Hj|A)(jl,2,,n)间差距达五倍以上时方可下结论,或是当某一后验概率值达085才下结论。应用举例一:如对某地区1207位阑尾炎思考的资料统计为表3-1。按慢性阑尾炎、急性阑尾炎、阑尾炎穿孔三类统计症候频率(腹痛开始部位、恶心呕吐、大便、体温、体征及体检结果)。若已知慢性阑尾炎H1、急性阑尾炎H2、阑尾炎穿孔H3发生的先验概率分别为:P(H1)0.391 P(H2)0.493 P(H3)0.116现有一阑尾炎患者、开始上腹痛,之后呕吐,腹泻,人院体温37全身腹肌紧张,压痛,WBC(白细胞)数达19350。显然其症侯为BB13B23B33B42B51B61B
8、73,则其P(Hj|B)(jl,2,3,4)的大小可通过公式算得。其中,P(B|Hj)P(B13B23B33B42B51B61B73|Hj)P(B13|Hj)P(B23|Hj)P(B33|Hj)P(B42|Hj)P(B51|Hj)P(B61|Hj)P(B73|Hj)(j=l,2,3)P(B|H1)94510-8 P(H1)P(B|H1)0351945 10-8 3695 10-8 同理P(H2)P(B|H2)=5.53 10-5 P(H3)P(B|H3)=1.136 10-4得:P(H1|B)=0.02%P(H2|B)=32.2%P(H3|B)=67.76%所以:诊断为阑尾炎穿孔(H3).得:
9、P(H1|B)=0.02%P(H2|B)=32.2%P(H3|B)=67.76%所以:诊断为阑尾炎穿孔(H3).3、贝叶斯临床决策系统设计实现贝叶斯模型与传统医生诊断的差异贝叶斯条件概率决策诊断模型及最大似然诊断模型使用时必须预先知道所规定的全部征候表现,然后再进行综合分析、判断。临床医师的诊断过程常是根据已掌握的病人的临床表现,结合自己的知识与经验进行分析、判断和逐步问诊、检查后再分析及再判断,直至有足够把握作出结论。贝叶斯逐步问诊模型就是仿效这种过程,进行逐步提问和逐步分析的计量诊断模型。举例二:中风部位诊断。基础资料:在因中风造成死亡的病例中选择发作后24小时仍处于昏迷状态的47例为对象
10、(62岁-87岁)。方法:在中风即刻到24小时内患者所表现的症状中选择六项症状进行研究:S1:呕吐S2:陈施氏呼吸S3:发作后血压上升到200mmHg以上S4:单侧麻痹S5:对光反射减弱或消失S6:心房颤动诊断疾病分类:G1:大脑前、中动脉支配区域的出血与下丘脑出血G2:小脑出血与蛛网膜下腔出血G3:大脑中动脉支配区域的栓塞诊断表编制步骤:对47例病人按G1,G2,G3三类分组,计算出各组内每一症状出现的频率。由于标本数不太多,所以症状出现率为0时以0.01表示,出现率为1时以0.99表示。某患者出现的症状为S1,S3,S4,S5,而S2和S6症状没有出现,根据表2-7可分别计算出该患者分属三
11、类的似然函数。于是,LG1 0.83(1-0.08)0.540.830.79(1-0.01)=0.27LG20.83(1-0.01)0.170.330.83(1-0.01)=0.04LG30.29(1-0.18)0.010.990.24(1-0.35)=0.0005比较上面三个似然函数的大小,最大函数为LG1,因而可以判断患者所得的病名属于G1类:大脑前、中动脉支配区域出血。判断实验结果在验证实验结果时除了上述47例外,还利用了原来没有考虑的脑干出血3例,脑干栓塞1例,其结果见表2-8,由表可知:病理诊断为G1类计24例,计量诊断符合20例;病理诊断为G2类计6例,计量诊断符合4例;病理诊断为
12、G3类计17例,计量诊断符合16例。若将病理诊断G1与G2合并后分为出血类(G1+G2)和栓塞类(G3)二大类,则病理诊断G1+G2类计30例计量诊断符合28例;栓塞17例中符合16例;同时,3例脑于出血全部符合,只有l例脑干栓塞误分在G1类中。Byes理论的局限:难估计先验概率与条件概率条件之间线性无关早期医学决策使用(二)决策树与决策分析启发式推理形成树型决策树(p170)决策树(decision tree)是一种能够有效地表达复杂决策问题的数学模型主诉腹部疼痛左上腹疼痛右上腹疼痛胆囊炎右下腹疼痛左下腹疼痛阑尾炎宫外孕卵巢囊肿扭转阑尾炎阑尾炎决策树由一些决策点、机会点和决策枝、机会枝组成。
13、一般用圆圈“”表示机会点,发生的结果不在医师的控制之下;小方框“”表示决策点,在决策点,医师必须在几种方案中选取一种;决策点相应的分枝称为决策枝;机会点相应的分枝称为机会枝。(P171图8-1)举例:决策树的应用:最可能患胰腺癌者包括40岁以上,中腹部疼痛持续13周的人。假设这类人中胰腺癌的发生率为12。如有一种不冒什么风险的早期诊断方法对胰腺癌的检出率为80(敏感度),但对有类似症状的非胰腺癌患者的假阳性率为5,用此法诊断确诊的胰腺癌患者手术死亡率为10,治愈率为45。根据上述疾病概率,诊断概率和死亡、治愈概率,如对1000人进行诊断、治疗,其所获得的益处,是否比不进行诊断检查和手术更大?可
14、以用一个决策树(下图)进行分析比较。由JCSisson等人的一个关于胰腺癌的决策树模型从以上决策树可见,不作该项检查的死亡者为12例,均为胰腺癌病人。用该项检查手术后死亡12.5人,其中有5例为非胰腺癌病人。而且新的检查使44例非胰腺癌患者的胰腺功能因手术而可能受到损害。因此这项检查对病人是弊大于利,不宜使用。(三)人工智能和专家系统技术人工智能是用机器来模拟推理,学习与联想的功能。专家系统是指运用一个或多个专家提供的特殊领域知识进行推理和判断,以求解那些需要专家才能解决的复杂问题的一种智能计算机程序。以专业知识专业知识来解决困难问题的计算机程序以逻辑演绎或专家的经验法则经验法则来模拟人类的推
15、理其过程是透过对问题特征的了解,进而向系统中的专家知识库知识库咨询,并藉由经验法则的应用,产生所需的答案专家系统是一种具逻辑性推理能力推理能力,以其储存某特定领域或专家知识来解决现实问题的计算机系统专家系统的优点专家系统的优点(1)具有高度的针对性:)具有高度的针对性:(2)具有启发性:)具有启发性:(3)透明性:)透明性:(4)灵活性:)灵活性:专家系统的组成专家系统的组成(1)知识库)知识库细菌感染病治疗专家系统细菌感染病治疗专家系统MYCIN 的一条规则如的一条规则如下下:如果如果:1)有机体的本性不知道有机体的本性不知道,且且2)有机体的染色是革兰氏阴性有机体的染色是革兰氏阴性,且且3
16、)有机体的形态是杆状的有机体的形态是杆状的,且且4)有机体的需氧性是需氧的有机体的需氧性是需氧的,则则:存在强有力的启发性证据说明有机体的类别存在强有力的启发性证据说明有机体的类别是肠细菌科。是肠细菌科。专家系统的组成专家系统的组成(2)数据库)数据库在医疗专家系统中在医疗专家系统中,数据库中存放的是当数据库中存放的是当前患者的姓名、年龄、症状等以及推理前患者的姓名、年龄、症状等以及推理而得的结果、病情等而得的结果、病情等。专家系统的组成专家系统的组成(3)推理机)推理机在专家系统中在专家系统中,推理方式有推理方式有:正向推理正向推理:反向推理:反向推理:正反向混合推理正反向混合推理:专家系统
17、的组成专家系统的组成知识获取模块知识获取模块它应具有下列功能:(1)根据实践结果,发现知识库中不合理或错误的知识(规则),并予以删除。(2)根据实践结果,总结出新知识,并加入知识库中。专家系统的组成专家系统的组成(5)解释接口解释接口如MYCIN中用户与系统的对答:用户问:你怎么知道培养基是从无菌源取得的?MYCIN答:RULE001和RULE002提供了证据。用户问:RULE001是如何触发的?MYCIN答:已知培养基的无菌性取决于对该培养基进行检验的方法,并且不知道是否小心地加以操作,所以有很大的可能性证明培养基是从无菌源取得的。专家系统的架构专家系统的架构知识库知识擷取副系统推理机解释副
18、系统自然語言介面使用者问题状况问题叙述工作区专家或知识工程師国外的开发的医学专家系统国外的开发的医学专家系统我国开发的专家系统的疾病覆盖我国开发的专家系统的疾病覆盖情况情况医学专家系统:MYCIN斯坦福大学1975年开发细菌感染的医学诊断1)血液中的细菌感染2)脑膜炎感染输入:与医师访谈后所得诊断与治疗法的建议输出:诊断与治疗的各种建议MYCIN的结构的结构咨询程序咨询程序解释程序解释程序提问提问/回答回答程序程序知识获取程序知识获取程序.病人数病人数据库据库知识库知识库MYCIN 系统MYCIN主要用于协助医生诊断脑膜炎一类的细菌感染疾病。在MYCIN的知识库里,大约存放着450条判别规则和
19、1000条关于细菌感染方面的医学知识。它一边与用户进行对话,一边进行推理诊断。它的推理规则称为“产生式规则”,类似于:“IF(打喷嚏)OR(鼻塞)OR(咳嗽),THEN(有感冒症状)”这种医生诊断疾病的经验总结,最后显示出它“考虑”的可能性最高的病因,并以给出用药的建议而结束。(四)神经网络和连接系统人工神经网络”(ARTIFICIAL NEURAL NETWORK,简称A.N.N.)是在对人脑组织结构和运行机智的认识理解基础之上模拟其结构和智能行为的一种工程系统。人工神经网络首先要以一定的学习准则进行学习,然后才能工作。现以人工神经网络对手写“A”、“B”两个字母的识别为例进行说明,规定当“
20、A”输入网络时,应该输出“1”,而当输入为“B”时,输出为“0”。所以网络学习的准则应该是:如果网络作出错误的的判决,则通过网络的学习,应使得网络减少下次犯同样错误的可能性。首先,给网络的各连接权值赋予(0,1)区间内的随机值,将“A”所对应的图象模式输入给网络,网络将输入模式加权求和、与门限比较、再进行非线性运算,得到网络的输出。在此情况下,网络输出为“1”和“0”的概率各为50%,也就是说是完全随机的。第二节 医学决策系统支持相关技术决策支持系统(DSS):从数据库中找出必要的数据,并利用数学模型的功能,为用户产生所需的信息。一、数据仓库技术数据仓库概念:是一个面向主题的、集成的、与时间相
21、关的、不可修改的、包含历史数据的数据集合。它用于支持经营管理中的决策制定过程。数据仓库的概念对收集不同来源的数据从新的角度提出了一种新的结构方法数据仓库的根本任务:把信息加以整理归纳并及时提供给管理决策人员。主要作用:提供报表和图表、支持多维分析、数据挖掘的基础。数据仓库的主题:是指用户使用数据仓库进行决策时所关心的重点方面。面向主题:数据仓库内的信息是按主题进行组织,为按主题进行决策的过程提供信息。集成:指信息是经过系统加工、汇总和整理。时间性变化:数据进入数据仓库后,将长期被保留。包含历史数据:从过去某一时点到目前的各个阶段的信息。数据仓库系统的四个层次体系结构:(1)数据源:整个系统的数
22、据源泉(2)数据的存储与管理:不同于传统的数据库,决定了外部数据的表现形式。大部分情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中。数据源数据仓库各分公司数据集市分析数据集市数据挖掘数据集市图1:数据挖掘库从数据仓库中得出数据挖掘库可能是你的数据仓库的一个逻辑上的子集,而不一定非得是物理上单独的数据库。可以把一个或几个事务数据库导到一个只读的数据库中,就把它当作数据集市,然后在他上面进行数据挖掘。数据源数据挖掘库图2:数据挖掘库从事务数据库中得出(3)联机分析处理(OLAP):对分析需要的数据进行有效集成,按多维模型进行组织,以便进行多角度、多层次的分析,并发现趋势。传统的查
23、询和报表工具是告诉你数据库中都有什么(what happened),OLAP则更进一步告诉你下一步会怎么样(What next)、和如果我采取这样的措施又会怎么样(What if)。(4)前端工具:报表工具、数据分析工具、查询工具、数据挖掘工具。(P173图8-2)二、在线分析处理技术(一)关系联机分析处理(二)多维联机在线分析处理(三)混合联机在线分析处理P174图8-3三、数据挖掘技术所谓数据挖掘,就是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的信息的过程。数据挖掘是KDD最核心的部分。数据挖掘与传统分析工具不同的是数据挖掘使用的是基于发现的方法,运用模式匹配和其它算法决定数据之间
24、的重要联系。(一)数据挖掘支持技术数据库技术和人工智能技术(二)数据挖掘方法与过程方法:决策树关联规则人工神经网络粗糙集理论遗传算法过程:对数据库数据整理,抽取出用来完成特定挖掘目标的数据集。选择合适的挖掘方法和工具,在领域专家指导下进行知识获取研究对事物的发展进行预测数据采集与处理:从数据仓库中选取相关的数据集合。知识库:指导数据挖掘和评价挖掘结果。数据挖掘:对数据仓库中提取的数据进行分析处理。知识评价:是以兴趣度作为衡量标准来查找和选择对最终决策活动友有益的的知识。HIS 中的数据处理模型中的数据处理模型(四)数据挖掘在医学决策支持系统中的应用(1)关联规则的发现关联规则的发现例如根据数据
25、库挖掘出以下三条规则:a)不锻炼(43年龄48)不吸烟不喝酒女性高血压(s=1.6%,c=20%)b)不锻炼(43年龄48)不吸烟喝酒女性高血压(s=2.3%,c=22%)c)不锻炼(43年龄48)吸烟喝酒女性高血压(s=2.9%,c=26%)规则a、b、c表明不锻炼、吸烟、喝酒这三个危险因素如果同时存在,将明显增加高血压病的发生率(22%26%)。(2)分类规则的发现分类规则的发现在HIS应用中,可以通过决策树方法、神经网络方法等算法对数据库中的病历记录进行挖掘,参照国际疾病的编码(ICD9)标准,根据系统中存在疾病的相应特征,构造出相应疾病的分类模型,并对每种疾病寻找出一种效果较好的治疗方
26、案。临床应用时,可以将病人的病症数据与模型中的数据相比较,确定出疾病的类型。(3)序列模式的发现序列模式的发现例如:某疾病40%的病人会发生在7、8、9三个月内。另外,为了发现序列模式,不仅需要知道某事件是否发生,而且需要确定知道此时间发生的时间。在HIS中,记录有大量病人病情变化的时间记录。可以收集对病人变化情况,利用相关挖掘技术发现序列模式。发现序列模式便于医疗工作人员预测病人的病情发展趋势,确定病情的发展时间,从而有针对性地防止某些疾病的发生(4)聚类分析聚类分析聚类分析不同于分类分析,输入的记录是一组未分类的记录,在进行聚类之前并不知道将要划分为哪几种类别。聚类就是将数据分到不同的类中
27、,要求同类数据间具有很高的相似性,而不同类间的数据尽量不相关。在医学中,一些特定症状的聚集可能预示某种特定的疾病。HIS 中数据挖掘实例分析中数据挖掘实例分析HIS 中数据挖掘实例分析中数据挖掘实例分析(1)IF(性别=男)AND(体重=肥胖)AND(47年龄55)AND(97血糖571)THEN高血压比率=66.20%(2)IF(性别=男)AND(体重=肥胖)AND(50年龄55)AND(103血糖571)THEN高血压比率=79.12%(3)IF(性别=男)AND(体重=肥胖)AND(44年龄50)AND(家庭有中风史)AND(0小便PH值60)AND(92血糖571)THEN高血压比率=
28、77.65%四、知识库知识库:人工智能和数据库技术的结合,知识库由知识和知识处理机构组成。医学知识库种类文献数据库事实数据库知识类型科学知识经验性知识知识库的三大技术:知识表示知识利用知识获取五、统一医学语言系统UMLS是美国国立医学图书馆主持开发的计算机化的生物医学检索语言集成系统和机读情报资源指南系统。UMLS第四节医学决策支持系统实例HELP系统(Health Evaluation through Logical Processing)基于知识框架技术,专用开发语言-HELP FRAME LANGUAGE帮助医护人员分析解释处理临床数据。呼吸系统疾病实验检查异常结果判断传染病监控用药合理
29、性检查HELPHELP系统的处方控制系统的处方控制HELP系统(Health Evaluation through Logical Processing)基于知识框架技术,专用开发语言-HELP FRAME LANGUAGE帮助医护人员分析解释处理临床数据。呼吸系统疾病实验检查异常结果判断传染病监控用药合理性检查HELPHELP系统的处方控制系统的处方控制改变处方?登录主诉并改变分发和评价yes医学知识库数据驱动的HELP系统药物合适?医疗药物医嘱护士输入药剂师输入历史过敏史等病人数据库接触医生yesnoyesno2 INTERNIST-1 和QMR系统INTERNIST-1系统是由Pittsburg医科大学开发的用于内科疾病诊断咨询系统。通过疾病症状来推理疾病。收集了600多种疾病的诊断知识,4500多临床表现。给出诊断疾病的相关参数:相关频率:在某种疾病中某临床症状发生的频率。提示力度:某症状对疾病存在的提示强度。处理用户输入的临床表现,得出一组诊断建议。移植到微机上,称QRM(Quick Medical Reference)
限制150内