临床医学数据挖掘分析(共3092字).doc
《临床医学数据挖掘分析(共3092字).doc》由会员分享,可在线阅读,更多相关《临床医学数据挖掘分析(共3092字).doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、临床医学数据挖掘分析(共3092字)临床医学数据挖掘分析 概述是数据库知识发现(,)不可缺少的一部分,而是将未加工的数据转换为有用信息的整个过程(图),包括一系列转换步骤,从数据的预处理到的后处理。其最早是在年举行的第届美国人工智能协会(,)学术会议上提出的,是近年来随着人工智能和数据库技术的发展而出现的一门新兴技术,其开发与研究应用是建立在先进的计算机技术、超大规模数据库的出现、对巨大量数据的快速访问、对这些数据应用精深的统计方法计算的能力这个必要条件基础上的,以数据库、人工智能和数理统计三大技术为支柱。的基本模式及在临床医学中的应用的任务通常有两大类:预测任务和描述任务。预测任务主要是根据
2、其他属性的值,预测特定属性的值,主要有分类()和回归()种模式。描述任务的目标是导出概括数据中潜在联系的模式(相关、趋势、聚类、轨迹和异常),主要有关联分析、聚类分析、异常检测种模式。预测建模()涉及以说明变量函数的方式为目标变量建立模型。有种模式:分类和回归。分类是用于预测离散的目标变量。在临床医学中,疾病的诊断和鉴别诊断就是典型的分类过程。和以美国麻省理工学院的心律失常数据库的心电图为原始数据,采用不同分类模型,对心电图的种异常波形和正常波形进行分类。回归是用于预测连续的目标变量。回归可广泛应用于医学研究中如医疗诊断与预后的判别、多因素疾病的病因研究等。等采用各种回归模式对影响乳腺癌患者预
3、后的因素进行回归分析。关联分析()用来描述数据中强关联特征的模式,用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的模式通常用蕴函规则或特征子集的形式表示。关联分析主要应用于序列间相似搜索与比较、识别同时出现的基因序列、在患者生理参数分析中的应用、疾病相关因素分析等。有学者对例肾病患者进行了追踪观察,监测肾小球过滤率、尿蛋白水平和贫血状况,结果发现以上种生理指标中的任何一项异常都伴随着心脏病发病率的上升,这种肾病与心脏病“关联”的现象可发生在肾病的早期阶段。聚类分析()旨在发现紧密相关的观测值组群,使得与属于不同簇的观测值相比,属于同一簇的观测值相互之间尽可能类似。聚类分析在医学领域中主要
4、用于分析、医学影像数据自动分析以及多种生理参数监护数据分析、中医诊断和方剂研究、疾病危险因素等方面。罗礼溥和郭宪国利用聚类分析对云南省县(市)现有的种医学革螨的动物地理区划进行分析,发现云南省医学革螨的分布明显地受到自然地理区位和特定的自然景观所制约。异常检测()用来识别其特征明显不同于其他数据的观测值。这样的观测值称为异常点()或离群点()。异常检测的目标是发现真正的异常点,避免错误地将正常对象标注为异常点。换言之,一个好的异常检测器必须具有高检测率和低误报率,其主要应用于检测欺诈、网络攻击、疾病的不寻常模式等。的方法及研究趋势在算法的理论基础上,常用方法:()生物学方法包括人工神经网络、遗
5、传算法等;()信息论方法包括决策树等;()集合论方法包括粗糙集理论、近邻算法等:()统计学方法;()可视化技术等方法。经过十几年的蓬勃发展,很多基本算法已较为成熟,在其基础上进行更加高效的改进和算法提高显得比较困难,如传统的频繁模式和关联规则挖掘在近几年的国际著名会议和期刊上已不再作为重要的研究主题。近年来众多国内外知名学者相继探讨的最新方向。和汇总形成了领域十大挑战性问题报告;等探讨了的现状并展望了未来的发展方向,等讨论了新的挑战性问题,并主要探讨在生物信息学()、多媒体挖掘()、链接挖掘()、文本挖掘()和网络挖掘()等领域所遇到的挑战。与国外相比,在国内的研究和应用始于世纪年代初,主要是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床医学 数据 挖掘 分析 3092
限制150内