数据挖掘中的本体应用研究综述 数据挖掘综述.docx
《数据挖掘中的本体应用研究综述 数据挖掘综述.docx》由会员分享,可在线阅读,更多相关《数据挖掘中的本体应用研究综述 数据挖掘综述.docx(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据挖掘中的本体应用研究综述 数据挖掘综述 摘要:数据挖掘是个交叉领域,与人工智能、信息科学、统计分析等领域有着紧密的联系。而本体作为一个新兴的探讨领域,与数据挖掘在应用的学科领域范围上有着较大的重合,比如在生物科学和化学领域,这两者的结合探讨也特别活跃。在数据挖掘中引入本体能够极大地解决数据挖掘面临的问题。系统探讨了在数据挖掘中本体的应用状况。关键词:数据管理;数据挖掘;本体中图分类号:TP391文献标识码:A文章编号:16727800(2012)007010403作者简介:闻中慧(1988-),女,湖北荆州人, 武汉高校信息管理学院硕士探讨生,探讨方向为数据挖掘与人工智能。0引言摩尔定律见
2、证了过去40多年来计算机技术的发展:芯片的处理速度越来越快,集成电路的体积越来越小、性价比越来越高。以硬盘为例,机械硬盘存储单位兆的成本不断下降,而性能更好的固态硬盘正在进入民用市场。计算机的硬件成本越来越低,而硬件的性能越来越好。存储每兆信息所须要的成本越来越低。这为大规模的数据存储打下了物质基础。计算机技术的普及大大提升了数据采集、存储和操作实力。数据库与DBMS顺应了大规模的数据管理而产生。从20世纪60年头早期简洁的数据收集到建立数据库,到20世纪70年头数据库管理系统的发展,到后来各种新型数据库,到数据仓库与数据挖掘的发展,数据库发展的内在驱动因素正是出于人们对快速增长的数据利用的需
3、求。身处于大量数据之中,却依旧感到缺乏信息,数据挖掘的产生正是为了满意从数据中挖掘信息的需求。数据挖掘这些年来被广泛应用和探讨,比如在生物科学、化学、天文和商业领域等等,这些领域的共同特点都是面临大量数据处理。数据挖掘也面临者很多问题:处于困难的数据环境中,须要支持多种数据源类型;挖掘算法的选择简单受运用者个人学问背景影响;产生规则过多;规则难以理解,须要领域学问背景等等。而本体的引入,从各个方面改进了数据挖掘面临的问题。1理论背景1.1数据挖掘的定义和KDD过程数据挖掘是“从资料中提取出隐含的过去未知的有价值的潜在信息”(1992年提出),也被认为是“从大量的、不完全的、有噪声的、模糊的、随
4、机的数据中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和学问的过程”(2001年提出),后者是被广泛引用的数据挖掘定义。数据挖掘定义的改变伴随着数据挖掘方法的探讨深化而改变, 在商务智能领域,数据挖掘被定义为是对商业数据库中的大量业务数据进行抽取、转换、分析和其它模型化处理,从中提取协助商业决策的关键性数据。尽管数据挖掘的定义在改变,但其总体目标仍旧是从现有的数据中挖掘未知的信息,转化和提取为可理解的信息和知,识以便进一步运用。数据挖掘经常与数据库中的学问发觉(Knowledge Discovery in Database,简称KDD)一起出现,两者被认为是同一概念。而文献2中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据挖掘中的本体应用研究综述 数据挖掘综述 数据 挖掘 中的 本体 应用 研究 综述
限制150内