数据挖掘:统计学理论之于ERP系统的应用浅析.doc
【精品文档】如有侵权,请联系网站删除,仅供学习与交流数据挖掘:统计学理论之于ERP系统的应用浅析.精品文档.数据挖掘:统计学技术之于ERP系统的应用浅析摘 要:随着信息技术的不断发展和现代管理业务需求的不断提升,同时在企业、学术团体及媒体的推动下,ERP已经成为近年来IT界的一个热点,应用ERP能够有效改善管理,全面提升企业竞争能力已是不争的事实。然而随着ERP系统的深入应用, 企业逐渐形成了大量的数据, 如何利用并分析ERP系统中的数据来帮助管理决策, 已经引起人们的重视并成为ERP系统建设的重要目标之一。本文将以数据挖掘技术为切入点,对统计学相关原理和方法在ERP系统中的应用进行简要分析。关键词:ERP系统 数据挖掘 统计学一 概念与定义:定义1【1】:ERP是建立在信息技术的基础上, 利用现代企业的先进管理思想, 全面地集成了企业的所有资源信息, 并为企业提供决策、计划、控制与经营业绩评估的全方位和系统化的管理平台。定义2【2】:数据挖掘就是从大量的数据中挖掘出有用的信息, 即从大量的、不完全的、有噪音的、模糊的、随机的实际应用数据中发现隐含的、规律性的, 人们事先未知的, 但又是潜在有用的并且最终可理解的信息和知识的非平凡过程。定义3【3】:统计: 收集、分析、表述和解释数据。二 数据挖掘技术在ERP系统中的应用与传统的数据分析手段相比, 数据挖掘有以下几个特点:首先, 数据挖掘处理的是大量或海量的数据; 其次, 数据挖掘的目的是发现隐含的、事先未知的知识; 再次, 数据挖掘更倾向于把任务交给程序自动完成, 也是人工智能的一种应用; 最后, 数据挖掘是一个交叉学科, 是高级的数据分析手段。数据挖掘使用各种不同的算法来完成不同的任务。数据挖掘的任务一般可以分为两类:描述和预测。描述性数据挖掘任务刻画数据库中数据的一般特性。预测性挖掘任务在当前数据上进行推断, 以进行预测。最基本也是最重要的数据挖掘任务为:1) 关联: 关联分析发现关联规则, 这些规则展示了属性与属性之间的关系;2) 聚类: 产生分组标记, 根据最大化类内相似性、最小化类间相似性原则将数据分成不同的簇;3) 分类/预测: 找出描述并区分数据类或概念的模型, 以便能使用模型预测类标记未知的对象类。数据挖掘还有序列发现、相关分析、孤立点分析等多种任务。1 基于数据仓库的应用框架【4】根据ERP系统的特点, 结合典型的数据挖掘系统结构 , 一种基于数据仓库的ERP系统数据挖掘应用框架如图1所示, 标记为应用框架1。ERP业务数据库属于数据库技术中的操作型数据库, 主要处理联机事务, 关注多事务处理、数据的一致性与完整性等, 重点不在于大数据量的查询与分析。而数据仓库是分析型数据库, 是一种数据的长期存储,数据经过组织在一致的模式下存放, 通常是历史数据的汇总, 目的是为了支持决策。数据仓库的数据组织、存取方法以及支持的主要功能等都是针对历史数据的查询与分析而设计, 因此数据仓库能更好地支持数据挖掘。图1所示的应用框架描述如下:a) 数据处理模块: 将ERP业务数据库的数据经过提取、转换与加载等, 转换为符合数据仓库要求的数据。b) 数据挖掘引擎: 用于执行数据挖掘任务, 包括关联规则、聚类、分类等。c) 知识库: 领域知识, 用于指导数据挖掘执行, 也用于评估数据挖掘的结果模式。d) 模式评估: 该模块与数据挖掘引擎交互, 也与用户交互, 并根据知识库的相关知识, 评估数据挖掘结果的兴趣度, 过滤发现的模式。基于数据仓库的数据挖掘应用框架的特点是: 数据挖掘过程与ERP业务过程分离, 挖掘过程不影响实时操作, 但分析对象也不是实时数据。2 基于ERP业务数据库的应用框架【5】尽管数据仓库技术对数据挖掘有着重要作用, 但是数据挖掘不限于仅分析数据仓库中的汇总数据, 它可以分析现存于ERP系统中的更细化的业务数据, 因此, 基于ERP业务数据库的数据挖掘应用框架如图2所示, 标记为应用框架2。在这一框架中, 数据挖掘不再是建立在数据仓库上的独立系统, 而是作为ERP系统的一个高级模块存在, 它一方面是对数据挖掘分析对象的扩展, 另一方面也是日益重要的在线实时数据分析的要求。在图2所示的应用框架中, ERP 数据挖掘模块直接处理分析业务数据, 同样基于知识库进行模式评估,并与用户交互。必要的数据预处理功能作为数据挖掘模块内部功能存在, 直接提取处理ERP操作数据库。事实上, 大型的数据库系统也越来越向提供智能分析与数据挖掘功能的方向发展, 因此, 在不建立数据仓库的情况下, 利用数据挖掘技术直接对ERP业务数据进行一定程度的分析也是可行的。总结:数据挖掘技术作为数据分析与决策支持实现的高级技术, 必将成为ERP应用的一个重要内容, 随着ERP系统与数据挖掘技术的进一步发展, 在ERP系统中的数据挖掘应用必将为企业提供更快、更有效的决策支持服务, 也必将给企业带来巨大的经济效益。三 数据挖掘与统计学的关系数据挖掘是统计学的新分支从本质上看, 统计工作的核心就是数据(或者信息)的采集、分析和处理。把数据挖掘作为统计学的一个分支。一方面是因为,数据挖掘大量借用了统计学的方法( 如抽样技术、因子分析,聚类分析、回归分析和时间序列分析等),而更重要的是,数据挖掘与统计学有着共同的处理对象数据;共同的目的处理和分析数据以获得数据中的信息,这是最本质的。根据权威的不列颠百科全书的统计定义,一切研究如何收集、分析、表述和解释数据的方法论科学都是统计学,所以作为一种数据处理和分析方法,数据挖掘是统计学的一个分支。而数据挖掘技术与传统统计学仍有一定的区别,数据挖掘所处理的数据是一种特殊数据, 与传统统计学所处理的数据相比有着一些明显的特征: 海量性、自然性、动态性、异地存储等, 还有很多数据为非数字型, 这些正是数据挖掘给传统统计学的挑战, 也是将数据挖掘作为统计学的一个分支给统计学注入的新鲜血液。四 总结【焦裕朋】 统计学最初是作为一门实质性科学建立起来的, 它从数量上研究某类具体的现象(如社会经济发展)的规律,但是,随着统计学研究范围的不断扩大以及统计方法在社会领域和自然领域内的有效应用,加之统计方法体系本身的不断发展和完善,使得统计学的研究对象也发生了变化。统计学已从实质性科学中分离出来,转而研究统计方法,成为一门方法论的科学。即统计学是研究如何搜集数据、整理数据和分析数据的一门方法论科学。同时,ERP不仅仅是信息系统, 更重要的是一种管理理论与管理思想, 它代表了当前在全球范围内应用最广泛、最有效的一种企业管理方法, 这种管理方法已经通过计算机软件得到了体现。 已经经过几百年发展历史的统计学理论,与伴随着信息技术发展以及现代企业管理技术的发展迅速进入人们视野的企业管理信息系统,找到了一个完美的契合点数据挖掘技术。数据挖掘技术广泛利用统计学理论,为分析和利用ERP系统积累的数据, 提高决策能力,增强ERP系统的工作效率,提供了巨大的技术支持和帮助。【参考文献】1罗鸿. ERP原理 设计 实施M . 北京: 电子工业出版社, 2005.2刘坚, 刘承焕. 数据挖掘技术在制造型企业信息化中的应用3不列颠百科全书4 HAN J, KAMBER M. Datemining: concepts and techniquesM. Morgan Kaufmann Publishers, 2000.5 李晶, 陈骥. 数据挖掘技术对ERP实施的重要性 J . 福建电脑