OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx
《OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx》由会员分享,可在线阅读,更多相关《OLAP和数据挖掘技术在QAD产品审计中的应用与研究3184.docx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 OLAP和数据挖掘技术在QAD产品审计中的应用与研究OLAP和和数据挖掘掘技术在QQAD产品品审计中的的应用与研究究摘要随着时代的的发展,如如今的企业业已大多进进入了“无纸化”的办公时时代。原有有的手工信信息输入与与分析已无无法适应如如今日益增增多的信息息数据。可可以说,企企业每天都都面临着大大量的商业业信息,而而如何利用用、分析好这这些数据从从而为企业业的发展提提供指导就就显得尤其其重要。对对于QADD公司而言言,它是一一家专门为为制造业提提供企业解解决方案的的软件供应应商,它在在全球范围围内的九十十多个国家家拥有超过过六千多个个客户。每每一年,它它都会对每每个客户使使用公司软软件产品的的
2、情况进行行审计。在在每个客户户审计的过过程中,自自然会产生生大量的数数据。对于于公司而言言,所有客客户的审计计数据将是是百万级的的。面对如如此庞大的的数据,如如何从这些些数据中获获取公司所所需的信息息,分析出出审计的结结果,并得得出一定的的指导性结结论就显得得尤其重要要。为此,本文文提出了一一种基于联联机分析处处理(OLLAP)和和数据挖掘掘技术的审审计信息分分析的设计计。OLAPP和数据挖挖掘技术是是近年来数数据库领域域和人工智智能领域研研究的热点点,它通过过对大量数数据进行分分析和处理理,得到隐隐含在这些些数据背后后有用的信信息和知识识。本项目目实现了基基于SQLL Serrver 200
3、88分析服务务(SSAAS)在审审计信息立立方体之上上的OLAAP多维数数据分析和和MDX多多维数据查查询,并利利用决策树树、神经网网络等数据据挖掘算法法对审计信信息数据进进行挖掘,得得出有用的的知识。为实现上述述目标,首首先需要决决定存储分分析后的审审计信息的的数据库版版本与类型型以及最终终生成审计计结果报表表所需使用用的报表生生成工具。为为此,针对对数据库的的选择提出出了以下几几种可行的的解决方案案:Proogresss数据库库、MySSQL数据据库、Acccesss数据库和和SQL Servver数据据库。根据据实际需求求,分别比比较了以上上四种数据据库的优缺缺点,最终终权衡之后后选择了
4、SSQL SServeer数据库库作为本项项目的关系系数据库服服务器。同同样,针对对报表生成成工具,也也提出了以以下几种可可行的解决决方案:QQAD公司司自己实现现的报表生生成框架、微微软的Acccesss工具和微微软的Exxcel工工具。分析析了以上几几种工具使使用的便捷捷性以及代代价考虑,最最终选择了了大家比较较常用且比比较轻量型型的Exccel作为为我们最终终的报表生生成工具。在选定了数数据库和报报表生成工工具的解决决方案之后后,便要对对历史审计计数据进行行一定的整整理、分析析以及数据据提取和存存储工作。审计数据是由公司产品所提供的功能菜单运行后自动生成的,客户在对这些多种多样的报表整理
5、时,可能根据自身的习惯进行不同的打包方式。因此公司从客户手上得到的审计数据结构则是复杂繁多的,没有一定的规律性可循,这对我们进行历史审计信息的提取造成了一定的困难与阻碍。经过对历史审计数据的详细分析之后,找到了所需要的两个审计文件:应用使用详细报告和许可权使用情况报告。其他诸如数据库使用报告等日志文件目前对我们来说并没有太大的意义。因此我们的目标只是在每个客户的审计数据文件夹下找到这两个文件,分析提取数据,并存入数据库中。在实践中,发现如果不对历史数据进行处理,直接运行数据分析提取程序,则效率十分低下。究其原因是因为程序每次都需要遍历每个文件来确认该文件是否为所需的那两个报告文件,因此要花费大
6、量的时间。为解决这一问题,就需要在程序之上再加上一层数据预处理的程序,即将不需要的历史数据文件过滤,按照原有的目录结构,只留下所需的那两个文件。这样,在数据预处理的基础上,程序运行的效率将大大提高。解决了这一问题之后,便是要将分析出的数据存入数据库中。根据历史审计数据信息及相关的外部数据信息,按照需求,共设计了六张数据表。该数据库将为后面的OLAP提供高效的数据源。有了关系数数据库源,便便可利用SSSAS对对审计数据据进行维度度建模。本本文重点论论述了审计计信息数据据的概念模模型设计和和逻辑模型型设计,包包括度量、维维度和粒度度的设计,事事实表和维维表的设计计,同时采采用了雪花花模型构造造了逻
7、辑视视图,最终终生成了审审计信息的的多维立方方体,供最最终生成审审计结果报报表和数据据挖掘提供供了多维数数据源,完完成了OLLAP在QQAD产品品审计中的的应用。在在生成审计计结果报表表时,使用用Exceel中的透透视表,建建立数据库库连接,选选择建立的的多维数据据源,便可可读取多维维数据中的的内容。为为了方便客客户审阅,特特别定义了了十多个报报表模板,可可供客户选选择,基本本涵盖了所所有的审计计结果,且且客户可以以自主选择择想要查看看的内容,对对数据进行行一定的钻钻取等,十十分方便。最后,便是是使用数据据挖掘技术术对审计数数据进行一一定的挖掘掘任务研究究。传统的的数据挖掘掘过程往往往基于关系
8、系数据库。本本文探讨了了基于OLLAP的数数据挖掘技技术在产品品审计中的的应用,分分别使用了了决策树算算法和神经经网络算法法对同一个个挖掘模型型进行了挖挖掘,并利利用提升图图比较了两两个算法的的挖掘准确确性。本文文所建立的的挖掘模型型为分析客客户选择QQAD公司司不同产品品类型组合合的因素,意意在发现一一个行业领领域内使用用QAD公公司产品组组合的最佳佳实践,为为不同的客客户在选择择公司产品品组合时提提供一定的的建议。由由于时间及及精力的有有限,只是是粗略探索索了数据挖挖掘在公司司审计中应应用的可能能性。相信信可以利用用该技术挖挖掘出更多多对公司经经营决策有有指导性意意义的知识识。本文的研究究
9、和结果表表明,OLLAP和数数据挖掘技技术在QAAD公司产产品审计中中的应用是是可行的,而而且是便捷捷高效的。它它不仅从企企业管理的的角度为公公司决策层层与销售人人员提供了了更为智能能的分析方方法和途径径,还为审审计分析人人员提供了了新的手段段和视角,来来挖掘出更更多数据背背后隐藏的的有用的知知识。关键词:数数据挖掘,OOLAP,多多维数据分分析,SQQL Seerverr 20008分析服服务,产品审计计THE AAPPLIICATIION AAND RRESEAARCH OF OLAP AND DATAA MINNING TECHHNOLOOGY IIN QAD PPRODUUCT AAU
10、DITTABSTRRACTWith the deveelopmment of tthe ssocieety, scieence and techhnoloogy, mostt of the enteerpriises havee noww entteredd thee papperleess oofficce tiime. The origginall mannual inpuut annd annalyssis ccoulddnt deeal wwith the incrreasiing iinforrmatiion aand ddata any moree. Evvery day, ent
11、terprrisess aree facced wwith lotss of busiinesss infformaationn, annd bee awaare oof knnow hhow tto usse thhese dataa to anallysiss, too proovidee guiidancce foor deeveloopmennt off thee entterprrise is eespecciallly immporttant. For QAD whicch iss a ssoftwware suppplierr commpanyy whoo proovidees
12、soolutiions to sspeciializzed mmanuffactuuringg entterprrisess, haas moore tthan 6,0000 muultipple ccliennts wwithiin 900 couuntriies wworlddwidee. Eveery yyear, alll cliientss usiing ssoftwware prodductss connditiions willl be audiited by tthe ccompaany. In eeveryy cusstomeer auudit proccess, larrg
13、e aamounnts oof daata wwill be pproduuced. Forr QADD, thhe nuumberr of all custtomerrs auddit ddata gathheredd toggetheer wiill bbe miillioons. Faciing ssuch largge nuumberrs off datta, iit iss esppeciaally impoortannt too knoow hoow too gett thee infformaationn thee commpanyy neeed, tto annalyssis
14、tthe aauditt ressultss, annd soome gguidaance concclusiions fromm thiis huuge aand mmessyy datta.Thereeforee, thhis ppaperr prooposeed a multti-diimenssionaal annalyssis oof QAAD prroducct auuditiing ddesiggn baased on OOLAP and dataa minning techhnoloogy. OLAPP andd datta miiningg tecchnollogy have
15、e beccominng a ressearcch hoot sppot oof daatabaase aand tthe ffieldd of artiificiial iintellligeence duriing rrecennt yeears. It throough the largge daata aanalyysis and proccessiing, impllicattes uusefuul innformmatioon annd knnowleedge behiind tthesee datta. TThis projject reallizedd OLAAP muulti
16、-dimeensioonal dataa anaalysiis annd MDDX muulti-dimeensioonal dataa queery oon thhe baasis of SSQL SServeer Annalyssis SServiice 22008 in tthe aauditt infformaationn cubbe, aand aachieeved audiit innformmatioon daata mmininng ussing deciisionn treees aand tthe nneuraal neetworrk daata mmininng allg
17、oriithm for audiit innformmatioon too draaw ussefull knoowleddge ffor tthe ccompaany.To acchievve thhis ggoal, we firsst neeed tto deecidee thee dattabasse veersioon annd tyype tto chhoosee, whhich is uused to sstoree thee auddit iinforrmatiion aafterr thee anaalysiis annd whhich repoortinng frramew
18、work toolls too chooose to ggenerrate finaal auudit resuult rreporrt. TThereeforee, seeveraal feeasibble ssoluttionss of dataabasees baased on ddemannd weere pput fforwaard. Theyy aree Proogresss daatabaase, MySQQL daatabaase, Acceess ddatabbase and SQL Servver ddatabbase. Acccordiing tto acctuall n
19、eeeds, and afteer coomparring eachh advvantaages and disaadvanntagees off thee aboove ffour dataabasee serrverss, thhe SQQL seerverr dattabasse waas chhosenn as the relaationnal ddatabbase servver ffinallly. Simiilarlly, ffor rreporrtingg toools, the folllowinng feeasibble ssoluttionss werre allso p
20、put fforwaard: QAD repoortinng frramewwork reallizedd by the comppany, Miccrosooft AAccesss toool aand MMicroosoftt Exccel ttoolss. Exxcel was chossen aas thhe reeportting tooll finaally becaause mostt of the userrs arre veery ffamilliar withh it and it iis poowerfful ffor ggenerratinng vaariouus re
21、eportts thhoughh it is vvery lighhtweiight.Afterr finnisheed seelecttion of ddatabbase and repoort ggenerratioon toool, the nextt steep waas too deaal wiith tthe aauditt datta. WWe neeed tto soort oout, anallysiss andd exttractt datta annd fiinallly maake tthese useeful infoormattion be sstoreed inn
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OLAP 数据 挖掘 技术 QAD 产品 审计 中的 应用 研究 3184
限制150内