审计数据采集与分析技术论述.pptx
《审计数据采集与分析技术论述.pptx》由会员分享,可在线阅读,更多相关《审计数据采集与分析技术论述.pptx(167页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 一般认为,计算机审计有一般认为,计算机审计有3层含义:层含义: 面向数据的审计面向数据的审计 面向现行信息系统的审计面向现行信息系统的审计 对信息系统生命周期的审计对信息系统生命周期的审计 审前调查:审前调查:电子数据的组织、处理和存储电子数据的组织、处理和存储 数据采集:数据采集:审计接口、数据库访问技术、数据采集技审计接口、数据库访问技术、数据采集技术术 数据清理、转换、验证、建立中间表数据清理、转换、验证、建立中间表 数据分析:数据分析:数据分析技术、数据分析技术、SQL、审计软件、审计软件 审计取证审计取证 对组织结构调查对组织结构调查 管理体制管理体制 在管理集中度高的单位,系统相
2、应是集中式的; 数据由下级部门录入并上传,下级部门可能了解数据结构,也可能根本不知道数据结构; 在上传前可能进行具体的数据处理,也可能不进行任何处理,只上传原始数据; 通过对管理体制的调查,可以为以后确定索取哪些技术资料、数据,以及索取的方式方法等提供依据; 部门设置情况部门设置情况 部门的具体职能部门的具体职能 部门内计算机信息系统的情况部门内计算机信息系统的情况 并非所有的业务都一定运用计算机信息系统并非所有的业务都一定运用计算机信息系统 选择重点部门进行部门内计算机信息系统情况的调查选择重点部门进行部门内计算机信息系统情况的调查 对计算机信息系统的调查对计算机信息系统的调查 对计算机信息
3、系统概况的调查对计算机信息系统概况的调查 硬件设备硬件设备 系统软件系统软件 系统技术文档资料系统技术文档资料 系统的主要功能系统的主要功能 系统的业务处理流程系统的业务处理流程 对数据库及数据的调查对数据库及数据的调查 数据库相关技术情况数据库相关技术情况 系统设计说明书 数据库详细设计说明书,基本包含以下内容: 总数据流图和具体业务数据流图、软件结构图设计 数据库表间关系图 表结构描述 数据库SQL文件(含表、视图、触发器、存储过程等) 用户使用手册 系统对业务处理的流程系统对业务处理的流程 提出数据需求提出数据需求 确定所需数据内容确定所需数据内容 确定数据获取的具体方式确定数据获取的具
4、体方式 提出书面数据需求提出书面数据需求 存储介质改变存储介质改变(纸张(纸张磁性、光电介质)磁性、光电介质) 基于一定的数据处理平台,有一定的数据模型基于一定的数据处理平台,有一定的数据模型(层次、网状和关系模型,利用(层次、网状和关系模型,利用DBMS存储和管理数据,存储和管理数据,会计信息组织与手工系统不同)会计信息组织与手工系统不同) 数据表示编码化数据表示编码化(各种编码)(各种编码) 带来系统控制和数据安全性的新问题带来系统控制和数据安全性的新问题(传统的控制点正在发生变化,信息系统的控制与安全(传统的控制点正在发生变化,信息系统的控制与安全性问题日渐突出)性问题日渐突出) 审计线
5、索改变审计线索改变(修改数据文件可以不留下痕迹,可以利用诸如系统日(修改数据文件可以不留下痕迹,可以利用诸如系统日志和数据库日志等系统控制手段发现一些线索)志和数据库日志等系统控制手段发现一些线索) 数据模型数据模型 数据模型是对现实世界数据特征的抽象数据模型是对现实世界数据特征的抽象 它提供模型化数据和信息的工具它提供模型化数据和信息的工具在信息世界中,使用概念模型在信息世界中,使用概念模型(用于信息世界建模,语义表(用于信息世界建模,语义表达能力强)达能力强) E-R模型是一种常用的概念模型,它用来描述实体以及模型是一种常用的概念模型,它用来描述实体以及实体之间的联系实体之间的联系 E-R
6、模型的要素模型的要素 实体:客观存在并可以相互区分的事物,用方框表示实体:客观存在并可以相互区分的事物,用方框表示 属性:实体的特征或性质,用椭圆表示属性:实体的特征或性质,用椭圆表示 联系:实体之间的联系,用菱形表示联系:实体之间的联系,用菱形表示在计算机世界中,使用具体在计算机世界中,使用具体DBMS支持的数据模型支持的数据模型(用于机(用于机器世界,有严格的形式化定义)器世界,有严格的形式化定义) 关系模型关系模型 层次模型层次模型 网状模型网状模型 数据结构数据结构 描述模型的静态特征描述模型的静态特征 是刻画数据模型最重要的方面是刻画数据模型最重要的方面 数据操作数据操作 描述模型的
7、动态特性描述模型的动态特性 数据检索数据检索 数据更新(增加、删除、修改)数据更新(增加、删除、修改) 约束条件约束条件 一组完整性规则的集合一组完整性规则的集合 实体完整性实体完整性 引用(参照)完整性引用(参照)完整性 用户定义的完整性用户定义的完整性 关系模型是目前最常用的一种数据模型关系模型是目前最常用的一种数据模型 关系数据库采用关系模型作为数据的组织方式关系数据库采用关系模型作为数据的组织方式 关系模型建立在严格的关系代数基础之上关系模型建立在严格的关系代数基础之上 关系模型概念单一关系模型概念单一实体以及实体之间的联系都用实体以及实体之间的联系都用关系关系来表来表示。示。关系之间
8、的联系则是通过关系之间的联系则是通过相容(来自同一个域)的属性相容(来自同一个域)的属性来表示。来表示。 关系必须是规范化的关系关系必须是规范化的关系最基本的要求是每一个分量是一个不可分的数据项,亦即不允许最基本的要求是每一个分量是一个不可分的数据项,亦即不允许表中还有表表中还有表 (满足第一范式,(满足第一范式,1NF) 关系数据库的标准语言关系数据库的标准语言SQL是一种非过程化语言,使用方是一种非过程化语言,使用方便便 关系关系 一张二维表,每一列都不可再分一张二维表,每一列都不可再分 表中的行、列次序并不重要表中的行、列次序并不重要 元组元组 二维表中的每一行,相当于一条记录二维表中的
9、每一行,相当于一条记录 属性属性 二维表中的每一列,属性有名称与类型。二维表中的每一列,属性有名称与类型。 属性不可再分,不允许重复属性不可再分,不允许重复 主键主键 由表中的属性或属性组组成,用于唯一确定一条记录由表中的属性或属性组组成,用于唯一确定一条记录 域域 属性的取值范围属性的取值范围 关系模式关系模式 记录结构的描述,对应关系表的表头记录结构的描述,对应关系表的表头 传统的集合运算传统的集合运算 并(并(UNION) 交(交(INTERSECTION) 差(差(MINUS) 笛卡儿积笛卡儿积 专门的关系运算专门的关系运算 选择(选择(SELECTION) 投影(投影(PROJECT
10、) 连接(连接(JOIN) 连接的含义:相容属性之间的关系连接的含义:相容属性之间的关系 连接的类型(内连接、外连接、自然连接)连接的类型(内连接、外连接、自然连接) 实体完整性(实体完整性(Entity Integrity)关键字属性的组成部分不能为空值关键字属性的组成部分不能为空值 参照完整性(参照完整性(Referential Integrity)参照表中的外关键字要么取空值,要么取被参照表参照表中的外关键字要么取空值,要么取被参照表中的某一主关键字的值中的某一主关键字的值 用户定义完整性(用户定义完整性(User-Defined Integrity )具体应用环境的完整性约束,反映了某
11、一具体应用具体应用环境的完整性约束,反映了某一具体应用所涉及的数据应满足的语义要求所涉及的数据应满足的语义要求 “数据文件数据文件”这个概念具有非常丰富的内涵,它泛这个概念具有非常丰富的内涵,它泛指各种用来存储数据的文件。指各种用来存储数据的文件。 在数据库技术诞生之前,它指的是存放数据的文件本身。在数据库技术诞生之前,它指的是存放数据的文件本身。 数据库技术诞生后,数据由数据库技术诞生后,数据由DBMS管理,数据文件是存放物理数管理,数据文件是存放物理数据库的载体。据库的载体。 不同的不同的DBMS存储数据的方式是不同的。存储数据的方式是不同的。 FoxPro一个逻辑上的表对应一个一个逻辑上
12、的表对应一个“库文件库文件”(.dbf) Access所有的数据库对象放在一个数据库文件中(所有的数据库对象放在一个数据库文件中(.mdb) IBM DB2一张表的数据可能分别放在不同的数据文件中一张表的数据可能分别放在不同的数据文件中 除了除了DBMS产生和维护的数据文件之外,还有很产生和维护的数据文件之外,还有很多应用程序管理的数据文件,如各种临时文件、多应用程序管理的数据文件,如各种临时文件、数据交换文件等。数据交换文件等。 运用运用软件工程的思想与方法软件工程的思想与方法,根据数据库设计的,根据数据库设计的特点提出了各种设计准则和设计规程;特点提出了各种设计准则和设计规程; 逻辑数据库
13、设计与物理数据库设计逻辑数据库设计与物理数据库设计是关键与核心;是关键与核心; 对设计质量的控制是以对设计质量的控制是以大量的书面文档大量的书面文档和和数据字数据字典典为基础的;为基础的; 目前出现了许多目前出现了许多可视化的规范化辅助设计软件可视化的规范化辅助设计软件; 还没有支持数据库设计全过程的辅助工具还没有支持数据库设计全过程的辅助工具 。 需求分析需求分析 概念结构设计概念结构设计 逻辑结构设计逻辑结构设计 物理数据库设计物理数据库设计 数据库实施数据库实施 运行维护运行维护 需求分析数据库运行和维护数据库实施数据库物理设计逻辑结构设计概念结构设计需求说明与数据说明概念结构逻辑结构物
14、理结构数据库系统需求分析的重点是获得两方面的需求:需求分析的重点是获得两方面的需求:(1 1)信息需求)信息需求定义未来信息系统使用的全部信息,了解各项数定义未来信息系统使用的全部信息,了解各项数据间的本质联系,描述数据的内容和结构以及它据间的本质联系,描述数据的内容和结构以及它们之间的联系等。们之间的联系等。(2 2)处理需求)处理需求定义未来信息系统数据处理的功能及功能与数据定义未来信息系统数据处理的功能及功能与数据之间的联系。同时考虑性能、安全性和完整性约之间的联系。同时考虑性能、安全性和完整性约束。束。 自顶向下的结构化分析方法(自顶向下的结构化分析方法(Structured Anal
15、ysis, SA)是需求分析阶段的一种常用方法。)是需求分析阶段的一种常用方法。它的核心思想是:自顶向下逐层分解,直到每它的核心思想是:自顶向下逐层分解,直到每一项功能都可以被容易地实现为止。一项功能都可以被容易地实现为止。 SA方法中要用到方法中要用到数据流程图数据流程图(Data Flow Diagram, DFD)来描述数据的处理过程。数据)来描述数据的处理过程。数据流图是从流图是从“数据数据”和和“处理处理”两方面来表达数两方面来表达数据处理过程的一种图形化的表示方法。据处理过程的一种图形化的表示方法。 以储户取款业务为例以储户取款业务为例储户取款业务处理帐户资料取款信息现金储户帐户资
16、料取款信息现金接受储户信息密码、余额验证支付现金密码验证通过信息金额金额 数据字典(数据字典(Data Dictionary,DD)是在系统设计过程)是在系统设计过程中对各类基本要素进行描述的集合。它是描述系统逻辑中对各类基本要素进行描述的集合。它是描述系统逻辑模型的重要工具。数据字典的组成部分模型的重要工具。数据字典的组成部分: 数据项数据项 数据结构数据结构 数据流数据流 数据存储数据存储 处理过程处理过程 其中数据项是数据的最小组成单位,若干个数据项可以其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构组成一个数据结构,数据字典通过对数据项和
17、数据结构的定义来描述数据流和数据存储的内容。的定义来描述数据流和数据存储的内容。 销售业务中有很多数据项,其中销售业务中有很多数据项,其中“科目代码科目代码”数据项数据项可以描述如下:可以描述如下:数据项编号:数据项编号:Item001数据项名称:数据项名称:KMDM 数据项含义说明:数据项含义说明:唯一标识每个科目唯一标识每个科目别名:别名:科目代码科目代码数据类型:数据类型:字符型字符型数据长度:数据长度:9取值范围:取值范围:100000000至至999999999取值含义:取值含义:前前3位是一级科目,后面每位是一级科目,后面每2位是一个科目位是一个科目级别级别与其他数据项的逻辑关系:
18、与其他数据项的逻辑关系:数据流数据流“工资结算单工资结算单”可以描述如下:可以描述如下:数据流编号:数据流编号:Flow001数据流名称:数据流名称:GZJSD说明:说明:财务部门计算的工资结算单财务部门计算的工资结算单数据流来源:数据流来源:财务部门财务部门数据流去向:数据流去向:职工职工组成(数据结构):组成(数据结构):职工号姓名性别基本工资出勤工日职工号姓名性别基本工资出勤工日缺勤工日病假事假工伤假应扣工资副食补贴物缺勤工日病假事假工伤假应扣工资副食补贴物价补贴房租水电储蓄其他实发工资价补贴房租水电储蓄其他实发工资平均流量:平均流量:1500/月(单位职工人数)月(单位职工人数)高峰期
19、流量:高峰期流量:低谷期流量:低谷期流量:处理过程处理过程“登记日记账登记日记账”可描述如下:可描述如下:处理过程编号:处理过程编号:Proc001处理过程名称:处理过程名称:DJRJZ输入数据流:输入数据流:记账凭证记账凭证输出数据流:输出数据流:现金及银行存款日记账现金及银行存款日记账处理说明:处理说明:根据收款凭证、付款凭证逐笔顺序登记现金日记根据收款凭证、付款凭证逐笔顺序登记现金日记账和银行存款日记账账和银行存款日记账处理要求:处理要求:每月处理多次,每次处理时间小于每月处理多次,每次处理时间小于15分钟分钟字段名称字段名称字段含义字段含义字段类型字段类型字段属性字段属性Prj_Cod
20、e项目编号项目编号字符型字符型关键字关键字Prj_Name项目名称项目名称字符型字符型非空非空Prj_Attr项目性质项目性质字符型字符型非空非空Audit_Chief审计组长审计组长字符型字符型非空非空Main_Staff主审主审字符型字符型非空非空Strategy审计方案审计方案字符型字符型非空非空Start_Date进点日期进点日期日期时间型日期时间型非空非空Time_Period工作周期工作周期数值型数值型非空非空 自顶向下:自顶向下:首先定义全局概念结构的框架,再做逐首先定义全局概念结构的框架,再做逐次细化。次细化。 自底向上:自底向上:首先定义每一局部应用的概念结构,然首先定义每一
21、局部应用的概念结构,然后按一定的规则把它们集成起来,得到全局概念结后按一定的规则把它们集成起来,得到全局概念结构。构。 由里向外:由里向外:首先定义最重要的那些核心结构,再逐首先定义最重要的那些核心结构,再逐渐向外扩充。渐向外扩充。 混合策略:混合策略:把自顶向下和自底向上结合起来的方法。把自顶向下和自底向上结合起来的方法。它先自顶向下设计一个概念结构的框架。然后以它它先自顶向下设计一个概念结构的框架。然后以它为骨架再自底向上设计局部概念结构,并把它们集为骨架再自底向上设计局部概念结构,并把它们集成起来。成起来。 E-R方法用方法用E-R图来描述现实世界的概念模型。将现图来描述现实世界的概念模
22、型。将现实世界抽象为实体以及实体之间联系。实世界抽象为实体以及实体之间联系。E-R图的元图的元素包括:素包括: 方框:表示实体型(方框:表示实体型(Entity),并在框内写上实体),并在框内写上实体的名称;的名称; 椭圆:表示实体的属性(椭圆:表示实体的属性(Attribute),并用无向边),并用无向边将实体与其属性连接起来;将实体与其属性连接起来; 菱形:表示实体间的联系(菱形:表示实体间的联系(Relationship),菱形),菱形内写上联系的名称,用无向边将菱形分别与相关的内写上联系的名称,用无向边将菱形分别与相关的实体相连,在无向边的旁边标明联系的类型。若联实体相连,在无向边的旁
23、边标明联系的类型。若联系也有属性,则把属性椭圆和联系菱形也用无向边系也有属性,则把属性椭圆和联系菱形也用无向边连接起来。连接起来。 一对一的联系(一对一的联系(1 :1)一个班级对应一个班主任一个班级对应一个班主任 一对多的联系(一对多的联系(1 :n)一个班级可以有多名学生,一个学生只能属于一个班级一个班级可以有多名学生,一个学生只能属于一个班级 多对多的联系(多对多的联系(m :n)一个学生可以学多门课程,一门课程可以有多名学生一个学生可以学多门课程,一门课程可以有多名学生班级职工班主任工资条1111班级部门学生职工1n1n学生产品课程原材料mnmnPrj_CodePrj_AttrPrj_
24、NameAudit_ChiefStrategyMain_StaffStart_DateStatusTime_PeriodProjectP-AAuditorID_CodeAgeAuditor_NameGenderServe_PeriodMajorUsageP-RResourceCodeTypeRsc_NameAvailableExp_Datemnnm 设计局部设计局部E-R模型模型 将局部将局部E-R模型集成为全局模型集成为全局E-R模型模型 属性冲突属性冲突 命名冲突命名冲突 结构冲突结构冲突 对全局对全局E-R模型进行优化模型进行优化 形成初始关系数据库模式形成初始关系数据库模式 关系模式规
25、范化和优化关系模式规范化和优化 外模式设计外模式设计提供了数据的逻辑独立性提供了数据的逻辑独立性 能适应用户对系统的不同需求能适应用户对系统的不同需求 具有一定的安全保密作用具有一定的安全保密作用 符合建立索引的条件:符合建立索引的条件:主关键字及外关键字主关键字及外关键字上一般都应建立索引,以加快实体间连接上一般都应建立索引,以加快实体间连接速度,有助于引用完整性检查以及唯一性检查。速度,有助于引用完整性检查以及唯一性检查。用户用户经常访问的字段经常访问的字段上应建立索引。上应建立索引。以读操作为主的关系表以读操作为主的关系表尽可能多地建立索引。尽可能多地建立索引。对对等值连接查询等值连接查
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 审计 数据 采集 分析 技术 论述
限制150内