《计算机二级公共基础(超级).docx》由会员分享,可在线阅读,更多相关《计算机二级公共基础(超级).docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章 算法与数据结构1.1 算法l 定义:指解题方案的准确而完整的描述。(不等于程序,也不等于计算方法)l 基本特征 可行性确定性有穷性有限个步骤后终止(有限时间内终止)拥有足够的情报l 四种基本运算与操作:算术运算 逻辑运算 关系运算 数据传输l 三种基本控制结构:顺序结构 选择结构 循环结构l 基本设计方法 列举法 归纳法 逆推 逆归 减半递推技术 回溯法l 指令系统:一个计算机系统能执行所有指令的集合。l 复杂度 时间复杂度执行算法所需的计算工作量空间复杂度执行算法所需的内存空间l 一种逻辑结构可以有多种存储结构l 不同存储结构影响效率l 逻辑结构:对数据元素之间的逻辑关系的描述l 存
2、储结构(物理结构):数据的逻辑结构在计算机存储空间中的存放形式1.2.1数据结构l 定义:相互关联的数据元素的集合l 研究的三个方面逻辑结构 一对多顺序存储结构链接索引等l 顺序存储方式主要用于线性的数据结构它把逻辑上相邻的数据元素存储在物理上相邻的存储单元里,结点之间的关系由存储单元的相邻衔接关系来体现l 链式存储结构在每个节点中至少包含一个指针域,用指针来体现数据元素之间逻辑 上的联系1.2.2线性结构和非线性结构l 根据数据元素结构中的各数据元素之间前后件关系的复杂程度l 对于一个非空的数据结构 线性结构 有且只有一个根结点(线性表) 每个结点最多有一个前件,也最多有一个后件非线性结构:
3、不是线性结构l 在一个线性结构中插入或删除任何一个结点后还是线性结构l 线性结构:栈、队列、串;循环队列、带链队列、带链栈l 非线性结构:数组、广义表、树(例二叉树)和图l 线性表是最简单的最常用的一种线性结构,线性链表指的是采用链式存储结构的线性表,栈和列是一种特殊的线性表,树是一种简单的非线性结构,二叉树是树的一种。l 线性与非线性是从数据的逻辑结构角度来讲,与该数据结构中含有多少个元素无关,即使是空的二叉树也是非线性结构l 有序线性表既可以采用顺序存储结构,又可以采用链式存储结构l 线性表的顺序存储结构具有以下两个基本特点:1) 线性表中所有元素所占的存储空间是连续的2) 线性表中各元素
4、所占的存储空间中是按逻辑顺序依次存放的3) 元素ai的存储地址为:ADR(ai)=ADR(a1)+(i-1)k, ADR(a1)为第一个元素地址,k代表每个元素占的字节数l 顺序表的运算:查找、插入、删除3种1.3 栈 (先进后出)(后进先出)(子弹匣)l 限定在一端进行插入与删除的线性表(既可以顺序存储,又可以链式存储)l 栈顶允许插入与删除元素的一端l 栈底封闭的一端,栈底指针不变l 栈顶总是最先被删除的一端l 栈底总是最先被插入的一端l 栈的基本运算入栈栈顶插入退栈取栈顶元素并赋给一个指定变量读栈顶元素:将栈顶元素赋给一个指定的变量。l 栈具有记忆作用l 在栈中,栈底指针不变,栈中元素随
5、栈顶指针变化而动态变化l 与栈结构关联:子程序的调用1.4队列(先进先出)(后进后出)(火车进隧道)l 只允许一段插入,另一端删除的顺序表(顺序存储)l 队头允许删除l 队尾允许插入l 队列运算入队插入元素退队删除元素l 与队列结构有关联: “先到先服务”的作业调度l 循环队列1) 定义:队列存储空间的最后一个位置绕到第一个位置形成逻辑上的环状空间,供队列循环使用2) 循环队列作为特殊的队列,也是线性结构3) 循环队列中,队尾指针既可以大于队头指针,也可以小于。4) 队列是一种逻辑结构,而循环队列是一种顺序存储结构的队列5) 循环队列中的元素个数由队头指针和队尾指针共同决定6) 求循环队列中的
6、元素个数?队尾指针(rear) 队头指针(front) m为队列容量入队(rear=rear+1) 退队(front=front+1)元素个数为 rear-front , rearfront ; rear-front+m , rear1,则该结点的父结点编号为INT(k/2)b) 若2kn,则编号为k的结点的左子结点编号为2k;否则该结点无左子结点(显然也没有右子结点)c) 若2k+1n,则编号为k的结点的右子结点编号为2k+1;否则该结点无右子结点。l 二叉树的遍历1) 前序遍历先访问根结点,然后遍历左子树,最后遍历右子树;并且在遍历左、右子树时,仍需先访问根结点,然后遍历左子树,最后遍历右
7、子树。2) 中序遍历先遍历左子树、然后访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。例如,对图1-1中的二叉树进行中序遍历的结果(或称为该二叉树的中序序列)3) 后序遍历先遍历左子树、然后遍历右子树,最后访问根结点;并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。例如,对图1-1中的二叉树进行后序遍历的结果(或称为该二叉树的后序序列)1.7查找l 查找是指在一个给定的数据结构中查找某个指定的元素。从线性表的第一个元素开始,依次将线性表中的元素与被查找的元素相比较,若相等则表示查找成功;若线性表中所有的元素都与
8、被查找元素进行了比较但都不相等,则表示查找失败。l 顺序查找下列两种情况下也只能采用顺序查找:1) 如果线性表为无序表,则不管是顺序存储结构还是链式存储结构,只能用顺序查找2) 即使是有序线性表,如果采用链式存储结构,也只能用顺序查找“有序”是特指元素按非递减排列,即从小到大排列,但允许相邻元素相等。下一节排序中,有序的含义也是如此l 二分法查找(对分法或拆半查找)1) 顺序存储结构2) 线性表是有序表l 对于长度为n的有序线性表,利用二分法查找元素X的过程如下1) 步骤1:将X与线性表的中间项比较;2) 步骤2:如果X的值与中间项的值相等,则查找成功,结束查找;3) 步骤3:如果X小于中间项
9、的值,则在线性表的前半部分以二分法继续查找;4) 步骤4:如果X大于中间项的值,则在线性表的后半部分以二分法继续查找。5) 步骤5:直到判断最后一个元素与被查找元素是否相等l 对于长度为n的有序线性表,在最坏情况下,二分法查找只需比较log2n次,而顺序查找需要比较n次。1.8 排序l 交换类排序法1) 冒泡法排序法在最坏的情况下,冒泡排序需要比较次数为n(n-1)/22) 快速排序法在最坏的情况下,冒泡排序需要比较次数为n(n-1)/2 快于冒泡法 l 插入类排序法1) 简单插入排序法,最坏情况需要n(n-1)/2次比较2) 希尔排序法,最坏情况需要O(n1.5)次比较l 选择类排序法1)
10、简单选择排序法,最坏情况需要n(n-1)/2次比较2) 堆排序法,最坏情况需要O(nlog2n)次比较l 相比以上几种(除希尔排序法外),堆排序法的时间复杂度最小第二章 程序设计基础l 结构化程序设计原则1) 自顶而下2) 逐步求精3) 模块化4) 限制使用goto语句l 程序设计方法与风格1) 源程序文档化a) 符号的命名b) 程序注释清晰第一,效率第二c) 视觉组织2) 数据说明的方法a) 次序应规范化b) 变量安排有序化c) 使用注释3) 语句的结构程序4) 输入和输出2.1程序设计的方法与风格2.2结构化程序设计l 结构化的基本结构1) 顺序结构:是最基本、最普通的结构形式,按照程序中
11、的语句行的先后顺序逐条执行2) 选择(分支)结构:又称为分支结构,它包括简单选择和多分支选择结构3) 循环(重复)结构:根据给定的条件,判断是否要重复执行某一相同的或类似的程序段当型循环结构:先判断后执行的循环体称为当型循环结构直到型循环结构:先执行循环体后判断的称为直到型循环结构2.3面对对象方法l 面向对象方法涵盖对象及对象属性与方法、类、继承、多态性几个基本要素2.3.1对象l 属性描述对象的状态l 方法(服务)表示对象的行为,基于同一个类产生的两个对象是可以分别设置自己的属性值l 属性即对象所包含的信息,它在设计对象时确定,一般只能通过执行对象的操作来改变。属性值应该指的是纯粹的数据值
12、,而不能指对象。l 操作描述了对象执行的功能,若通过信息的传递,还可以为其他对象使用。操作过程是被封装在对象中,用户看不到,称之为对象的封装l 对象的基本特点1) 标识唯一性2) 分类性3) 多态性4) 封装性5) 模块独立性l 面对对象设计方法的主要特征1) 封装性2) 继承性3) 多态性2.3.2类和实例l 类对一类具有相同的属性和方法对象的描述l 类是具有共同属性、共同方法的对象的集合。它描述了属于该对象类型的所有对象的性质,而一个对象则是其对应类的一个实例l 类是关于对象性质的描述,它同对象一样,包括一组数据属性和在数据上的一组合法操作2.3.3信息l 消息是实例之间传递的信息,它请求
13、对象执行某一处理或回答某一要求的信息,它统一了数据流和控制流l 一个消息由三部分组成:接收消息的对象的名称、消息标识符(消息名)和零个或多个参数2.3.4继承l 广义地说,继承是指能够直接获得已有的性质和特征,而不必重复定义它们。(类之间共享属性和操作的机制)l 继承分为单继承与多重继承。单继承是指,一个类只允许有一个父类,即类等级为树形结构。多重继承是指,一个类允许有多个父类2.3.5多态性l 对象根据所接受的消息而做出动作,同样的消息被不同的对象接受时可导致完全不同的行动,该现象称为多态性l 在面对对象方法中,实现信息隐蔽是依靠对象的封装性第二章 软件工程基础3.1软件工程的基本概念l 计
14、算机软件包括程序、数据及相关文档的完整集合软件 机器可执行的程序和数据及其不可执行的,与软件开发、运行、维护、使用等有关的文档l 软件的特点包括:(1)软件是一种逻辑实体,而不是物理实体,具有抽象性;(2)软件的生产与硬件不同,它没有明显的制作过程;(3)软件在运行、使用期间不存在磨损、老化问题;(4)软件的开发、运行对计算机系统具有依赖性,受计算机系统的限制,这导致了软件移植的问题;(5)软件复杂性高,成本昂贵;(6)软件开发涉及诸多的社会因素。l 软件功能 1) 应用软件学生成绩管理系统2) 系统软件操作系统、数据库管理系统3) 支撑软件(工具软件)编辑软件、汇编程序等l 软件危机主要表现
15、在成本、质量、生产率等问题1) 软件需求的增长得不到满足2) 软件开发成本和进度得不到满足3) 软件质量难以保证4) 软件不可维护或维护成度非常低5) 软件的成本不断提高6) 软件开发生产效率低l 软件工程1) 软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具、文档、实践标准和工序。软件工程学是研究软件开发和维护的普遍原理与技术的一门工程学科。所谓软件工程是指采用工程的概念、原理、技术和方法指导软件的开发与维护。软件工程学的主要研究对象包括软件开发与维护的技术、方法、工具和管理等方面。2) 软件工程是建立并使用完善的工程化原则,以较经济的手段获得能在实际机器上有效运行的可靠软件的
16、一系列方法。软件工程的主要思想是强调在软件开发过程中需要应用工程化原则。3) 软件工程的目标在给定成本、进度的前提下,开发出具有有效性、可靠性、可理解性、可维护性、可重用性、可适应性、可移植性、可追踪性和可互操作性且满足用户需求的产品。基本目标:付出较低的开发成本;达到要求的软件功能;取得较好的软件性能;开发软件易于移植;需要较低的费用;能按时完成开发,及时交付使用。4) 软件工程三要素1) 方法方法是完成软件工程项目的技术手段2) 工具工具支持软件的开发、管理、文档生成3) 过程过程支持软件开发的各个环节的控制、管理5) 软件工程过程把软件转化为输出的一组彼此相关的资源3.2l 软件工程的四
17、种基本活动1) 软件规格说明2) 软件开发3) 软件确认4) 软件演进软件生命周期1) 定义:软件产品从提出、实现、使用维护到停止使用退役的过程2) 软件生命周期分为3个时期共8个阶段 a) 软件定义期:包括问题定义、可行性研究和需求分析3个阶段b) 软件开发期:包括概要设计、详细设计、实现和测试4个阶段c) 运行维护期:即运行维护阶段软件生命周期各个阶段的活动可以有重复,执行时也可以有迭代3) 软件生命周期的活动包括需求分析、软件设计(分为概要设计和详细设计)、软件实现、软件测试和软件维护软件生命周期各阶段的主要任务任务 描述 问题定义确定要求解决的问题是什么 可行性研究与计划制定决定该问题
18、是否存在一个可行的解决办法,指定完成开发任务的实施计划需求分析对待开发软件提出需求进行分析并给出详细定义。编写软件规格说明书及初步的用户手册,提交评审 软件设计通常又分为概要设计和详细设计两个阶段,给出软件的结构、模块的划分、功能的分配以及处理流程。这阶段提交评审的文档有概要设计说明书、详细设计说明书和测试计划初稿 软件实现在软件设计的基础上编写程序。这阶段完成的文档有用户手册、操作手册等面向用户的文档,以及为下一步作准备而编写的单元测试计划 软件测试在设计测试用例的基础上,检验软件的各个组成部分。编写测试分析报告运行维护将已交付的软件投入运行,同时不断的维护,进行必要而且可行的扩充和删改3.
19、3软件设计l 软件设计的基本目标是用比较抽象概括的方式确定目标系统如何完成预定的任务,软件设计是确定系统的物理模型。l 软件设计是开发阶段最重要的步骤,是将需求准确地转化为完整的软件产品或系统的唯一途径l 基本原则:抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性。l 软件工程的理论和技术性研究的内容主要包括:软件开发技术和软件工程管理。l 软件开发技术包括:软件开发方法学、开发过程、开发工具和软件工程环境。l 软件工程管理包括:软件管理学、软件工程经济学、软件心理学等内容。l 软件管理学包括人员组织、进度安排、质量保证、配置管理、项目计划等。l 常见的过程设计工具有:图形工具
20、(程序流程图)、PAD图、N-S图表格工具(判定表)、语言工具(PDL)l 软件设计分类:1) 按技术观点分软件设计包括软件结构设计、数据设计、接口设计、过程设计。2) 按工程管理角度分软件设计分两步完成:概要设计和详细设计l 软件设计基本原理抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性高内聚,低耦合内聚性是度量一个模块功能强度的一个相对指标耦合性是模块之间互相连接的紧密程度的度量在程序结构中各模块的内聚性越强,则耦合性越弱。优秀软件应高内聚,低耦合。l 软件概要设计的基本任务是:(1)设计软件系统结构; (2)数据结构及数据库设计;(3)编写概要设计文档; (4)概要设计
21、文档评审。3.4结构化分析方法l 定义使用数据流图(DFD)、数据字典(DD)、结构化英语、判定表和判定树的工具,来建立一种新的、称为结构化规格说明的目标文档l 结构化分析方法的实质是着眼于数据流、自顶向下、对系统的功能进行逐层分解、以数据流图和数据字典为主要工具,建立系统的逻辑模型。l 结构化方法的核心和基础是结构化程序设计理论。l 需求分析方法有(1)结构化需求分析方法; (2)面向对象的分析的方法。从需求分析建立的模型的特性来分:静态分析和动态分析。结构化分析方法的实质:着眼于数据流,自顶向下,逐层分解,建立系统的处理流程,以数据流图和数据字典为主要工具,建立系统的逻辑模型。l 结构化分
22、析的常用工具1) 数据流图(DFD)描述数据处理过程的工具,是需求理解的逻辑模型的图形表示,它直接支持系统功能建模数据流图是系统逻辑模型的图形表示,即使不是专业的计算机技术人员也容易理解它,因此它是分析员与用户之间极好的通信工具2) 数据字典(DD) 数据字典是对数据流图中所有元素的定义的集合,是结构化分析的核心;数据流图和数据字典共同构成系统的逻辑模型,没有数据字典数据流图就不严格,若没有数据流图,数据字典也难于发挥作用。数据字典中有4种类型的条目:数据流、数据项、数据存储和加工3) 判定树从问题定义的文字描述中分清哪些是判定的条件,哪些是判定的结论,根据描述材料中的连接词找出判定条件之间的
23、从属关系、并列关系、选择关系,根据它们构造判定树4) 判定表与判定树相似,当数据流图中的加工要依赖于多个逻辑条件的取值,即完成该加工的一组动作是由于某一组条件取值的组合而引发的,使用判定表描述比较适宜l 软件需求规格说明书是需求分析阶段的最后成果,是软件开发的重要文档之一。它的特点是具有正确性、无歧义性、完整性、可验证性、一致性、可理解性、可修改性和可追踪性软件需求规格说明书的特点:(1)正确性;(2)无岐义性;数据词典(DD)所定义的对象都包含于数据流图(DFD图)数据词典是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图的各个元素做出详
24、细的说明(3)完整性;(4)可验证性;(5)一致性;(6)可理解性;(7)可追踪性。l 结构化方法软件需求分析工具 目标文档1) 数据流程图(DFD图)面向结构化的需求分析工具2) 数据词典(DD)3) 判定表4) 判定树l 软件设计阶段工具1) 概要设计阶段系统(总体)结构图(仅支持系统设计的概要设计阶段)2) 详细设计阶段PAD图(问题分析图;主要用于详细设计阶段)、程序流程图、N-S图l 箭头数据流图用带箭头的线段数据流程序流程图用带箭头的线段控制流34 软件测试l 定义:使用人工或自动手段来运行或测定某个系统的过程,其目的在于检验它是否满足规定的需求或是弄清预期结果与实际结果之间的差别
25、。l 软件测试的目的:1) 测试是为了发现程序中的错误而执行程序的过程2) 好的测试用例(test case)能发现迄今为止尚未发现的错误3) 一次成功的测试是能发现至今为止尚未发现的错误测试的目的是发现软件中的错误,但是,暴露错误并不是软件测试的最终目的,测试的根本目的是尽可能多地发现并排除软件中隐藏的错误。l 软件测试方法:静态测试和动态测试。l 静态测试包括代码检查、静态结构分析、代码质量度量。不实际运行软件,主要通过人工进行。l 动态测试:是基本计算机的测试,主要包括白盒测试方法和黑盒测试方法。1) 白盒测试:在程序内部逻辑进行,主要用于完成软件内部操作的验证。主要方法有逻辑覆盖、基本
26、基路径测试。例: 逻辑覆盖、基本路径测试2) 黑盒测试根据程序外部功能:主要诊断功能不对或遗漏、界面错误、数据结构或外部数据库访问错误、性能错误、初始化和终止条件错,用于软件确认。主要方法有等价类划分法、边界值分析法、错误推测法、因果图等。例:等价类划分、边界值分析、错误推测、因果图、综合策略l 软件测试过程一般按4个步骤进行:单元测试、集成测试、验收测试(确认测试)和系统测试。1) 单元测试是对软件设计的最小单位模块(程序单元)进行正确性检验测试。单元测试的技术可以采用静态分析和动态测试。2) 集成测试是测试和组装软件的过程,主要目的是发现与接口有关的错误,主要依据是概要设计说明书。集成测试
27、所设计的内容包括:软件单元的接口测试、全局数据结构测试、边界条件和非法输入的测试等。集成测试时将模块组装成程序,通常采用两种方式:非增量方式组装和增量方式组装。3) 确认测试的任务是验证软件的功能和性能,以及其他特性是否满足了需求规格说明中确定的各种需求,包括软件配置是否完全、正确。确认测试的实施首先运用黑盒测试方法,对软件进行有效性测试,即验证被测软件是否满足需求规格说明确认的标准4) 系统测试是通过测试确认的软件,作为整个基于计算机系统的一个元素,与计算机硬件、外设、支撑软件、数据和人员等其他系统元素组合在一起,在实际运行(使用)环境下对计算机系统进行一系列的集成测试和确认测试。系统测试的
28、具体实施一般包括:功能测试、性能测试、操作测试、配置测试、外部接口测试、安全性测试等35 程序的调试l 程序调试的任务是诊断和改正程序中的错误,主要在开发阶段进行l 在对程序进行了成功的测试之后将进入程序调试(通常称Debug,即排错)l 程序调试活动由两部分组成,一是根据错误的迹象确定程序中错误的确切性质、原因和位置;二是对程序进行修改,排除这个错误l 程序调试的基本步骤:(1)错误定位。从错误的外部表现形式入手,研究有关部分的程序,确定程序中出错位置,找出错误的内在原因(2)修改设计和代码,以排除错误(3)进行回归测试,防止引进新的错误软件调试可分表静态调试和动态调试。静态调试主要是指通过
29、人的思维来分析源程序代码和排错,是主要的设计手段,而动态调试是辅助静态调试。主要调试方法有:(1)强行排错法;(2)回溯法;(3)原因排除法。第三章 数据库系统的基本概念l 数据数据库中存储的基本对象,它是描述事物的符号记录数据的特点:有一定的结构,有型与值之分,如整型、实型、字符型等。而数据的值给出了符合定型的值,如整型值15l 数据库是数据的集合,具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序共享数据库存放数据是按数据所提供的数据模式存放的,具有集成与共享的特点l 数据库技术的根本目的:解决数据的共享问题l 数据库系统(DBS)包含数据库(DB)和数据
30、库管理系统(DBMS)l 数据库管理系统(DBMS)是数据库的机构,它是一种系统软件,负责数据库中的数据组织、数据操作、数据维护、控制及保护和数据服务等l 数据库管理系统是数据系统的核心。l 数据库管理系统功能:(1)数据模式定义:即为数据库构建其数据框架;(2)数据存取的物理构建:为数据模式的物理存取与构建提供有效的存取方法与手段;(3)数据操纵:为用户使用数据库的数据提供方便,如查询、插入、修改、删除等以及简单的算术运算及统计;(4)数据的完整性、安生性定义与检查;(5)数据库的并发控制与故障恢复;(6)数据的服务:如拷贝、转存、重组、性能监测、分析等。l 数据语言1) 为完成以上六个功能
31、,数据库管理系统提供以下的数据语言:(1)数据定义语言:负责数据的模式定义与数据的物理存取构建;(2)数据操纵语言:负责数据的操纵,如查询与增、删、改等;(3)数据控制语言:负责数据完整性、安全性的定义与检查以及并发控制、故障恢复等。2) 数据语言按其使用方式具有两种结构形式:交互式命令(又称自含型或自主型语言)、宿主型语言(一般可嵌入某些宿主语言中)。l 数据库管理员:对数据库进行规划、设计、维护、监视等的专业管理人员。l 数据库系统:由数据库(数据)、数据库管理系统(软件)、数据库管理员(人员)、硬件平台(硬件)、软件平台(软件)五个部分构成的运行实体。l 数据库应用系统:由数据库系统、应
32、用软件及应用界面三者组成。l 文件系统阶段:提供了简单的数据共享与数据管理能力,但是它无法提供完整的、统一的、管理和数据共享的能力。l 层次数据库与网状数据库系统阶段 :为统一与共享数据提供了有力支撑。l 数据库管理技术的发展经历了三个阶段:人工管理阶段(无共享,冗余度大)、文件管理阶段、数据库系统管理阶段l 数据库系统的基本特点:数据的集成性 、数据的高共享性与低冗余性 、数据独立性(物理独立性与逻辑独立性)、数据统一管理与控制。 数据的独立性是指数据库中数据独立于应用程序而不依赖于应用程序,即数据与程序之间的互不依赖性 数据的独立性一般分为物理独立性与逻辑独立性两种 物理独立性:当数据的物
33、理结构(包括存储结构、存取方式等)改变时,如存储设备的更换、物理存储的更换、存取方式改变等,应用程序都不用改变。 逻辑独立性:数据的逻辑结构改变了,如修改数据模式、增加新的数据类型、改变数据间联系等,用户程序都可以不变。3) 数据库系统的三级模式:(1)概念模式数据库系统中全局数据逻辑结构的描述,全体用户公共数据视图;(2)外模式(用户级)也称子模式与用户模式。是用户的数据视图,也就是用户所见到的数据模式;(3)内模式(物理级)又称物理模式,它给出了数据库物理存储结构与物理存取方法。4) 数据库系统的两级映射:(1)概念模式到内模式的映射;(2)外模式到概念模式的映射。4.2 数据模型l 数据
34、模型的概念:是数据特征的抽象,从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表与操作提供一个抽象的框架。描述了数据结构、数据操作及数据约束。l E-R模型的基本概念(1)实体:现实世界中的事物(2)属性:事物的特性(3)联系:现实世界中事物间的关系。实体集的关系有一对一、一对多、多对多的联系l E-R模型三个基本概念之间的联接关系:实体是概念世界中的基本单位,属性有属性域,每个实体可取属性域内的值。一个实体的所有属性值叫元组。l E-R模型的图示法:(1)实体集表示法; (2)属性表法; (3)联系表示法。l 根据数据库之间的联系,数据库可分为层次型、网状型、关系型数
35、据库1) 层次模型的基本结构是树形结构,具有以下特点:(1)每棵树有且仅有一个无双亲结点,称为根;(2)树中除根外所有结点有且仅有一个双亲。2) 从图论上看,网状模型是一个不加任何条件限制的无向图。3) 关系模型a) 关系模型采用二维表来表示,简称表,由表框架及表的元组组成。b) 一个二维表就是一个关系。(一个关系只能是一个二维表)c) 在二维表中凡能唯一标识元组的最小属性称为键或码。从所有侯选健中选取一个作为用户使用的键称主键。表A中的某属性是某表B的键,则称该属性集为A的外键或外码。d) 关系中的数据约束:(1)实体完整性约束:约束关系的主键中属性值不能为空值;(2)参照完全性约束:是关系
36、之间的基本约束;(3)用户定义的完整性约束:它反映了具体应用中数据的语义要求4.3关系代数l 关系数据库系统的特点之一是它建立在数据理论的基础之上,有很多数据理论可以表示关系模型的数据操作,其中最为著名的是关系代数与关系演算。l 关系模型的基本运算:(1)插入 (2)删除 (3)修改 (4)查询(包括投影、选择、笛卡尔积运算)4.4 数据库设计与管理l 数据库设计是数据应用的核心。l 数据库设计的两种方法:(1)面向数据:以信息需求为主,兼顾处理需求;(2)面向过程:以处理需求为主,兼顾信息需求。l 数据库的生命周期:需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、编码阶段、测试阶段、
37、运行阶段、进一步修改阶段。1) 需求分析常用结构析方法和面向对象的方法。a) 结构化分析(简称SA)方法用自顶向下、逐层分解的方式分析系统。用数据流图表达数据和处理过程的关系。b) 对数据库设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主要结果。c) 数据字典是各类数据描述的集合,包括5个部分:数据项、数据结构、数据流(可以是数据项,也可以是数据结构)、数据存储、处理过程。d) 数据库概念设计的目的是分析数据内在语义关系。设计的方法有两种(1)集中式模式设计法(适用于小型或并不复杂的单位或部门);(2)视图集成设计法。设计方法:E-R模型与视图集成。视图设计一般有三种设计次序:自顶向下、由底向上、由内向外。视图集成的几种冲突:命名冲突、概念冲突、域冲突、约束冲突。关系视图设计:关系视图的设计又称外模式设计。关系视图的主要作用:(1)提供数据逻辑独立性;(2)能适应用户对数据的不同需求;(3)有一定数据保密功能。l 数据库的物理设计主要目标是对数据内部物理结构作调整并选择合理的存取路径,以提高数据库访问速度有效利用存储空间。一般RDBMS中留给用户参与物理设计的内容大致有索引设计、集成簇设计和分区设计。l 数据库管理的内容:(1)数据库的建立;(2)数据库的调整;(3)数据库的重组;(4)数据库安全性与完整性控制;(5)数据库的故障恢复;(6)数据库监控。
限制150内