2022年二级公共基础知识综述 .pdf
全国计算机等级考试二级公共基础知识第一章数据结构与算法 .21.1 算法 .21.2 数据结构的基本概念.21.3 线性表及其顺序存储结构.21.4 栈和队列 . .31.5 线性链表 . .31.6 树与二叉树 .31.7 查找技术 . .41.8 排序技术 . .4第二章程序设计基础 .52.1 程序设计方法和风格.52.2 结构化程序设计.52.3 面向对象的程序设计.5第三章软件工程基础 .63.1 软件工程基本概念.63.2 结构化分析方法.73.3 结构化设计方法.83.4 软件测试 . .83.5 程序的调试 .9第四章数据库设计基础 .94.1 数据库系统的基本概念.94.2 数据模型 . . 104.3 关系型数据库 . . 114.4 数据库设计与管理. 12精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 12 页第一章 数据结构与算法1.1 算法1算法的基本概念算法是指解题方案的准确而完整的描述。通俗的说, 算法就是计算机解题的过程。算法不等于程序, 也不等于计算方法,由于受到计算机系统运行环境的限制,程序的编制不可能优于算法的设计。2算法的基本特征 确定性 : 算法中每一步骤都必须有明确定义,不允出现歧义。 有穷性 : 算法必须能在有限的时间内执行完成,即能在执行有限个步骤后终止。 可行性 : 算法原则上能够精确地执行。 拥有足够的情报: 算法有零个或多个输入、至少有一个输出。3算法的基本要素一个算法通常由两种基本要素组成:一是对数据对象的运算和操作,二是算法的控制结构。运算和操作包括:算术运算、逻辑运算、关系运算、数据传输。三种基本控制结构: 顺序结构、 选择结构、 循环结构。4算法的复杂度 算法时间复杂度: 指执行算法所需要的计算工作量。即算法执行过程中所需要的基本运算次数。通常用平均性态和最坏情况复杂度衡量算法的时间复杂度。 算法空间复杂度:执行算法时所需要的存储空间。1.2 数据结构的基本概念1数据结构所谓数据结构是指相互有关联的数据元素的集合。主要研究以下三个方面: 数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构。 在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构。 对各种数据结构进行的运算。2逻辑结构 表示数据元素本身的信息。 表示各数据元素之间的前后件关系( 指数据元素间的逻辑关系,与存储位置无关)。3存储结构 (物理结构 ) 数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构, 也称数据物理结构。 常用的数据存储结构有顺序、链式、索引等。4线性结构与非线性结构根据数据结构中各元素之间前后件关系的复杂程度,一般将数据结构分为两大类型:线性结构与非线性结构。如果一个非空数据结构满足下列两个条件,则称为线性结构, 也称为线性表。如果不是线性结构,则为非线性结构。 有且只有一个根结点。 每一个结点最多有一个前件,也最多有一个后件。1.3 线性表及其顺序存储结构1非空线性表的结构特征 有且只有一个根结点,它无前件。 有且只有一个终端结点,它无后件。 除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。2线性表的顺序存储结构的两个基本特点 中所有元素所占的存储空间是连续的。 各数据元素在存储空间中是按逻辑顺序依次存放。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 12 页1.4 栈和队列1栈限定在一端进行插入与删除的线性表。其允许插入与删除的一端称为栈顶, 用指针 top 表示栈顶位置。 不允许插入与删除的另一端称为栈底,用指针bottom 表示栈底。栈按照“先进后出”(FILO)或“后进先出”(LIFO)方式组织数据, 具有记忆作用。 其存储方式可以是顺序存储,也可以是链式存储。栈的基本运算有以下三种: 入栈运算,在栈顶位置插入元素,也称为压栈。 退栈运算,删除元素 ( 取出栈顶元素并赋给一个指定的变量 ) ,也称为出栈。 读栈顶元素,将栈顶元素赋给一个指定的变量,此时指针无变化。2队列指允许在一端(队尾)进行插入,而在另一端(队头)进行删除的线性表。用rear 指针指向队尾,用front指针指向队头元素的前一个位置。队列是“先进先出”(FIFO)或“后进后出”(LILO )的线性表。队列运算包括: 入队运算:从队尾插入一个元素。 退队运算:从队头删除一个元素。队列的顺序存储结构一般采用队列循环的形式。循环队列中,s=0 表示队列空, s=1 且 front=rear表示队列满。 计算循环队列的元素个数:尾指针减头指针, 若为负数, 再加其容量即可。1.5 线性链表假设数据结构中的每一个数据对应于一个存储单元,这种存储单元称为存储结点,简称结点。在链式存储结构中,结点由两部分组成: 用于存储数据元素值,称为数据域。 用于存放指针,称为指针域,用于指向前一个或后一个结点。在链式存储结构中, 存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。链式存储方式即可用于表示线性结构,也可用于表示非线性结构。线性单链表中,HEAD 称为头指针, HEAD=NULL(或 0)称为空表。1.6 树与二叉树1树树是一种简单的非线性结构。在树结构中, 每一个结点只有一个前件, 称为父结点。 没有前件的结点只有一个,称为树的根结点,简称树的根。每一个结点可以有多个后件,称为该结点的子结点。没有后件的结点称为叶子结点。在树结构中, 一个结点所拥有的后件的个数称为该结点的度,所有结点中最大的度称为树的度。树的最大层次称为树的深度。2二叉树 非空二叉树只有一个根结点。 每一个结点最多有两棵子树,且分别称为该结点的左子树与右子树。3满二叉树与完全二叉树满二叉树是指除最后一层外,每一层上的所有结点有两个子结点。完全二叉树是指除最后一层外,每一层上的结点数均达精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 12 页左图遍历结果如下:前序遍历: FCADBEGHP 中序遍历: ACBDFEHGP 后序遍历: ABDCHPGEF 到最大值,在最后一层上只缺少右边的若干结点。完全二叉树中,除了度为2 的结点和度为0 的结点 ( 叶子结点 ) 外,最多只有一个度为1 的结点。4二叉树基本性质 在二叉树的第k 层上,最多有2k-1(k 1)个结点。 深度为 m的二叉树最多有个2m-1 结点。 度为 0 的结点(即叶子结点)总是比度为2 的结点多一个。 具有 n 个结点的二叉树,其深度至少为log2n+1 ,其中 表示取整数部分。 具有 n 个结点的完全二叉树的深度为log2n+1 。 设完全二叉树共有n 个结点。如果从根结点开始,按层序(每一层从左到右)用自然数 1,2, n 给结点进行编号(k=1,2.n),有以下结论:若 k=1,则该结点为根结点,它没有父结点。若k1,则该结点的父结点编号为INT(k/2)。若 2kn,则 k 结点的左子结点编号为2k。否则该结点无左子结点(也无右子结点);若 2k+1n,则编号为k 的结点的右子结点编号为2k+1。否则该结点无右子结点。5二叉树的遍历 前序遍历( DLR ) ,首先遍历根结点,然后遍历左子树,最后遍历右子树。 中序遍历( LDR ) ,首先遍历左子树,然后遍历根结点,最后遍历右子树。 后序遍历( LRD ) ,首先遍历左子树,然后遍历右子树,最后遍历根结点。FCEADBGHP1.7 查找技术1顺序查找顺序查找又称顺序搜索。基本方法如下: 从线性表的第一个元素开始,依次将线性表中元素与被查找元素进行比较, 若相等则表示查找成功。 只能使用顺序查找的两种情况: 线性表为无序表,不管是顺序存储还是链式存储。 表采用链式存储结构,即使是有序线性表。2二分法二分法查找只适用于顺序存储的有序线性表。其基本方法如下:将被查找元素x 与有序线性表的中间项进行比较,若相等则查找成功。若 x 小于中间项, 则在有序线性表的前半部分以相同方法进行查找。若 x 大于中间项, 则在有序线性表的后半部分以相同方法进行查找。此过程一直进行到查找成功或子表长度为0 为止。对于长度为n 的有序线性表,最坏情况只需比较log2n次,而顺序查找需要比较n 次。1.8 排序技术 冒泡排序法:最坏情况下需要比较的次数为n(n-1)/2 快速排序法:最坏情况下需要比较的次数为n(n-1)/2 插入排序法:最坏情况下需要比较的次数为n(n-1)/2 选择排序法:最坏情况下需要比较的次数为n(n-1)/2 希尔排序法:最坏情况下需要比较的次数为O(n1.5) 堆排序法:最坏情况下需要比较的次数为O(nlog2n) 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 12 页第二章 程序设计基础2.1 程序设计方法和风格程序设计风格会深刻地影响软件的质量和可维护性,良好的程序设计风格可以使程序结构清晰合理,使程序代码更加易于维护。 要形成良好的程序设计风格,主要应注重和考虑下述一些因素:1源程序文档化源程序文档化应考虑如下几点:符号的命令名尽量做到见名知义, 添加正确的程序注释能够帮助读者理解程序,采用适当的空格、空行、缩进等技巧使程序层次清晰。程序注释一般分为序言性注释和功能性注释。序言性注释通常位于整个程序的开头部分,用于给出程序的整体说明。功能性注释一般嵌在源程序体之中,对源程序中的语句或程序段进行描述。2数据说明的方法数据说明次序规范化、说明语句中的变量安排有序化、使用注释来说明复杂数据的结构。3语句的结构程序应当简单易懂, 语句构造应当简单直接,不应为提高效率而将语句复杂化。除非对效率有特殊要求,程序编写要做到清晰第一、效率第二。4输入和输出输入与输出方式和格式应尽量方便用户的使用,输入格式要简单、 对输入数据要检验数据的合法性、应该允许自由格式输入、 尽量使用缺省值、 保持数据输入和输出的一致性等。2.2 结构化程序设计1结构化程序设计的原则 自顶向下 逐步求精 模块化 限制使用 goto 语句2结构化程序的基本结构 顺序结构:一种简单的程序设计,最基本、最常用的结构。 选择结构:又称分支结构,包括简单选择和多分支选择结构, 可根据条件, 判断应该选择哪一条分支来执行相应的语句序列。 循环结构:又称重复结构,可根据给定条件,判断是否需要重复执行某一相同或类似的程序段。2.3 面向对象的程序设计1对象对象即客观存在可以相互区分的实体。可以是具体的事物( 如: 一本书 ) ,也可以是一个抽象事件( 一次足球比赛 ) 。 属性:用于描述对象的状态(静态特征),即数据。 方法:用于描述对象的行为(动态特征),即操作。2对象的基本特点 标识惟一性:指对象是可区分的,并且由对象的内在本质来区分。 分类性:将具有相同属性和操作的对象抽象成类。 多态性:同一个操作针对不同的对象可导致完全不同的结果。 封装性:对象是由数据加操作组成的封装体,对外是不可见的。 模块独立性好:对象是以数据为中心,操作围绕对其数据所需的处理来设置,各元素间紧密结合,内聚性强。3类和实例类是指具有共同属性、共同方法的对象的集合。类是对象的抽象, 它描述了属于该对象类型的所有对象的性质。而对象则是其对应类的一个实例。4消息消息是一个实例与另一个实例之间传递的信息。对象间精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 12 页的通信靠消息传递, 它请求对象执行某一处理或回答某一要求的信息,它统一了数据流和控制流。消息的组成包括: 接收消息的对象的名称 消息标识符,也称消息名 零个或多个参数5子类和继承利用现有的类创建一个新类,其中将现有的类称为父类,将新类称为子类。子类继承了父类的所有属性和方法,除此之外,子类还可以具有自己新的属性和方法。继承主要是在父类和子类之间其享属性和方法的一种机制。分为单继承和多重继承,单继承指一个类只允许有一个父类,多重继承指一个类允许有多个父类。第三章 软件工程基础3.1 软件工程基本概念1软件的定义计算机软件是计算机系统中与硬件系统相互依存的另一部分, 是包括程序、 数据及相关文档的完整集合。程序是一组指令序列, 数据是使程序能正常操纵的数据结构,文档则是与程序开发、维护和使用等有关的图文资料。可见软件由两部分组成:一是机器可执行的程序和数据,二是机器不可执行的,与软件开发、运行、维护使用相关的文档。2软件的特点 软件是一种逻辑实体,不是物理实体, 具有抽象性。 软件的生产与硬件不同,它没有明显的制作过程。一旦开发成功,可大量复制使用。 软件在运行、使用期间不存在磨损、老化问题。但为适应硬件、 环境及需求的变化,要进行必须的修改,而这些修改无可避免的会引入错误,导致软件失效率升高,从而使得软件退化。 软件的开发、运行对计算机系统具有依赖性,受计算机系统的限制,这导致了软件移植的问题。 软件复杂性高,成本昂贵。 软件开发涉及诸多的社会因素。3软件的分类 应用软件:是为了解决特定领域的应用而开发的软件,如音频视频播放软件、 图像处理软件、 文字排版软件等。 系统软件:是计算机管理自身资源,提高计算机使用效率并为用户提供各种服务的软件,如操作系统、 编译程序、数据库管理系统等。 支撑软件:是介于系统软件与应用软件之间,协助用户开发软件的工具软件,如需求分析工具软件、设计工具软件、编码工具软件、测试工具软件等。4软件危机泛指在计算机软件的开发和维护过程中所遇到的一系列严重问题。主要表现在: 软件需求的增长得不到满足,用户对系统不满意情况经常发生。 软件开发成本和进度无法控制,质量难以保证。 所开发的软件不可维护或维护性较低。 软件开发生产率的提高赶不上硬件的发展和应用需求的增长。5软件工程软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具、文档、实践标准和工序。其核心思想是把软件产品看作是一个工程产品来处理。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 12 页6软件工程的基本目标软件工程需要达到的基本目标是付出较低的开发成本,达到要求的软件功能,取得较好的软件性能,开发软件易于移植,需要较低的费用,能按时完成开发,及时交付使用。7软件工程的基本原则为了达到软件工程的目标,在软件开发过程中,必须遵循软件工程的基本原则。软件工程基本原则包括抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性等。8软件工程三要素 方法:完成软件工程项目的技术手段。 工具:支持软件的开发、管理、文档生成。 过程:支持软件开发各个环节的控制、管理。9软件生命周期软件产品从提出、 实现、使用维护到停止使用退役的过程称为软件生命周期。 软件生命周期分三个阶段:软件定义、软件开发、运行维护,主要活动阶段是: 可行性研究与计划制定 需求分析 概要设计 详细设计 软件实现 ( 即编码 ) 软件测试 运行和维护3.2 结构化分析方法结构化分析方法是结构化程序设计理论在软件需求分析阶段的运用。 需求分析阶段的任务是对待开发软件提出的需求分析并给出详细的定义。1需求分析阶段的工作需求分析阶段的工作包括需求获取( 确定目标系统的各方面需求 ) 、需求分析 ( 对获得的需求进行分析,给出目标系统的解决方案和目标系统的逻辑模型) 、编写软件需求规格说明书 ( 需求规格说明是需求分析阶段的成果、控制软件开发进程的依据 ) 、需求评审。2需求分析方法(1) 结构化分析方法 面向数据结构的Jackson 方法( JSD) 面向数据流的结构化分析方法(SA) 面向数据结构的结构化数据系统开发方法(DSSD )(2) 面向对象的分析的方法(OOA ) 。结构化分析方法的实质:着眼于数据流, 自顶向下, 逐层分解, 建立系统的处理流程,以数据流图和数据字典为主要工具,建立系统的逻辑模型。3结构化分析的常用工具 数据流图 数据字典 判定树 判定表数据流图( DFD 图) :描述数据处理过程的工具,是需求理解逻辑模型的图形表示,它直接支持系统功能建模。加工 ( 转换 ) ,输入数据经加工后产生的输出。数据流,沿箭头方向传递数据的通道,一般在旁边标注数据流名。存储文件(数据源), 表示处理过程中存放各种数据的文件。源、潭,表示系统和环境的接口,属系统之外的实体。数据字典:数据字典是结构化分析的核心。判定树: 从问题定义的文字描述中分清哪些是判定的条件,哪些是判定的结论,根据描述材料中的连接词找出判定条件之间的从属关系、并列关系、 选择关系, 根据它们构造判定树。判定表: 与判定树相似, 当数据流图中的加工要依赖于多个逻辑条件取值, 即完成该加工的一组动作是由于某一组条件取值的组合而引发,使用判定表描述比较适宜。4软件需求规格说明书的特点正确性无歧义性完整性可验证性精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 7 页,共 12 页一致性可理解性可修改性可追踪性3.3 结构化设计方法软件设计是确定系统的物理模型,是开发阶段最重要的步骤,是将需求准确地转化为完整的软件产品或系统的唯一途径。软件设计的基本目标是确定目标系统如何完成预定的任务。1软件设计的过程(1) 从技术观点来看, 软件设计分为结构设计、数据设计、接口设计、过程设计。 结构设计:定义软件系统各主要部件之间的关系。 数据设计:将分析时创建的模型转化为数据结构的定义。 接口设计:描述软件内部、软件和协作系统之间以及软件与人之间如何通信。 过程设计:把系统结构部件转换成软件的过程。(2) 从工程管理角度来看,软件设计分两步: 概要设计和详细设计。软件设计的一般过程:软件设计是一个迭代的过程,先进行高层次的结构设计,后进行低层次的过程设计,穿插进行数据设计和接口设计。3软件设计的基本原理 抽象 模块化 信息隐蔽 模块独立性衡量软件模块独立性使用耦合性和内聚性两个定性的度量标准。 耦合性是模块间相互连接的紧密程度的度量。内聚性是一个模块内部各个元素间彼此结合的紧密程度的度量。优秀软件应具有高内聚性、低耦合性, 有利于提高模块的独立性。4概要设计的基本任务 设计软件系统结构 数据结构及数据库设计 编写概要设计文档 概要设计文档评审5结构图 (SC) 在结构图中, 模块用一个矩形表示,箭头表示模块间的调用关系。 用带实心圆的箭头表示传递的是控制信息,空心圆心表示传递的是数据。结构图的基本形式: 基本形式、 顺序形式、 重复形式、选择形式。结构图有四种模块类型:传入模块、传出模块、变换模块和协调模块。6数据流类型 ( 面向数据流设计方法) 典型的数据流类型有两种:变换型和事务型。变换型是指信息沿输入通路进入系统,同时由外部形式变换成内部形式。变换型系统结构图由输入、中心变换、输出三部分组成。事务型数据流特点是:接受一项事务, 根据事务处理的特点和性质,选择分派一个适当的处理单元,给出结果。7详细设计详细设计是为软件结构图中的每一个模块确定实现算法和局部数据结构, 用某种选定的表达工具表示算法和数据结构的细节。常见的过程设计工具有:图形工具 (程序流程图PFD 、N-S 图、 PAD图、 ) ,表格工具(判定表) ,语言工具( PDL ) 。程序流程图中:箭头为控制流、方框为加工步骤、菱形为逻辑条件。3.4 软件测试1软件测试的目的尽可能多的发现软件中的错误是软件测试的主要目的。一个好的测试用例是指很可能找到迄今为止尚未发现的错误的用例,一个成功的测试是发现了到今尚未发现的错误的测试。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 12 页2软件测试方法分类从是否需求运行软件角度,分为静态测试和动态测试。 静态测试包括代码检查、静态结构分析、代码质量度量。不实际运行软件,主要通过人工进行。 动态测试是基本计算机的测试,主要包括白盒测试方法和黑盒测试方法。3白盒测试也称结构测试或逻辑驱动测试。在程序内部进行, 主要用于完成软件内部操作的验证。白盒测试主要考虑内部的逻辑结构。主要方法有逻辑覆盖、基本路径测试。4黑盒测试也称功能测试或数据驱动测试。是由客户参与的测试,在软件接口处进行, 完成功能验证。 黑盒测试依据程序的需求和功能规格说明,检查程序的功能是否符合它的设计要求,主要应用于软件确认测试。主要测试方法有等价类划分法、边界值分析法、错误推测法、因果图等。5软件测试步骤 单元测试:由开发人员测试自己所编写的模块。 集成测试:是测试和组装软件的过程。 验收测试:也称确认测试,检查软件的功能和性能是否需求规格说明书中确定的各种需求。 系统测试:在真实的系统工作环境下,检验软件是否能与系统正确连接,发现软件与系统需求不一致的地方。3.5 程序的调试程序调试的任务是诊断和改正程序中的错误,主要在开发阶段进行。1程序调试的基本步骤 错误定位 修改设计和代码,以排除错误 进行回归测试,防止引进新的错误2程序调试方法及分类可分为静态调试和动态调试。静态调试主要是指通过人的思维来分析源程序代码和排错,是主要的设计手段, 而动态调试是辅助静态调试。主要调试方法有强行排错法、回溯法、原因排除法等。第四章 数据库设计基础4.1 数据库系统的基本概念1基本概念(1) 数据库 (DB) 数据库是指存储在计算机的存储设备上、相互关联结构化的数据集合。 数据库中不仅描述事物的数据本身,还描述了相关数据之间的联系。(2) 数据库管理系统 (DBMS) 数据库管理系统是一种系统软件,负责数据库中的数据组织、数据操纵、数据维护、控制及保护和数据服务等,是数据库系统的核心。它具有以下的几大功能: 数据模式定义:即为数据库构建其数据框架。 数据存取的物理构建:为数据模式的物理存取与构建提供有效的存取方法与手段。 数据操纵:为用户使用数据库的数据提供方便,如查询、插入、修改、删除等以及简单的算术运算及统计。 数据的完整性、安全性定义与检查。 数据库的并发控制与故障恢复。 数据的服务:如拷贝、转存、重组、性能监测、分析等。为完成以上功能,DBMS 提供了相应的数据语言: 数据定义语言 (DDL): 负责数据的模式定义与数据的物理存取构建。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 9 页,共 12 页 数据操纵语言 (DML):负责数据的操纵, 如查询与增加、删除、修改等。 数据控制语言 (DCL):负责数据完整性、 安全性的定义与检查以及并发控制、故障恢复等。(3) 数据库管理员 (DBA) 数据库管理员是对数据库进行规划、设计、维护、 监视等的专业管理人员。(4) 数据库系统 (DBS) 由数据库 ( 数据 ) 、数据库管理系统 ( 软件 ) 、数据库管理员( 人员 ) 、 硬件平台 ( 硬件 ) 、软件平台 (软件 ) 五个部分构成的运行实体。(5) 数据库应用系统 (DBAS) 开发人员利用数据库资源开发出来的一种应用软件,由数据库系统、应用软件及应用界面三者组成。2数据系统的发展数据管理发展至今经历三个阶段: 人工管理:程序和数据不具独立性,数据不能长期保存,且存在大量数据冗余。 文件系统:数据具有一定独立性,但不具共享性。 数据库系统:数据由DBMS 对数据进行统一的管理,实现了数据的共享, 提供了数据与应用程序的独立性,减少了数据冗余,保证数据的完整性、一致性和安全性。3数据库系统的基本特点 数据的集成性 数据的高共享性与低冗余性 数据独立性(物理独立性与逻辑独立性) 数据统一管理与控制。4数据库系统的内部结构体系(1) 数据库系统的三级模式 概念模式:数据库系统中全局数据逻辑结构的描述,是全体用户公共数据视图。 外模式:也称子模式与用户模式。它是用户的数据视图,也就是用户所见到的数据模式。 内模式:又称物理模式,它给出了数据库物理存储结构与物理存取方法。(2) 数据库系统的两级映射 概念模式到内模式的映射:给出概念模式中数据的全局逻辑结构到数据的物理存储结构间的对应关系,映射一般由数据库管理系统实现。 外模式到概念模式的映射:概念模式是一个全局模式,而外模式是一个局部模式。该映射给出了外模式与概念模式间的对应关系,一般也是由数据库管理系统实现。4.2 数据模型数据是现实世界符号的抽象,而数据模型则是数据特征的抽象。数据模型可以将现实世界要求反映到计算机数据库中的物理世界, 其所描述的内容有数据结构、数据操作及数据约束三部分。1数据模型的分类(1) 概念数据模型概念数据模型简称概念模型,是一种面向客观世界、面向用户的模型, 它与具体的数据库管理系统及计算机平台无关。较为有名的概念模型有E-R 模型、 扩充的 E-R 模型、面向对象模型及谓词模型等。(2) 逻辑数据模型逻辑数据模型以称数据模型,是一种面向数据库的模型,着重于在数据库一级实现。概念模型只有转化为数据模型后才能在数据库中得以表示。常用的数据模型有层次模型、网状模型、关系模型及面向对象模型等。(3) 物理数据模型物理数据模型又称物理模型,是一种面向计算机物理表示的模型,此模型给出了数据模型在计算机上物理结构的表示。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 10 页,共 12 页2E-R 模型(1) E-R模型的基本概念 实体:客观存在并且可以相互区别的事物。 属性:描述实体的特性称为属性。 实体集和实体型:属性值的集合表示一个实体,而属性的集合表示一种实体的类型,称为实体型。 同类型的实体的集合称为实体集。 联系:现实世界中事物( 实体 ) 间的关系。(2) 实体间的联系 一对一联系 (1:1) :假设一个学校只有一个校长,一个校长只能在一个学校任职,则实体学校与实体校长间即为一对一联系。 一对多联系 (1:n) :一个系可以有多个学生注册,而一个学生一般只能在一个系注册,则实体系与实体学生间即为一对多联系。 多对多联系 (m:n) :一门课程可以被多个学生选修,而一个学生同时也可以选修多门课程,则实体课程与实体学生间即为多对多联系。(3) E-R模型的图示法 实体集表示法矩形 属性表示法椭圆形 联系表示法菱形3逻辑数据模型 层次模型:采用树形结构表示实体及实体间的联系,层次模型属于格式化模型。 网状模型:采用网状结构表示实体及实体间的联系,网状模型属于格式化模型 关系模型:采用二维表结构表示实体及实体间的联系,关系模型属于非格式化模型。4.3 关系型数据库1术语介绍 关系:关系型数据库中, 一张二维表就是一个关系。 元组:二维表中行上的所有数据称为元组。 属性:二维表中列称为属性。 域:属性的取值范围。 关键字:用来区分所有元组的单个属性或多个属性的组合。 所有的关键字称为候选关键字。从候选关键字选择一个用来区分关系中的元组,这个关键字称为主关键字。 外部关键字:一个关系中的单个属性或多个属性的组合不是本关系的主关键字,而是另一个关系的主关键字或候选关键字,则称此属性或属性的组合称为外部关键字。2关系中的数据约束 实体完整性约束:约束关系的主键中属性值不能为空值及重复值。 参照完全性约束:是多个关系之间的基本约束。 用户定义的完整性约束:它反映了具体应用中数据的语义要求。3关系的性质 同一个关系中不能出现相同的属性名和元组。 关系中属性和元组的次序无关紧要。 关系必须规范化:最基本要求是关系中元组的分量必须是不可分的数据单元。4传统的集合运算 并:由属于这两个关系的元组组成的集合。 差:设两个关系R 和 S,差运算的结果就是从R中去除 S 中已存在的元组。 交:由既属于R又属于 S的元组组成的集合。5关系演算 选择:从关系中找出满足条件的元组的操作。 投影:从关系中指定若干个属性组成新的关系。精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 11 页,共 12 页 笛卡尔积:两个关系相乘的结果组成一个新关系。 除运算:笛卡尔积的逆运算。 联接:从笛卡尔积中取出满足联接条件的元组。以相等为条件的联接称为等值联接。 自然联接:从等值联接中去掉重复的属性。4.4 数据库设计与管理数据库设计是数据应用系统的核心,根本目标是解决数据共享问题。 数据库设计的两种方法,一种是以信息需求为主,兼顾处理需求, 称为面向数据的方法;另一种是以处理需求为主,兼顾信息需求,称为面向过程的方法。1数据库设计的四个阶段 需求分析阶段:需求分析阶段的任务是通过详细调查现实世界要处理的对象,充分了解、明确用户的各种需求,并在此基础上确定系统的功能。 概念设计阶段:目的是分析数据内在语义关系,在此基础上建立一个数据的抽象模型。概念设计的方法有两种,一种是集中式模式设计法,另一种是视图集成设计法。 逻辑设计阶段:主要工作是将E-R 图转换成指定的关系模式。 物理设计阶段:对数据内部物理结构作调整,并选择合理的存取路径, 以提高数据库访问速度有效利用存储空间。2数据库管理的内容 数据库的建立 数据库的调整 数据库的重组 数据库安全性与完整性控制 数据库的故障恢复 数据库监控精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 12 页,共 12 页