全国计算机二级公共基础知识汇总.pdf
公共基础知识1 二级公共基础知识总结(30分:10 选择+5填空)复习及应试建议:1考生的复习必须遵守:“80/20的原则”二级考试的公共知识部分的覆盖面广,至少涵盖了计算机应用专业的四门核心课程:算法及数据结构、程序设计基础、软件工程基础和数据库。事实上,这些课程本身的涉及面就很广,难度系数较大。因此,这些课程甚至也是计算机专业学生最头疼的课程,对大多数考生来说其难度之大不言而喻。所以,考生应把80%的时间用在20%的重点知识点上,争取用20%的重点知识点来答对80%的考题,这是考生复习二级考试的公共知识部分的总体思路。2复习的关键是考生必须准确判断和掌握常见考点考生必须能够准确判断和掌握常见考点,例如:算法部分主要考查算法的概念及算法的复杂度;数据结构部分主要考查最基本的概念、最典型的数据结构和最常见的操作;程序设计部分主要考查程序设计风格的基本要求、结构化程序设计的最基本知识和面向对象程序设计的最常见概念;软件工程基础部分主要考查软件工程的基本概念及软件生命周期的各个阶段的基础知识;数据库基础部分主要考查数据库基本概念、数据模型、关系代数基础知识、数据库设计方法和步骤。对常见考点的准确把握会使考生避免盲目学习,从而能够轻松面对考试。二级考试中要求的知识点都是最基本的、最简单的,真正需要“灵活”掌握的考点极少。很多考生在考试过程中可能已经发现,该部分的题目“会做就是不懂”。所以建议在复习过程中不要急于“灵活”,其实等到把基本的知识点掌握后自然就“灵活”了。公共知识部分仅占30%分,题目相对简单。因此,在答题过程中,这部分要争取速度快、准确度高。总的原则是如果一道题在两分钟内没有任何思路,就应该跳过此题,把时间给后面的题目。记住:二级考试是一种合格考试,不是竞赛,及格就行了。使用说明:公共基础的复习没有技巧,就是背诵、背诵、再背诵,就是要把这10 页纸背下来。划线字体是至关重要的部分,框起来的字体为填空题的常考词汇,一定要背熟牢记,这里面有100 分里 30 分的原题。第一章 数据结构与算法1.1 算法算法:是一组有穷指令集,是解题方案的准确而完整的描述。通俗地说,算法就是计算机解题的过程。算法不等于程序,也不等于计算方法,程序的编制不可能优于算法的设计。算法是一组严谨地定义运算顺序的规则,每一个规则都是有效的,且是明确的,此顺序将在有限的次数下终止。所以其四个基本特征包括:(1)确定性,算法中每一步骤都必须有明确定义,不允许有模棱两可的解释,不允许有多义性;(2)有穷性,算法必须能在有限的时间内做完,即能在执行有限个步骤后终止;(3)可行性,算法原则上能够精确地执行;(4)拥有足够的情报。算法的基本要素:一是对数据对象的运算和操作;二是算法的控制结构。指令系统:一个计算机系统能执行的所有指令的集合。基本运算和操作包括:算术运算、逻辑运算、关系运算、数据传输。算法的三种基本控制结构:顺序结构、选择结构、循环结构。算法基本设计方法:列举法、归纳法、递推、递归、减半递推技术、回溯法。算法效率的度量算法复杂度:算法时间复杂度和算法空间复杂度。算法时间复杂度:指执行算法所需要的计算工作量。即算法执行过程中所需要的基本运算次数。通常,一个算法所用的时间包括编译时间和运行时间。算法空间复杂度:指执行这个算法所需要的内存空间。包括算法程序所占的空间,输入的初始数据所占的空间,算法执行过程中所需的额外空间。公共基础知识2 1.2 数据结构的基本概念数据结构:指相互有关联的数据元素的集合。数据结构研究的三个方面:(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;(2)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构;(3)对各种数据结构进行的运算。数据的逻辑结构应包含:(1)表示数据元素的信息;(2)表示各数据元素之间的前后件关系(指逻辑关系,与存储位置无关)。数据的逻辑结构在计算机存储空间中的存放形式称为数据的存储结构,也称数据物理结构。数据的存储结构有顺序、链接、索引等。线性结构的条件,(一个非空数据结构):(1)有且只有一个根结点;(2)每一个结点最多有一个前件,也最多有一个后件。非线性结构:不满足线性结构条件的数据结构。1.3 线性表及其顺序存储结构线性表是由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。在复杂线性表中,由若干项数据元素组成的数据元素称为记录;由多个记录构成的线性表称为文件。非空线性表的结构特征:(1)且只有一个根结点a1,它无前件;(2)有且只有一个终端结点an,它无后件;(3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。结点个数 n 称为线性表的长度,当n=0时,称为空表。线性表的顺序存储结构具有以下两个基本特点:(1)线性表中所有元素所占的存储空间是连续的;(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。元素 ai 的存储地址为:ADR(ai)=ADR(a1)+(i-1)k,ADR(a1)为第一个元素的地址,k 代表每个元素占的字节数。顺序表的运算:查找、插入、删除。1.4线性链表数据结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点。结点由两部分组成:(1)用于存储数据元素值,称为数据域;(2)用于存放指针,称为指针域,用于指向前一个或后一个结点。在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。链式存储方式即可用于表示线性结构,也可用于表示非线性结构。线性单链表中,HEAD 称为头指针,HEAD=NULL(或 0)称为空表。如果是双项链表的两指针:左指针(Llink)指向前件结点,右指针(Rlink)指向后件结点。线性链表的基本运算:查找、插入、删除。1.5栈和队列栈:限定在一端进行插入与删除的线性表。其允许插入与删除的一端称为栈顶,用指针top 表示栈顶位置。不允许插入与删除的另一端称为栈底,用指针bottom表示栈底。栈按照“先进后出”(FILO)或“后进先出”(LIFO)组织数据,栈具有记忆作用。栈的存储方式有顺序存储和链式存储。栈的基本运算:(1)入栈运算,在栈顶位置插入元素;公共基础知识3(2)退栈运算,删除元素(取出栈顶元素并赋给一个指定的变量);(3)读栈顶元素,将栈顶元素赋给一个指定的变量,此时指针无变化。队列:指允许在一端(队尾)进入插入,而在另一端(队头)进行删除的线性表。用 rear指针指向队尾,用front指针指向队头元素的前一个位置。队列是“先进先出”(FIFO)或“后进后出”(LILO)的线性表。队列运算包括:(1)入队运算:从队尾插入一个元素;(2)退队运算:从队头删除一个元素。队列的顺序存储结构一般采用队列循环的形式。循环队列 s=0表示队列空;s=1且 front=rear表示队列满。计算循环队列的元素个数:“尾指针减头指针”,若为负数,再加其容量即可。1.6 树与二叉树树是一种简单的非线性结构,其所有元素之间具有明显的层次特性。在树结构中,每一个结点只有一个前件,称为父结点。没有前件的结点只有一个,称为树的根结点,简称树的根。每一个结点可以有多个后件,称为该结点的子结点。没有后件的结点称为叶子结点。在树结构中,一个结点所拥有的后件的个数称为该结点的度,所有结点中最大的度称为树的度。树的最大层次称为树的深度。二叉树的特点:(1)非空二叉树只有一个根结点;(2)每一个结点最多有两棵子树,且分别称为该结点的左子树与右子树。满二叉树是指除最后一层外,每一层上的所有结点有两个子结点,则k 层上有 2k-1个结点深度为m 的满二叉树有2m-1 个结点。完全二叉树是指除最后一层外,每一层上的结点数均达到最大值,在最后一层上只缺少右边的若干结点。二叉树基本性质:(1)在二叉树的第k 层上,最多有2k-1(k 1)个结点;(2)深度为 m 的二叉树最多有2m-1个结点;(3)度为 0 的结点(即叶子结点)总是比度为2 的结点多一个;(4)具有 n 个结点的二叉树,其深度至少为log2n+1,其中 log2n 表示取 log2n 的整数部分(5)具有 n 个结点的完全二叉树的深度为log2n+1;(6)设完全二叉树共有n 个结点。如果从根结点开始,按层序(每一层从左到右)用自然数1,2,n 给结点进行编号(k=1,2.n),有以下结论:若 k=1,则该结点为根结点,它没有父结点;若k1,则该结点的父结点编号为INT(k/2);若 2k n,则 k 结点的左子结点编号为2k;否则该结点无左子结点(也无右子结点);若 2k+1 n,则编号为k 的结点的右子结点编号为2k+1;否则该结点无右子结点。补充:增加度为1 的结点不会影响二叉树的叶子结点数,每增加一个度为2 的结点便会增加一个叶子结点,没有度为2 的结点时叶子结点数为1。已知完全二叉树有x 个结点,求其叶子结点数:确定层数为k;第 k 层的结点数y=x-(2 k-1-1);第 k-1层的叶子结点数n=2(k-1)-1-y/2;最后 y+n。二叉树存储结构采用链式存储结构,对于满二叉树与完全二叉树可以按层序进行顺序存储。二叉树的遍历:(1)前序遍历(DLR),首先访问根结点,然后遍历左子树,最后遍历右子树;(树根在第一,下走不跳结点)(2)中序遍历(LDR),首先遍历左子树,然后访问根结点,最后遍历右子树;(有左先左,再寻根,后找右。最左边的结点最先遍历,最右边的结点最后遍历)(3)后序遍历(LRD)首先遍历左子树,然后访问遍历右子树,最后访问根结点。(有左先左,再找右,后寻根,到最右一路上行,树根在最后)公共基础知识4 前序遍历结果为a b d e h i c f g;中序遍历结果为d b h e i a f c g;后序遍历结果为d h i e b f g c a 例 2:先序遍历 图 1.13 的二叉树。图 1.13 先访问整棵二叉树的根结点A,然后再先序遍历左子树T1;在访问 T1 时,也以先序遍历原则,先访问T1 的根结点 B,然后再先序遍历T1 的左子树 T11;在访问 T11 时,也以先序遍历原则,先访问T11 的根结点 D,然后再先序遍历T11 的左子树。由于此时T11 的左子树只有H 结点,所以访问H 结点,T11 的左子树先序遍历结束,根据先序遍历的原则,进行先序遍历 T11 的右子树。由于T11 的右子树只有I 结点,故访问此结点后T11 的右子树的先序遍历结束。先序遍历完T11 子树后,返回T1 子树,先序遍历T1 的右子树。先序遍历完T1 子树后,接着先序遍历根结点A 的右子树 T2。先序遍历完T2后,该二叉树的所有结点都已经访问过,各结点被访问的顺序为:ABDHIECFG1)中序遍历:先中序遍历左子树,然后再访问根结点,最后再中序遍历右子树。对图1.12 的二叉树进行中序遍历,访问各个结点的顺序为:HDIBEAFCG2)后序遍历:先后序遍历左子树,然后再后序遍历右子树,最后再访问根结点。对图1.12 的二叉树进行后序遍历,访问各个结点的顺序为:HIDEBFGCA。下面树的先序、中序、后续遍历的结果依次为 _ abdcef _、bdaecf _、_ dbefca a b c d e f 公共基础知识5 6、一棵二叉树如图所示,它的中序遍历的结果为(B)A、abdgcefh B、dgbaechf C、gdbehfca D、abcdefgh 小结:逻辑结构可分为线性表和非线性表。线性表包括栈、队列,其存储方式为顺序存储、链式存储均可。链式型有:线性链表,带链的栈,带链的队列,循环链表等。非线性表包括树(二叉树),其存储方式为链式存储。1.7 查找技术只能使用顺序查找的两种情况:(1)线性表为无序表,不管是顺序存储还是链式存储;(2)表采用链式存储结构,即使是有序线性表。二分法查找只适用于顺序存储的有序表,对于长度为n 的有序线性表,最坏情况只需比较log2n 次,而顺序查找需要比较 n 次。1.8 排序技术排序是指将一个无序序列整理成按值非递减顺序排列的有序序列。交换类排序法:(1)冒泡排序法,需要比较的次数为n(n-1)/2;(2)快速排序法。插入类排序法:(1)简单插入排序法,最坏情况需要n(n-1)/2次比较;(2)希尔排序法,最坏情况需要O(n1.5)次比较。选择类排序法:(1)简单选择排序法,最坏情况需要n(n-1)/2次比较;(2)堆排序法,最坏情况需要O(nlog2n)次比较。相比以上几种(除希尔排序法外),堆排序法的时间复杂度最小。第二章 程序设计基础2.1 程序设计设计方法和风格“清晰第一、效率第二”已成为当今主导的程序设计风格。形成良好的程序设计风格需注意:(详见书 P27)1、源程序文档化;2、数据说明的方法;3、语句的结构;4、输入和输出。注释分序言性注释和功能性注释。语句结构清晰第一、效率第二。a b d g c e f h 公共基础知识6 2.2 结构化程序设计结构化程序设计方法的四条原则是:1、自顶向下;2、逐步求精;3、模块化;4、结构化编码 限制使用 goto语句。(1)自顶向下。程序设计时,应先考虑总体,后考虑细节;先考虑全局目标,后考虑局部目标。不要一开始就过多追求众多的细节,先从最上层总目标开始设计,逐步使问题具体化。(2)逐步求精。对复杂问题,应设计一些子目标作过渡,逐步细化。(3)模块化。一个复杂问题,肯定是由若干稍简单的问题构成。模块化是把程序要解决的总目标分解为分目标,再进一步分解为具体的小目标,把每个小目标称为一个模块。(4)限制使用goto 语句。结构化程序的基本结构及特点:(1)顺序结构:一种简单的程序设计,最基本、最常用的结构;(2)选择结构:又称分支结构,包括简单选择和多分支选择结构,可根据条件,判断应该选择哪一条分支来执行相应的语句序列;(3)循环结构:又称重复结构,可根据给定条件,判断是否需要重复执行某一相同或类似的程序段。结构化程序设计的特点:只有一个入口和出口2.3 面向对象的程序设计面向对象的程序设计的首次提出以60 年代末挪威奥斯陆大学和挪威计算机中心研制的SIMULA语言为标志。面向对象方法的优点:(1)与人类习惯的思维方法一致;(2)稳定性好;(3)可重用性好;(4)易于开发大型软件产品;(5)可维护性好。对象是面向对象方法中最基本的概念,可以用来表示客观世界中的任何实体,对象是实体的抽象。面向对象的程序设计方法中,对象是由数据的容许的操作组成的封装体,是系统中用来描述客观事物的一个实体,是构成系统的一个基本单位,由一组表示其静态特征的属性和它可执行的一组操作组成。属性即对象所包含的信息,它在设计对象时确定,一般只能通过执行对象的操作来改变。操作描述了对象执行的功能,是对象的动态属性,操作也称为方法或服务。对象的基本特点:(1)标识惟一性。指对象是可区分的,并且由对象的内在本质来区分,而不是通过描述来区分。(2)分类性。指可以将具有相同属性的操作的对象抽象成类。(3)多态性。指同一个操作可以是不同对象的行为。(4)封装性。从外面看只能看到对象的外部特性,即只需知道数据的取值范围和可以对该数据施加的操作,根本无需知道数据的具体结构以及实现操作的算法。对象的内部,即处理能力的实行和内部状态,对外是不可见的。从外面不能直接使用对象的处理能力,也不能直接修改其内部状态,对象的内部状态只能由其自身改变。*:信息隐蔽是通过对象的封装性来实现的。(5)模块独立性好。对象是面向对象的软件的基本模块,它是由数据及可以对这些数据施加的操作所组成的统一体,而且对象是以数据为中心的,操作围绕对其数据所需做的处理来设置,没有无关的操作。从模块的独立性考虑,对象内部各种元素彼此结合得很紧密,内聚性强。类是指具有共同属性、共同方法的对象的集合。类是关于对象性质的描述。类是对象的抽象,对象是其对应类的一个实例。消息是一个实例与另一个实例之间传递的信息。对象间的通信靠消息传递。它请求对象执行某一处理或回答某一要求的信息,它统一了数据流和控制流。消息的组成包括:(1)接收消息的对象的名称;(2)消息标识符,也称消息名;(3)零个或多个参数。继承是使用已有的类定义作为基础建立新类的定义技术,广义指能够直接获得已有的性质和特征,而不必重复定义他们。继承具有传递性,一个类实际上继承了他上层的全部基类的特性。继承分单继承和多重继承。单继承指一个类只允许有一个父类,即类等级为树形结构;多重继承指一个类允许有多个父类。多态性是指同样的消息被不同的对象接受时可导致完全不同的行动的现象公共基础知识7 第三章 软件工程基础3.1 软件工程基本概念计算机软件是包括程序、数据及相关文档的完整集合。软件的特点包括:(1)软件是一种逻辑实体,具有抽象性;(2)软件的生产与硬件不同,它没有明显的制作过程;(3)软件在运行、使用期间不存在磨损、老化问题;(4)软件的开发、运行对计算机系统具有依赖性,受计算机系统的限制,这导致了软件移植的问题;(5)软件复杂性高,成本昂贵;(6)软件开发涉及诸多的社会因素。软件按功能分为应用软件、系统软件、支撑软件(或工具软件)。软件危机主要表现在成本、质量、生产率等问题。软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具、文档、实践标准和工序。简单的说就是使软件走向工程化。软件工程的核心思想是把软件产品看作是一个工程产品来处理。软件工程包括3 个要素:方法、工具和过程。软件工程过程是把软件转化为输出的一组彼此相关的资源活动,包含4 种基本活动:(1)P(plan)软件规格说明;(2)D(do)软件开发;(3)C(check)软件确认;(4)A(action)软件演进。软件生命周期:软件产品从提出、实现、使用维护到停止使用退役的过程。软件生命周期分三个阶段:软件定义、软件开发、运行维护,主要活动阶段是:(1)可行性研究与计划制定;(2)需求分析;(3)软件设计(概要设计和详细设计);(4)软件实现;(5)软件测试;(6)运行和维护。软件工程的目标:在给定成本、进度的前提下,开发出具有有效性、可靠性、可理解性、可维护性、可重用性、可适应性、可移植性、可追踪性和可互操作性且满足用户需求的产品。基本目标:付出较低的开发成本;达到要求的软件功能;取得较好的软件性能;开发软件易于移植;需要较低的费用;能按时完成开发,及时交付使用。软件工程的理论和技术性研究的内容主要包括:软件开发技术和软件工程管理。软件开发技术包括:软件开发方法学、开发过程、开发工具和软件工程环境。软件开发环境或软件工程环境是指全面支持软件开发全过程的软件工具的集合。软件工程管理包括:软件管理学、软件工程经济学、软件心理学等内容。软件管理学包括人员组织、进度安排、质量保证、配置管理、项目计划等。软件工程基本原则:抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性。3.2 结构化分析方法结构化方法的核心和基础是结构化程序设计理论。软件定义阶段中,可行性研究与计划的制定是确定待开发目标和总的要求,给出它的功能、性能、可靠性以及接口等方面的可能方案,制定完成开发的实施计划。需求分析,对待开发软件提出的需求分析并给出详细的定义。需求分析阶段的工作:需求获取,需求分析,编写需求规格说明书,需求评审。需求分析方法有:(1)结构化需求分析方法;面向数据结构的Jackson方法(ISD);面向数据流的结构化分析方法(SA);面向数据结构的结构化数据系统开发方法(DSSD);(2)面向对象的分析的方法(OOA)。从需求分析建立的模型的特性来分:静态分析和动态分析。结构化分析方法的实质:着眼于数据流,自顶向下,逐层分解,建立系统的处理流程,以数据流图和数据字典为主要工具,公共基础知识8 建立系统的逻辑模型。结构化分析的常用工具:数据流图;数据字典;判定树;判定表。(1)数据流图(DFD 图):描述数据处理过程的工具,是需求理解的逻辑模型的图形表示,它直接支持系统功能建模。加工(转换)圆框,输入数据经加工变换产生的输出。数据流箭头,沿箭头方向传递数据的通道,一般在旁边标注数据流名。存储文件(数据源)双横线,表示处理过程中存放各种数据的文件。源、潭方框,表示系统和环境的接口,属系统之外的实体。(2)数据字典:对所有与系统相关的数据元素的一个有组织的列表,以及精确的、严格的定义,使得用户和系统分析员对于输入、输出、存储成分和中间计算结果有共同的理解。数据字典是结构化分析的核心。(3)判定树:从问题定义的文字描述中分清哪些是判定的条件,哪些是判定的结论,根据描述材料中的连接词找出判定条件之间的从属关系、并列关系、选择关系,根据它们构造判定树。(4)判定表:与判定树相似,当数据流图中的加工要依赖于多个逻辑条件的取值,即完成该加工的一组动作是由于某一组条件取值的组合而引发的,使用判定表描述比较适宜。软件需求规格说明书的特点:正确性;无岐义性;完整性;可验证性;一致性;可理解性;可修改性;可追踪性。3.3 结构化设计方法软件设计是确定系统的物理模型。软件设计是开发阶段最重要的步骤,是将需求准确地转化为完整的软件产品或系统的唯一途径。系统设计人员和程序设计人员应该在反复理解软件需求的基础上,给出软件结构、模块的划分、功能的分配以及处理流程。软件设计的基本目标是用比较抽象概括的方式确定目标系统如何完成预定的任务。从技术观点来看,软件设计包括软件结构设计、数据设计、接口设计、过程设计。结构设计:定义软件系统各主要部件之间的关系。数据设计:将分析时创建的模型转化为数据结构的定义。接口设计:描述软件内部、软件和协作系统之间以及软件与人之间如何通信。过程设计:把系统结构部件转换成软件的过程描述。从工程管理角度来看,软件设计分两步:概要设计和详细设计。软件设计的一般过程:软件设计是一个迭代的过程;先进行高层次的结构设计;后进行低层次的过程设计;穿插进行数据设计和接口设计。软件设计的基本原理是:(1)抽象;(2)模块化;(3)信息隐蔽;(4)模块独立性。衡量软件模块独立性使用耦合性和内聚性两个定性的度量标准。耦合性是模块见相互连接的紧密程度的度量。耦合程度取决于各个模块之间接口的复杂程度、调用方式以及哪些信息通过接口。内聚性是一个模块内部各个元素间彼此结合的紧密程度的度量。在程序结构中各模块的内聚性越强,则耦合性越弱。优秀软件应高内聚,低耦合,有利于提高模块的独立性。软件概要设计的基本任务是:(1)设计软件系统结构;(2)数据结构及数据库设计;(3)编写概要设计文档;(4)概要设计文档评审。在结构图中,模块用一个矩形表示,箭头表示模块间的调用关系。可以用带注释的箭头表示模块调用过程中来回传递的信息。还可用带实心圆的箭头表示传递的是控制信息,空心圆箭心表示传递的是数据。结构图的基本形式:基本形式、顺序形式、重复形式、选择形式。结构图有四种模块类型:传入模块、传出模块、变换模块和协调模块。典型的数据流类型有两种:变换型和事务型。变换型系统结构图由输入、中心变换、输出三部分组成。事务型数据流的特点是:接受一项事务,根据事务处理的特点和性质,选择分派一个适当的处理单元,然后给出结果。详细设计:是为软件结构图中的每一个模块确定实现算法和局部数据结构,用某种选定的表达工具表示算法和数据结构的细公共基础知识9 节。常见的过程设计工具有:图形工具(程序流程图(PFD)、N-S 图、PAD 图、),表格工具(判定表),语言工具(PDL)。程序流程图中:箭头为控制流、方框为加工步骤、菱形为逻辑条件。3.4 软件测试软件测试定义:使用人工或自动手段来运行或测定某个系统的过程,其目的在于检验它是否满足规定的需求或是弄清预期结果与实际结果之间的差别。软件测试的目的:发现错误而执行程序的过程。软件测试方法:静态测试和动态测试。静态测试包括代码检查、静态结构分析、代码质量度量。不实际运行软件,主要通过人工进行。动态测试:是基本计算机的测试,主要包括白盒测试方法和黑盒测试方法。白盒测试:也称结构测试或逻辑测试。在程序内部进行,主要用于完成软件内部操作的验证。白盒测试主要考虑内部的逻辑结构。主要方法有逻辑覆盖、基本路径测试。黑盒测试:也称功能测试或数据驱动测试。是在软件接口处进行,完成功能验证。黑盒测试完全不考虑程序内部的逻辑结构和内部特性,只依据程序的需求和功能规格说明,检查程序的功能是否符合它的设计要求。主要诊断功能不对或遗漏、界面错误、数据结构或外部数据库访问错误、性能错误、初始化和终止条件错,用于软件确认测试。主要方法有等价类划分法、边界值分析法、错误推测法、因果图等。驱动测试相当于被测模块的主程序,它接收测试数据,并传给被测模块,输出实际测试结果。软件测试过程一般按4 个步骤进行:单元测试、集成测试、验收测试(确认测试)和系统测试。单元测试是对模块(程序单元)进行,静态动态均有,动态时以白盒为主辅之以黑盒。集成测试是测试、组装软件。确认测试的任务是验证软件的功能和性能及其他特性是否满足了需求规格说明中的各项需求以及软件配置是否完全正确,先用黑盒。3.5 程序的调试程序调试 的任务是诊断和改正程序中的错误,主要在开发阶段进行。程序调试的基本步骤:(1)错误定位;(2)修改设计和代码,以排除错误;(3)进行回归测试,防止引进新的错误。软件调试可分为静态调试和动态调试。静态调试主要是指通过人的思维来分析源程序代码和排错,是主要的设计手段,而动态调试是辅助静态调试。主要调试方法有:(1)强行排错法;(2)回溯法;(3)原因排除法。第四章 数据库设计基础4.1 数据库系统的基本概念数据:实际上就是描述事物的符号记录。软件的数据是有一定的结构,有型与值之分,如整型、实型、字符型等。而数据的值给出了符合定型的值,如整型值15。数据库:是指在已有数据库管理系统的基础上建立数据库,是数据的集合,具有统一的结构形式并存放于统一的存储介质内,是多种应用数据的集成,并可被各个应用程序共享。数据库存放数据是按数据所提供的数据模式存放的,具有集成与共享的特点。数据库管理系统:一种系统软件,负责数据库中的数据组织、数据操纵、数据维护、控制及保护和数据服务等,数据库系统中实现各种数据管理功能的核心软件称为数据库管理系统。数据库管理系统的六大功能:(1)数据模式定义:即为数据库构建其数据框架;(2)数据存取的物理构建:为数据模式的物理存取与构建提供有效的存取方法与手段;公共基础知识10(3)数据操纵:为用户使用数据库的数据提供方便,如查询、插入、修改、删除等以及简单的算术运算及统计;(4)数据的完整性、安全性定义与检查;(5)数据库的并发控制与故障恢复;(6)数据的服务:如拷贝、转存、重组、性能监测、分析等。为完成以上功能,数据库管理系统提供以下的数据语言:(1)数据定义语言(DDL):负责数据的模式定义与数据的物理存取构建;(2)数据操纵语言(DML):负责数据的操纵,如查询与增、删、改等;(3)数据控制语言(DCL):负责数据完整性、安全性的定义与检查以及并发控制、故障恢复等。数据语言按其使用方式具有两种结构形式:交互式命令(又称自含型或自主型语言);宿主型语言(一般可嵌入某些宿主语言中)。数据库管理员:对数据库进行规划、设计、维护、监视等的专业管理人员。数据库系统:由数据库(数据)、数据库管理系统(软件)、数据库管理员(人员)、硬件平台(硬件)、软件平台(软件)五个部分构成的运行实体。对数据库系统需要操作系统的支持.数据库应用系统:由数据库系统、应用软件及应用界面三者组成。数据管理发展的三个阶段:人工管理阶段,文件系统阶段,数据库系统阶段。而数据独立性最高的是数据库系统。文件系统阶段:提供了简单的数据共享与数据管理能力,但是它无法提供完整的、统一的、管理和数据共享的能力。层次数据库与网状数据库系统阶段:为统一与共享数据提供了有力支撑。数据库系统的基本特点:数据的集成性、数据的高共享性与低冗余性、数据独立性(物理独立性与逻辑独立性)、数据统一管理与控制。物理独立性:用户的应用程序与存储在磁盘在磁盘等介质上的数据库是相互独立的。数据库系统的三级模式:(1)概念模式:数据库系统中全局数据逻辑结构的描述,全体用户公共数据视图;(2)外模式:也称子模式与用户模式。是用户的数据视图,也就是用户所见到的数据模式;(3)内模式:又称物理模式,它给出了数据库物理存储结构与物理存取方法。数据库系统的两级映射:(1)概念模式到内模式的映射;(2)外模式到概念模式的映射。4.2 数据模型数据模型:是数据特征的抽象,从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表与操作提供一个抽象的框架。描述了数据结构、数据操作及数据约束。关系模型属于非格式化模型,而模型和网状模型属于格式化模型。E-R 模型(实体联系模型)的基本概念(1)实体:现实世界中的事物;(2)属性:事物的特性;(3)联系:现实世界中事物间的关系。实体集间的联系有一对一、一对多、多对多的联系。E-R模型基本概念之间的联接关系:实体是概念世界中的基本单位,属性有属性域,每个实体可取属性域内的值。一个实体的 所有属性值叫元组。E-R 模型的图示法:描述概念模型的常用工具。(1)实体 集表示法 矩形;(2)属性 表法 椭圆 形;(3)联系 表示法 菱形。公共基础知识11(4)数据库管理系统常见的数据模型有层次模型、网状模型和关系模型三种。层次模型的基本结构是树形结构,具有以下特点:(1)每棵树有且仅有一个无双亲结点,称为根;(2)树中除根外所有结点有且仅有一个双亲。从图论观点看,网状模型是一个不加任何条件限制的无向图。关系模型是数学化的模型。要用到集合论、离散数学等理论知识。关系模型采用二维表来表示,简称表,由表框架及表的元组组成。一个二维表就是一个关系。每行数据称为元组。在二维表中凡能唯一标识元组的最小属性称为键或码。从所有侯选键中选取一个作为用户使用的键称主键。表 A 中的某属性是某表B 的键,则称该属性集为A 的外键或外码。3)关系模型采用二维表来表示,简称表,由表框架及表的元组组成。一个二维表就是一个关系。二维表的表框架由n 个命名的属性组成,n 称为属性元数。每个属性有一个取值范围称为值域。表框架对应了关系的模式,即类型的概念。在表框架中按行可以存放数据,每行数据称为元组,实际上,一个元组是由n 个元组分量所组成,每个元组分量是表框架中每个属性的投影值。学号姓名性别出生年月班级籍贯2007102 张洁然男07-07-88 07 动画 1 班天津2007203 李一明男05-01-87 07 播音 5 班广西南宁2007305 王丽女04-09-88 07 管理 4 班辽宁沈阳2007406 刘宏男10-11-88 07 新闻 3 班江苏南京*:同一个关系模型的任两个元组值不能完全相同。主码:或称为关键字、主键,简称码、键,表中的一个属性或几个属性的组合、其值能唯一地标识表中一个元组的,称为关系的主码或关键字。例如,学生的学号。主码属性不能取空值。外部关键字:或称为外键,在一个关系中含有与另一个关系的关键字相对应的属性组称为该关系的外部关键字。外部关键字取空值或为外部表中对应的关键字值。例如,在学生表中含有的所属班级名字,是班级表中的关键字属性,它是学生表中的外部关键字。关系中的数据约束:(1)实体完整性 约束:约束关系的主键中属性值不能为空值;(2)参照完全性 约束:是关系之间的基本约束;(3)用户定义的完整性约束:它反映了具体应用中数据的语义要求。4.3 关系代数关系数据库系统的特点之一是它建立在数据理论的基础之上,有很多数据理论可以表示关系模型的数据操作,其中最为著名的是关系代数与关系演算。关系数据库管理系统能实现的专门关系运算包括:选择、投影、连接。关系模型的基本运算:(1)插入(2)删除(3)修改(4)查询(包括投影、选择、笛卡尔积运算)学生课程选课MN学号姓名性别出生年月系课号课程名学分成绩选修时间公共基础知识12 还有扩充运算交、除、连接及自然连接运算。在关系运算中,连接运算后得到的新表的属性是运算前表中属性相加。即多于原来关系中属性的个数。集合运算及选择、投影、连接运算(1)并():关系 R 和 S 具有相同的关系模式,R 和 S的并是由属于R 或属于 S 的元组构成的集合。(2)差():关系 R 和 S 具有相同的关系模式,R 和 S的差是由属于R 但不属于 S的元组构成的集合。(3)交():关系 R 和 S 具有相同的关系模式,R 和 S的交是由属于R 且属于 S 的元组构成的集合。(4)广义笛卡尔积():设关系R 和 S 的属性个数分别为n、m,则 R 和 S 的广义笛卡尔积是一个有(n+m)列的元组的集合。每个元组的前n 列来自 R 的一个元组,后m 列来自 S 的一个元组,记为RS。*:根据笛卡尔积的定义:有n 元关系 R 及 m 元关系 S,它们分别有p、q 个元组,则关系R 与 S 经笛卡尔积记为RS,该关系是一个n+m 元关系,元组个数是pq,由 R 与 S 的有序组组合而成。例:有两个关系R 和 S,分别进行并、差、交和广义笛卡尔积运算。(5)在关系型数据库管理系统中,基本的关系运算有选择、投影与联接三种操作:1)选择:选择指的是从二维关系表的全部记录中,把那些符合指定条件的记录挑出来。(产生新行)2)投影:投影是从所有字段中选取一部分字段及其值进行操作,它是一种纵向操作。(产生新列)3)联接:联接将两个关系模式基于共有属性 拼接成一个更宽的关系模式,生成的新关系中包含满足联接条件的元组。4.4 数据库设计与管理数据库设计 是数据应用的核心。数据库设计的根本目标是解决数据共享问题.数据库设计的两种方法:(1)面向数据:以信息需求为主,兼顾处理需求;(2)面向过程:以处理需求为主,兼顾信息需求。数据库的生命周期:需求分析阶段、概念设计阶段、逻辑设计阶段、物理设计阶段、编码阶段、测试阶段、运行阶段、进一步修改阶段。数据库设计分为四个阶段:需求分析阶段,概念设计阶段,逻辑设计阶段,物理设计阶段。需求分析常用结构析方法和面向对象的方法。结构化分析(简称SA)方法用自顶向下、逐层分解的方式分析系统。用数据流图表达数据和处理过程的关系。对数据库设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主要结果。数据字典是各类数据描述的集合,包括5 个部分:数据项、数据结构、数据流(可以是数据项,也可以是数据结构)、数据存储、处理过程。数据库概念设计的目的是分析数据内在语义关系。设计的方法有两种(1)集中式模式设计法(适用于小型或并不复杂的单位或部门);(2)视图集成设计法。使用 E-R 模型与视图集成进行设计。视图设计一般有三种设计次序:自顶向下、由底向上、由内向外。公共基础知识13 视图集成的几种冲突:命名冲突、概念冲突、域冲突、约束冲突。关系视图设计又称外模式设计。关系视图的主要作用:(1)提供数据逻辑独立性;(2)能适应用户对数据的不同需求;(3)有一定数据保密功能。数据库的物理设计主要目标是对数据内部物理结构作调整并选择合理的存取路径,以提高数据库访问速度有效利用存储空间。一般 RDBMS 中留给用户参与物理设计的内容大致有索引设计、集成簇设计和分区设计。数据库管理的内容:(1)数据库的建立;(2)数据库的调整;(3)数据库的重组;(4)数据库安全性与完整性控制;(5)数据库的故障恢复;(6)数据库监控。4.5 数据库设计方法和步骤(1)数据库设计阶段包括:需求分析、概念分析、逻辑设计、物理设计。(2)数据库设计的每个阶段都有各自的任务:1)需求分析阶段:这是数据库设计的第一个阶段,任务主要是收集和分析数据,这一阶段收集到的基础数据和数据流图是下一步设计概念结构的基础。2)概念设计阶段:分析数据间内在语义关联,在此基础上建立一个数据的抽象模型,即形成 E-R 图。*:数据库概念设计的过程包括选择局部应用、视图设计和视图集成。3)逻辑设计阶段:将E-R 图转换成指定RDBMS 中的关系模式。4)物理设计阶段:对数据库内部物理结构作调整并选择合理的存取路径,以提高数据库访问速