《数据结构 课件1.ppt》由会员分享,可在线阅读,更多相关《数据结构 课件1.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数 据 结 构南京航空航天大学数据结构课题组第一章 绪绪 论论1.1 数据结构讨论的范畴数据结构讨论的范畴1.2 基本概念基本概念1.3 算法和算法的度量算法和算法的度量1.11.1 数据结构讨论的范畴数据结构讨论的范畴Niklaus Wirth:Algorithm+Data Structures=Programs程序设计程序设计:算法算法:数据结构数据结构:为计算机处理问题编制 一组指令集 处理问题的策略处理问题的策略问题的数学模型问题的数学模型非数值计算的程序设计问题例一例一:求一组(n个)整数整数中的最大值算法:?模型:?基本操作是“比较两个数的大小比较两个数的大小”取决于整数值的范围整
2、数值的范围例二:例二:计算机对弈算法:?模型:?对弈的规则和策略棋盘及棋盘的格局例三:例三:足协的数据库管理算法:?模型:?需要管理的项目?如何管理?用户界面?各种表格概括地说:概括地说:数据结构是一门讨论数据结构是一门讨论“描述现描述现实世界实体的数学模型实世界实体的数学模型(非数值计非数值计算算)及其上的操作在计算机中如何及其上的操作在计算机中如何表示和实现表示和实现”的学科。的学科。1.2 基本概念基本概念一、数据与数据结构一、数据与数据结构二、数据类型二、数据类型三、抽象数据类型三、抽象数据类型一、数据与数据结构一、数据与数据结构所有能被输入被输入到计算机中,且能被计算机处理的符号处理
3、的符号的集合。数据数据:是计算机操作的对象计算机操作的对象的总称。是计算机处理的信息的信息的某种特定的符号表示形式表示形式。是数据(集合)中的一个“个体个体”数据元素数据元素:是数据结构中讨论的基本基本单位 数据项:数据项:是数据结构中讨论的最小最小单位数据元素可以是数据项的集合数据元素可以是数据项的集合例如:描述一个运动员的数据元素可以是称之为组合项称之为组合项数据结构:数据结构:带结构结构的数据元素的集合假设用三个三个 4 位的十进制数位的十进制数表示一个含 12 位位数的十进制数。数的十进制数。3214,6587,9345 a1(3214),a2(6587),a3(9345)则在数据元素
4、 a1、a2 和 a3 之间存在着“次序次序”关系关系 a1,a2、a2,a3 3214,6587,9345 a1 a2 a3 6587,3214,9345 a2 a1 a3例如例如:又例,在2行3列的二维数组a1,a2,a3,a4,a5,a6中六个元素之间存在两个关系:行的次序关系行的次序关系:列的次序关系列的次序关系:row=,col=,a1 a3 a5 a2 a4 a6 a1 a2 a3a4 a5 a6数据结构:数据结构:带结构结构的数据元素的集合再例,在一维数组 a1,a2,a3,a4,a5,a6 的数据元素之间存在如下的次序关系次序关系:|i=1,2,3,4,5 或者说,数据结构数据
5、结构是相互之间存在着某相互之间存在着某种逻辑关系的数据元素的集合种逻辑关系的数据元素的集合。数据结构:数据结构:带结构结构的数据元素的集合可见,不同的“关系关系”构成不同的“结构结构”数据的逻辑结构逻辑结构可归结为以下四类四类:线性线性结构树形树形结构图状图状结构集合集合结构数据结构的形式定义数据结构的形式定义为:数据结构数据结构是一个二元组 Data_Structures=(D,S)其中:D 是数据元素的有限集数据元素的有限集,S 是 D上关系的有限集关系的有限集。数据的存储结构存储结构 逻辑结构在存储器中的映象映象“数据元素”的映象?“关系”的映象?数据元素的映象方法:数据元素的映象方法:
6、用二进制位(bit)的位串表示数据元素(321)10 =(501)8 =(101000001)2 A =(101)8 =(001000001)2关系的映象方法:关系的映象方法:(表示x,y的方法)顺序映象顺序映象以相对的存储位置表示后继关系以相对的存储位置表示后继关系例如例如:令 y 的存储位置和 x 的存储位置之间差一个常量 C而 C 是一个隐含值,整个存储结构中只整个存储结构中只含数据元素本身的信息含数据元素本身的信息 x y链式映象链式映象以附加信息以附加信息(指针指针)表示后继关系表示后继关系需要用一个和 x 在一起的附加信息附加信息指示 y 的存储位置y x在不同的编程环境中,存储结
7、构可有不同的描述方法。当用高级程序设计语言进行编程时,通常可用高级编程语言中提供的数据类型描述之。例如例如:以三个带有次序关系的整数表示一个长整数时,可利用 C 语言中提供的整数数组类型。typedef int Long_int 3定义长整数定义长整数为:二、数据类型二、数据类型 在用高级程序语言编写的程序中,必须对程序中出现的每个变量、常量或表达式,明确说明明确说明它们所 属的数据类型数据类型。例如,C 语言中提供的基本数据类型基本数据类型有:整型整型 int浮点型浮点型 float字符型字符型 char逻辑型逻辑型 bool双精度型双精度型 double 数据类型数据类型 是一个 值的集合
8、值的集合和定义在此集合上的 一组操作一组操作的总称。不同类型的变量,其所能取的值的值的范围范围不同,所能进行的操作进行的操作不同。三、抽象数据类型三、抽象数据类型 (Abstract Data Type 简称简称ADT)是指一个数学模型以及是指一个数学模型以及定义在此数学模型上的一定义在此数学模型上的一组操作。组操作。例如,例如,抽象数据类型复数复数的定义:数据对象:数据对象:De1,e2e1,e2RealSet 数据关系:数据关系:R1|e1是复数的实数部分|e2 是复数的虚数部分 ADT Complex 基本操作:基本操作:AssignComplex(&Z,v1,v2)操作结果:构造复数
9、Z,其实部和虚部 分别被赋以参数 v1 和 v2 的值。DestroyComplex(&Z)操作结果:复数Z被销毁。GetReal(Z,&realPart)初始条件:复数已存在。操作结果:用realPart返回复数Z的实部值。GetImag(Z,&ImagPart)初始条件:复数已存在。操作结果:用ImagPart返回复数Z的虚部值。Add(z1,z2,&sum)初始条件:z1,z2是复数。操作结果:用sum返回两个复数z1,z2 的 和值。ADT Complex假设:z1和z2是上述定义的复数则 Add(z1,z2,z3)操作的结果z3=z1+z2即为用户期望的结果ADT 有两个重要特征:数
10、据抽象数据抽象 用ADT描述程序处理的实体时,强调的是其本质的特征本质的特征、其所能完成的其所能完成的功能功能以及它和外部用户的接口外部用户的接口(即外界外界使用它的方法使用它的方法)。数据封装数据封装 将实体的外部特性和其内部外部特性和其内部实现细节分离实现细节分离,并且对外部用户隐藏对外部用户隐藏其内部实现细节。其内部实现细节。抽象数据类型的描述方法抽象数据类型的描述方法抽象数据类型可用(D,S,P)三元组表示。其中:D 是数据对象;S 是 D 上的关系集;P 是对 D 的基本操作集。ADT 抽象数据类型名抽象数据类型名 数据对象:数据对象:数据对象的定义 数据关系:数据关系:数据关系的定
11、义 基本操作:基本操作:基本操作的定义 ADT 抽象数据类型名其中基本操作的定义格式为:基本操作名基本操作名(参数表)初始条件:初始条件:初始条件描述 操作结果操作结果:操作结果描述 赋值参数赋值参数 只为操作提供输入值。引用参数引用参数 以&打头,除可提供输入值外,还将返回操作结果。初始条件初始条件 描述了操作执行之前数据结构和参数应满足的条件,若不满足,则操作失败,并返回相应出错信息。操作结果操作结果 说明了操作正常完成之后,数据结构的变化状况和应返回的结果。若初始条件为空,则省略之。抽象数据类型的表示和实现抽象数据类型的表示和实现 抽象数据类型需要通过固有数据固有数据类型类型(高级编程语
12、言中已实现的数据类型)来实现。例如,对以上定义的复数。typedef struct float realpart;float imagpart;complex;/-存储结构的定义存储结构的定义/-基本操作的函数原型说明基本操作的函数原型说明void Assign(complex&Z,float realval,float imagval);/构造复数 Z,其实部和虚部分别被赋以参数/realval 和 imagval 的值float GetReal(cpmplex Z);/返回复数 Z 的实部值float Getimag(cpmplex Z);/返回复数 Z 的虚部值void add(comp
13、lex z1,complex z2,complex&sum);/以 sum 返回两个复数 z1,z2 的和 /-基本操作的实现基本操作的实现void add(complex z1,complex z2,complex&sum)/以 sum 返回两个复数 z1,z2 的和 sum.realpart=z1.realpart+z2.realpart;sum.imagpart=z1.imagpart+z2.imagpart;其它省略 1.3 1.3 算法和算法的衡量算法和算法的衡量一、算法一、算法二、算法设计的原则二、算法设计的原则三、算法效率的衡量方法和准则三、算法效率的衡量方法和准则四、算法的存储
14、空间需求四、算法的存储空间需求 算法算法是为了解决某类问题而规定的一个有限长的操作序列操作序列。一个算法必须满足以下五五个重要特性特性:1 1有穷性有穷性 2 2确定性确定性 3 3可行性可行性4 4有输入有输入 5 5有输出有输出一、算法一、算法1 1有穷性有穷性 对于任意一组合法输入值,在执行有穷步骤有穷步骤之后一定能结束,即:算法中的每个步骤都能在有限时间有限时间内完成。2 2确定性确定性 对于每种情况每种情况下所应执行的操作,在算法中都有确切确切的规定,使算法的执行者或阅读者都能明确其含义及如何执行。并且并且在任何条件下,算法都只有一在任何条件下,算法都只有一条执行路径。条执行路径。3
15、 3可行性可行性 算法中的所有操作都必须足够基本,都可以通过已经实现的基本操作运算有限次实现之。4 4有输入有输入 作为算法加工对象的量值,通常体现为算法中的一组变量。有些输入量需要在算法执行过程中输入,而有的算法表面上可以没有输入,实际上已被嵌入算法之中。5 5有输出有输出 它是一组与“输入”有确定关系的量值,是算法进行信息加工后得到的结果,这种确定关系即为算法的功能。二、算法设计的原则二、算法设计的原则设计算法时,通常应考虑达到以下目标:1正确性正确性2.可读性可读性3健壮性健壮性4高效率与低存储量需求高效率与低存储量需求1 1正确性正确性 首先,首先,算法应当满足满足以特定的“规格规格说
16、明说明”方式给出的需求需求。其次,其次,对算法是否“正确正确”的的理解可以有以下四个层次四个层次:a a程序中不含语法错误;b b程序对于几组输入数据能够得出满足要求的结果;c c程序对于精心选择的、典型、苛刻且程序对于精心选择的、典型、苛刻且带有刁难性的几组输入数据能够得出满足带有刁难性的几组输入数据能够得出满足要求的结果;要求的结果;通常以第 c c 层意义的正确性作为衡量一个算法是否合格的标准。d d程序对于一切合法的输入数据都能得出满足要求的结果;2.可读性可读性 算法主要是为了人的阅读与交流阅读与交流,其次才是为计算机执行,因此算法应该易易于于人的理解理解;另一方面,晦涩难读的程序易
17、于隐藏较多错误而难以调试。3健壮性健壮性 当输入的数据非法非法时,算法应当恰当地作出反映或进行相应处理进行相应处理,而不是产生莫名奇妙的输出结果。并且,处理出处理出错的方法错的方法不应是中断程序的执行,而应是返回返回一个表示错误或错误性质的值表示错误或错误性质的值,以便在更高的抽象层次上进行处理。4高效率与低存储量需求高效率与低存储量需求通常,效率指的是算法执行时间;存储量指的是算法执行过程中所需的最大存储空间,两者都与问题的规模有关。三三、算法效率的、算法效率的 衡量方法和准则衡量方法和准则通常有两种两种衡量算法效率的方法:事后统计法事后统计法事前分析估算法事前分析估算法缺点:缺点:1必须执
18、行程序 2其它因素掩盖算法本质和算法执行时间时间相关的因素因素:1 1算法算法选用的策略的策略2 2问题的规模问题的规模3 3编写程序的语言语言4 4编译编译程序产生的机器代码的质量的质量5 5计算机计算机执行指令的速度的速度 一个特定算法的算法的“运行工作量运行工作量”的大小,只依赖于问题的规模(通常用整数量n表示),或者说,它是问题规模的函数是问题规模的函数。假如,随着问题规模 n 的增长,算法执行时间的增长率和算法执行时间的增长率和 f(n)的增长的增长率相同率相同,则可记作:T(n)=O(f(n)称称T(n)为算法的为算法的(渐近)时间复杂度。时间复杂度。如何估算如何估算 算法的时间复
19、杂度?算法的时间复杂度?算法算法 =控制结构控制结构 +原操作原操作 (固有数据类型的操作)算法的执行时间算法的执行时间=原操作原操作(i)(i)的执行次数的执行次数原操作原操作(i)(i)的执行时间的执行时间 算法的执行时间算法的执行时间 与与 原操作执行次数之和原操作执行次数之和 成正比成正比 从算法中选取一种对于所研究的问题来说是 基本操作基本操作 的原操作,以该基本操作 在算法中重复执行的次在算法中重复执行的次数数 作为算法运行时间的衡量准则。例例一一两两个个矩矩阵阵相相乘乘void mult(int a,int b,int&c)/以二维数组存储矩阵元素,c 为 a 和 b 的乘积 f
20、or(i=1;i=n;+i)for(j=1;j=n;+j)ci,j=0;for(k=1;k=n;+k)ci,j+=ai,k*bk,j;/for/mult基本操作:乘法乘法操作时间复杂度:O(n3)例例二二选选择择排排序序 void select_sort(int&a,int n)/将将 a 中整数序列重新排列成自小至大有序的整数序列中整数序列重新排列成自小至大有序的整数序列。/select_sort基本操作:比较比较(数据元素)操作操作时间复杂度:O(n2)j=i;/选择第选择第 i i 个最小元素个最小元素for(k=i+1;k n;+k)if(ak aj)j=k;for(i=0;i1&ch
21、ange;-i)/bubble_sort基本操作:赋值赋值操作时间复杂度:O(n2)change=FALSE;/change 为元素进行交换标志 for(j=0;j aj+1)aj aj+1;change=TRUE;/一趟起泡四、算法的存储空间需求四、算法的存储空间需求算法的空间复杂度定义为空间复杂度定义为:表示随着问题规模表示随着问题规模 n 的增大,的增大,算法运行所需存储量的增长率算法运行所需存储量的增长率与与 g(n)的增长率相同。的增长率相同。S(n)=O(g(n)算法的存储量算法的存储量包括:1输入数据输入数据所占空间2程序本身程序本身所占空间3辅助变量辅助变量所占空间 若输入数据输入数据所占空间只取决于问题 本身,和算法无关和算法无关,则只需要分析除 输入和程序之外的辅助变量辅助变量所占额外额外 空间空间。若所需额外空间相对于输入数据量 来说是常数,则称此算法为原地工作原地工作。若所需存储量依赖于特定的输入,则通常按最坏情况考虑。1.熟悉各名词、术语的含义,掌握基本概念。2.理解算法五个要素的确切含义。本章学习要点本章学习要点3.掌握计算语句频度和估算算法时掌握计算语句频度和估算算法时间复杂度的方法。间复杂度的方法。
限制150内