清华大学严蔚敏数据结构.ppt
《清华大学严蔚敏数据结构.ppt》由会员分享,可在线阅读,更多相关《清华大学严蔚敏数据结构.ppt(240页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数 据 结 构计算机系第一章 绪 论1.1 什么是数据结构1.2 基本概念和术语1.3 抽象数据类型的表示与实现1.4 算法和算法分 1.4.1 算法 1.4.2 算法设计的要求 1.4.3 算法效率的度量 1.4.4 算法的存储空间的需求 第一章 绪 论l计算机是一门研究用计算机进行信息表示和处理的科学。这里面涉及到两个问题:l 信息的表示 信息的处理 而信息的表示和组又直接关系到处理信息的程序的效率。随着计算机的普及,信息量的增加,信息范围的拓宽,使许多系统程序和应用程序的规模很大,结构又相当复杂。因此,为了编写出一个“好”的程序,必须分析待处理的对象的特征及各对象之间存在的关系,这就是数
2、据结构这门课所要研究的问题。l 1.1什么是数据结构l 众所周知,计算机的程序是对信息进行加工处理。在大多数情况下,这些信息并不是没有组织,信息(数据)之间往往具有重要的结构关系,这就是数据结构的内容。那么,什么是数据结构呢?先看以下几个例子。l 例1、电话号码查询系统l 设有一个电话号码薄,它记录了N个人的名字和其相应的电话号码,假定按如下形式安排:l (a1,b1)(a2,b2)(an,bn)l其中ai,bi(i=1,2n)分别表示某人的名字和对应的电话号码要求设计一个算法,当给定任何一个人的名字时,该算法能够打印出此人的电话号码,如果该电话簿中根本就没有这个人,则该算法也能够报告没有这个
3、人的标志。l 算法的设计,依赖于计算机如何存储人的名字和对应的电话号码,或者说依赖于名字和其电话号码的结构。l 数据的结构,直接影响算法的选择和效率。l 上述的问题是一种数据结构问题。可将名字和对应的电话号码设计成:二维数组、表结构、向量。假定名字和其电话号码逻辑上已安排成N元向量的形式,它的每个元素是一个数对(ai,bi),1in 数据结构还要提供每种结构类型所定义的各种运算的算法。例2、图书馆的书目检索系统自动化问题例3、教师资料档案管理系统例4、多叉路口交通灯的管理问题 P3 通过以上几例可以直接地认为:数据结构就是研究数据的逻辑结构和物理结构以及它们之间相互关系,并对这种结构定义相应的
4、运算,而且确保经过这些运算后所得到的新结构仍然是原来的结构类型。l 1.2 基本概念和术语l数据(Data):是对信息的一种符号表示。在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。l数据元素(Data Element):是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。l 一个数据元素可由若干个数据项组成。数据项是数据的不可分割的最小单位。l数据对象(Data Object):是性质相同的数据元素的集合。是数据的一个子集。l数据结构(Data Structure):是相互之间存在一种或多种特定关系的数据元素的集合。l数据结构主要指逻辑结构和物理结构l 数据
5、之间的相互关系称为逻辑结构。通常分为四类基本结构:l一、集合 结构中的数据元素除了同属于一种类型外,别无其它关系。l二、线性结构 结构中的数据元素之间存在一对一的关系。l三、树型结构 结构中的数据元素之间存在一对多的关系。l四、图状结构或网状结构 结构中的数据元素之间存在多对多的关系。l l数据结构的形式定义为:数据结构是一个二元组:l Data-Structure=(D,S)l其中:D是数据元素的有限集,S是D上关系的有限集。例 复数的数据结构定义如下:Complex=(C,R)其中:C是含两个实数的集合C1,C2,分别表示复数的实部和虚部。R=P,P是定义在集合上的一种关系C1,C2。数据
6、结构在计算机中的表示称为数据的物理结构,又称为存储结构。l 数据对象可以是有限的,也可以是无限的。l数据结构不同于数据类型,也不同于数据对象,它不仅要描述数据类型的数据对象,而且要描述数据对象各元素之间的相互关系。l抽象数据类型:一个数学模型以及定义在该模型上的一组操作。l抽象数据类型实际上就是对该数据结构的定义。因为它定义了一个数据的逻辑结构以及在此结构上的一组算法。l用三元组描述如下:l(,)l数据结构在计算机中有两种不同的表示方法:l 顺序表示和非顺序表示l由此得出两种不同的存储结构:顺序存储结构和链式存储结构l顺序存储结构:用数据元素在存储器中的相对位置来表示数据元素之间的逻辑关系。l
7、链式存储结构:在每一个数据元素中增加一个存放地址的指针(),用此指针来表示数据元素之间的逻辑关系。l数据类型:在一种程序设计语言中,变量所具有的数据种类。l例1、在FORTRAN语言中,变量的数据类型有整型、实型、和复数型 l例2、在C语言中l数据类型:基本类型和构造类型l基本类型:整型、浮点型、字符型l构造类型:数组、结构、联合、指针、枚举型、自定义l数据对象:某种数据类型元素的集合。l例3、整数的数据对象是-3,-2,-1,0,1,2,3,l英文字符类型的数据对象是A,B,C,D,E,F,l 1.3 抽象数据类型的表示和实现lP11l 1.4 算法和算法分析l算法:是对特定问题求解步骤的一
8、种描述l 算法是指令的有限序列,其中每一条指令表示一个或多个操作。l 算法具有以下五个特性:l(1)有穷性 一个算法必须总是在执行有穷步之后结束,且每一步都在有穷时间内完成。l(2)确定性 算法中每一条指令必须有确切的含义。不存在二义性。且算法只有一个入口和一个出口。l(3)可行性 一个算法是可行的。即算法描述的操作都是可以通过已经实现的基本运算执行有限次来实现的。l4)输入 一个算法有零个或多个输入,这些输入取自于某个特定的对象集合。l5)输出 一个算法有一个或多个输出,这些输出是同输入有着某些特定关系的量。l1.4.2 算法设计的要求l评价一个好的算法有以下几个标准:l(1)正确性(Cor
9、rectness)算法应满足具体问题的需求。l(2)可读性(Readability)算法应该好读。以有利于阅读者对程序的理解。(3)健状性(Robustness)算法应具有容错处理。当输入非法数据时,算法应对其作出反应,而不是产年莫名其妙的输出结果。l(4)效率与存储量需求 效率指的是算法执行的时间;存储量需求指算法执行过程中所需要的最大存储空间。一般,这两者与问题的规模有关。l1.4.3 算法效率的度量l 对一个算法要作出全面的分析可分成两用人才个阶段进行,即事先分析和事后测试l事先分析 求出该算法的一个时间界限函数l事后测试 收集此算法的执行时间和实际占用空间的统计资料。l定义:如果存在两
10、个正常数c和n0,对于所有的nn0,有f(n)cg(n)l则记作 f(n)=O(g(n)一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,算法的时间量度记作 T(n)=O(f(n)称作算法的渐近时间复杂度。例、for(I=1,I=n;+I)for(j=1;j=n;+j)cIj=0;for(k=1;k=n;+k)cIj+=aIk*bkj;l由于是一个三重循环,每个循环从1到n,则总次数为:nnn=n3l时间复杂度为T(n)=O(n3)l频度:是指该语句重复执行的次数l例+x;s=0;l将x自增看成是基本操作,则语句频度为,即时间复杂度为(1)l如果将s=0也看成是基本操作,则语句频
11、度为,其时间复杂度仍为(1),即常量阶。l例、for(I=1;I=n;+I)l +x;s+=x;l 语句频度为:2n其时间复杂度为:O(n)l 即时间复杂度为线性阶。l例、for(I=1;I=n;+I)lfor(j=1;j=n;+j)l +x;s+=x;l 语句频度为:2n2l其时间复杂度为:O(n2)l 即时间复杂度为平方阶。l定理:若A(n)=a m n m+a m-1 n m-1+a1n+a0是一个m次多项式,则A(n)=O(n m)证略。例for(i=2;i=n;+I)for(j=2;j=i-1;+j)+x;ai,j=x;l语句频度为:l 1+2+3+n-2=(1+n-2)(n-2)/
12、2l =(n-1)(n-2)/2l =n2-3n+2l 时间复杂度为O(n2)l 即此算法的时间复杂度为平方阶.l 一个算法时间为O(1)的算法,它的基本运算执行的次数是固定的。因此,总的时间由一个常数(即零次多项式)来限界。而一个时间为O(n2)的算法则由一个二次多项式来限界。l l以下六种计算算法时间的多项式是最常用的。其关系为:l O(1)O(logn)O(n)O(nlogn)l O(n2)O(n3)l指数时间的关系为:l O(2n)O(n!)1&change;-I)l l change=false;l for(j=0;jaj+1)l aj aj+1;l change=TUREl l 最
13、好情况:0次l l l最坏情况:1+2+3+n-1l =n(n-1)/2l 平均时间复杂度为:O(n2)l1.4.4算法的存储空间需求l空间复杂度:算法所需存储空间的度量,记作:l S(n)=O(f(n)l其中n为问题的规模(或大小)第二章 线性表l2.1 线性表的类型定义l2.2 线性表的顺序表示和实现l2.3 线性表的链式表示和实现l 2.3.1 线性链表 2.3.2 循环链表 2.3.3 双向链表 2.4 一元多项式的表示及相加l2.1 线性表的逻辑结构l线性表(Linear List):由n(n)个数据元素(结点)a1,a2,an组成的有限序列。其中数据元素的个数n定义为表的长度。当n
14、=0时称为空表,常常将非空的线性表(n0)记作:l (a1,a2,an)l这里的数据元素ai(1in)只是一个抽象的符号,其具体含义在不同的情况下可以不同。l例1、26个英文字母组成的字母表l (A,B,C、Z)l例2、某校从1978年到1983年各种型号的计算机拥有量的变化情况。l (6,17,28,50,92,188)例例3 3、学生健康情况登记表如下:、学生健康情况登记表如下:姓 名学 号性 别年龄 健康情况王小林790631 男 18 健康陈 红790632 女 20 一般刘建平790633 男 21 健康张立立790634 男 17 神经衰弱.l例4、一副扑克的点数l (2,3,4,
15、J,Q,K,A)从以上例子可看出线性表的逻辑特征是:在非空的线性表,有且仅有一个开始结点a1,它没有直接前趋,而仅有一个直接后继a2;有且仅有一个终端结点an,它没有直接后继,而仅有一个直接前趋a n-1;其余的内部结点ai(2in-1)都有且仅有一个直接前趋a i-1和一个直接后继a i+1。线性表是一种典型的线性结构。l数据的运算是定义在逻辑结构上的,而运算的具体实现则是在存储结构上进行的。l抽象数据类型的定义为:P19 算法2.1l例2-1 利用两个线性表LA和LB分别表示两个集合A和B,现要求一个新的集合A=AB。void union(List&La,List Lb)La-len=li
16、stlength(La);Lb-len=listlength(Lb);for(I=1;I=lb-len;I+)getelem(lb,I,e);if(!locateelem(la,e,equal)listinsert(la,+la-en,e)l l 算法2.2l例2-2 巳知线性表LA和线性表LB中的数据元素按值非递减有序排列,现要求将LA和LB归并为一个新的线性表LC,且LC中的元素仍按值非递减有序排列。l 此问题的算法如下:void mergelist(list la,list lb,list&lc)initlist(lc);I=j=1;k=0;la-len=listlength(la);l
17、b-len=listlength(lb);while(I=la-len)&(j=lb-len)l getelem(la,I,ai);getelem(lb,j,bj);l if(ai=bj)listinsert(lc,+k,ai);+I;elselistinsert(lc,+k,bj);+j;while(I=la-len)getelem(la,I+,ai);listinsert(lc,+k,ai);while(j=lb-len)getelem(lb,j+,bj);listinsert(lc,+k,bi);l 2.2 线性表的顺序存储结构l2.2.1 线性表 把线性表的结点按逻辑顺序依次存放在一组
18、地址连续的存储单元里。用这种方法存储的线性表简称顺序表。假设线性表的每个元素需占用l个存储单元,并以所占的第一个单元的存储地址作为数据元素的存储位置。则线性表中第I+1个数据元素的存储位置LOC(a i+1)和第i个数据元素的存储位置LOC(a I )之间满足下列关系:LOC(a i+1)=LOC(a i)+l 线性表的第i个数据元素ai的存储位置为:LOC(ai)=LOC(a1)+(I-1)*l l由于C语言中的一维数组也是采用顺序存储表示,故可以用数组类型来描述顺序表。又因为除了用数组来存储线性表的元素之外,顺序表还应该用一个变量来表示线性表的长度属性,所以我们用结构类型来定义顺序表类型。
19、l#define ListSize 100l typedef int DataType;l typedef strucl DataType dataListSize;l int length;l Sqlist;l2.2.2 顺序表上实现的基本操作 在顺序表存储结构中,很容易实现线性表的一些操作,如线性表的构造、第i个元素的访问。注意:C语言中的数组下标从“0”开始,因此,若L是Sqlist类型的顺序表,则表中第i个元素是l.dataI-1。以下主要讨论线性表的插入和删除两种运算。1、插入 线性表的插入运算是指在表的第I(1in+1个位置上,插入一个新结点x,使长度为n的线性表 (a1,a i-
20、1,ai,an)变成长度为n+1的线性表 (a1,a i-1,x,ai,an)算法2.3lVoid InsertList(Sqlist*L,DataType x,int I)l l int j;l if(Il.length+1)l printf(“Position error”);l return ERRORl l if(l.length=ListSize)l printf(“overflow”);l exit(overflow);l for(j=l.length-1;j=I-1;j-)l l.dataj+1=l.dataj;l l.dataI-1=x;l l.length+;ll 现在分析算
21、法的复杂度。l 这里的问题规模是表的长度,设它的值为。该算法的时间主要化费在循环的结点后移语句上,该语句的执行次数(即移动结点的次数)是。由此可看出,所需移动结点的次数不仅依赖于表的长度,而且还与插入位置有关。l当时,由于循环变量的终值大于初值,结点后移语句将不进行;这是最好情况,其时间复杂度O(1);l当=1时,结点后移语句将循环执行n次,需移动表中所有结点,这是最坏情况,l其时间复杂度为O(n)。l 由于插入可能在表中任何位置上进行,因此需分析算法的平均复杂度 在长度为n的线性表中第i个位置上插入一个结点,令Eis(n)表示移动结点的期望值(即移动的平均次数),则在第i个位置上插入一个结点
22、的移动次数为n-I+1。故 Eis(n)=pi(n-I+1)不失一般性,假设在表中任何位置(1in+1)上插入结点的机会是均等的,则 p1=p2=p3=p n+1=1/(n+1)因此,在等概率插入的情况下,Eis(n)=(n-I+1)/(n+1)=n/2 也就是说,在顺序表上做插入运算,平均要移动表上一半结点。当表长 n较大时,算法的效率相当低。虽然Eis(n)中n的的系数较小,但就数量级而言,它仍然是线性阶的。因此算法的平均时间复杂度为O(n)。2、删除 线性表的删除运算是指将表的第i(1in)结点删除,使长度为n的线性表:(a1,a i-1,ai,a i+1,an)变成长度为n-1的线性表
23、 (a1,a i-1,a i+1,an)Void deleteList(Sqlist*L,int I)int j;if(Il.length)printf(“Position error”);return ERROR for(j=i;jdata=ch;pnext=head;head=p;ch=getchar();return(head);listlink createlist(int n)int data;linklist head;listnode*p head=null;for(i=n;i0;-i)p=(listnode*)malloc(sizeof(listnode);scanf(%d,&
24、pdata);pnext=head;head=p;return(head);2、尾插法建表 头插法建立链表虽然算法简单,但生成的链表中结点的次序和输入的顺序相反。若希望二者次序一致,可采用尾插法建表。该方法是将新结点插入到当前链表的表尾上,为此必须增加一个尾指针r,使其始终指向当前链表的尾结点。例:linklist creater()char ch;linklist head;listnode *p,*r;/(,*head;)head=NULL;r=NULL;while(ch=getchar()!=n)p=(listnode*)malloc(sizeof(listnode);pdata=ch;
25、if(head=NULL)head=p;else rnext=p;r=p;if(r!=NULL)rnext=NULL;return(head);说明:第一个生成的结点是开始结点,将开始结点插入到空表中,是在当前链表的第一个位置上插入,该位置上的插入操作和链表中其它位置上的插入操作处理是不一样的,原因是开始结点的位置是存放在头指针(指针变量)中,而其余结点的位置是在其前趋结点的指针域中。算法中的第一个if语句就是用来对第一个位置上的插入操作做特殊处理。算法中的第二个if语句的作用是为了分别处理空表和非空表两种不同的情况,若读入的第一个字符就是结束标志符,则链表head是空表,尾指针r亦为空,结点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 清华大学 严蔚敏 数据结构
限制150内