自考数据结构重点.pdf
《自考数据结构重点.pdf》由会员分享,可在线阅读,更多相关《自考数据结构重点.pdf(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品文档 精品文档 自考数据结构重点(周尧整理)第一章 概论 1.数据是信息的载体。2.数据元素是数据的基本单位。3.一个数据元素可以由若干个数据项组成。4.数据结构指的是数据之间的相互关系,即数据的组织形式。5.数据结构一般包括以下三方面内容:数据的逻辑结构、数据的存储结构、数据的运算 数据元素之间的逻辑关系,也称数据的逻辑结构,数据的逻辑结构是从逻辑关系上描述数据,与数据的存储无关,是独立于计算机的。数据元素及其关系在计算机存储器内的表示,称为数据的存储结构。数据的存储结构是逻辑结构用计算机语言的实现,它依赖于计算机语言。数据的运算,即对数据施加的操作。最常用的检索、插入、删除、更新、排序
2、等。6.数据的逻辑结构分类:线性结构和非线性结构 线性结构:若结构是非空集,则有且仅有一个开始结点和一个终端结点,并且所有结点都最多只有一个直接前趋和一个直接后继。线性表是一个典型的线性结构。栈、队列、串等都是线性结构。非线性结构:一个结点可能有多个直接前趋和直接后继。数组、广义表、树和图等数据结构都是非线性结构。7.数据的四种基本存储方法:顺序存储方法、链接存储方法、索引存储方法、散列存储方法(1)顺序存储方法:该方法把逻辑上相邻的结点存储在物理位置上相邻的存储单元里,结点间的逻辑关系由存储单元的邻接关系来体现。通常借助程序语言的数组描述。(2)链接存储方法:该方法不要求逻辑上相邻的结点在物
3、理位置上亦相邻,结点间的逻辑关系由附加的指针字段表示。通常借助于程序语言的指针类型描述。(3)索引存储方法:该方法通常在储存结点信息的同时,还建立附加的索引表。索引表由若干索引项组成。若每个结点在索引表中都有一个索引项,则该索引表称之为稠密索引,稠密索引中索引项的地址指示结点所在的存储位置。若一组结点在索引表中只对应一个索引项,则该索引表称为稀疏索引稀疏索引中索引项的地址指示一组结点的起始存储位置。索引项的一般形式是:(关键字、地址)关键字是能唯一标识一个结点的那些数据项。(4)散列存储方法:该方法的基本思想是:根据结点的关键字直接计算出该结点的存储地址。8.抽象数据类型(ADT):是指抽象数
4、据的组织和与之相关的操作。可以看作是数据的逻辑结构及其在逻辑结构上定义的操作。抽象数据类型可以看作是描述问题的模型,它独立于具体实现。它的优点是将数据和操作封装在一起,使得用户程序只能通过在 ADT里定义的某些操作来访问其中的数据,从而实现了信息隐藏。9.算法+数据结构=程序 数据结构:是指数据的逻辑结构和存储结构 算法:是对数据运算的描述 10.数据的运算通过算法描述的。算法是任意一个良定义的计算过程。它以一个或多个值作为输入,并产生一个或多个值作为输出。若一个算法对于每个输入实例均能终止并给出正确的结果,则称该算法是正确的。正确的算法解决了给定的计算问题。11.选用的算法首先应该是正确的。
5、此外,主要考虑如下三点:执行算法所耗费的时间;精品文档 精品文档 执行算法所耗费的存储空间,其中主要考虑辅助存储空间;算法应易于理解,易于编码,易于调试等等。12.一个算法所耗费的时间=算法中每条语句的执行时间之和,每条语句的执行时间=语句的执行次数(即频度(Frequency Count)语句执行一次所需时间。13.算法求解问题的输入量称为问题的规模(Size),一般用一个整数表示。14.一个算法的时间复杂度 T(n)是该算法的时间耗费,是该算法所求解问题规模 n 的函数。当问题的规模 n 趋向无穷大时,时间复杂度 T(n)的数量级(阶)称为算法的渐进时间复杂度。平均时间复杂度是指所有可能的
6、输入实例均以等概率出现的情况下,算法的期望运行时间。15.常见的时间复杂度按数量级递增排列依次为:常数 0(1)、对数阶 0(log2n)、线形阶 0(n)、线形对数阶 0(nlog2n)、平方阶 0(n2)立方阶 0(n3)、k 次方阶 0(nk)、指数阶 0(2n)。16.一个算法的空间复杂度 S(n)定义为该算法所耗费的存储空间,它也是问题规模 n 的函数。第二章 线性表 1.线性表(Linear List)是由 n(n0)个数据元素(结点)a1,a2,an组成的有限序列。2.线性表的逻辑结构特征,对于非空的线性表:有且仅有一个开始结点 a1,没有直接前趋,有且仅有一个直接后继 a2;有
7、且仅有一个终结结点 an,没有直接后继,有且仅有一个直接前趋 an-1;其余的内部结点 ai(2in-1)都有且仅有一个直接前趋 ai-1和一个 ai+1。3.常见的线性表的基本运算:(1)InitList(L)构造一个空的线性表 L,即表的初始化。(2)ListLength(L)求线性表 L中的结点个数,即求表长。(3)GetNode(L,i)取线性表 L中的第 i 个结点,这里要求 1iListLength(L)(4)LocateNode(L,x)在 L中查找值为 x 的结点,并返回该结点在 L中的位置。若 L中有多个结点的值和 x 相同,则返回首次找到的结点位置;若 L中没有结点的值为
8、x,则返回一个特殊值表示查找失败。(5)InsertList(L,x,i)在线性表 L的第 i 个位置上插入一个值为 x 的新结点,使得原编号为 i,i+1,n 的结点变为编号为 i+1,i+2,n+1 的结点。这里 1in+1,而 n 是原表 L的长度。插入后,表 L的长度加 1。(6)DeleteList(L,i)删除线性表 L的第 i 个结点,使得原编号为 i+1,i+2,n 的结点变成编号为 i,i+1,n-1 的结点。这里 1in,而 n 是原表 L的长度。删除后表 L的长度减 1。4.顺序存储方法:把线性表的结点按逻辑次序依次存放在一组地址连续的存储单元里的方法。顺序表(Seque
9、ntial List):用顺序存储方法存储的线性表简称为顺序表。顺序表是一种随机存取结构,顺序表的的特点是逻辑上相邻的结点其物理位置亦相邻。5.顺序表中结点 ai 的存储地址:LOC(ai)=LOC(a1)+(i-1)*c 1in,6.顺序表上实现的基本运算:(1)插入:在顺序表中,结点的物理顺序必须和结点的逻辑顺序保持一致,因此必须将表中位置为 n,n-1,i 上的结点,依次后移到位置 n+1,n,i+1 上,空出第 i 个位置,然后在该位置上插入新结点 x。仅当插入位置i=n+1 时,才无须移动结点,直接将 x 插入表的末尾。具体算法:void InsertList(SeqList*L,D
10、ataType x,int i)/将新结点 x 插入 L所指的顺序表的第 i 个结点ai的位置上 算法的时间主要花费在 for 循环中的结点后移语句上。该语句的执行次数是 n-i+1,在表中第 i 个位置插入一个结点的移动次数为 n-i+1,当 i=n+1:移动结点次数为 0,即算法在最好时间复杂度是 O(1),当 i=1:移动结点次数为n,即算法在最坏情况下时间复杂度是 O(n)即在顺序表上进行插入运算,平均要移动一半结点(n/2)。(2)删除:在顺序表上实现删除运算必须移动结点,才能反映出结点间的逻辑关系的变化。若 i=n,则只要简单地删除终端结点,无须移动结点;若 1in-1,则必须将表
11、中位置 i+1,i+2,n 的结点,依次前移到位置 i,i+1,n-1 上,以填补删除操作造成的空缺。具体算法:void DeleteList(SeqList*L,int i)/从 L所指的顺序表中删除第 i 个结点 ai 结点的移动次数由表长 n 和位置 i 决定:i=n 时,结点的移动次数为 0,即为 0(1),i=1 时,结点的移动次数为 n-1,的逻辑结构数据的存储结构数据的运算数据元素之间的逻辑关系也称数据的逻辑结构数据的逻辑结构是从逻辑关系上据的存储结构是逻辑结构用计算机语言的实现它依赖于计算机语言数据的运算即对数据施加的操作最常用的检索插入终端结点并且所有结点都最多只有一个直接前
12、趋一个直接后继线性表是一个典型的线性结构栈队列串等都是线性结构精品文档 精品文档 算法时间复杂度分别是 O(n)顺序表上做删除运算,平均要移动表中约一半的结点(n-1)/2,平均时间复杂度也是 O(n)。7.链接方式存储的线性表简称为链表(Linked List)。链表的具体存储表示为:用一组任意的存储单元来存放线性表的结点,链表中结点的逻辑次序和物理次序不一定相同(这组存储单元既可以是连续的,也可以是不连续的)。为了能正确表示结点间的逻辑关系,在存储每个结点值的同时,还必须存储指示其后继结点的地址(或位置)信息(称为指针(pointer)或链(link))。8.链表的结点结构:data 域-
13、存放结点值的数据域,next 域-存放结点的直接后继的地址(位置)的指针域(链域)单链表中每个结点的存储地址是存放在其前趋结点 next 域中,而开始结点无前趋,故应设头指针 head 指向开始结点。终端结点无后继,故终端结点的指针域为空,即 NULL。9.生成结点变量的标准函数 p=(ListNode*)malloc(sizeof(ListNode);/函数 malloc 分配一个类型为 ListNode 的结点变量的空间,并将其首地址放入指针变量 p 中释放结点变量空间的标准函数 free(p);/释放 p 所指的结点变量空间 结点分量的访问 方法二:p-data 和 p-next 指针变
14、量 p 和结点变量*p 的关系:指针变量 p 的值结点地址,结点变量*p 的值结点内容 10.建立单链表:(1)头插法建表:从一个空表开始,重复读入数据,生成新结点,将读入数据存放在新结点的数据域中,然后将新结点插入到当前链表的表头上,直到读入结束标志为止。算法:s=(ListNode*)malloc(sizeof(ListNode);/生成新结点 s-data=ch;/将读入的数据放入新结点的数据域中 s-next=head;head=s;(2)尾插法建表:从一个空表开始,重复读入数据,生成新结点,将读入数据存放在新结点的数据域中,然后将新结点插入到当前链表的表尾上,直到读入结束标志为止。算
15、法:s=(ListNode*)malloc(sizeof(ListNode);/生成新结点 s-data=ch;/将读入的数据放入新结点的数据域中 if(head!=NULL)head=s;/新结点插入空表 else r-next=s;/将新结点插到*r 之后 r=s;/尾指针指向新表尾 的逻辑结构数据的存储结构数据的运算数据元素之间的逻辑关系也称数据的逻辑结构数据的逻辑结构是从逻辑关系上据的存储结构是逻辑结构用计算机语言的实现它依赖于计算机语言数据的运算即对数据施加的操作最常用的检索插入终端结点并且所有结点都最多只有一个直接前趋一个直接后继线性表是一个典型的线性结构栈队列串等都是线性结构精品
16、文档 精品文档(3)尾插法建带头结点的单链表:头结点及作用:头结点是在链表的开始结点之前附加一个结点。它具有两个优点:由于开始结点的位置被存放在头结点的指针域中,所以在链表的第一个位置上的操作就和在表的其它位置上操作一致,无须进行特殊处理;无论链表是否为空,其头指针都是指向头结点的非空指针(空表中头结点的指针域空),因此空表和非空表的处理也就统一了。头结点数据域的阴影表示该部分不存储信息。在有的应用中可用于存放表长等附加信息。具体算法:r=head;/尾指针初值也指向头结点 while(ch=getchar()!=n)s=(ListNode*)malloc(sizeof(ListNode);/
17、生成新结点 s-data=ch;/将读入的数据放入新结点的数据域中 r-next=s;r=s;r-next=NULL;/终端结点的指针域置空,或空表的头结点指针域置空 以上三个算法的时间复杂度均为 O(n)。11.单链表上的查找:(1)链表不是随机存取结构 在链表中,即使知道被访问结点的序号 i,也不能像顺序表中那样直接按序号 i 访问结点,而只能从链表的头指针出发,顺链域 next 逐个结点往下搜索,直至搜索到第 i 个结点为止。因此,链表不是随机存取结构。(2)查找的思想方法 计数器 j 置为 0 后,扫描指针 p 指针从链表的头结点开始顺着链扫描。当 p 扫描下一个结点时,计数器 j相应
18、地加 1。当 j=i 时,指针 p 所指的结点就是要找的第 i 个结点。而当 p 指针指为 null 且 ji 时,则表示找不到第 i 个结点。头结点可看做是第 0 个结点。算法:p=head;j=0;/从头结点开始扫描 while(p-next&jnext 为 NULL或 i=j 为止 p=p-next;j+;if(i=j)return p;/找到了第 i 个结点 else return NULL;/当 i0 时,找不到第 i 个结点 时间复杂度:在等概率假设下,平均时间复杂度为:为 n/2=O(n)(2)按值查找:具体算法:ListNode*p=head-next;/从开始结点比较。表非空
19、,p 初始值指向开始结点 while(p&p-data!=key)/直到 p 为 NULL或 p-data 为 key 为止 p=p-next;/扫描下一结点 的逻辑结构数据的存储结构数据的运算数据元素之间的逻辑关系也称数据的逻辑结构数据的逻辑结构是从逻辑关系上据的存储结构是逻辑结构用计算机语言的实现它依赖于计算机语言数据的运算即对数据施加的操作最常用的检索插入终端结点并且所有结点都最多只有一个直接前趋一个直接后继线性表是一个典型的线性结构栈队列串等都是线性结构精品文档 精品文档 return p;/若 p=NULL,则查找失败,否则 p 指向值为 key 的结点 时间复杂度为:O(n)12.
20、插入运算:插入运算是将值为 x 的新结点插入到表的第 i 个结点的位置上,即插入到 ai-1与 ai之间。具体步骤:(1)找到 ai-1存储位置 p (2)生成一个数据域为 x 的新结点*s (3)令结点*p 的指针域指向新结点 (4)新结点的指针域指向结点 ai。具体算法:p=GetNode(head,i-1);/寻找第 i-1 个结点 if(p=NULL)/in+1 时插入位置 i 有错 Error(position error);s=(ListNode*)malloc(sizeof(ListNode);s-data=x;s-next=p-next;p-next=s;算法的时间主要耗费在查
21、找操作 GetNode 上,故时间复杂度亦为 O(n)。13.删除运算 删除运算是将表的第 i 个结点删去。具体步骤:(1)找到 ai-1的存储位置 p(因为在单链表中结点 ai的存储地址是在其直接前趋结点 ai-1的指针域 next 中)(2)令 p-next 指向 ai的直接后继结点(即把 ai从链上摘下)(3)释放结点 ai的空间,将其归还给存储池。具体算法:p=GetNode(head,i-1);/找到第 i-1 个结点 if(p=NULL|p-next=NULL)/in 时,删除位置错 Error(position error);/退出程序运行 r=p-next;/使 r 指向被删除
22、的结点 ai p-next=r-next;/将 ai从链上摘下 free(r);/释放结点 ai的空间给存储池 算法的时间复杂度也是 O(n)。链表上实现的插入和删除运算,无须移动结点,仅需修改指针。的逻辑结构数据的存储结构数据的运算数据元素之间的逻辑关系也称数据的逻辑结构数据的逻辑结构是从逻辑关系上据的存储结构是逻辑结构用计算机语言的实现它依赖于计算机语言数据的运算即对数据施加的操作最常用的检索插入终端结点并且所有结点都最多只有一个直接前趋一个直接后继线性表是一个典型的线性结构栈队列串等都是线性结构精品文档 精品文档 14.单循环链表在单链表中,将终端结点的指针域 NULL改为指向表头结点或
23、开始结点即可。判断空链表的条件是 head=head-next;15.仅设尾指针的单循环链表:用尾指针 rear 表示的单循环链表对开始结点 a1和终端结点 an查找时间都是 O(1)。而表的操作常常是在表的首尾位置上进行,因此,实用中多采用尾指针表示单循环链表。判断空链表的条件为rear=rear-next;16.循环链表:循环链表的特点是无须增加存储量,仅对表的链接方式稍作改变,即可使得表处理更加方便灵活。若在尾指针表示的单循环链表上实现,则只需修改指针,无须遍历,其执行时间是 O(1)。具体算法:LinkList Connect(LinkList A,LinkList B)/假设 A,B
24、为非空循环链表的尾指针 LinkList p=A-next;/保存 A表的头结点位置 A-next=B-next-next;/B表的开始结点链接到 A表尾 free(B-next);/释放 B表的头结点 B-next=p;/return B;/返回新循环链表的尾指针 循环链表中没有 NULL指针。涉及遍历操作时,其终止条件就不再是像非循环链表那样判别 p 或 p-next 是否为空,而是判别它们是否等于某一指定指针,如头指针或尾指针等。在单链表中,从一已知结点出发,只能访问到该结点及其后续结点,无法找到该结点之前的其它结点。而在单循环链表中,从任一结点出发都可访问到表中所有结点,这一优点使某些
25、运算在单循环链表上易于实现。17.双向链表:双(向)链表中有两条方向不同的链,即每个结点中除 next 域存放后继结点地址外,还增加一个指向其直接前趋的指针域 prior。双链表由头指针 head 惟一确定的。带头结点的双链表的某些运算变得方便。将头结点和尾结点链接起来,为双(向)循环链表。的逻辑结构数据的存储结构数据的运算数据元素之间的逻辑关系也称数据的逻辑结构数据的逻辑结构是从逻辑关系上据的存储结构是逻辑结构用计算机语言的实现它依赖于计算机语言数据的运算即对数据施加的操作最常用的检索插入终端结点并且所有结点都最多只有一个直接前趋一个直接后继线性表是一个典型的线性结构栈队列串等都是线性结构精
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自考 数据结构 重点
限制150内