数据结构(严蔚敏)学习课件第10章.ppt
2020年10月28日星期三,第1页,第十章 排序,2020年10月28日星期三,第2页,【课前思考】,在第一章中曾以选择排序和起泡排序为例讨论算法实践复杂度,不知你还记得吗?,2020年10月28日星期三,第3页,【学习目标】,1理解排序的定义和各种排序方法的特点,并能加以灵活应用。排序方法有不同的分类方法,基于关键字间的比较进行排序的方法可以按排序过程所依据的不同原则分为插入排序、交换排序、选择排序、归并排序和计数排序等五类。2掌握各种排序方法的时间复杂度的分析方法。能从关键字间的比较次数分析排序算法的平均情况和最坏情况的时间性能。按平均时间复杂度划分,内部排序可分为三类:O (n2) 的简单排序方法,O (nlogn) 的高效排序方法和O (dn)的基数排序方法。3理解排序方法稳定或不稳定的含义,弄清楚在什么情况下要求应用的排序方法必须是稳定的。,2020年10月28日星期三,第4页,【重点和难点】,希尔排序、快速排序、堆排序和归并排序等高效方法是本章的学习重点和难点。,【知识点】,排序、直接插入排序、折半插入排序、表插入排序、希尔排序、起泡排序、快速排序、简单选择排序、堆排序、2-路归并排序、基数排序、排序方法的综合比较 。,2020年10月28日星期三,第5页,【学习指南】,本章学习的要点主要是了解各种排序方法实现时所依据的原则以及它们的主要操作(“关键字间的比较”和“记录的移动”)的时间分析。学习中应注意掌握各种排序方法实现的要点,可通过对基础知识题中算法的手工执行和比较分析,切实掌握各种排序过程的排序特点所在,注意同一排序方法在不同的教科书上可以有不同书写形式描述的算法。在学习本章过程中需练习的算法设计题为:10.23,10.25,10.27 , 10.32, 10.34, 10.38, 10.42 和 10.45。,2020年10月28日星期三,第6页,10.1 概述,10.2 插入排序,10.3 快速排序,10.4 堆排序,10.5 归并排序,10.6 基数排序,10.7 各种排序方法的综合比较,10.8 外部排序,2020年10月28日星期三,第7页,10.1 概 述,一、排序的定义,二、内部排序和外部排序,三、内部排序方法的分类,2020年10月28日星期三,第8页,一、什么是排序?,排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。,例如:将下列关键字序列,52, 49, 80, 36, 14, 58, 61, 23, 97, 75,调整为,14, 23, 36, 49, 52, 58, 61 ,75, 80, 97,2020年10月28日星期三,第9页,一般情况下, 假设含n个记录的序列为 R1, R2, , Rn 其相应的关键字序列为 K1, K2, ,Kn ,这些关键字相互之间可以进行比较,即在 它们之间存在着这样一个关系 : Kp1Kp2Kpn,按此固有关系将上式记录序列重新排列为 Rp1, Rp2, ,Rpn 的操作称作排序。,2020年10月28日星期三,第10页,二、内部排序和外部排序,若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序;,反之,若参加排序的记录数量很大, 整个序列的排序过程不可能在内存中 完成,则称此类排序问题为外部排序。,2020年10月28日星期三,第11页,三、内部排序的方法,内部排序的过程是一个逐步扩大 记录的有序序列长度的过程。,经过一趟排序,有序序列区,无 序 序 列 区,有序序列区,无 序 序 列 区,2020年10月28日星期三,第12页,基于不同的“扩大” 有序序列长度的方法,内部排序方法大致可分下列几种类型:,插入类,交换类,选择类,归并类,其它方法,2020年10月28日星期三,第13页,待排记录的数据类型定义如下:,#define MAXSIZE 1000 / 待排顺序表最大长度,typedef int KeyType; / 关键字类型为整数类型,typedef struct KeyType key; / 关键字项 InfoType otherinfo; / 其它数据项 RcdType; / 记录类型,typedef struct RcdType rMAXSIZE+1; / r0闲置 int length; / 顺序表长度 SqList; / 顺序表类型,2020年10月28日星期三,第14页,1. 插入类,将无序子序列中的一个或几个记录“插入”到有序序列中,从而增加记录的有序子序列的长度。,2020年10月28日星期三,第15页,2. 交换类,通过“交换”无序序列中的记录从而得到其中关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。,2020年10月28日星期三,第16页,3. 选择类,从记录的无序子序列中“选择”关键字最小或最大的记录,并将它加入到有序子序列中,以此方法增加记录的有序子序列的长度。,2020年10月28日星期三,第17页,4. 归并类,通过“归并”两个或两个以上的记录有序子序列,逐步增加记录有序序列的长度。,5. 其它方法,2020年10月28日星期三,第18页,10. 2 插 入 排 序,2020年10月28日星期三,第19页,有序序列R1.i-1,Ri,无序序列 Ri.n,一趟直接插入排序的基本思想:,有序序列R1.i,无序序列 Ri+1.n,2020年10月28日星期三,第20页,实现“一趟插入排序”可分三步进行:,3将Ri 插入(复制)到Rj+1的位置上。,2将Rj+1.i-1中的所有记录均后移 一个位置;,1在R1.i-1中查找Ri的插入位置, R1.j.key Ri.key < Rj+1.i-1.key;,2020年10月28日星期三,第21页,直接插入排序(基于顺序查找),表插入排序(基于链表存储),不同的具体实现方法导致不同的算法描述,折半插入排序(基于折半查找),希尔排序(基于逐趟缩小增量),2020年10月28日星期三,第22页,一、直接插入排序,利用 “顺序查找”实现 “在R1.i-1中查找Ri的插入位置”,算法的实现要点:,2020年10月28日星期三,第23页,从Ri-1起向前进行顺序查找, 监视哨设置在R0;,R0 = Ri; / 设置“哨兵”,循环结束表明Ri的插入位置为 j +1,R0,j,Ri,for (j=i-1; R0.key<Rj.key; -j); / 从后往前找,j=i-1,插入位置,2020年10月28日星期三,第24页,对于在查找过程中找到的那些关键字不小于Ri.key的记录,并在查找的同时实现记录向后移动;,for (j=i-1; R0.key<Rj.key; -j); Rj+1 = Rj,R0,j,Ri,j= i-1,上述循环结束后可以直接进行“插入”,插入位置,2020年10月28日星期三,第25页,令 i = 2,3,, n, 实现整个序列的排序。,for ( i=2; i<=n; +i ) if (Ri.key<Ri-1.key) 在 R1.i-1中查找Ri的插入位置; 插入Ri ; ,2020年10月28日星期三,第26页,void InsertionSort ( SqList +i ) if (L.ri.key < L.ri-1.key) / InsertSort,L.r0 = L.ri; / 复制为监视哨 for ( j=i-1; L.r0.key < L.rj.key; - j ) L.rj+1 = L.rj; / 记录后移 L.rj+1 = L.r0; / 插入到正确位置,2020年10月28日星期三,第27页,内部排序的时间分析:,实现内部排序的基本操作有两个:,(2)“移动”记录。,(1)“比较”序列中两个关键字的 大小;,2020年10月28日星期三,第28页,对于直接插入排序:,最好的情况(关键字在记录序列中顺序有序):,“比较”的次数:,最坏的情况(关键字在记录序列中逆序有序):,“比较”的次数:,0,“移动”的次数:,“移动”的次数:,2020年10月28日星期三,第29页,因为 R1.i-1 是一个按关键字有序的有序序列,则可以利用折半查找实现“在R1.i-1中查找Ri的插入位置”,如此实现的插入排序为折半插入排序。,二、折半插入排序,2020年10月28日星期三,第30页,void BiInsertionSort ( SqList i<=L.length; +i ) / for,L.r0 = L.ri; / 将 L.ri 暂存到 L.r0,for ( j=i-1; j=high+1; -j ) L.rj+1 = L.rj; / 记录后移,L.rhigh+1 = L.r0; / 插入,2020年10月28日星期三,第31页,low = 1; high = i-1; while (low<=high) ,m = (low+high)/2; / 折半,if (L.r0.key < L.rm.key) high = m-1; / 插入点在低半区 else low = m+1; / 插入点在高半区,2020年10月28日星期三,第32页,14 36 49 52 80,58 61 23 97 75,i,low,high,m,m,low,low,m,high,14 36 49 52 58 61 80,23 97 75,i,low,high,m,high,m,high,m,low,例如:,再如:,插入 位置,插入 位置,L.r,L.r,2020年10月28日星期三,第33页,三、表插入排序,为了减少在排序过程中进行的 “移动”记录的操作,必须改变排序过 程中采用的存储结构。利用静态链表 进行排序,并在排序完成之后,一次 性地调整各个记录相互之间的位置, 即将每个记录都调整到它们所应该在 的位置上。,2020年10月28日星期三,第34页,void LInsertionSort (Elem SL , int n) / 对记录序列SL1.n作表插入排序 SL0.key = MAXINT ; SL0.next = 1; SL1.next = 0; for ( i=2; i<=n; +i ) for ( j=0, k = SL0.next;SLk.key<= SLi.key ; j=k, k=SLk.next ) SLj.next = i; SLi.next = k; / 结点i插入在结点j和结点k之间 / LinsertionSort,2020年10月28日星期三,第35页,算法中使用了三个指针: 其中:p指示第i个记录的当前位置 i指示第i个记录应在的位置 q指示第i+1个记录的当前位置,如何在排序之后调整记录序列?,2020年10月28日星期三,第36页,void Arrange ( Elem SL , int n ) p = SL0.next; / p指示第一个记录的当前位置 for ( i=1; i<n; +i ) while (p<i) p = SLp.next; q = SLp.next; / q指示尚未调整的表尾 if ( p!= i ) SLpSLi; / 交换记录,使第i个记录到位 SLi.next = p; / 指向被移走的记录 p = q; / p指示尚未调整的表尾, / 为找第i+1个记录作准备 / Arrange,2020年10月28日星期三,第37页,四、希尔排序(又称缩小增量排序),基本思想:对待排记录序列先作“宏观”调整,再作“微观”调整。,所谓“宏观”调整,指的是,“跳跃式” 的插入排序。 具体做法为:,2020年10月28日星期三,第38页,将记录序列分成若干子序列,分别对每个子序列进行插入排序。,其中,d 称为增量,它的值在排序过程中从大到小逐渐缩小,直至最后一趟排序减为 1。,例如:将 n 个记录分成 d 个子序列: R1,R1+d,R1+2d,R1+kd R2,R2+d,R2+2d,R2+kd Rd,R2d,R3d,Rkd,R(k+1)d ,2020年10月28日星期三,第39页,例如:,16 25 12 30 47 11 23 36 9 18 31,第一趟希尔排序,设增量 d =5,11 23 12 9 18 16 25 36 30 47 31,第二趟希尔排序,设增量 d = 3,9 18 12 11 23 16 25 31 30 47 36,第三趟希尔排序,设增量 d = 1,9 11 12 16 18 23 25 30 31 36 47,2020年10月28日星期三,第40页,void ShellInsert ( SqList / 插入 / if / ShellInsert,2020年10月28日星期三,第41页,void ShellSort (SqList /一趟增量为dltak的插入排序 / ShellSort,2020年10月28日星期三,第42页,10.3 快 速 排 序,一、起泡排序,二、一趟快速排序,三、快速排序,四、快速排序的时间分析,2020年10月28日星期三,第43页,一、起泡排序,假设在排序过程中,记录序列R1.n的状态为:,第 i 趟起泡排序,无序序列R1.n-i+1,有序序列 Rn-i+2.n,n-i+1,无序序列R1.n-i,有序序列 Rn-i+1.n,比较相邻记录,将关键字最大的记录交换到 n-i+1 的位置上,2020年10月28日星期三,第44页,void bibubble (int r,int n) int flag=1; int i=0,j; int temp; while(flag=1) flag=0; for(j=i+1;jrj+1) flag=1; temp=rj;rj=rj+1;rj+1=temp; i+; ,2020年10月28日星期三,第45页,注意:,2. 一般情况下,每经过一趟“起泡”,“i 减一”,但并不是每趟都如此。,例如:,2,5,5,3,1,5,7,9,8,9,i=7,i=6,for (j = 1; j < i; j+) if (Rj+1.key < Rj.key) ,1,3,i=2,1. 起泡排序的结束条件为, 最后一趟没有进行“交换记录”。,2020年10月28日星期三,第46页,时间分析:,最好的情况(关键字在记录序列中顺序有序): 只需进行一趟起泡,“比较”的次数:,最坏的情况(关键字在记录序列中逆序有序): 需进行n-1趟起泡,“比较”的次数:,0,“移动”的次数:,“移动”的次数:,n-1,2020年10月28日星期三,第47页,二、一趟快速排序(一次划分),目标:找一个记录,以它的关键字作为“枢轴”,凡其关键字小于枢轴的记录均移动至该记录之前,反之,凡关键字大于枢轴的记录均移动至该记录之后。,致使一趟排序之后,记录的无序序列Rs.t将分割成两部分:Rs.i-1和Ri+1.t,且 Rj.key Ri.key Rj.key (sji-1) 枢轴 (i+1jt)。,2020年10月28日星期三,第48页,s,t,low,high,设 Rs=52 为枢轴,将 Rhigh.key 和 枢轴的关键字进行比较,要求Rhigh.key 枢轴的关键字,将 Rlow.key 和 枢轴的关键字进行比较,要求Rlow.key 枢轴的关键字,high,23,low,80,high,14,low,52,例如,R0,52,low,high,high,high,low,2020年10月28日星期三,第49页,可见,经过“一次划分” ,将关键字序列 52, 49, 80, 36, 14, 58, 61, 97, 23, 75 调整为: 23, 49, 14, 36, (52) 58, 61, 97, 80, 75,在调整过程中,设立了两个指针: low 和high,它们的初值分别为: s 和 t,,之后逐渐减小 high,增加 low,并保证 Rhigh.key52,和 Rlow.key52,否则进行记录的“交换”。,2020年10月28日星期三,第50页,int Partition (RedType / 返回枢轴所在位置 / Partition,2020年10月28日星期三,第51页,int Partition (RedType R, int low, int high) / Partition,R0 = Rlow; pivotkey = Rlow.key; / 枢轴,while (low<high) ,while(low=pivotkey) - high; / 从右向左搜索,Rlow = Rhigh;,while (low<high / 从左向右搜索,Rhigh = Rlow;,Rlow = R0; return low;,2020年10月28日星期三,第52页,三、快速排序,首先对无序的记录序列进行“一次划分”,之后分别对分割所得两个子序列“递归”进行快速排序。,无 序 的 记 录 序 列,无序记录子序列(1),无序子序列(2),枢轴,一次划分,分别进行快速排序,2020年10月28日星期三,第53页,void QSort (RedType / 对 Rs.t 进行一次划分,QSort(R, s, pivotloc-1); / 对低子序列递归排序,pivotloc是枢轴位置,QSort(R, pivotloc+1, t); / 对高子序列递归排序,2020年10月28日星期三,第54页,void QuickSort( SqList / QuickSort,第一次调用函数 Qsort 时,待排序记录序列的上、下界分别为 1 和 L.length。,2020年10月28日星期三,第55页,四、快速排序的时间分析,假设一次划分所得枢轴位置 i=k,则对n 个记录进行快排所需时间:,其中 Tpass(n)为对 n 个记录进行一次划分所需时间。,若待排序列中记录的关键字是随机分布的,则 k 取 1 至 n 中任意一值的可能性相同。,T(n) = Tpass(n) + T(k-1) + T(n-k),2020年10月28日星期三,第56页,设 Tavg(1)b,则可得结果:,结论: 快速排序的时间复杂度为O(nlogn),由此可得快速排序所需时间的平均值为:,2020年10月28日星期三,第57页,若待排记录的初始状态为按关键字有序时,快速排序将蜕化为起泡排序,其时间复杂度为O(n2)。,为避免出现这种情况,需在进行一次划分之前,进行“予处理”,即:,先对 R(s).key, R(t).key 和 R(s+t)/2.key,进行相互比较,然后取关键字为 “三者之中”的记录为枢轴记录。,2020年10月28日星期三,第58页,10.4 堆 排 序,简 单 选 择 排 序,堆 排 序,2020年10月28日星期三,第59页,一、简单选择排序,假设排序过程中,待排记录序列的状态为:,有序序列R1.i-1,无序序列 Ri.n,第 i 趟 简单选择排序,从中选出 关键字最小的记录,有序序列R1.i,无序序列 Ri+1.n,2020年10月28日星期三,第60页,简单选择排序的算法描述如下:,void SelectSort (Elem R, int n ) / 对记录序列R1.n作简单选择排序。 for (i=1; i<n; +i) / 选择第 i 小的记录,并交换到位 / SelectSort,j = SelectMinKey(R, i); / 在 Ri.n 中选择关键字最小的记录,if (i!=j) RiRj; / 与第 i 个记录交换,2020年10月28日星期三,第61页,时间性能分析,对 n 个记录进行简单选择排序,所需进行的 关键字间的比较次数 总计为:,移动记录的次数,最小值为 0, 最大值为3(n-1) 。,2020年10月28日星期三,第62页,二、堆排序,堆是满足下列性质的数列r1, r2, ,rn:,或,堆的定义:,12, 36, 27, 65, 40, 34, 98, 81, 73, 55, 49,例如:,是小顶堆,12, 36, 27, 65, 40, 14, 98, 81, 73, 55, 49,不是堆,(小顶堆),(大顶堆),2020年10月28日星期三,第63页,ri,r2i,r2i+1,若将该数列视作完全二叉树, 则 r2i 是 ri 的左孩子; r2i+1 是 ri 的右孩子。,12,36,27,65,49,81,73,55,40,34,98,例如:,是堆,14,不,2020年10月28日星期三,第64页,堆排序即是利用堆的特性对记录序列进行排序的一种排序方法。,例如:,建大顶堆, 98, 81, 49, 73, 36, 27, 40, 55, 64, 12 , 12, 81, 49, 73, 36, 27, 40, 55, 64, 98 ,交换 98 和 12,重新调整为大顶堆, 81, 73, 49, 64, 36, 27, 40, 55, 12, 98 , 40, 55, 49, 73, 12, 27, 98, 81, 64, 36 ,经过筛选,2020年10月28日星期三,第65页,void HeapSort ( HeapType i0; -i ) HeapAdjust ( H.r, i, H.length ); / 建大顶堆,for ( i=H.length; i1; -i ) H.r1H.ri; / 将堆顶记录和当前未经排序子序列 / H.r1.i中最后一个记录相互交换 HeapAdjust(H.r, 1, i-1); / 对 H.r1 进行筛选 ,2020年10月28日星期三,第66页,如何“建堆”?,两个问题:,如何“筛选”?,定义堆类型为:,typedef SqList HeapType; / 堆采用顺序表表示之,2020年10月28日星期三,第67页,所谓“筛选”指的是,对一棵左/右子树 均为堆的完全二叉树,“调整”根结点 使整个二叉树也成为一个堆。,堆,堆,筛选,2020年10月28日星期三,第68页,98,81,49,73,55,64,12,36,27,40,例如:,是大顶堆,12,但在 98 和 12 进行互换之后,它就不是堆了,,因此,需要对它进行“筛选”。,98,12,81,73,64,12,98,比较,比较,2020年10月28日星期三,第69页,void HeapAdjust (RcdType / 暂存 Rs,for ( j=2*s; j<=m; j*=2 ) / j 初值指向左孩子 自上而下的筛选过程; ,Rs = rc; / 将调整前的堆顶记录插入到 s 位置,2020年10月28日星期三,第70页,if ( rc.key = Rj.key ) break; / 再作“根”和“子树根”之间的比较, / 若“=”成立,则说明已找到 rc 的插 / 入位置 s ,不需要继续往下调整,Rs = Rj; s = j; / 否则记录上移,尚需继续往下调整,if ( j<m / 左/右“子树根”之间先进行相互比较 / 令 j 指示关键字较大记录的位置,2020年10月28日星期三,第71页,建堆是一个从下往上进行“筛选”的过程。,40,55,49,73,81,64,36,12,27,98,例如: 排序之前的关键字序列为,12,36,81,73,49,98,81,73,55,现在,左/右子树都已经调整为堆,最后只要调整根结点,使整个二叉树是个“堆”即可。,98,49,40,64,36,12,27,2020年10月28日星期三,第72页,堆排序的时间复杂度分析:,1. 对深度为 k 的堆,“筛选”所需进行的关键字 比较的次数至多为2(k-1);,3. 调整“堆顶” n-1 次,总共进行的关键 字比较的次数不超过 2 (log2(n-1)+ log2(n-2)+ +log22) < 2n(log2n),因此,堆排序的时间复杂度为O(nlogn)。,2. 对 n 个关键字,建成深度为h(=log2n+1)的堆,所需进行的关键字比较的次数至多 4n;,2020年10月28日星期三,第73页,10.5 归 并 排 序,归并排序的过程基于下列基本思想进行: 将两个或两个以上的有序子序列 “归并” 为一个有序序列。,2020年10月28日星期三,第74页,在内部排序中,通常采用的是2-路归并排序。即:将两个位置相邻的记录有序子序列,归并为一个记录的有序序列。,有 序 序 列 Rl.n,有序子序列 Rl.m,有序子序列 Rm+1.n,这个操作对顺序表而言,是轻而易举的。,2020年10月28日星期三,第75页,void Merge (RcdType SR, RcdType i<=m , ,2020年10月28日星期三,第76页,if (i<=m) TRk.n = SRi.m; / 将剩余的 SRi.m 复制到 TR,if (j<=n) TRk.n = SRj.n; / 将剩余的 SRj.n 复制到 TR,2020年10月28日星期三,第77页,归并排序的算法,如果记录无序序列 Rs.t 的两部分 Rs.(s+t)/2 和 R(s+t)/2+1.t 分别按关键字有序, 则利用上述归并算法很容易将它们归并成整个记录序列是一个有序序列。,由此,应该先分别对这两部分进行 2-路归并排序。,2020年10月28日星期三,第78页,例如:,52, 23, 80, 36, 68, 14 (s=1, t=6), 52, 23, 80 36, 68, 14, 52, 2380, 52, 23, 52, 23, 52, 80,36, 6814,3668,36, 68,14, 36, 68, 14, 23, 36, 52, 68, 80 ,23,2020年10月28日星期三,第79页,void Msort ( RcdType SR, RcdType else / Msort, ,2020年10月28日星期三,第80页,m = (s+t)/2; / 将SRs.t平分为SRs.m和SRm+1.t,Msort (SR, TR2, s, m); / 递归地将SRs.m归并为有序的TR2s.m Msort (SR, TR2, m+1, t); /递归地SRm+1.t归并为有序的TR2m+1.t,Merge (TR2, TR1, s, m, t); / 将TR2s.m和TR2m+1.t归并到TR1s.t,2020年10月28日星期三,第81页,void MergeSort (SqList / MergeSort,容易看出,对 n 个记录进行归并排序的时间复杂度为(nlogn)。即: 每一趟归并的时间复杂度为 O(n), 总共需进行 log2n 趟。,2020年10月28日星期三,第82页,10.6 基 数 排 序,2020年10月28日星期三,第83页,基数排序是一种借助“多关键字排序”的思想来实现“单关键字排序”的内部排序算法。,多关键字的排序,链式基数排序,2020年10月28日星期三,第84页,一、多关键字的排序,n 个记录的序列 R1, R2, ,Rn 对关键字 (Ki0, Ki1,Kid-1) 有序是指:,其中: K0 被称为 “最主”位关键字,Kd-1 被称为 “最次”位关键字,对于序列中任意两个记录 Ri 和 Rj (1i<jn) 都满足下列(词典)有序关系: (Ki0, Ki1, ,Kid-1) < (Kj0, Kj1, ,Kjd-1),2020年10月28日星期三,第85页,实现多关键字排序 通常有两种作法:,最低位优先LSD法,最高位优先MSD法,2020年10月28日星期三,第86页,先对K0进行排序,并按 K0 的不同值将记录序列分成若干子序列之后,分别对 K1 进行排序,., 依次类推,直至最后对最次位关键字排序完成为止。,2020年10月28日星期三,第87页,先对 Kd-1 进行排序,然后对 Kd-2 进行排序,依次类推,直至对最主位关键字 K0 排序完成为止。,排序过程中不需要根据 “前一个” 关键字的排序结果,将记录序列分割成若干个(“前一个”关键字不同的)子序列。,2020年10月28日星期三,第88页,例如:学生记录含三个关键字: 系别、班号和班内的序列号,其中以系别为最主位关键字。,无序序列,对K2排序,对K1排序,对K0排序,3,2,30,1,2,15,3,1,20,2,3,18,2,1,20,1,2,15,2,3,18,3,1,20,2,1,20,3,2,30,3,1,20,2,1,20,1,2,15,3,2,30,2,3,18,1,2,15,2,1,20,2,3,18,3,1,20,3,2,30,LSD的排序过程如下:,2020年10月28日星期三,第89页,二、链式基数排序,假如多关键字的记录序列中,每个关键字的取值范围相同,则按LSD法进行排序时,可以采用“分配-收集”的方法,其好处是不需要进行关键字间的比较。,对于数字型或字符型的单关键字,可以看成是由多个数位或多个字符构成的多关键字,此时可以采用这种“分配-收集”的办法进行排序,称作基数排序法。,2020年10月28日星期三,第90页,例如:对下列这组关键字 209, 386, 768, 185, 247, 606, 230, 834, 539 ,首先按其 “个位数” 取值分别为 0, 1, , 9 “分配” 成 10 组,之后按从 0 至 9 的顺序将 它们 “收集” 在一起;,然后按其 “十位数” 取值分别为 0, 1, , 9 “分配” 成 10 组,之后再按从 0 至 9 的顺序将它们 “收集” 在一起;,最后按其“百位数”重复一遍上述操作。,2020年10月28日星期三,第91页,在计算机上实现基数排序时,为减少所需辅助存储空间,应采用链表作存储结构,即链式基数排序,具体作法为:,待排序记录以指针相链,构成一个链表;,“分配” 时,按当前“关键字位”所取值,将记录分配到不同的 “链队列” 中,每个队列中记录的 “关键字位” 相同;,“收集”时,按当前关键字位取值从小到大将各队列首尾相链成一个链表;,对每个关键字位均重复 2) 和 3) 两步。,2020年10月28日星期三,第92页,例如:,p369367167239237138230139,进行第一次分配,进行第一次收集,f0 r0,f7 r7,f8 r8,f9 r9,p230,230,367 ,167,237,367167237,138,368239139,369 ,239,139,138,2020年10月28日星期三,第93页,进行第二次分配,p230237138239139,p230367167237138368239139,f3 r3,f6 r6,230 ,237,138,239,139,367 ,167,368,367167368,进行第二次收集,2020年10月28日星期三,第94页,进行第三次收集之后便得到记录的有序序列,f1 r1,p230237138239139367167368,进行第三次分配,f2 r2,f3 r3,138 ,139,167,230 ,237,239,367 ,368,p138139167,230237239,367368,2020年10月28日星期三,第95页,提醒注意:,“分配”和“收集”的实际操作仅为修改链表中的指针和设置队列的头、尾指针。,2020年10月28日星期三,第96页,基数排序的时间复杂度为O(d(n+rd),其中:分配为O(n) 收集为O(rd)(rd为“基”) d为“分配-收集”的趟数,2020年10月28日星期三,第97页,10.7 各种排序方法的综合比较,2020年10月28日星期三,第98页,一、时间性能,1. 平均的时间性能,基数排序,时间复杂度为 O(nlogn):,快速排序、堆排序和归并排序,时间复杂度为 O(n2):,直接插入排序、起泡排序和 简单选择排序,时间复杂度为 O(n):,2020年10月28日星期三,第99页,2. 当待排记录序列按关键字顺序有序时,3. 简单选择排序、堆排序和归并排序的时间性能不随记录序列中关键字的分布而改变。,直接插入排序和起泡排序能达到O(n)的时间复杂度, 快速排序的时间性能蜕化为O(n2) 。,2020年10月28日星期三,第100页,二、空间性能,指的是排序过程中所需的辅助空间大小,1. 所有的简单排序方法(包括:直接插入、 起泡和简单选择) 和堆排序的空间复杂度为O(1);,2. 快速排序为O(logn),为递归程序执行过程中,栈所需的辅助空间;,2020年10月28日星期三,第101页,3. 归并排序所需辅助空间最多,其空间复杂度为 O(n);,4. 链式基数排序需附设队列首尾指针,则空间复杂度为 O(rd)。,2020年10月28日星期三,第102页,三、排序方法的稳定性能,1. 稳定的排序方法指的是,对于两个关键字相等的记录,它们在序列中的相对位置,在排序之前和经过排序之后,没有改变。,2. 当对多关键字的记录序列进行LSD方法排序时,必须采用稳定的排序方法。,排序之前 : Ri(K) Rj(K) ,排序之后 : Ri(K) Rj(K) ,2020年10月28日星期三,第103页,例如:,排序前 ( 56, 34, 47, 23, 66, 18, 82, 47 ),若排序后得到结果 ( 18, 23, 34, 47, 47, 56, 66, 82 ) 则称该排序方法是稳定的;,若排序后得到结果 ( 18, 23, 34, 47, 47, 56, 66, 82 ) 则称该排序方法是不稳定的。,2020年10月28日星期三,第104页,3. 对于不稳定的排序方法,只要能举出一个实例说明即可。,4. 快速排序、堆排序和希尔排序是不稳定的排序方法。,例如 : 对 4, 3, 4, 2 进行快速排序, 得到 2, 3, 4, 4 ,2020年10月28日星期三,第105页,四、关于“排序方法的时间复杂度的下限”,本章讨论的各种排序方法,除基数排序外,其它方法都是基于“比较关键字”进行排序的排序方法。,可以证明, 这类排序法可能达到的最快的时间复杂度为O(