导引与基本数据结构课件.ppt
《导引与基本数据结构课件.ppt》由会员分享,可在线阅读,更多相关《导引与基本数据结构课件.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于导引与基本数据结构关于导引与基本数据结构1现在学习的是第1页,共74页2教材教材l计算机算法基础(第二版)余祥宣等计算机算法基础(第二版)余祥宣等 华中科技大学出版社华中科技大学出版社l参考书:参考书:1.计算机算法设计与分析:王晓东,电子工业出版计算机算法设计与分析:王晓东,电子工业出版社社2.算法分析与设计算法分析与设计:(美)古德里奇,(美)塔:(美)古德里奇,(美)塔玛西亚,霍红卫译玛西亚,霍红卫译 人民邮电出版社人民邮电出版社 课时安排:课时安排:28+12考试形式:闭卷考试形式:闭卷成绩:成绩:平时平时50%+考试考试50%现在学习的是第2页,共74页3序序l计算机算法是计算机
2、科学和计算机应用的核心计算机算法是计算机科学和计算机应用的核心l数据结构数据结构+算法算法=程序程序l算法(算法(algorithm)是一个在有限时间内逐步)是一个在有限时间内逐步执行某种任务的过程执行某种任务的过程l数据结构(数据结构(data structure)是一种系统组织)是一种系统组织和访问数据的方法和访问数据的方法l算法:计算机软件的灵魂算法:计算机软件的灵魂现在学习的是第3页,共74页4问题求解问题求解(Problem Solving)设计程序设计程序证明正确性证明正确性分析算法分析算法理解问题理解问题精确解或近似解精确解或近似解选择数据结构选择数据结构算法设计策略算法设计策略
3、设计算法设计算法现在学习的是第4页,共74页5章节安排章节安排l第一章第一章 导引与基本数据结构导引与基本数据结构 l第二章第二章 分治法分治法 l第三章第三章 贪心方法贪心方法 l第四章第四章 动态规划动态规划 l第五章第五章 检索与周游检索与周游l第六章第六章 回溯法回溯法l第七章第七章 分枝分枝-限界限界l第八章第八章 NP-问题问题?l算法研讨环节算法研讨环节 现在学习的是第5页,共74页6第一章第一章 导引与基本数据结构导引与基本数据结构1.1 算法的定义及特性1.什么是算法?什么是算法?算法如数字、计算一样,是一个算法如数字、计算一样,是一个基本概念基本概念。算法是解一算法是解一类
4、确定问题类确定问题的任意一种的任意一种特殊的方法特殊的方法。在计算机科学中,算法是使用计算机解在计算机科学中,算法是使用计算机解一类问题一类问题的精确、有效方法的代名词:的精确、有效方法的代名词:算法算法是一组是一组有穷的规则有穷的规则,它规定了解决某一,它规定了解决某一特定类特定类型问题型问题的一系列的一系列运算运算。现在学习的是第6页,共74页72.2.算法的五个重要特性算法的五个重要特性 确定性确定性、能行性能行性、输入输入、输出输出、有穷性有穷性1)确定性:)确定性:算法的每种运算必须要有确切的定义,算法的每种运算必须要有确切的定义,不能有二义性。不能有二义性。例:不符合确定性的运算例
5、:不符合确定性的运算l 5/0 l 将将6或或7与与x相加相加l 未赋值变量参与运算未赋值变量参与运算现在学习的是第7页,共74页82)能行性)能行性 算法中有待实现的运算都是基本的运算,算法中有待实现的运算都是基本的运算,原理上每种运算都能由人用纸和笔在有限的时间原理上每种运算都能由人用纸和笔在有限的时间内完成。内完成。例:整数的算术运算是例:整数的算术运算是“能行能行”的的 实数实数(无理数无理数)的算术运算是的算术运算是“不能行不能行”的的现在学习的是第8页,共74页93)输入)输入 每个算法有每个算法有0个或个或多多个输入。这些输入是在算法开始个输入。这些输入是在算法开始之前给出的量,
6、取自于特定的对象集合之前给出的量,取自于特定的对象集合定义域定义域(或值域)(或值域)4)输出)输出 一个算法产生一个算法产生一个一个或或多个多个输出,这些输出是同输入有某种特定关系输出,这些输出是同输入有某种特定关系的量。的量。现在学习的是第9页,共74页105)有穷性有穷性 一个算法总是在执行了一个算法总是在执行了有穷步有穷步的运算之后的运算之后终止终止。计算过程计算过程:只满足确定性、能行性、输入、输出四:只满足确定性、能行性、输入、输出四个特性但个特性但不一定能终止不一定能终止的一组规则。的一组规则。l 准确理解算法和计算过程的区别:准确理解算法和计算过程的区别:l 不能终止的计算过程
7、:操作系统。不能终止的计算过程:操作系统。l 算法是算法是“可以终止的计算过程可以终止的计算过程”。l 算法的时效性:只能把在相当有穷步内终止的算法的时效性:只能把在相当有穷步内终止的算法投入到计算机上运行。算法投入到计算机上运行。现在学习的是第10页,共74页114.我们的主要任务我们的主要任务 算法学习将涉及算法学习将涉及5个方面的内容:个方面的内容:1)设计算法设计算法:创造性的活动:创造性的活动 2)表示算法表示算法:思想的表示形式:思想的表示形式 3)确认算法确认算法:证明算法的正确性:证明算法的正确性 程序的证明(程序的证明(程序的形式化证明技术程序的形式化证明技术)4)分析算法分
8、析算法:算法时空特性分析:算法时空特性分析 5)测试程序测试程序:“调试只能指出有错误,而不能指出它们调试只能指出有错误,而不能指出它们 不存在错误不存在错误”本课程集中于学习算法的本课程集中于学习算法的设计设计与与分析分析。通过学习,掌握计算机。通过学习,掌握计算机算法设计和分析算法设计和分析基本策略与方法基本策略与方法,为设计更复杂、更有效的算法奠,为设计更复杂、更有效的算法奠定基础。定基础。现在学习的是第11页,共74页125.5.课程关系课程关系 数据结构数据结构 程序设计语言:结构化设计程序设计语言:结构化设计 数学基础数学基础 非数值计算领域的基本知识非数值计算领域的基本知识现在学
9、习的是第12页,共74页131.2 1.2 分析算法分析算法1.分析算法的目的分析算法的目的 在于:通过对算法的分析,在把算法变成程序在于:通过对算法的分析,在把算法变成程序实际运行前,就知道为完成一项任务所设计的算法实际运行前,就知道为完成一项任务所设计的算法的好坏,从而运行好的算法,改进差的算法,避免的好坏,从而运行好的算法,改进差的算法,避免无益的人力和物力浪费。无益的人力和物力浪费。算法分析是计算机领域的古老而前沿的课题。算法分析是计算机领域的古老而前沿的课题。进行算法分析的基本技术:抽象进行算法分析的基本技术:抽象现在学习的是第13页,共74页142.重要的假设和约定重要的假设和约定
10、1)计算机模型的假设)计算机模型的假设l Turing机模型:计算机形式理论模型机模型:计算机形式理论模型 l 通用计算机模型:通用计算机模型:l 顺序计算机顺序计算机l 有足够的有足够的“内存内存”l 能在固定的时间内存取数据单元能在固定的时间内存取数据单元 现在学习的是第14页,共74页152)计算的约定)计算的约定 算法的执行时间算法的执行时间=Fi*ti 其中,其中,Fi是算法中用到的某种运算是算法中用到的某种运算i的次数,的次数,ti是该运是该运算执行一次所用的时间。算执行一次所用的时间。l 确定使用什么样的运算及其执行时间。确定使用什么样的运算及其执行时间。l从计算时间上,运算的分
11、类:从计算时间上,运算的分类:l 时间囿界于常数的运算时间囿界于常数的运算:基本算术运算,如整数、浮点数的加、减、乘、除基本算术运算,如整数、浮点数的加、减、乘、除 字符运算字符运算 赋值赋值运算运算 过程调用等过程调用等 特点:尽管每种运算的执行时间不同,但一般只花特点:尽管每种运算的执行时间不同,但一般只花 一个一个固定量固定量的时间(单位时间)就可完成。的时间(单位时间)就可完成。现在学习的是第15页,共74页162)计算的约定(续)计算的约定(续)其他运算其他运算:字符串操作:与字符串中字符的数量成正比字符串操作:与字符串中字符的数量成正比 记录操作:与记录的属性数、属性类型等有关记录
12、操作:与记录的属性数、属性类型等有关 特点:运算时间特点:运算时间无定量无定量 如何分析非时间囿界于常数的运算:分解成若干时间囿如何分析非时间囿界于常数的运算:分解成若干时间囿界于常数的运算。界于常数的运算。如:如:Tstring=Length(String)*tchar现在学习的是第16页,共74页173)工作数据集的选择)工作数据集的选择l编制能够反映算法在最好、平均、最坏情况下工作编制能够反映算法在最好、平均、最坏情况下工作的的数据配置数据配置。然后使用这些数据配置运行算法,以了解算。然后使用这些数据配置运行算法,以了解算法的性能。法的性能。l测试数据集的生成测试数据集的生成在目前算法证
13、明与程序正确性证明没在目前算法证明与程序正确性证明没有取得理论上的突破性进展的情况下,是程序测试与算有取得理论上的突破性进展的情况下,是程序测试与算法分析中的关键技术之一。法分析中的关键技术之一。作为算法分析的数据集:典型特征作为算法分析的数据集:典型特征 作为程序性能测试的数据集:对执行指标产生影响作为程序性能测试的数据集:对执行指标产生影响的性质的性质现在学习的是第17页,共74页183.如何进行算法分析?如何进行算法分析?对算法进行全面分析,可分两个阶段进行:对算法进行全面分析,可分两个阶段进行:l事前分析事前分析:就算法本身,通过对其执行性能的理论分析,:就算法本身,通过对其执行性能的
14、理论分析,得出关于算法特性得出关于算法特性时间和空间时间和空间的一个特征的一个特征 函数(函数(、)与计算机物理软硬件没有与计算机物理软硬件没有 直接关系。直接关系。l事后测试事后测试:将算法编制成程序后实际放到计算机上运行,:将算法编制成程序后实际放到计算机上运行,收集其执行时间和空间占用等统计资料,进行收集其执行时间和空间占用等统计资料,进行 分析判断分析判断直接与物理实现有关。直接与物理实现有关。现在学习的是第18页,共74页191)事前分析)事前分析l目的:试图得出关于算法执行特性的一种形式描目的:试图得出关于算法执行特性的一种形式描 述,以述,以“理论上理论上”衡量算法的衡量算法的“
15、好坏好坏”。l如何给出反映算法执行特性的描述如何给出反映算法执行特性的描述?最直接方法:最直接方法:统计算法中各种运算的执行情况,包括:统计算法中各种运算的执行情况,包括:l 引用了哪些运算引用了哪些运算l 每种运算被执行的次数每种运算被执行的次数l 该种运算执行一次所花费的时间等。该种运算执行一次所花费的时间等。算法的执行时间算法的执行时间=Fi*ti现在学习的是第19页,共74页20l频率计数频率计数 例:例:xx+y for i 1 to n do for i 1 to n do x x+y for j 1 to n do repeat x x+y repeat repeat (a)(b
16、)(c)分析:分析:(a):xx+y执行了执行了1次次 (b):xx+y执行了执行了n次次 (c):xx+y执行了执行了n2次次 定义:定义:频率计数频率计数:一条:一条语句语句或一种或一种运算运算在算法(或程序)体中的执行次在算法(或程序)体中的执行次数。数。现在学习的是第20页,共74页21一条语句在整个程序运行时实际执行时间一条语句在整个程序运行时实际执行时间=频率计数频率计数*每执行一次该语句所需的时间每执行一次该语句所需的时间l 如何刻画算法执行特性的形式描述如何刻画算法执行特性的形式描述l实际执行时间受约于诸多实际因素,如机器类型、编实际执行时间受约于诸多实际因素,如机器类型、编程
17、与语言、操作系统等,没有统一的描述模型。程与语言、操作系统等,没有统一的描述模型。l在事前分析中,在事前分析中,只限于确定与所使用的机器及其他环境只限于确定与所使用的机器及其他环境因素无关的频率计数因素无关的频率计数,依此建立理论分析模型。,依此建立理论分析模型。现在学习的是第21页,共74页22l数量级数量级l 语句的数量级语句的数量级:语句的执行频率:语句的执行频率 例:例:1,n,n2l 算法的数量级算法的数量级:算法所包含的所有语句的执:算法所包含的所有语句的执 行频率之和。行频率之和。算法的数量级从本质上反映了一个算法的执行特性。算法的数量级从本质上反映了一个算法的执行特性。例:假如
18、求解同一个问题的三个算法分别具有例:假如求解同一个问题的三个算法分别具有n,n2,n3数数 量级。量级。若若n=10,则可能的执行时间将分别是,则可能的执行时间将分别是10,100,1000个个 单位单位时间时间与环境因素无关。与环境因素无关。现在学习的是第22页,共74页23l 计算时间计算时间/频率计数的表示函数频率计数的表示函数 通过事前分析给出算法计算时间(频率计通过事前分析给出算法计算时间(频率计数)的一个数)的一个函数函数表示形式,一般记为与表示形式,一般记为与输入规模输入规模n有关的函数形式:有关的函数形式:f(n)注:最高次项与函数整体的关系注:最高次项与函数整体的关系l空间特
19、性分析(略)空间特性分析(略)现在学习的是第23页,共74页242)事后测试)事后测试l目的:运行程序,确定程序实际耗费的时间与空间,目的:运行程序,确定程序实际耗费的时间与空间,验证先前的分析结论验证先前的分析结论包括正确性、执行性能等,包括正确性、执行性能等,比较、优化所设计的算法。比较、优化所设计的算法。l分析手段:作时、空性能分布图分析手段:作时、空性能分布图现在学习的是第24页,共74页254.计算时间的渐近表示计算时间的渐近表示记:记:算法的计算时间为算法的计算时间为f(n)数量级限界函数为数量级限界函数为g(n)其中,其中,l n是输入或输出规模的某种测度。是输入或输出规模的某种
20、测度。l f(n)表示算法的表示算法的“实际实际”执行时间执行时间与机器及语言有关与机器及语言有关。l g(n)是是形式简单形式简单的函数,如的函数,如nm,logn,2n,n!等。是事前分析中等。是事前分析中通过对计算时间或频率计数统计分析所得的、通过对计算时间或频率计数统计分析所得的、与机器及语言无关与机器及语言无关的的函数。函数。以下给出算法执行时间:以下给出算法执行时间:上界(上界()、下界(下界()、“平均平均”()的定义。的定义。现在学习的是第25页,共74页261)上界函数)上界函数定义定义1 如果存在两个正常数如果存在两个正常数c和和n0,对于所有的,对于所有的nnn0 0,有
21、,有|f(n)|c|g(n)|f(n)|c|g(n)|则记作则记作f(n)=f(n)=(g(n)(g(n)含义:含义:l如果算法用如果算法用n n值不变的同一类数据在某台机器上运行时,所用的值不变的同一类数据在某台机器上运行时,所用的时间总是小于时间总是小于|g(n)|g(n)|的一个常数倍。所以的一个常数倍。所以g(n)g(n)是计算时间是计算时间f(n)f(n)的的一个一个上界函数上界函数。f(n)f(n)的数量级就是的数量级就是g(n)g(n)。l试图求出试图求出最小最小的的g(n)g(n),使得,使得f(n)=f(n)=(g(n)(g(n)。现在学习的是第26页,共74页27lF(n)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 导引 基本 数据结构 课件
限制150内