最新【考研计算机专业课】武汉大学数据结构PPT课件 第12章文件(共40张PPT课件).pptx
《最新【考研计算机专业课】武汉大学数据结构PPT课件 第12章文件(共40张PPT课件).pptx》由会员分享,可在线阅读,更多相关《最新【考研计算机专业课】武汉大学数据结构PPT课件 第12章文件(共40张PPT课件).pptx(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第12章章 文文 件件 本章本章(bn zhn)小结小结12.1 文件文件(wnjin)的基本概念的基本概念12.2 顺序顺序(shnx)文件文件12.4 哈希文件哈希文件12.3 索引文件索引文件12.5 多关键字文件多关键字文件第一页,共四十页。12.1 文件的基本概念文件的基本概念12.1.1 什么是文件什么是文件 文件文件是性质相同的记录的集合。文件的数据量通常很大是性质相同的记录的集合。文件的数据量通常很大,它被它被放置在外存上。放置在外存上。 数据结构中所讨论的文件主要是数据库意义数据结构中所讨论的文件主要是数据库意义(yy)上的文件上的文件,而不而不是操作系统意义是操作系统意义
2、(yy)上的文件。操作系统中研究的文件是一维的无上的文件。操作系统中研究的文件是一维的无结构连续字符序列结构连续字符序列,数据库中所研究的文件是带有结构的记录集合数据库中所研究的文件是带有结构的记录集合,每个记录可由若干个数据项构成。每个记录可由若干个数据项构成。 第二页,共四十页。 记录记录是文件中存取的基本单位是文件中存取的基本单位,数据项数据项是文件可使用的最小单位。是文件可使用的最小单位。数据项有时数据项有时(yush)也称为也称为字段字段。其值能惟一标识一个记录的数据项或数。其值能惟一标识一个记录的数据项或数据项的组合称为据项的组合称为主关键字项主关键字项,其他不能惟一标识一个记录的
3、数据项则其他不能惟一标识一个记录的数据项则称为称为次关键字项次关键字项,主关键字项主关键字项(或次关键字项或次关键字项)的值称为的值称为主关键字主关键字(或或次关次关键字键字)。 为讨论方便起见为讨论方便起见,我们仍不严格区分关键字项和关键字我们仍不严格区分关键字项和关键字,即在不易混即在不易混淆时淆时,将主将主(或次或次)关键字项简称为主关键字项简称为主(或次或次)关键字关键字,并且假定主关键字项只并且假定主关键字项只含一个数据项含一个数据项。 第三页,共四十页。 文件可以文件可以(ky)按照记录中关键字的多少按照记录中关键字的多少,分成分成单关键字文件单关键字文件和和多多关键字文件关键字文
4、件。若文件中的记录只有一个惟一标识记录的主关键字。若文件中的记录只有一个惟一标识记录的主关键字,则称其则称其为为单关键字文件单关键字文件;若文件中的记录除了含有一个主关键字外;若文件中的记录除了含有一个主关键字外,还含有还含有若干个次关键字若干个次关键字,则称为则称为多关键字文件多关键字文件。 文件又可分成定长文件和不定长文件。若文件中记录含有的信息文件又可分成定长文件和不定长文件。若文件中记录含有的信息长度相同长度相同,则称这类记录为定长记录则称这类记录为定长记录,由这种定长记录组成的文件称做由这种定长记录组成的文件称做定长文件定长文件;若文件中记录含有的信息长度不等;若文件中记录含有的信息
5、长度不等,则称做则称做不定长文件不定长文件。 第四页,共四十页。12.1.2 文件的逻辑结构及操作文件的逻辑结构及操作 文件中各记录之间存在着逻辑关系文件中各记录之间存在着逻辑关系,当一个文件的各个记录当一个文件的各个记录按照某种次序排列起来时按照某种次序排列起来时(这种排列的次序可以是记录中关键字这种排列的次序可以是记录中关键字的大小的大小,也可以是各个记录存入该文件的时间先后等等也可以是各个记录存入该文件的时间先后等等),各记录之各记录之间就自然地形成了一种线性关系。在这种次序下间就自然地形成了一种线性关系。在这种次序下,文件中每个记文件中每个记录最多只有录最多只有(zhyu)一个后继记录
6、和一个前驱记录一个后继记录和一个前驱记录,而文件的第一个而文件的第一个记录只有记录只有(zhyu)后继没有前驱后继没有前驱,文件的最后一个记录只有文件的最后一个记录只有(zhyu)前驱前驱而没有后继。因此而没有后继。因此,文件可看成是一种线性结构文件可看成是一种线性结构。 文件上的操作主要有两类:检索和维护。文件上的操作主要有两类:检索和维护。第五页,共四十页。12.1.3 文件的存储结构文件的存储结构 文件的存储结构是指文件在外存上的组织方式。采用不同的文件的存储结构是指文件在外存上的组织方式。采用不同的组织方式就得到不同的存储结构。基本的组织方式有四种:顺序组织方式就得到不同的存储结构。基
7、本的组织方式有四种:顺序组织、索引组织、哈希组织和链组织。文件组织的各种方式往往组织、索引组织、哈希组织和链组织。文件组织的各种方式往往是这四种基本方式的结合。是这四种基本方式的结合。 几种常用的文件组织方式:顺序文件、索引文件、哈希文件和多几种常用的文件组织方式:顺序文件、索引文件、哈希文件和多关键字文件。选择关键字文件。选择(xunz)哪一种文件组织方式哪一种文件组织方式,取决于对文件中记录的取决于对文件中记录的使用方式和频繁程度、存取要求、外存的性质和容量。使用方式和频繁程度、存取要求、外存的性质和容量。 第六页,共四十页。12.2 顺序文件顺序文件 顺序文件顺序文件是指按记录进入文件的
8、先后顺序存放、其逻辑顺序跟是指按记录进入文件的先后顺序存放、其逻辑顺序跟物理顺序一致的文件。若顺序文件中的记录按其主关键字有序物理顺序一致的文件。若顺序文件中的记录按其主关键字有序,则则称此顺序文件为称此顺序文件为顺序有序文件顺序有序文件;否则称为;否则称为顺序无序文件顺序无序文件。为了提高检。为了提高检索效率索效率,常常将顺序文件组织成有序文件。常常将顺序文件组织成有序文件。 顺序文件的结构特点:顺序文件的结构特点: 记录在文件中的排列顺序是由记录进入存储介质的次序记录在文件中的排列顺序是由记录进入存储介质的次序(cx)决定的决定的, 即文即文件物理结构中记录的排列顺序和文件的逻辑结构中记录
9、的排列顺序一致。件物理结构中记录的排列顺序和文件的逻辑结构中记录的排列顺序一致。第七页,共四十页。 顺序文件的操作特点:顺序文件的操作特点: (1)便于进行顺序存取;便于进行顺序存取; (2)不便于进行直接存取不便于进行直接存取,为取第为取第i个记录个记录,必须先读出前必须先读出前i-1个记个记录录,对于磁盘上的等长记录的连续文件可以进行折半查找;对于磁盘上的等长记录的连续文件可以进行折半查找; (3)插入插入(ch r)新的记录只能加在文件的末尾;新的记录只能加在文件的末尾; (4)删除记录时删除记录时,只作标记;只作标记; (5)更新记录必须生成新的文件。更新记录必须生成新的文件。第八页,
10、共四十页。12.3 索引文件索引文件 用索引的方法组织文件时用索引的方法组织文件时,通常是在文件本身通常是在文件本身(称为主文件称为主文件)之之外外,另外建立一张表另外建立一张表,它指明逻辑记录和物理记录之间的一一对应关它指明逻辑记录和物理记录之间的一一对应关系系,这张表就叫做索引表这张表就叫做索引表,它和主文件一起构成它和主文件一起构成(guchng)的文件称作索的文件称作索引文件。引文件。 索引表中的每一项称作索引表中的每一项称作索引项索引项,一般索引项都是由一般索引项都是由主关键字和该主关键字和该关键字所在记录的物理地址组成关键字所在记录的物理地址组成的。显然的。显然,索引表必须按主关键
11、字有索引表必须按主关键字有序序,而主文件本身则可以按主关键字有序或无序而主文件本身则可以按主关键字有序或无序,前者称为前者称为索引顺序文索引顺序文件件,后者称为后者称为索引非顺序文件索引非顺序文件。 第九页,共四十页。 对于索引非顺序文件对于索引非顺序文件,由于由于(yuy)主文件中记录是无序的主文件中记录是无序的,则必则必须为每个记录建立一个索引项须为每个记录建立一个索引项,这样建立的索引表称为这样建立的索引表称为稠密索引稠密索引。 对于索引顺序文件对于索引顺序文件,由于主文件中记录按关键字有序由于主文件中记录按关键字有序,则可对则可对一组记录建立一个索引项一组记录建立一个索引项,例如例如,
12、让文件中每个页块对应一个索引让文件中每个页块对应一个索引项项,这种索引表称之为这种索引表称之为稀疏索引稀疏索引。 通常可将索引非顺序文件简称为索引文件通常可将索引非顺序文件简称为索引文件,本节只讨论这种本节只讨论这种文件。文件。 第十页,共四十页。 索引文件在存储器上分为两个索引文件在存储器上分为两个(lin )区:索引区和数据区区:索引区和数据区,前者前者存放索引表存放索引表,后者存放主文件。在建立文件过程中后者存放主文件。在建立文件过程中,按输入记录的先按输入记录的先后次序建立数据区和索引表后次序建立数据区和索引表,这样的索引表其关键字是无字的这样的索引表其关键字是无字的,待全待全部记录输
13、入完毕后再对索引表进行排序部记录输入完毕后再对索引表进行排序,排序后的索引表和主文件排序后的索引表和主文件一起就形成了索引文件。一起就形成了索引文件。 第十一页,共四十页。索引文件的结构特点:索引文件的结构特点: (1) 索引文件由索引文件由“主文件主文件”和多级和多级“索引索引”组成;组成; (2) 索引中的每个记录由索引中的每个记录由“关键字关键字”和和“指针指针”组成;组成; (3) 通常通常,索引文件中的主文件是无序文件索引文件中的主文件是无序文件,索引是索引是 (按关键字有序按关键字有序)的有的有序文件;序文件; (4) “索引索引”是在输入数据建立文件时自动生成是在输入数据建立文件
14、时自动生成(shn chn)。初建时的。初建时的“静态索引静态索引”为无序文件为无序文件,经过排序后成为有序文件。经过排序后成为有序文件。第十二页,共四十页。索引文件的操作特点:索引文件的操作特点: (1) 检索方式为:直接存取和按关键字存取。检索方式为:直接存取和按关键字存取。“按关键字检索按关键字检索”将分两步进行:先查索引将分两步进行:先查索引,然后然后(rnhu)根据索引中指针所指索取记录;根据索引中指针所指索取记录; (2) 插入记录时插入记录时,“记录记录”插入在主文件的末尾插入在主文件的末尾,而相应的而相应的“索引索引项项”必须插入在索引的合适位置上。因此必须插入在索引的合适位置
15、上。因此,最好在建索引表时留有最好在建索引表时留有一定一定“空位空位”; (3) 删除记录时删除记录时,仅需删除索引表中相应的索引项即可;仅需删除索引表中相应的索引项即可; (4) 更新记录时更新记录时,应将更新后的记录插入在主文件的末尾应将更新后的记录插入在主文件的末尾,同时修改相应同时修改相应的索引项。的索引项。第十三页,共四十页。有两种典型的索引顺序文件有两种典型的索引顺序文件(wnjin)。12.2.1 ISAM文件文件 ISAM(Index Sequential Access Method)(索引顺序存取方索引顺序存取方法法)是一种专为磁盘存取设计的文件组织方法。是一种专为磁盘存取设
16、计的文件组织方法。第十四页,共四十页。1. 文件的组织文件的组织(zzh)方式方式 主文件按柱面集中存放主文件按柱面集中存放,同时同时(tngsh)建立三级索引:建立三级索引: (1) 磁道索引磁道索引 (2) 柱面索引柱面索引 (3) 主索引主索引磁道索引磁道索引(suyn)结构如下:结构如下:基本索引项基本索引项溢出索引项溢出索引项关键字关键字 指针指针 关键字关键字 指针指针第十五页,共四十页。2101024主主索索引引 r(14) r(21) r(38) r(41) r(57) r(63) r(72) r(85) r(99) 溢溢 出出 区区 磁磁 道道 索索 引引 r(514) 溢溢
17、 出出 区区 磁道索引磁道索引(suyn) r(1024)一一 个个 柱柱 面面 .柱柱面面索索引引992101024T0T1T2T3T4T5第十六页,共四十页。2. 操作的特点操作的特点 (1) 检索检索 可有两种方式:可有两种方式: 顺序存取顺序存取 依关键字最小至大顺序存取。依关键字最小至大顺序存取。 按关键字存取按关键字存取 从主索引开始从主索引开始(kish),到到 柱面索引柱面索引,到磁道索到磁道索引引,最后取最后取 得记录得记录,先后访问四次外存。先后访问四次外存。 (2) 插入插入 将记录插入在某个磁道的合适位置上将记录插入在某个磁道的合适位置上;将该磁道上关键字最大的记录将该
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考研计算机专业课 最新【考研计算机专业课】武汉大学数据结构PPT课件 第12章 文件共40张PPT课件 最新 考研 计算机 专业课 武汉大学 数据结构 PPT 课件 12 文件 40
限制150内