《数据结构第11章(共5页).doc》由会员分享,可在线阅读,更多相关《数据结构第11章(共5页).doc(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上第十一章 文件一、选择题1. 散列文件使用散列函数将记录的关键字值计算转化为记录的存放地址,因为散列函数是一对一的关系,则选择好的( )方法是散列文件的关键。【哈尔滨工业大学 2001二、5 (2分)】A. 散列函数 B. 除余法中的质数 C. 冲突处理 D. 散列函数和冲突处理2. 顺序文件采用顺序结构实现文件的存储,对大型的顺序文件的少量修改,要求重新复制整个文件,代价很高,采用( )的方法可降低所需的代价。【北京邮电大学 2000 二、8 (20/8分)】A. 附加文件 B. 按关键字大小排序 C. 按记录输入先后排序 D. 连续排序3. 用ISAM组织文件适合
2、于( )。【中科院软件所 1998】 A磁带 B磁盘4下述文件中适合于磁带存储的是( )。【中科院计算所 2000 一、7(2分)】 A. 顺序文件 B. 索引文件 C. 散列文件 D. 多关键字文件5. 用ISAM和VSAM组织文件属于( )。A. 顺序文件 B. 索引文件 C. 散列文件【中国科技大学 1998 二、5(2分) 中科院计算所 1998 二、5(2分)】6. ISAM文件和VASM文件属于( )。【山东大学 2001 二、5 (1分)】 A. 索引非顺序文件 B. 索引顺序文件 C. 顺序文件 D. 散列文件7. B+树应用在( )文件系统中。【北京邮电大学 2001 一、1
3、(2分)】A. ISAM B. VSAM二、判断题1. 文件是记录的集合,每个记录由一个或多个数据项组成,因而一个文件可看作由多个记录组成的数据结构。【长沙铁道学院 1998 一、5 (1分)】2. 倒排文件是对次关键字建立索引。【南京航空航天大学 1997 一、10(1分)】3. 倒排序文件的优点是维护简单。【南京航空航天大学 1995 五、10(1分)】4. 倒排文件与多重表文件的次关键字索引结构是不同的。【西安交通大学 1996 二、6 (3分)】5. Hash表与Hash文件的唯一区别是Hash文件引入了桶的概念。【南京航空航天大学1996六10(1分)】6. 文件系统采用索引结构是为
4、了节省存储空间。【北京邮电大学 2000 一、10 (1分)】7. 对处理大量数据的外存介质而言,索引顺序存取方法是一种方便的文件组织方法。【东南大学 2001 一、1-10 (1分)】8. 对磁带机而言,ISAM是一种方便的稳健组织方法。【中科院软件所 1997 一、10(1分)】9. 直接访问文件也能顺序访问,只是一般效率不高。【北京邮电大学 2002 一、10(1分)】10. 存放在磁盘,磁带上的文件,即可以是顺序文件,也可以是索引结构或其他结构类型的文件。【山东大学 2001 一、7 (1分)】11. 检索出文件中的关键码值落在某个连续的范围内的全部记录,这种操作称为范围检索。对经常需
5、要做范围检索的文件进行组织,采用散列法优于顺序检索法。【中山大学 1994 一、5 (2分)】三、填空题1. 文件可按其记录的类型不同而分成两类,即_和_文件。【西安电子科技大学 1998 二、6(3分)】2. 数据库文件按记录中关键字的多少可分成_和_两种文件。【燕山大学 1998 一、10 (2分)】3. 从用户的观点看,文件的逻辑结构通常可以区分为两类:一类是如 dBASE 中数据库文件那样的文件组织结构,称为_(1)_文件;另一种是诸如用各种文字处理软件编辑成的文本文件,称为_(2)_文件。从文件在存储器上的存放方式来看,文件的物理结构往往可区分为三类,即_(3)_,_(4)_和_(5
6、)_。B+ 树适用于组织_(6)_的索引结构,m 阶B+ 树每个结点至多有_(7)_个儿子,除根结点外每个结点至少有 (8) 个儿子,根结点至少有_(9)_个儿子,有k个儿子的结点必有_(10) 个关键码。【山东工业大学 1996 一、4(5分)】4. 文件由_组成;记录由_组成。【大连海事大学 1996 (分)】5. 物理记录之间的次序由指针相链表示的顺序文件称为 _。【燕山大学 1998 一、11 (1分)】6. 顺序文件中,要存取第I个记录,必须先存取_个记录。【哈尔滨工业大学 2001 一、4 (2分)】7. 索引顺序文件既可以顺序存取,也可以_存取。【武汉大学2000 一、10】8.
7、 建立索引文件的目的是_。【中山大学 1998 一、12 (1分)】9. 索引顺序文件是最常用的文件组织之一,通常用_结构来组织索引。【长沙铁道学院1998二、6(2分)】10. 倒排序文件的主要优点在于_。【山东工业大学1995一、3(1分)】11. 检索是为了在文件中寻找满足一定条件的记录而设置的操作。检索可以按_检索,也可以按_检索;按_检索又可以有_检索和_检索。【山东大学 1999 一、1 (5分)】12. 散列检索技术的关键是_和 _。【山东工业大学 1995 一、2 (2分)】13. VSAM系统是由_、_、_构成的。【北京科技大学 1997 一、9】14. VSAM(虚拟存储存
8、取方法)文件的优点是:动态地_,不需要文件进行_,并能较快地_进行查找。【山东大学 2001 三、4 (2分)】四、应用题1. 文件【山东工业大学 1998 一、1-1(2分)】2. 文件存储结构的基本形式有哪些?一个文件采用何种存储结构应考虑哪些因素?【燕山大学 1999 二、4(4分)】3 名词解释:索引文件【哈尔滨工业大学 2000 一、4 (3分)】4. 什么是索引顺序文件?【哈尔滨工业大学2001三、5(3分)】【山东工业大学1998一、1-2(2分)】5 索引顺序存取方法(ISAM)中,主文件已按关键字排序,为何还需要主关键字索引?【东南大学 1995 四 (6分)】6 分析ISA
9、M文件(INDEXED SEQUENTIAL ACCESS METHORD)和VSAM文件(VIRTUAL STORAGE ACCESS METHORD)的应用场合、优缺点等。【华南理工大学 2001 一、4 (4分)】7. 一个ISAM文件除了主索引外,还包括哪两级索引?【北京科技大学 1999 一、8(2分)】8. 倒排文件 【山东工业大学 1998 一、1-3(2分)】9. 为什么在倒排文件(inverted files)组织中,实际记录中的关键字域(key fields)可删除以节约空间?而在多表(multilists)结构中这样做为什么要牺牲性能?【东南大学 1997 一、4 (8分
10、)】10. 简单比较文件的多重表和倒排表组织方式各自特点。【东南大学 2000 一、2 (6分)】11. 组织待检索文件的倒排表的优点是什么?【北京科技大学 2001 一、10 (2分)】12. 为什么文件的倒排表比多重表组织方式节省空间? 【东南大学 2001 一、2 (1分)】13. 试比较顺序文件,索引非顺序文件,索引顺序文件,散列文件的存储代价,检索,插入,删除记录时的优点和缺点。【西北工业大学 1999 四 (8分)】14. 已知两个各包含N和M个记录的排好序的文件能在O(N+M)时间内合并为一个包含N+M个记录的排好序的文件。当有多于两个排好序的文件要被合并在一起时,只需重复成对地
11、合并便可完成。合并的步骤不同,所需花费的记录移动次数也不同。现有文件F1,F2,F3,F4,F5,各有记录数为20,30,10,5和30,试找出记录移动次数最少的合并步骤。【重庆大学 2000 二、3】15已知职工文件中包括职工号、职工姓名、职务和职称4个数据项(见下表)。职务有校长、系主任、室主任和教员;校长领导所有系主任,系主任领导他所在系的所有室主任,室主任领导他所在室的全体教员;职称有教授、副教授和讲师3种。请在职工文件的数据结构中设置若干指针和索引,以满足下列两种查找的需要:(1) 能够检索出全体职工间领导与被领导的情况;(2) 能够分别检索出全体教授、全体副教授、全体讲师。要求指针
12、数量尽可能少,给出各指针项索引的名称及含义即可。表 职工文件职工号职工姓名职务职称001002003004005006007008009010张军沈灵叶明张莲叶宏周芳刘光黄兵李民赵松教员系主任校长室主任系主任教员系主任教员室主任教员讲师教授教授副教授教授教授教授讲师教授副教授 【北京航空航天大学 1996】参考文献1严蔚敏等。数据结构。北京:清华大学出版社,1997.42殷人昆。数据结构。北京:清华大学出版社,2001.33范策等。算法与数据结构。北京:机械工业出版社,2004.?4胡学刚。数据结构算法设计指导。北京:清华大学出版社,1999.25黄水松等。数据结构与算法习题解析。北京:电子工
13、业出版社,1996.86蒋盛益等。数据结构学习指导与训练。北京:中国水利水电出版社,2003.87前沿考试研究室。计算机专业研究生入学考试全真题解-数据结构与程序设计分册。北京:人民邮电出版社,2003.68何军等。数据结构500题。北京:人民邮电出版社,2003.49何军等。数据结构课程辅导与习题解析。北京:人民邮电出版社,2003.310徐孝凯。数据结构辅导与提高。北京:清华大学出版社,2003.1211薛晓燕等。数据结构习题集与解题指导。北京:科学技术文献出版社,1995.7第十一章 文件一选择题 1.D2.A3.B4.A5.B6.B7.B二.判断题1.2.3.4.5.6.7.8.9.1
14、0.11. 三填空题1操作系统文件 数据库 2单关键字文件 多关键字文件3(1)数据库 (2)文本 (3)顺序组织 (4)随机组织 (5)链组织 (6)随机组织 (7)m (8)m/2 (9)2 (10) k4记录 数据项 5串联文件 6第I-1 7随机 8提高查找速度 9树 10检索记录快 11(1)关键字 (2)记录号 (3)记录号 (4)顺序 (5)直接 12构造散列函数 解决冲突的方法 13索引集 顺序集 数据集 14分配和释放存储空间 重组 对插入的记录四应用题1文件是由大量性质相同的记录组成的集合,按记录类型不同可分为操作系统文件和数据库文件。2文件的基本组织方式有顺序组织、索引组
15、织、散列组织和链组织。文件的存储结构可以采用将基本组织结合的方法,常用的结构有顺序结构、索引结构、散列结构。(1) 顺序结构,相应文件为顺序文件,其记录按存入文件的先后次序顺序存放。顺序文件本质上就是顺序表。若逻辑上相邻的两个记录在存储位置上相邻,则为连续文件;若记录之间以指针相链接,则称为串联文件。顺序文件只能顺序存取,要更新某个记录,必须复制整个文件。顺序文件连续存取的速度快,主要适用于顺序存取,批量修改的情况。(2) 带索引的结构,相应文件为索引文件。索引文件包括索引表和数据表,索引表中的索引项包括数据表中数据的关键字和相应地址,索引表有序,其物理顺序体现了文件的逻辑次序,实现了文件的线
16、性结构。索引文件只能是磁盘文件,既能顺序存取,又能隋机存取。(3) 散列结构,也称计算寻址结构,相应文件称为散列文件,其记录是根据关键字值经散列函数计算确定其地址,存取速度快,不需索引,节省存储空间。不能顺序存取,只能随机存取。其它文件均由以上文件派生而得。文件采用何种存储结构应综合考虑各种因素,如:存储介质类型、记录的类型、大小和关键字的数目以及对文件作何种操作。3在主文件外,再建立索引表指示关键字及其物理记录的地址间一一对应关系。这种由索引表和主文件一起构成的文件称为索引文件。索引表依关键字有序。主文件若按关键字有序称为索引顺序文件,否则称为索引非顺序文件(通常简称索引文件)。索引顺序文件
17、因主文件有序,一般用稀疏索引,占用空间较少。常用索引顺序文件有ISAM和VSAM。ISAM采用静态索引结构,而VSAM采用B+树的动态索引结构。索引文件既能顺序存取,也能随机存取。4在索引文件中,若(数据区)主文件中关键字有序,则文件称为索引顺序文件,参见上题3。5ISAM是专为磁盘存取设计的文件组织方式。即使主文件关键字有序,但因磁盘是以盘组、柱面和磁道(盘面)三级地址存取的设备,因此通常对磁盘上的数据文件建立盘组、柱面和磁道(盘面)三级索引。在ISAM文件上检索记录时,先从主索引(柱面索引的索引)找到相应柱面索引。再从柱面索引找到记录所在柱面的磁道索引,最后从磁道索引找到记录所在磁道的第一
18、个记录的位置,由此出发在该磁道上进行顺序查找直到查到为止;反之,若找遍该磁道而未找到所查记录,则文件中无此记录。6ISAM是一种专为磁盘存取设计的文件组织形式,采用静态索引结构,对磁盘上的数据文件建立盘组、柱面、磁道三级索引。ISAM文件中记录按关键字顺序存放,插入记录时需移动记录并将同一磁道上最后的一个记录移至溢出区,同时修改磁道索引项,删除记录只需在存储位置作标记,不需移动记录和修改指针。经过多次插入和删除记录后,文件结构变得不合理,需周期整理ISAM文件。VSAM文件采用B+树动态索引结构,文件只有控制区间和控制区域等逻辑存储单位,与外存储器中柱面、磁道等具体存储单位没有必然联系。VSA
19、M文件结构包括索引集、顺序集和数据集三部分,记录存于数据集中,顺序集和索引集构成B+树,作为文件的索引部分可实现顺链查找和从根结点开始的随机查找。与ISAM文件相比,VSAM文件有如下优点:动态分配和释放存储空间,不需对文件进行重组;能保持较高的查找效率,且查找先后插入记录所需时间相同。因此,基于B+树的VSAM文件通常作为大型索引顺序文件的标准组织。7ISAM文件有三级索引:磁盘组、柱面和磁盘,柱面索引存放在某个柱面上,若柱面索引较大,占多个磁道时,可建立柱面索引的索引主索引。故本题中所指的两级索引是盘组和磁道。8倒排文件是一种多关键字的文件,主数据文件按关键字顺序构成串联文件,并建立主关键
20、字索引。对次关键字也建立索引,该索引称为倒排表。倒排表包括两项,一项是次关键字,另一项是具有同一次关键字值的记录的物理记录号(若数据文件非串联文件,而是索引顺序文件如ISAM,则倒排表中存放记录的主关键字而不是物理记录号)。倒排表作索引的优点是索引记录快,缺点是维护困难。在同一索引表中,不同的关键字其记录数不同,各倒排表的长度不同,同一倒排表中各项长度也不相等。9因倒排文件组织中,倒排表有关键字值及同一关键字值的记录的所有物理记录号,可方便地查询具有同一关键字值的所有记录;而多重表文件中次关键字索引结构不同,删除关键字域后查询性能受到影响。10多重表文件是把索引与链接结合而形成的组织方式。记录
21、按主关键字顺序构成一个串联文件,建立主关键字的索引(主索引)。对每一次关键字建立次关键字索引,具有同一关键字的记录构成一个链表。主索引为非稠密索引,次索引为稠密索引,每个索引项包括次关键字,头指针和链表长度。多重表文件易于编程,也易于插入,但删除繁锁。需在各次关键字链表中删除。倒排文件的特点见上面题8。11倒排表作索引的优点是索引记录快,因为从次关键字值直接找到各相关记录的物理记录号,倒排因此而得名(因通常的查询是从关键字查到记录)。在插入和删除记录时,倒排表随之修改,倒排表中具有相同次关键字的记录号是有序的。12排表有两项,一是次关键字值,二是具有相同次关键字值的物理记录号,这些记录号有序且
22、顺序存储,不使用多重表中的指针链接,因而节省了空间。13(1)顺序文件只能顺序查找,优点是批量检索速度快,不适于单个记录的检索。顺序文件不能象顺序表那样插入、删除和修改,因文件中的记录不能象向量空间中的元素那样“移动”,只能通过复制整个文件实现上述操作。(2)索引非顺序文件适合随机存取,不适合顺序存取,因主关键字未排序,若顺序存取会引起磁头频繁移动。索引顺序文件是最常用的文件组织,因主文件有序,既可顺序存取也可随机存取。索引非顺序文件是稠密索引,可以“预查找”,索引顺序文件是稀疏索引,不能“预查找”,但由于索引占空间较少,管理要求低,提高了索引的查找速度。(3)散列文件也称直接存取文件,根据关
23、键字的散列函数值和处理冲突的方法,将记录散列到外存上。这种文件组织只适用于像磁盘那样的直接存取设备,其优点是文件随机存放,记录不必排序,插入、删除方便,存取速度快,无需索引区,节省存储空间。缺点是散列文件不能顺序存取,且只限于简单查询。经多次插入、删除后,文件结构不合理,需重组文件,这很费时。14类似最优二叉树(哈夫曼树),可先合并含较少记录的文件,后合并较多记录的文件,使移动次数减少。见下面的哈夫曼树。F2AF5F3F4F115问题分析在职务项中增加一个指针项,指向其领导者。因题目中未提出具体的隶属关系,如哪个系的系主任,哪个系哪个室的室主任,哪个室的教员等。这里假设每个室主任隶属于他前边离他最近的那个系主任,每个教员隶属于他前边离他最近的那个室主任,见下面多重表文件。在职称项中增加一个指针项,指向同一职称的下一个职工,增加一个次关键字索引表: 关键字头指针长度讲师 001 2 副教授 004 2 教授 002 6 “职称”索引表记录号职工号职工姓名职务职称01020304050607080910001002003004005006007008009010张军沈灵叶明张莲叶宏周芳刘光黄兵李民赵松教员系主任校长室主任系主任教员系主任教员室主任教员040302030403040709讲师教授教授副教授教授教授教授讲师教授副教授08030510060709 多重表文件专心-专注-专业
限制150内