基于动态哈希的格网法空间数据库索引技术毕业论文.docx
《基于动态哈希的格网法空间数据库索引技术毕业论文.docx》由会员分享,可在线阅读,更多相关《基于动态哈希的格网法空间数据库索引技术毕业论文.docx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本科毕业论文(设计)题目:基于动态哈希的格网法空间数据库索引技术姓 名: 学号: 20081001887院(系):信息工程学院 专业: 地理信息系统 指导教师: 职称: 讲师 评 阅 人: 职称: 2012 年 5 月学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。作者签名: 年 月 日 学位论文版权使用授权书本学位论文作者完全了解学校有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理部门或机构送交论文的复
2、印件和电子版,允许论文被查阅和借阅。本人授权省级优秀学士学位论文评选机构将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、 保密 ,在_年解密后适用本授权书。2、 不保密 。(请在以上相应方框内打“”)作者签名: 年 月 日 导师签名: 年 月 日 摘要 空间数据库索引技术是对存储在介质上的数据位置信息的描述,用来提高系统对数据后去的效率。空间数据库索引技术的提出是两方面因素所决定的:其一是由于计算机的体系结构将存储器分为内存和外存两种;其二是空间数据库所表现的空间数据多维性使得传统的数据库索引技术(如B-树等)并不适
3、用,因为传统的数据库索引技术所针对的字符、数字等传统数据类型是在一个良序集之中,即都是在一个维度上,集合中任给两个元素,都可以在这个维度上确定,其关系只可能是大于、小于、等于三种1。而基于动态哈希的格网法是众多空间数据库索引技术中的一种。由于哈希索引能够根据查找关键字通过哈希函数直接定位查找记录,因此哈希索引被广泛应用于现有的数据库管理系统中。动态哈希是一类能根据需要而优美地扩充和收缩文件空间的哈希方法,它为现代数据库系统中,高效地组织和处理大型动态文件提供了一个新途径。基于动态哈系的格网方法的基本思路是将索引空间划分为相等或不相等的一些小方格网,与每个格网相关联的空间目标则存储在同一磁盘页,
4、而格网的访问地址则可以直接通过求数组下标或某种算法得到。关键字: 动态哈希、格网法、空间数据库索引技术 Abstract The spatial database is stored in the index technology to the data on the medium position information description, used to improve the system for the efficiency of data after. The index of the spatial database technology is put forward two
5、 aspects of factors: one is the system structure of the computer will be divided into memory and memory CRT two; Second is the spatial database of space data show that the traditional database multidimensionality index technology (such as B-trees, etc) is not applicable, because the traditional data
6、base index technology for characters, Numbers of traditional data types are in a good order sets in, or in a dimension, set to the two elements of, can be determined in this dimension, the relationship between can only be larger than, less than, equal to three. Based on dynamic and hash of the grid
7、method of spatial database is one of the index technology. Due to hash index according to find key words through the hash function directly positioning search records, so hash index to be widely used in the existing database management system. Dynamic hash is a kind of can according to the need and
8、elegant grace of the expansion and contraction of the hash file space method a dynamic hash, it for modern database systems, organization efficient and dealing with large dynamic file provides a new way. Based on the dynamic, the grid method is the basic thought of the index is divided into space wi
9、ll be equal or not equal a few small squares nets, and each grid linked to the space the goal is in the same disk storage page, and grid access can be directly address by calculating an array subscript or some kind of algorithm to get. Key word:Dynamic hash、Grid method、Space database index technolog
10、y 目录摘要III第一章 绪论11.1空间数据库的起源和发展11.2空间数据库索引技术的现状11.3现今主要的几种空间索引技术21.3.1基于二叉树的空间索引技术21.3.2基于四叉树的空间索引技术31.3.3基于B-树的空间索引41.3.4基于空间目标排序的索引方法41.3.5QR-树51.4论文的组织结构5第二章 关于动态哈希方法62.1关于动态哈希方法的介绍62.2动态哈希法的分类7第三章 基于动态哈希的格网法的空间索引技术93.1网格文件93.1.1网格文件及其查找93.1.2插入103.1.3删除113.2 R-文件123.3 G树153.3.1 G树的空间模型153.3.1.1 G
11、树的总体结构153.3.1.2 G树对N维对象的支持173.3.2 G树上的操作算法173.3.2.1树的构造173.3.2.2减少拐弯数的策略183.3.2.3 G树算法的讨论193.4 基于动态哈希的格网法的空间索引技术的分析203.4.1关于网格文件中的分析203.4.2关于R-文件的分析203.4.3关于G树的分析21第四章 基于动态哈希的格网法索引技术的发展前景234.1基于动态哈希的实际应用234.1.1基于动态哈希路由的Peer-to-Peer网络234.1.2 基于动态哈希树的流量跟踪算法234.1.3基于哈希函数高速网络入侵检测负载均衡算法研究244.1.4基于动态哈希函数的
12、虚拟网格的过滤算法和P-stable分布244.2基于动态哈希的格网法的索引技术的发展24第五章 结束语26致 谢27参考文献:28中国地质大学2012年本科生毕业论文第一章 绪论1.1空间数据库的起源和发展近年来,空间数据信息在国内外各行业信息处理各个行业中的比重不断地上升,特别是与空间及地理分布数据密切相关的地理信息系统(GlS)在20世纪90年代,广泛的应用于众多的业务领域中。由于地理信息系统中所需的处理的数据太多而且过程繁琐,所以如何使得未来的空间数据库系统能够快速便捷地获取不同来源的分布式数据,将这些空间数据集中分析,且进行网格计算,是空间数据库系统面临的一个重大挑战。实现空间数据和
13、服务的共享是目前地理信息系统发展的主要方向之一,在实现技术上的研究主要集中在两个方面:1、面向对象技术,2、中间件技术。衡量空间数据库性能最重要的一项指标就是能够快速地响应用户提交的空间查询要求,而空间查询操作往往涉及海量的空间数据,以及需要对空间数据进行复杂而且高代价的几何操作。空间数据是某个空间框架中对象的位置信息。空间数据是多维的,它不仅要表达空间目标的属性信息,而且要存储目标的几何信息以及目标间的空间关系。一般而言,空间数据具有以下的特征:1、空间性,2、抽象性,3、多尺度与多态性,4、多时空性,5、非结构化特征,6、空间关系特征,7、分类编码特征,8、海量数据特征2。目前成熟的商用数
14、据库是基于关系模型的数据库系统。空间数据库是一个存储空间数据和非空间数据的数据库系统,其数据模型和查询语言能提供空间数据类型,可以进行空间索引,且提供空间查询和其它空间分析方法。总之,空间数据库具备以下的特征:1、能够表达空间特征,2、空间数据具有多层次性,3、满足多粒度,4、能够描述非结构化特征,5、具备高效的空间数据索引技术。1.2空间数据库索引技术的现状由于实际应用的需要,近几十年来,国内外的学者十分重视空间索引的研究,相继地提出了多种空间索引结构与索引方法。如表1.1所示,概括介绍了空间数据库索引技术的历史研究情况,揭示了空间数据库索引技术目前发展的趋势和热点问题。基于不同的理论基础,
15、空间数据库索引技术一般地可被划分成为四类:基于二叉树的空间数据索引技术、基于B一树的空间数据索引技术、基于哈希的空间数据索引技术和基于空间目标排序的空间数据索引技术。不过目前业界普遍认同的主流的空间数据库索引技术一般均采用树状索引结构3。表1.1空间数据库索引技术的研究历史研研究年代研究成果基于二叉树基于B-树基于哈希基于空间目标排序1984年Kd-树R-树Grid-文件基于位置链四叉树1986年1987年Skd-树R*-树Bang-文件等z-排序1988年1989年LSD-树Cell-树、HB-树PLop-哈希等1990年GBD-树R*-树、Greens树R-文件等1992年1996年TV-
16、树、K-树等Filter-树1.3现今主要的几种空间索引技术1.3.1基于二叉树的空间索引技术二叉查找树是一种基本的索引数据结构。在随机情况下,其平均长度为1+4logn;平衡二叉查找树的平均查找长度为logn,它具有很好的查找性能。因此,二次查找树被采纳并予以推广,用于重复地划分数据空间,以期达到缩减查找空间、提高查找性能的目的。以下是基于二叉树的空间索引技术中的几种实例:1 、kd-树:Kd-树或者是一颗空树,或者是一颗具有以下性质的二叉树:(1)若它的左子树不空,则左子树上所有结点的第d维的值均小于它的根结点的第d维值(d为根结点的分辨器值);(2)若它的右子树不空,则右子树上所有结点的
17、第d维的值均大于或等于它的根结点的第d维值(d为根结点的分辨器值);(3)它的左右子树也分别为kd-树。2、K-D-B-树K-D-B-树是 kd-树与B-树的结合。它由两种基本的结构区域页(region pages,非叶结点)和点页(point pages,页结点)组成在K-D-B-树中,区域页显示存储了这些子空间信息。区域页的子空间两两不相交,且一起构成该区域页的矩形索引空间,即父区域页的一子空间。3、hB-树hB-树是一种有效的多维动态索引结构,其结点间搜索和增长过程模拟B-树的处理方法,结点内采用k维树组织和进行高效搜索。 1.3.2基于四叉树的空间索引技术 四叉树是建立在对区域循环分解
18、原则之上的一种层次数据结构,在计算机图形处理、图像处理及地理信息系统中有广泛的应用,同样,它也可以应用于对空间点的表示与索引。这里的四叉树实际上是指2k叉树,其中k为数据空间的维数。以下是基于四叉树的空间索引技术中的几种实例4:1、点四叉树:点四叉树(Point quad-tree)R.A.Finkel and J.L.Bentley,1974的提出主要是针对空间点的存储表达和索引。对于k维数据空间而言,点四叉树的每个结点存储了一空间点的信息及2k个孩子结点的指针,且隐式地与一索引空间相对应。2、区域四叉树采用区域四叉树索引多维空间的点比较常见的方法有MX四叉树和PR四叉树。MX四叉树将每个空
19、间点看成是区域四叉树中的一个黑像素,或当作一方阵(Square Matrix)中的非零元素,因此称为MX四叉树。MX四叉树与区域四叉树的组织方式很相似,区别是叶子结点为黑结点或空结点分别表示数据空间某一位置空间点的存在与否。PR(Point Region)四叉树与区域四叉树的组织方式一样。区别是叶子结点或者为空、或者包含一数据点。3、CIF四叉树CIF(Caltech Intermediate Form)四叉树是针对表示VLSI(Very Large Scale Integration)应用中的小矩形而提出的,它可以用于索引空间矩形及其他形体。它的组织方式与区域四叉树相似,数据空间被递归地细分
20、直至产生的子象限不再包含任何矩形。1.3.3基于B-树的空间索引1、R-树R-树是B-树在多维空间的扩展,它由Guttman 于1984年提出A.Guttman,1984。 查找:为了找到与查找区域相交所有空间目标,查找必须从根结点开始,递归地遍历所有索引空间与查找区域相交的子树,当遇到叶子结点时,数据矩形首先与查找区域进行测试,如果数据矩形与查找区域相交,则再提取对应目标的几何信息进行计算。2、R*-树R*-树在结构上与R-树完全相同,在树的构造、插入、删除、检索算法上也基本相同,区别有三点:(1)插入路径的选择,为了选择一合适的插入路径,R-树只考虑了目录矩形的“面积”这一因素,R*-树除
21、了考虑“面积”以外,还考虑了目录矩形的重叠(Overlap)。(2)结点的分裂,R*-树考虑了三种“优势值(goodness values)”的计算方法,分别为area-value=areambr(Group1)+areambr(Group2),margin-value=margin mbr(Group1)+marginmbr(Group2),overlap-value= areambr(Group1)areambr(Group2)。(3)强制重新插入,无论是R-树还是R*-树都是动态建立的。对于同一空间目标集合,插入的顺序不同,所构造的R-树或R*-树是不同的5。3、R+-树R+-树是R-树
22、的又一种变体。提出R+-树的主要思想是:如果裁剪数据矩形,那么中间结点目录矩形的零重叠可以获得,因此对于点查询,查找路径可以只有一条;对于区域查询,查找性能也可以得到提高。查找:R+-树的查找算法与R-树雷同。插入:R+-树的插入算法与R-树的插入算法不同的是:数据矩形可能被插入到多个叶结点;溢出的结点须执行分裂操作,且分裂可能向上蔓延到父结点,向下传播至子节点。删除:由于数据矩形可能被插入到多个叶结点,因此R+-树的删除算法必须同时删除一个数据矩形的多个拷贝。1.3.4基于空间目标排序的索引方法1、Z-排序Z-排序技术基于空间填充曲线,空间填充曲线基于这样一种假设:任何属性值都可以用固定长度
23、的比特位表示,称为k比特位。沿着每一维的值的最大数目是2k。它通过将数据空间循环分解到更小的子空间来获得对于给定对象形状的近似。Z-排序作为一种空间索引机制,它已经被用于数个商业化的空间数据库系统。2、Hilbert曲线与Z-排序类似,Hilbert曲线也是一种空间填充曲线,它利用一个线性序列来填充空间。1.3.5QR-树QR-树是结合Quadtree(准确地说,应该是2k叉树,k为空间的维数。为描述方便,以下称为Quadtree)和R-树而提出的一种空间索引结构。QR-树的结构由Quadtree和R-树的结构组成。1.4论文的组织结构第1章:绪论。概述了当前空间数据库的起源及其发展现状,简述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于动态哈希的格网法空间数据库索引技术 毕业论文 基于 动态 格网法 空间 数据库 索引 技术
限制150内