嵌入式移动实时数据库中一种基于代价模型的查询优化技术.doc
《嵌入式移动实时数据库中一种基于代价模型的查询优化技术.doc》由会员分享,可在线阅读,更多相关《嵌入式移动实时数据库中一种基于代价模型的查询优化技术.doc(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、摘 要随着当前最先进的无线通信和移动计算机技术的发展,移动环境下查询处理中的表连接涉及到不同站点之间的操作,这些站点包括固定服务器和移动计算机。由于节省电源的需要以及移动计算环境下一些不对称的特征表现,常规的为分布式数据库设计的查询处理方案不能直接应用于移动计算环境下。分布式环境下常用到的查询优化算法主要是基于连接/半连接的优化算法,以及由此而提出的SDD-1算法等等。这些算法在分布式数据库中得以广泛运用。移动数据库技术是一种可以支持移动计算环境的分布式数据库技术,在分布式数据库中使用的这些算法到了移动环境下有必要对其进行一定的改进,包括其代价估算模型,才能适应新的要求。移动环境下具有很多不对
2、称的特征。根据这些特征,可以针对连接和查询处理(主要是多关系连接查询操作)分别设计相应的方案。直观的看来,在移动环境中使用半连接操作能有效减少数据传输量和电源消耗量。对不同连接方式进行实验可以看到这些特征对于查询代价的影响。从模拟实验得出的结果可以看到,通过充分考虑移动环境网络拓扑结构和其它特征,提出的相关算法在减少移动终端电源消耗和数据传输量两个方面都是非常有效的,并且通过对其进行适当扩展,这些策略能得以应用进而设计出一个适用于移动计算环境下的有效查询处理过程。关键词:移动计算,查询处理,表连接,多元连接查询46AbstractWith the cutting edge technology
3、 advance in wireless and mobile computers, the query processing in a mobile environment involves join processing among different sites which include static servers and mobile computers. Because of the need for energy saving and also the presence of asymmetric features in a mobile computing environme
4、nt, the conventional query processing for a distributed database cannot be directly applied to a mobile computing system. the regular optimization algorithms of distributed query, such as the optimization algorithm based on join,the optimization algorithm based on semi join,SDD-1 algorithm, have bee
5、n greatly researched and widly used in DDBMS. Mobile DBMS is one kind of DDBMS which supports mobile computing. However, the regular optimization algorithms used in DDBMS must be developed so as to apple to the Mobile DBMS. without doing any changes, these algorithms wont be fitted for the mobile co
6、mputing environment.There are many asymmetric features in a mobile environment. Then, in light of these features, query processing methods for both join and query processing can be devised. Intuitively, employing semijoin operations in a mobile computing environment is able to further reduce both th
7、e amount of data transmission and energy consumption. According to those asymmetric features of a mobile computing system, two different join methods have been examined. For query processing, which refers to the processing of multijoin queries, two query processing schemes are devised. It is shown b
8、y the simulation results that, by exploiting the asymmetric features, these characteristic functions are very powerful in reducing both the amounts of energy consumption and data transmission incurred and can lead to the design of an efficient and effective query processing procedure for a mobile co
9、mputing environment.Key words: mobile computing, query processing, join method, multijoin queries.目 录摘 要IAbstractII1引言1.1课题背景(1)1.2国内外研究状况(1)1.3本文的组织(7)2分布式数据库的查询优化方法与技术2.1基于半连接操作的优化算法(9)2.2多关系半连接查询优化算法(13)2.3SDD-1算法(19)2.4本章小结(20)3嵌入式/移动实时环境下的查询优化处理3.1适用于移动数据库系统的客户/服务器结构(22)3.2嵌入式/移动实时数据库查询优化处过程(25
10、)3.3嵌入式/移动实时环境下的查询代价分析(27)3.4代价估算公式(28)3.5本章小结(30)4 嵌入式/移动实时环境下的数据库查询优化算法4.1 查询处理方法和优化策略(31)4.2 算法仿真实验与性能分析(33)4.3本章小结(39)5结束语5.1总结(40)5.2未来展望(40)致 谢(42)参考文献(43)1 引言1.1 课题背景互联网正不断延伸、渗透,推动我们进入一个移动信息社会,任何可以获得并传播信息的地方都可以成为人们的工作场所。信息系统正逐渐走出传统的机房与桌面,使用户能够随时随地获取为做出正确决策所需要的信息,并使企业事务一发生便可获得反馈信息。这就是移动计算模式,也就
11、是所谓的“Computing Anywhere”。在移动计算模式1中,由移动终端(如笔记本、手机、PDA等)构成的计算结点可以在自由移动的过程中保持网络连接,使得人们在任何时候、任何地点、访问任何数据的需求成为可能。但是原来基于有线网络和固定主机的分布式数据库不再适应这种应用环境,于是一种更加灵活、复杂的数据库技术便应运而生,并迅速成为一个新的研究热点,这就是移动数据库。所谓移动数据库技术是指支持移动计算环境的分布式数据库技术,它涉及数据库,分布式计算以及移动通讯等多个学科领域,已成为分布式数据库一个新的研究方向。由于移动数据库系统的终端设备通常不是传统的台式计算机,而是诸如掌上电脑,PDA,
12、车载设备,移动电话等嵌入式设备,因此,它又被称为嵌入式移动数据库系统。在移动数据库的设计中,需要考虑诸多传统计算环境下不需要考虑的问题,如对断接操作的支持,对跨区长事务的支持,对位置相关查询的支持,对查询优化的特殊考虑以及对提高有限资源的利用率和对系统效率的考虑等等。为了有效地解决上述问题,诸如复制与缓存技术,移动事务处理,数据广播技术,移动查询处理与查询优化,位置相关的数据处理及查询技术,移动信息发布技术,移动Agent等技术在移动数据库中具有特别的意义。它们都是实现和完善移动数据库的关键性技术,还有待于人们的进一步探索。1.2 国内外研究状况移动计算环境以及移动设备的特点,对移动计算的应用
13、软件提出新了的要求。因此嵌入式移动数据库管理系统与传统数据库管理系统相比,也存在特殊的要求,主要表现为以下几方面:1) 易于定制。在嵌入式/移动环境下,软硬件资源有限,因此嵌入式系统中从硬件、操作系统到数据库,都强调与具体的移动计算应用的捆绑和集成。所以可定制是该环境下的软件的最大特点。因此EMDBMS的开发应该以组件化的思想想为指导,便于系统根据用户的实际需求进行定制。2) 内核尽可能小。这主要是由于移动终端存储容量、计算能力等都有限。3) 便于用户使用。移动用户的计算机水平普遍不高,系统应向用户屏蔽掉数据库系统的技术细节,并且提供自动配置功能,即系统能根据用户当前的软、 硬件状态自动地配置
14、系统参数。4) 便于移植。移动设备的硬件资源多种多样,所使用的操作系统也不尽相同,因此移动DBMS应能方便地在各个平台间移植。5) 支持断接操作。在移动计算环境中,断接不应该被视为故障,而应作为一种特殊情况来处理。即使在断接情况下,用户也能进行各种操作,并且在用户重新入网时,系统负责进行同步,以保持数据的一致性。这些操作对用户应该都是透明的。1.2.1 国内外相关产品及技术目前,国内外很多公司都在嵌入式移动环境领域做了很多工作,一些大型的数据库公司纷纷推出自己相应的数据库产品,如Sybase的iAnywhere,Informix的Cloudscape,Oracle的think9i2-4。在国内
15、,中国人民大学推出了人大小金灵。由于这些产品在研究开发时的重点不同,因此这些产品各有特点,但在某些方面又有不足之处。Oracle公司,Informix公司的移动数据库产品都是基于客户/Agent/服务器这样一个三层的无连接结构,它们主要解决移动客户机与数据库之间因为无线网络的低带宽、高延迟、易中断而带来的网络连接问题。通过扩展传统的客户/服务器结构来提高无线网络的使用效率。而Sybase公司则将其一直处于领先地位的复制技术的产品进行延伸,推出了基于会话的Sybase Sql Anywhere和基于消息的SQL Remote两种复制方式。但它没有涉及客户机的移动性、数据广播方式、应用程序的不同一
16、致性要求等方面。1.2.2 嵌入式/移动实时数据库查询处理相关技术查询处理是关系型数据库系统的一个重要问题,而描述性的数据查询语言引起的低效率问题在嵌入式环境下更为严重。所以,能否在嵌入式系统中建立一个成功的关系DBMS,采用什么样的查询处理及优化技术是十分关键的。在嵌入式和移动环境下,由于移动设备和无线网络的特殊性,查询优化又有了新的含义。嵌入式移动环境下查询优化和处理技术是指在传统分布式数据库查询优化和处理技术的基础上利用多种方法,消除带宽多样性、断接等因素产生的影响,使查询引擎能够根据当前可用网络条件采取恰当的优化策略。同时,针对移动设备有限的电源能力,需要合理地组织本地数据库管理、远程
17、数据库访问等消耗电能较多的操作,达到节能目的,延长关键数据的可用时间。综合国内外相关研究文献,大致可以将涉及到嵌入式/移动实时数据库的查询处理分为以下几种:1)语义缓存这是研究得比较多的一个方向,具体适用的范围也是移动终端,这种策略更多的考虑的是移动主机相对较弱的存储和计算能力。因此其思路也就是更细化移动客户端缓存的粒度,由此而发展出移动子集,查询修剪等相关技术。缓存技术并不是新的技术,它已经在很多传统的领域得到广泛的运用。它利用了数据的空间局部性,其性能取决于数据库的物理组织,不合适的物理组织可能造成较高的网络通讯和空间开销。在传统的页缓存技术中,由于没有保持缓存数据的语义信息,客户机主要依
18、靠网络连接服务器来判断局部缓存数据是否与查询结果相匹配,这种方法在出现断接时是不可行的。这种理论更偏向从物理优化角度进行研究,因此语义缓存的实现应该有自定义的底层存储管理系统,它能使得缓存的数据带有时间和空间的特征。2)传统分布式数据库系统查询优化算法的扩展和改进传统分布式数据库系统中研究的较多的就是尽量减少网络开销的半连接操作优化算法。但是,嵌入式/移动实时数据库系统的网络拓扑结构与传统分布式数据库系统有很大的区别,网络中结点的类型和功能也有很大的不同。首先,嵌入式/移动实时数据库系统中的移动终端自带一个本地DBMS,具有一定的自治功能。很多最新的信息或者表都最先存在移动终端,这也就使得参与
19、连接运算所涉及的站点有可能包括移动终端。移动终端参与运算带来的电源消耗,网络传输等,将很大程度的影响整个查询操作的性能。而在传统的分布式数据库系统中,由于固定主机的计算能力和存储能力一般都远大于移动终端,半连接操作仅仅考虑固定主机之间的网络传输等消耗,这也使得分布式环境下的优化算法不能直接应用到嵌入式/移动实时数据库所在的移动网络环境下。3)多重查询优化处理策略多重查询处理优化(Multiple Query Processing, MQP)就是对一组查询语句,求出它们的公共子表达式(Common Subexpression,CSE),在查询过程中,公共子表达式仅被执行一次,得到一个中间结果,所
20、有包含该公共子表达式的查询都使用这一中间结果,这样就使得查询代价大为降低。这种策略主要是从移动网络数据广播的方面进行考虑。移动计算环境的一个非常重要的特点是要在有限的网络带宽上进行数据的分发。数据分发的方式有多种:基于推动的策略、基于拉动的策略、推拉结合的策略。在基于推动的策略中,数据被组织成多盘进行广播调度,移动客户象访问一个远程磁盘一样从广播中获取自己所需要的数据。在基于拉动的策略中,移动客户通过上行链路向中央服务器发出请求,中央服务器响应并处理移动客户的请求,然后将结果数据集通过下行链路发送给移动客户。如果通过上行链路发出的请求很多,中央服务器通过下行链路发送的结果数据集的数量就会非常多
21、,占据大量的带宽资源,致使无线网络负荷过重,移动查询响应时间迅速增长。因此,若能批量处理某一时间段内移动客户的请求,对查询集中的公共子表达式仅执行一次,生成物化视图,然后对该物化视图采用广播的方式发送到移动客户端,相同的数据仅广播一次,这样将不仅降低了查询代价,也减少了带宽使用。1.2.3 传统移动计算环境体系结构移动计算技术所研究的一个重要问题是要建立一个高效、合理、可行的计算环境体系结构,满足不同应用系统的数据处理请求。这一节介绍几种典型的体系模型,并分析其体系特征。1) Imielinski通用模型图1-1描述了移动计算环境的通用模型5。这个模型将无线局域WLAN(Wireless LA
22、N)引入整个拓扑结构。其中MU可以是哑终端或移动主机;MSS提供无线接口与MO通信,而移动用户可以通过MSS存取自己的用户profile、日志、权限控制和其他私有数据。移动客户本身也管理若干文件,这需要硬件支持,将RAM扩展为VMFS。而FH是更为安全、可靠的固定网络中的静止节点。通过这个模型可以界定MCE中的许多新问题,重点要解决WLAN内部以及各WLAN之间的各种数据管理问题。通用模型建立的是一个基于小区(Cell)概念的通用个人通信网PCN(Personal Communic- ation Network)该体系中的用户在其主定位服务器HLS(Home Location Server)中
23、注册一个永久用户地址,当用户在不同小区之间移动时,所发出的请求能够透明地跨区间以不同频段来移交(Take over)或转接(Hand off)处理。作为一个参考模型,该模型描述了早期移动计算环境的基本结构,MSS作为小区无线通信的中转器,提供的无线通信带宽一般远低于固定网络并且稳定性较差。但随着无线通信能力的不断增强以及信息服务方式的变化,这种结构已经不完全合适了。2) Bayou系统结构Bayou系统是Xerox PARC开发的复制存储系统,支持MCE中的协同工作6。该系统提供允许MC主动读写共享数据的存取机制,如存取预约日历、书目数据库、会议通知、设计文档和消息布告栏等。系统对特定应用的更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 嵌入式 移动 实时 数据库 一种 基于 代价 模型 查询 优化 技术
限制150内