《数据库原理与技术第十章.ppt》由会员分享,可在线阅读,更多相关《数据库原理与技术第十章.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章第十章 数据库恢复技术数据库恢复技术事务v事事务定定义事务是用户定义的一个数据库操作序列构成,这些操作要么全做,要么全不做,是一个不可分割的工作单位。事务与应用程序是两个概念,一般来说,一个应用程序可以包含多个事务。事务的开始与结束可以由用户显式控制。如果用户没有显式定义事务,则由DBMS按缺省规定自动划分事务。SQL中事务的定义v事事务务以以Begin transaction开始,以开始,以Commit work或或 Rollback work结结束。束。vCommit work表示提交,事表示提交,事务务正常正常结结束。束。vRollback work表示事表示事务务非正常非正常结结
2、束,撤消事束,撤消事务务已做的操作,回已做的操作,回滚滚到事到事务务开始开始时时状状态态。事务的例子BEGIN TRANSACTIONREAD 甲甲账户余余额;甲甲账户余余额=1000;IF 甲甲账户余余额 0 THEN;ROLLBACK WORK;ELSEWRITE 甲甲账户余余额;READ 乙乙账户余余额;乙乙账户余余额=1000;WRITE 甲甲账户余余额;COMMIT WORK;事务的特性(ACID)v原子性原子性(Atomicity)事事务是数据是数据库的的逻辑工作工作单位,事位,事务中包括中包括的的诸操作要么全做,要么全不做。操作要么全做,要么全不做。v一致性一致性(Consist
3、ency)事事务执行的行的结果果应当使数据当使数据库从一个一致性状从一个一致性状态转变为另一个一致性状另一个一致性状态。事务的特性(ACID)v隔离性隔离性(Isolation)一个事一个事务的的执行不能被其它事行不能被其它事务干干扰。即一个。即一个事事务内部的操作及使用的数据内部的操作及使用的数据对其它并其它并发事事务是隔离的,并是隔离的,并发执行的各个事行的各个事务之之间不能相互不能相互干干扰。事务的特性(ACID)v持久性持久性(Durability)一个事一个事务一旦提交之后,它一旦提交之后,它对数据数据库的影响必的影响必须是永久的。事是永久的。事务提交后,系提交后,系统发生故障不能改
4、生故障不能改变事事务的持久性。的持久性。数据库恢复概述v虽然数据然数据库系系统中采用了各种措施来保中采用了各种措施来保证系系统安全性和完整性,但安全性和完整性,但计算机系算机系统的故障是不可的故障是不可避免的,避免的,这些故障些故障轻则造成运行事造成运行事务的非正常的非正常中断,影响数据中断,影响数据库中数据的正确性,重中数据的正确性,重则破坏破坏数据数据库,使数据,使数据库中的全部或部分数据中的全部或部分数据丢失,失,因此数据因此数据库管理系管理系统必必须具有把数据具有把数据库从从错误状状态恢复到某一已知正确状恢复到某一已知正确状态的功能,的功能,这就是就是数据数据库的恢复。数据的恢复。数据
5、库恢复是通恢复是通过数据数据库管理管理系系统的恢复子系的恢复子系统完成的。完成的。数据库恢复概述v数据数据库恢复子系恢复子系统的目的包括:的目的包括:保证事务的原子性,即确保一个事务被交付运行后,要么该事务中的所有数据库操作都被成功地完成,而且这些操作的结果被永久地存储到数据库中,要么这个事务对数据库没有任何影响。当系统发生故障以后,数据库能够恢复到正确状态。故障的种类v事事务内部的故障内部的故障事务内部的故障包括可预期的和不可预期的。可预期的是指可以通过事务程序本身发现和处理的故障。而不可预期的错误是指那些不能由应用程序处理的事务故障,如死锁,运算溢出,违反完整性规则等。故障的种类v系系统故
6、障故障系统故障是指造成系统停止运行的任何事情,使得系统要重新启动。如硬件错误,操作系统故障,停电等。这类故障影响正在运行的所有事务,所有事务都非正常终止,但不会破坏数据库。恢复子系统必须清除所有未完成的事务对数据库的修改,同时重做所有已完成的事务,保证数据库的一致性。故障的种类v介介质故障故障介质故障指外存故障,如磁盘损坏,瞬时强磁场干扰等。这类故障将破坏全部或部分数据库,并影响正在存取这部分数据的所有事务。v计算机病毒算机病毒计算机病毒是一种人为的破坏或故障,已成为数据库系统的主要威胁之一。恢复的实现技术v数据数据库恢复的原理恢复的原理数据库恢复的基本原理为冗余。如果数据库中任何一部分数据被
7、破坏或处于不正确的状态,则可以通过存储在系统别处的冗余数据来重建。v数据数据库恢复的关恢复的关键问题如何建立冗余如何利用冗余实施数据库恢复恢复的实现技术v建立冗余的常用方法建立冗余的常用方法数据转储数据转储是数据库恢复中采用的基本技术。所谓转储即DBA定期地将整个数据库复制到磁带或其它存储设备上保存起来的过程。这些备用的数据文本称为后备副本或后援副本。当数据库发生故障时,可以将后备副本重新装入,并重新运行自转储以后的所有更新事务。恢复的实现技术T0T0T1T1T3T3正常运行恢复重装后备副本重新运行事务恢复的实现技术v转储可以分可以分为:静态转储静态转储是在系统中无事务运行时进行的转储操作。即
8、转储开始时数据库处于一致状态,转储过程中,不允许对数据库的任何存取、更新活动。由于转储必须等待正在运行的事务结束才能开始,而新的事务必须等待转储结束才能执行,降低了数据库的可用性。恢复的实现技术动态转储动态转储是指转储期间允许对数据库进行存取或修改,即转储和用户事务可以并发执行。动态转储克服了静态转储的缺点,但除了转储数据库的数据以外,还必须把转储期间各事务对数据库的修改记录下来,这样才能保证把数据库恢复到某一时刻的一致状态。恢复的实现技术v转储的方式的方式海量转储海量转储指每次转储全部数据库。增量转储增量转储指每次只转储上一次转储后更新过的数据。恢复的实现技术转储状态转储状态动态转储动态转储
9、静态转储静态转储转储转储方式方式海量转储海量转储动态海量转储动态海量转储静态海量转储静态海量转储增量转储增量转储动态增量转储动态增量转储静态增量转储静态增量转储转储计划的例子23:00海量增量增量海量增量增量增量周日周日周一周一周二周二周三周三周四周四周五周五周六周六恢复的实现技术登录日志文件日志文件是用来记录事务对数据库的更新操作的文件。日志文件主要有两种格式:以记录为单位的日志文件和以数据块为单位的日志文件。以记录为单位的日志文件记录的内容包括:各个事务的开始标记各个事务的结束标记各个事务的所有更新操作恢复的实现技术上述内容均作为日志文件中的一个日志记录,每个日志记录的内容包括:事务标识(
10、标明是哪个事务)操作的类型(插入、删除或修改)操作对象(记录的内部标识)更新前数据的旧值(对插入操作,此项为空)更新后数据的新值(对删除操作,此项为空)对于以数据块为单位的日志文件,日志记录的内容包括事务标识以及更新前和更新后的数据块。日志记录的例子vT0,startsvT0,A,1000,950vT0,B,2000,2050vT0,commit恢复的实现技术v日志文件的作用日志文件的作用日志文件可以用来进行事务故障恢复和系统故障恢复,并协助后备副本进行介质恢复。其具体作用是:事务故障和系统故障恢复必须使用日志文件。在动态转储方式中必须建立日志文件,后备副本和日志文件综合起来才能保证备份的一致
11、性,和有效地恢复数据库。在静态转储方式中,也可以建立日志文件。当数据库发生故障时,用后援副本把数据库恢复到转储结束时的正确状态,然后利用日志文件重做已完成的事务,把数据库恢复到故障前的正确状态。恢复的实现技术v登登记日志文件日志文件为保证数据库是可恢复的,登记日志文件时必须遵循两条原则:登记的次序严格按并发事务执行的时间顺序。必须先写日志文件,后写数据库。恢复策略v事事务故障的恢复故障的恢复事务故障是指事务在运行至正常终止点之前被终止。事务故障的恢复是由系统自动完成的,其步骤是:反向扫描文件日志(即从最后向前扫描日志文件),查找该事务的更新操作。对该事务的更新操作执行逆操作,即将日志记录中的“
12、更新前的值”写入数据库。这时,如果记录中是插入操作,则相当于做删除操作;如果记录中是删除操作,则相当于做插入操作;如果记录中是修改操作,则用修改前的值代替修改后的值。继续反向扫描日志文件,查找该事务的更新操作,并做同样处理如此处理下去,直到读到该事务的开始标志。恢复策略v系系统故障的恢复故障的恢复系统故障造成数据库不一致状态的原因有两个,一是未完成的事务对数据库的更新可能已经写入数据库;二是已提交事务对数据库的更新可能还留在缓冲区还没来得及写入数据库。因此恢复操作就是要撤销故障发生时未完成的事务,重做已完成的事务。恢复策略v其步其步骤是:是:正向扫描日志文件,找出故障发生前已经提交的事务,将其
13、事务标识记入重做(REDO)队列。同时找出故障发生时尚未完成的事务,将其事务标识记入撤销(UNDO)队列。对撤销队列中的各个事务进行UNDO处理。即反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作,即将日志文件中的“更新前的值”写入数据库。对重做队列中的各个事务进行REDO处理。即正向扫描日志文件,对每个REDO事务重新执行日志文件登记的操作,即将日志文件中的“更新后的值”写入数据库。恢复策略v介介质故障的恢复故障的恢复介质故障将全部或部分地破坏数据库甚至是日志文件,其恢复的方法是:装入最新的数据库后备副本(离故障发生时刻最近的转储副本),使数据库恢复到最近一次转储时的一致状态。对于动
14、态转储的副本,还需要装入转储开始时刻的日志文件副本,将数据库恢复到一致状态。装入转储以后的日志文件副本,重做已经完成的事务。推迟更新技术v推推迟更新技更新技术在日志中在日志中记录对事事务T的所有更的所有更新操作,并把所有新操作,并把所有对数据数据库的更新操作推的更新操作推迟到到该事事务提交提交时执行。它遵循以下推行。它遵循以下推迟更新更新协议:每个事务在到达提交点之前不能更新数据库。一个事务的所有更新操作所对应的日志记录写入永恒存储器之前,该事务不能到达提交点。v当一个事当一个事务到达提交点到达提交点时,我,我们称称该事事务进入入部分提交状部分提交状态。推。推迟更新更新协议保保证当一个事当一个
15、事务部分提交部分提交时,该事事务的所有更新操作的信息已的所有更新操作的信息已经记录在日志中。在日志中。推迟更新技术v当当T开始开始执行行时,推,推迟更新技更新技术在日志中写入在日志中写入。如果。如果T执行行Write(X)的操作,推的操作,推迟更更新技新技术在日志中写入在日志中写入,其中,其中V1为X的原始的原始值,V2为Write(X)要写入的要写入的X值。当当T进入部分提交状入部分提交状态时,推,推迟更新技更新技术在日志在日志中写入中写入。接着,所有日志。接着,所有日志记录都都写入永恒存写入永恒存储器。然后,器。然后,对于日志中的每个形如于日志中的每个形如的的记录,将数据,将数据库中中X数
16、据数据项的的值更新更新为V2。延迟执行更新SQL UPDATERAM中的数据页数据文件InsertDeleteUpdateCommit日志5.写日志操作4.写数据页1.事务开始2.执行更新命令6.确认7.写commit8.确认10.在恰当的时候写入数据文件推迟更新技术v试考考虑如下数据如下数据库事事务T0和和T1,其中,其中A、B和和C的初的初值分分别为1000,2000和和700,T0和和T1按照串行按照串行调度度执行:行:T0:read(A)A=A-50 write(A)read(B)B=B+50 write(B)T1:read(C)C=C-100 write(C)推迟更新技术日志文件日志
17、文件数据库数据库T0,startsT0,A,950T0,B,2050T0,commitA=950B=2050T1,startsT1,C,600T1,commitC=600推迟更新技术T0,startsT0,startsT0,startsT0,A,950T0,A,950T0,A,950T0,B,2050T0,B,2050T0,B,2050T0,commitT0,commitT1,startsT1,startsT1,C,600T1,C,600T1,commit即时更新技术v即即时更新技更新技术允允许事事务直接更新数据直接更新数据库。处于活于活动状状态的事的事务直接在数据直接在数据库实施的更新称施的
18、更新称为非提非提交更新。任何即交更新。任何即时更新技更新技术都必都必须遵循如下的即遵循如下的即时更新更新协议:所有型日志记录安全的存储到永恒存储器之前,不允许事务T更新数据库。所有型日志记录安全的存储到永恒存储器之前,不允许事务T提交。v即即时更新更新协议保保证在系在系统故障故障发生生时,每个运行,每个运行事事务的更新操作都安全地的更新操作都安全地记录在日志中。在日志中。即时更新技术v当当T开始开始执行行时,被写入日志。在被写入日志。在T运行期运行期间,当,当T发出一个出一个Write(X)操作操作时,记录首先被写入日志,然后,直首先被写入日志,然后,直接在数据接在数据库上上执行行Write(
19、X)。当。当T部分提交部分提交时,被写入日志。被写入日志。为满足即足即时更新更新协议的要求,在的要求,在Write(X)直接作用到数据直接作用到数据库之前,之前,有关有关这个操作的日志个操作的日志记录必必须安全地写入永恒存安全地写入永恒存储器。器。即时更新技术日志文件日志文件数据库数据库T0,startsT0,A,1000,950A=950T0,B,2000,2050B=2050T0,commitT1,startsT1,C,700,600C=600T1,commit即时更新技术T0,startsT0,startsT0,startsT0,A,1000,950T0,A,1000,950T0,A,1
20、000,950T0,B,2000,2050T0,B,2000,2050T0,B,2000,2050T0,commitT0,commitT1,startsT1,startsT1,C,700,600T1,C,700,600T1,commit具有检查点的恢复技术v利用日志技利用日志技术进行恢复行恢复时,恢复子系,恢复子系统通常需通常需要要检查所有日志所有日志记录,这样将耗将耗费大量大量时间,同同时也可能也可能REDO了一些已了一些已经写到数据写到数据库中的中的更新操作更新操作结果,因此也浪果,因此也浪费了了时间。为此,提此,提出了出了检查点技点技术。这种技种技术在日志文件中增加在日志文件中增加一一类
21、新的新的记录检查点(点(checkpoint)记录,增加一个重新开始文件,并增加一个重新开始文件,并让恢复子系恢复子系统在登在登录日志文件期日志文件期间动态地地维护日志。日志。具有检查点的恢复技术v检查点点记录的内容包括:的内容包括:建立检查点时刻所有正在执行的事务清单。这些事务最近一个日志记录的地址。重新开始文件用来记录各个检查点记录在日志文件中的地址。具有检查点的恢复技术v动态维护日志文件的方法是周期性地日志文件的方法是周期性地执行如行如下操作:下操作:将当前日志缓存中的所有日志记录写入磁盘的日志文件上。在日志文件上写入一个检查点记录将当前数据缓存的所有数据记录写入磁盘的数据库中把检查点记
22、录在日志文件中地址写入一个重新开始文件。具有检查点的恢复技术v使用使用检查点的方式可以改善效率,当事点的方式可以改善效率,当事务T在在一个一个检查点之前提交,点之前提交,T对数据数据库所做的修改所做的修改一定已一定已经写入数据写入数据库,写入,写入时间是在是在这个个检查点建立之前或建立之点建立之前或建立之时。这样在在进行恢复行恢复处理理时,没有必要,没有必要对事事务T进行行REDO操作。操作。具有检查点的恢复技术时间T1T2T3T4T5Tc检查点Tf系统故障不要REDOREDOREDOUNDOUNDO具有检查点的恢复技术v系系统用用检查点方法点方法进行恢复的步行恢复的步骤是:是:在重新开始文件
23、中找到最后一个检查点记录在日志文件中的地址,由该地址在日志文件中找到最后一个检查点记录。由该检查点记录得到检查点建立时刻所有正在运行的事务清单ACTIVE-LIST(暂时放入UNDO-LIST)从检查点开始正向扫描日志文件如果有新开始的事务Ti,把Ti暂时放入UNDO-LIST;如果有提交的事务Tj,把Tj从UNDO-LIST队列移入到REDO-LIST队列;直到文件结束对UNDO-LIST中的每一个事务执行UNDO操作,对REDO-LIST中的每个事务执行REDO操作。数据库镜像v即根据即根据DBADBA要求,自要求,自动把整个数据把整个数据库或其中的或其中的关关键数据复制到另一个磁数据复制到另一个磁盘上。每当主数据上。每当主数据库更新更新时,DBMSDBMS自自动把更新后的数据复制把更新后的数据复制过去,去,即即DBMSDBMS自自动保保证镜像数据与主数据的一致性。像数据与主数据的一致性。这样,一旦,一旦发生介生介质故障,不但可以故障,不但可以继续由由镜像磁像磁盘提供服提供服务,而且可以直接通,而且可以直接通过镜像磁像磁盘进行数据行数据库恢复。在没有故障恢复。在没有故障时,镜像磁像磁盘还可以提供一定的并行性。可以提供一定的并行性。数据库镜像应用1镜像应用2应用3应用4readreadread复制update应用1镜像应用2应用3应用4readreadread恢复update
限制150内