数据库系统概论—并发控制.ppt
数据库系统概论并发控制1数据库系统概论7.1 事务的基本概念一、什么是事务二、如何定义事务三、事务的特性2数据库系统概论一、什么是事务n事务(Transaction)是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位n事务和程序是两个概念n在关系数据库中,一个事务可以是一条SQL语句,一组SQL语句或整个程序n一个应用程序通常包含多个事务n事务是恢复和并发控制的基本单位3数据库系统概论二、如何定义事务n显式定义方式BEGINTRANSACTIONBEGINTRANSACTIONSQL语句1SQL语句1SQL语句2SQL语句2。COMMITROLLBACKn隐式方式当用户没有显式地定义事务时,DBMS按缺省规定自动划分事务4数据库系统概论事务结束COMMIT事务正常结束提交事务的所有操作(读+更新)事务中所有对数据库的更新永久生效ROLLBACK事务异常终止n事务运行的过程中发生了故障,不能继续执行回滚事务的所有更新操作n事务滚回到开始时的状态5数据库系统概论三、事务的特性(ACID特性)事务的ACID特性:n原子性(Atomicity)n一致性(Consistency)n隔离性(Isolation)n持续性(Durability)6数据库系统概论1.原子性n事务是数据库的逻辑工作单位n事务中包括的诸操作要么都做,要么都不做7数据库系统概论2.一致性事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态一致性状态:数据库中只包含成功事务提交的结果不一致状态:数据库中包含失败事务的结果8数据库系统概论一致性与原子性银行转帐:从帐号A中取出一万元,存入帐号B。n定义一个事务,该事务包括两个操作n这两个操作要么全做,要么全不做n全做或者全不做,数据库都处于一致性状态。n如果只做一个操作,数据库就处于不一致性状态。B=B+1A=A-1BA9数据库系统概论3.隔离性对并发执行而言一个事务的执行不能被其他事务干扰n一个事务内部的操作及使用的数据对其他并发事务是隔离的n并发执行的各个事务之间不能互相干扰10数据库系统概论T1的修改被T2覆盖了!读A=16AA-3写回A=13读A=16AA-1写回A=15T2T111数据库系统概论4.持续性n持续性也称永久性(Permanence)n一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。n接下来的其他操作或故障不应该对其执行结果有任何影响。12数据库系统概论事务的特性 n保证事务ACID特性是事务处理的任务n破坏事务ACID特性的因素n多个事务并行运行时,不同事务的操作交叉执行n事务在运行过程中被强行停止13数据库系统概论内容提要n并发控制是数据库管理系统的重要组成部分,通过本章的学习,应重点掌握:n并发控制带来的新问题n封锁及封锁协议n并发调度的可串行性n两段锁协议14数据库系统概论概述n在单处理机系统中,事务的并行执行实际上是这些并行事务的并行操作轮流交叉运行,称为交叉并发方式。n在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行,称为同时并发方式。n并发的目的:n改善系统的资源利用率n改善短事务的响应时间15数据库系统概论例子n飞机订票系统中的活动序列:甲售票点读出某航班的机票余额A,设A=16乙售票点读出同一航班的机票余额A,也为16甲售票点卖出一张机票,修改余额AA-1,把A=15写回数据库乙售票点也卖出一张机票,修改余额AA-1,把A=15写回数据库n这种情况称为数据库的不一致性,是由并发控制引起的。16数据库系统概论数据不一致性(1)n丢失修改:两个事务T1和T2读入同一数据并修改,T2提交的结果破坏了T1提交的结果,导致T1的修改被丢失。“写写冲突”n读“脏”数据:事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,则T2读到的数据就为“脏”数据,即不正确的数据。“读写冲突”17数据库系统概论数据不一致性(2)n不可重复读:事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次的读取结果。“读写冲突”n产生原因:并发操作破坏了事务的隔离性n并发控制的任务:用正确的方式调度并发操作,使一个用户事务的执行不受其它事务的干扰,避免造成数据的不一致性。n并发控制的主要方法:封锁18数据库系统概论n三种数据不一致性T1T2T1T2T1T2读A=16读A=50读B=100求和=150读C=100CC*2写C=200读A=16读B=100BB*2写B=200读C=200AA-1写A=15读A=50读B=200求和=250ROLLBACKC=100AA-1写A=1519数据库系统概论封锁(Locking)(1)n封锁:事务T在对某个数据对象操作之前,先向系统发出请求,对其加锁。n封锁类型:排它锁(X锁)和共享锁(S锁)n排它锁:又称写锁,若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的X锁。n共享锁:又称读锁,若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。20数据库系统概论封锁(Locking)(2)nX锁和S锁的控制方式可有相容矩阵表示。n最左边表示T1已经获得的锁的类型,最上面表示T2的封锁请求,-表示没有加锁。nY表示相容,请求可以满足;N表示冲突,请求被拒绝。T1T2XS-XNNYSNYY-YYY21数据库系统概论一级封锁协议n加锁必须遵守一定的规则,称为封锁协议。n一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。事务结束包括正常结束(COMMIT)和非正常结束(ROLLBACK)。n一级封锁协议中,如果是读数据不修改,是不需要加锁的,可防止丢失修改。22数据库系统概论二级封锁协议n二级封锁协议:在一级封锁协议基础上,加上事务T在读数据R之前必须先对其加上S锁,读完后即可释放S锁。n在二级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。23数据库系统概论三级封锁协议n三级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。n三级封锁协议除了防止了丢失修改和不读“脏”数据外,还进一步防止了不可重复读。n上述三级协议的主要区别在于:什么操作需要申请封锁,以及何时释放锁。24数据库系统概论不同级别的封锁协议X锁S锁一致性保证操作结束释放事务结束释放操作结束释放事务结束释放不丢失修改不读脏数据可重复读一级封锁协议二级封锁协议三级封锁协议25数据库系统概论活锁n若某数据对象加了S锁,这时若有其它事务申请对它的X锁,则需等待。但此时若有其它事务申请对它的S锁,按相容矩阵,应可获准。如果不断有事务申请对此数据对象的S锁,以致它始终被S锁占有,而X锁的申请迟迟不能获准。这种现象叫活锁。n避免活锁的简单方法是采用“先来先服务”的策略。26数据库系统概论死锁n一个事务如果申请锁而未获准,则需等待其它事务释放锁。如果事务中出现循环等待时,如果不加干预,则会一直等待下去,这叫死锁。n对付死锁的方法:n检测死锁,发现死锁后处理死锁n防止死锁27数据库系统概论死锁的诊断(1)n超时法:如果一个事务的等待时间超过了某个时限,就认为发生死锁。n特点:n优点:简单n缺点:一是事务因其它原因(如系统负荷太重、通信受阻等)而使事务等待时间超过时限,可能被误判死锁。二是时限的设置。28数据库系统概论死锁的诊断(2)n等待图法:等待图是一个有向图G=(T,U)。nT为结点的集合,每个结点表示正在运行的事务nU为边的集合,每条边表示事务等待的情况n当且仅当等待图中出现回路时,死锁发生。n当运行的事务比较多时,维护等待图和检测回路的开销较大,影响系统的性能。n方法是周期性的进行死锁检测。死锁检测周期的确定用实验方法确定最佳值。29数据库系统概论死锁的解除(1)n出现死锁后,必须由DBMS干预。处理如下:n在循环等待的事务中,选一个事务作为“牺牲者”,给其它事务让路n撤销牺牲的事务,释放其获得的锁及其它资源n将释放的锁让给等待它的事务n被牺牲的事务可以有两种处理:n发消息给有关用户,由用户向系统再交付该事务n由DBMS重新启动该事务n注:被牺牲的事务应等待一段时间才能交付系统,否则可能再发生死锁。30数据库系统概论死锁的解除(2)n选择哪个事务作为牺牲者,由下列几种选法:n选择最迟交付的事务作为牺牲者n选择获得锁最少的事务作为牺牲者n选择撤销代价最小的事务作为牺牲者31数据库系统概论死锁的预防一次封锁法n一次封锁法:要求每个事务必须一次将所有要使用的数据全部加锁。n缺点:n有些数据对象过早的加锁,降低了并发度n如果有些事务需要访问的“热点”数据比较多,其它事务总是不断的占有其中某些数据,不能一次获得所需要数据的全部,就会一直等待下去,易发生活锁。32数据库系统概论死锁的预防顺序封锁法n顺序封锁法:预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。n缺点:n数据库中一般是按内容访问,而不是按名访问,所以很难预先确定所有的访问对象n数据经常变动,次序也经常调整n上述两种方法用于数据库系统不实际。33数据库系统概论死锁的预防事务重执(1)n事务重执:当事务申请锁而未获准时,不是一律等待,而是让一些事务撤销重执。n为区别事务开始执行的先后,每个事务开始执行时,赋予一个唯一的、随时间增长的整数,称为时间标记,记为ts。如两个事务TA和TB,若ts(TA)ts(TB),表明TA比TB“年老”n事务重执有两种策略n等待死亡策略n击伤等待策略34数据库系统概论死锁的预防事务重执(2)n等待死亡策略n设TB持有某对象数据的锁,当TA申请同一数据的锁发生冲突时,按如下规则处理:Ifts(TA)ts(TB)thenTAwaits;elserollbackTB;/*wound*/restratTBwiththesamets(TB);n总是年轻的事务等待年老的事务。36数据库系统概论死锁的预防事务重执(4)n上述两种策略中,当冲突发生时,总是以年轻的事务作为牺牲品。因为年轻的事务随着时间的流逝,总会变成年老的事务,不致永远成为牺牲品。37数据库系统概论并发调度的可串行性(1)n定义:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同,称这种调度策略为可串行化的调度。n可串行性是并发事务正确性的准则。按这个规则规定,一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。n对于n个事务,可有n!中排列次序,即有n!种串行调度。38数据库系统概论并发调度的可串行性(2)n一个调度S是否可串行化,可用前趋图来测试。前趋图是有向图,点表示所有参与调度的事务对于边,当满足下列条件之一时,加入:nRi(x)在Wj(x)之前nWi(x)在Rj(x)之前nWi(x)在Wj(x)之前n若前趋图中有回路,则S显然不等价于任何串行调度,若无回路,则可用拓扑排序得到一个串行调度。39数据库系统概论并发调度的可串行性(3)n设有事务集T1,T2,T3,T4的一个调度:S=W3(y)R1(x)R2(y)W3(x)W2(x)W3(z)R4(z)W4(x)试检验S是否可串行化。n分别分析对x,y,z的所有操作,画出前趋图。T2T1T4T1,T3,T2,T4T340数据库系统概论并发调度的可串行性(4)n可串行化调度和串行调度是有区别的:n前者交叉执行各事务操作,在效果上相当于事务的某一串行执行n后者完全是串行执行各事务,失去并发意义,不能充分利用系统资源nDBMS并发控制的任务就是保证事务执行的可串行化,比较有效的方法是要求DBMS按一定的封锁协议调度事务,以保证其执行可串行化。n两段锁协议(2PL)就是保证并发调度可串行化的封锁协议。41数据库系统概论两段锁协议(1)n两段锁协议是指所有事务必须分两个阶段对是数据项加锁和解锁n在对任何数据进行读、写操作之前,首先要申请并获得对该数据的封锁。扩展阶段n在释放一个封锁之后,事物不再申请和获得任何其它封锁。收缩阶段n若并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调度策略都可是可串行化。(充分条件)(可用反证法证明)42数据库系统概论两段锁协议(2)n两段锁协议和一次封锁法的异同:n一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议n两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此可能会发生死锁43数据库系统概论封锁的粒度n定义:封锁对象的大小。n封锁的对象:n可以是逻辑单元:属性、属性值的集合、元组、关系、索引项、整个索引、整个数据库n也可以是物理单元:页(数据页或索引页)、块n封锁粒度一系统的并发度和并发控制开销相关n封锁粒度越大,并发度越小,系统开销越小n封锁粒度越小,并发度较高,系统开销越大44数据库系统概论多粒度封锁n如果在一个系统中同时支持多种封锁粒度供不同的事务选择,这种封锁方法称为多粒度封锁n多粒度封锁,一个数据对象可能以两种方式被封锁:n显式封锁:应事务的要求直接加锁于该数据对象n隐式封锁:该数据对象没有加锁,而是由于它的上级被封锁,应此这个数据对象被隐含地封锁了n为了方便加锁引起的冲突,引进了意向锁(INTENTIONLOCK)45数据库系统概论意向锁(1)n含义:如果对一个结点加意向锁,则说明该结点的下级结点正在被加锁;对任一结点加锁时必须先对其上级结点加意向锁。n意向共享锁(IS):如果对一个数据对象加IS锁,表示它的后裔结点加了或拟(意向)加S锁n意向排它锁(IX):如果对一个数据对象加IX锁,表示它的后裔结点加了或拟(意向)加X锁n共享意向排它锁(SIX):如果对一个数据对象加SIX锁,表示它加了S锁,再加IX锁。即SIX=S+IX。如读整个关系,修改其中元组,则该关系加SIX锁46数据库系统概论意向锁(2)n各种锁的相容矩阵T1T2SXISIXSIX-SYNYNNYXNNNNNYISYNYYYYIXNNYYNYSIXNNNNNY-YYYYYY47数据库系统概论意向锁(3)n各种锁的强度如图所示偏序关系XSIX所谓强度是指它对其它锁的排斥程度。SIXS一个事务在申请封锁时,以强所代替弱锁是安全的;-反之则不然。48数据库系统概论意向锁(4)n在多粒度封锁中,要对一个数据对象加锁,必须对这个数据对象所有上级加相应的意向锁。n申请锁时,应按自上而下的次序申请,以便及时发现冲突,停止下级锁的申请n释放锁时,应按自下而上的次序释放49数据库系统概论习题n使某个事务永远处于等待状态,而得不到执行的现象称为()。A死锁B活锁C串行调度D不可串行调度n对数据对象施加封锁,可能会引起活锁和死锁问题。避免活锁的简单方法是采用()的策略。A顺序封锁法B依次封锁法C优先级高先服务D先来先服务n习题1350数据库系统概论