《数据库系统》PPT课件.ppt
第十章 并发控制,问题的产生,多用户数据库系统的存在 允许多个用户同时使用的数据库系统飞机定票数据库系统银行数据库系统 特点:在同一时刻并发运行的事务数可达数百个,问题的产生,不同的多事务执行方式(1)事务串行执行每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行不能充分利用系统资源,发挥数据库共享资源的特点,事务的串行执行方式,问题的产生,(2)交叉并发方式(Interleaved Concurrency)在单处理机系统中,事务的并行执行是这些并行事务的并行操作轮流交叉运行单处理机系统中的并行事务并没有真正地并行运行,但能够减少处理机的空闲时间,提高系统的效率,问题的产生,事务的交叉并发执行方式,问题的产生,(3)同时并发方式(simultaneous concurrency)多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行,问题的产生,事务并发执行带来的问题会产生多个事务同时存取同一数据的情况 可能会存取和存储不正确的数据,破坏事务一致性和数据库的一致性,例飞机订票系统 甲事务:甲售票点售票 乙事务:乙售票点售票在并发操作情况下,对甲、乙两个事务的操作序列的调度是随机的。,并发控制概述(续),例飞机订票系统中的一个活动序列 甲售票点(甲事务)读出某航班的机票余额A,设A=16;乙售票点(乙事务)读出同一航班的机票余额A,也为16;甲售票点卖出一张机票,修改余额AA-1,所以A为15,把A写回数据库;乙售票点也卖出一张机票,修改余额AA-1,所以A为15,把A写回数据库 结果明明卖出两张机票,数据库中机票余额只减少1 这种情况称为数据库的不一致性,是由并发操作引起的。,核心问题在保证一致性的前提下最大限度地提高并发度并发控制机制的任务对并发操作进行正确调度保证事务的隔离性保证数据库的一致性,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,10.1 并发控制概述,例飞机订票系统中的一个活动序列 甲售票点(甲事务)读出某航班的机票余额A,设A=16;乙售票点(乙事务)读出同一航班的机票余额A,也为16;甲售票点卖出一张机票,修改余额AA-1,所以A为15,把A写回数据库;乙售票点也卖出一张机票,修改余额AA-1,所以A为15,把A写回数据库,10.1 并发控制概述,在并发操作情况下,对甲、乙两个事务的操作序列的调度是随机的。若按上面的调度序列执行,甲事务的修改就被丢失。原因:第4步中乙事务修改A并写回后覆盖了甲事务的修改,10.1 并发控制概述,并发操作带来的数据不一致性丢失修改(Lost Update)不可重复读(Non-repeatable Read)读“脏”数据(Dirty Read)记号R(x):读数据xW(x):写数据x,10.1 并发控制概述,丢失修改两个事务T1和T2读入同一数据并修改,T2的提交结果破坏了T1提交的结果,导致T1的修改被丢失。,丢失修改,10.1 并发控制概述,不可重复读不可重复读是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。,不可重复读,10.1 并发控制概述,不可重复读包括三种情况(1)事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时,得到与前一次不同的值(2)事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同条件读取数据时,发现某些记录消失了(3)事务T1按一定条件从数据库中读取某些数据记录后,事务T2插入了一些记录,当T1再次按相同条件读取数据时,发现多了一些记录。,幻影现象(Phantom Row),10.1 并发控制概述,读“脏”数据事务T1修改某一数据,并将其写回磁盘事务T2读取同一数据后,T1由于某种原因被撤销这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致T2读到的数据就为“脏”数据,即不正确的数据,读“脏”数据,10.1 并发控制概述,数据不一致性:由于并发操作破坏了事务的隔离性并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性,10.1 并发控制概述,并发控制的主要技术有封锁(Locking)时间戳(Timestamp)乐观控制法商用的DBMS一般都采用封锁方法,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,10.2 封锁,什么是封锁封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。,10.2 封锁,基本封锁类型排它锁(Exclusive Locks,简记为X锁)共享锁(Share Locks,简记为S锁),10.2 封锁,排它锁又称为写锁若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁保证其他事务在T释放A上的锁之前不能再读取和修改A,10.2 封锁,共享锁又称为读锁若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁保证其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改,10.2 封锁,锁的相容矩阵,Y=Yes,相容的请求N=No,不相容的请求,T2 T1,使用封锁机制解决丢失修改问题,使用封锁机制解决读“脏”数据问题,使用封锁机制解决不可重复读问题,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,10.3 活锁和死锁,封锁技术可以有效地解决并行操作的一致性问题,但也带来一些新的问题死锁活锁,10.3 活锁和死锁-活锁,事务T1封锁了数据R事务T2又请求封锁R,于是T2等待。T3也请求封锁R,当T1释放了R上的封锁之后系统首先批准了T3的请求,T2仍然等待。T4又请求封锁R,当T3释放了R上的封锁之后系统又批准了T4的请求T2有可能永远等待,这就是活锁的情形,10.3 活锁和死锁-活锁,10.3 活锁和死锁-活锁,避免活锁:采用先来先服务的策略当多个事务请求封锁同一数据对象时按请求封锁的先后次序对这些事务排队该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁,10.3 活锁和死锁-死锁,事务T1封锁了数据R1T2封锁了数据R2T1又请求封锁R2,因T2已封锁了R2,于是T1等待T2释放R2上的锁接着T2又申请封锁R1,因T1已封锁了R1,T2也只能等待T1释放R1上的锁这样T1在等待T2,而T2又在等待T1,T1和T2两个事务永远不能结束,形成死锁,10.3 活锁和死锁-死锁,10.3 活锁和死锁-死锁,解决死锁的方法1.预防死锁2.死锁的诊断与解除,10.3 活锁和死锁-死锁,死锁的预防产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。预防死锁的发生就是要破坏产生死锁的条件,10.3 活锁和死锁-死锁,预防死锁的方法 一次封锁法 顺序封锁法,10.3 活锁和死锁-死锁,一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行存在的问题降低系统并发度难于事先精确确定封锁对象,10.3 活锁和死锁-死锁,顺序封锁法顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。顺序封锁法存在的问题维护成本 数据库系统中封锁的数据对象极多,并且在不断地变化。难以实现:很难事先确定每一个事务要封锁哪些对象,10.3 活锁和死锁-死锁,结论在操作系统中广为采用的预防死锁的策略并不很适合数据库的特点DBMS在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法,10.3 活锁和死锁-死锁,死锁的诊断超时法事务等待图法,10.3 活锁和死锁-死锁,超时法如果一个事务的等待时间超过了规定的时限,就认为发生了死锁优点:实现简单缺点有可能误判死锁时限若设置得太长,死锁发生后不能及时发现,10.3 活锁和死锁-死锁,等待图法用事务等待图动态反映所有事务的等待情况事务等待图是一个有向图G=(T,U)T为结点的集合,每个结点表示正运行的事务U为边的集合,每条边表示事务等待的情况若T1等待T2,则T1,T2之间划一条有向边,从T1指向T2,10.3 活锁和死锁-死锁,事务等待图,10.3 活锁和死锁-死锁,等待图法并发控制子系统周期性地(比如每隔数秒)生成事务等待图,检测事务。如果发现图中存在回路,则表示系统中出现了死锁。,10.3 活锁和死锁-死锁,解除死锁选择一个处理死锁代价最小的事务,将其撤消释放此事务持有的所有的锁,使其它事务能继续运行下去,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,10.4 并发调度的可串行性,DBMS对并发事务不同的调度可能会产生不同的结果什么样的调度是正确的?,10.4 并发调度的可串行性,可串行化(Serializable)调度多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的结果相同可串行性(Serializability)是并发事务正确调度的准则一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度,10.4 并发调度的可串行性,例现在有两个事务,分别包含下列操作:事务T1:读B;A=B+1;写回A事务T2:读A;B=A+1;写回B现给出对这两个事务不同的调度策略,串行化调度,正确的调度,假设A、B的初值均为2。按T1T2次序执行结果为A=3,B=4 串行调度策略,正确的调度,(a),串行化调度,正确的调度,假设A、B的初值均为2。T2T1次序执行结果为B=3,A=4 串行调度策略,正确的调度,(b),不可串行化调度,错误的调度,执行结果与(a)、(b)的结果都不同是错误的调度,可串行化调度,正确的调度,执行结果与串行调度(a)的执行结果相同是正确的调度,10.4 并发调度的可串行性,可串行化调度的充分条件一个调度是冲突可串行化,一定是可串行化的调度一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc,如果Sc是串行的,称调度Sc为冲突可串行化的调度,10.4 并发调度的可串行性,冲突操作指不同的事务对同一个数据的读写操作和写写操作Ri(x)与Wj(x)/*事务Ti读x,Tj写x*/Wi(x)与Wj(x)/*事务Ti写x,Tj写x*/其他操作是不冲突操作不同事务的冲突操作和同一事务的两个操作不能交换(Swap),10.4 并发调度的可串行性,可串行化调度的充分条件一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc,如果Sc是串行的,称调度Sc为冲突可串行化的调度一个调度是冲突可串行化,一定是可串行化的调度,例今有调度Sc1=r1(A)w1(A)r2(A)w2(A)r1(B)w1(B)r2(B)w2(B)把w2(A)与r1(B)w1(B)交换,得到:r1(A)w1(A)r2(A)r1(B)w1(B)w2(A)r2(B)w2(B)再把r2(A)与r1(B)w1(B)交换:Sc2r1(A)w1(A)r1(B)w1(B)r2(A)w2(A)r2(B)w2(B)Sc2等价于一个串行调度T1,T2,Sc1冲突可串行化的调度,10.4 并发调度的可串行性,冲突可串行化调度是可串行化调度的充分条件,不是必要条件。还有不满足冲突可串行化条件的可串行化调度。,例有3个事务 T1=W1(Y)W1(X),T2=W2(Y)W2(X),T3=W3(X)调度L1=W1(Y)W1(X)W2(Y)W2(X)W3(X)是一个串行调度。调度L2=W1(Y)W2(Y)W2(X)W1(X)W3(X)不满足冲突可串行化。但是调度L2是可串行化的,因为L2执行的结果与调度L1相同,Y的值都等于T2的值,X的值都等于T3的值,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,10.5 两段锁协议,封锁协议运用封锁方法时,对数据对象加锁时需要约定一些规则 何时申请封锁持锁时间何时释放封锁等,10.5 两段锁协议,两段封锁协议(Two-Phase Locking,简称2PL)是最常用的一种封锁协议,理论上证明使用两段封锁协议产生的是可串行化调度,10.5 两段锁协议,两段锁协议 指所有事务必须分两个阶段对数据项加锁和解锁 在对任何数据进行读、写操作之前,事务首先要申请并获得对该数据的封锁在释放一个封锁之后,事务不再申请和获得任何其他封锁,10.5 两段锁协议,“两段”锁的含义所有事务必须分两个阶段对数据项加锁和解锁 第一阶段是获得封锁,也称为扩展阶段事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁 第二阶段是释放封锁,也称为收缩阶段事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁,10.5 两段锁协议,例事务Ti遵守两段锁协议,其封锁序列是:Slock A Slock B Xlock C Unlock B Unlock A Unlock C;|扩展阶段|收缩阶段|事务Tj不遵守两段锁协议,其封锁序列是:Slock A Unlock A Slock B Xlock C Unlock C Unlock B;,遵守两段锁协议的可串行化调度,10.5 两段锁协议,事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的若并发事务的一个调度是可串行化的,不一定所有事务都符合两段锁协议,可串行化调度,正确的调度,执行结果与串行调度(a)的执行结果相同是正确的调度,10.5 两段锁协议,两段锁协议与防止死锁的一次封锁法一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁,10.5 两段锁协议,例 遵守两段锁协议的事务发生死锁,T1Slock BR(B)=2Xlock A等待等待,T2Slock AR(A)=2Xlock B等待,第十章 并发控制,10.1 并发控制概述10.2 封锁10.3 活锁和死锁10.4 并发调度的可串行性10.5 两段锁协议10.6 封锁的粒度,10.5 封锁粒度,封锁对象的大小称为封锁粒度(Granularity)封锁的对象:逻辑单元,物理单元 例:在关系数据库中,封锁对象:逻辑单元:属性值、属性值集合、元组、关系、索引项、整个索引、整个数据库等物理单元:页(数据页或索引页)、物理记录等,10.5 封锁粒度,封锁粒度与系统的并发度和并发控制的开销密切相关。封锁的粒度越大,数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小;封锁的粒度越小,并发度较高,但系统开销也就越大,10.5 封锁粒度,例若封锁粒度是数据页,事务T1需要修改元组L1,则T1必须对包含L1的整个数据页A加锁。如果T1对A加锁后事务T2要修改A中元组L2,则T2被迫等待,直到T1释放A。如果封锁粒度是元组,则T1和T2可以同时对L1和L2加锁,不需要互相等待,提高了系统的并行度。又如,事务T需要读取整个表,若封锁粒度是元组,T必须对表中的每一个元组加锁,开销极大,10.5 封锁粒度,多粒度封锁(Multiple Granularity Locking)在一个系统中同时支持多种封锁粒度供不同的事务选择,10.5 封锁粒度,选择封锁粒度 同时考虑封锁开销和并发度两个因素,适当选择 封锁粒度需要处理多个关系的大量元组的用户事务:以数据库为封锁单位需要处理大量元组的用户事务:以关系为封锁单元只处理少量元组的用户事务:以元组为封锁单位,10.5 封锁粒度-多粒度封锁,多粒度树以树形结构来表示多级封锁粒度根结点是整个数据库,表示最大的数据粒度叶结点表示最小的数据粒度,10.5 封锁粒度-多粒度封锁,例:三级粒度树。根结点为数据库,数据库的子结点为关系,关系的子结点为元组。,三级粒度树,10.5 封锁粒度-多粒度封锁,多粒度封锁协议允许多粒度树中的每个结点被独立地加锁对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁在多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁,10.5 封锁粒度-多粒度封锁,显式封锁:直接加到数据对象上的封锁隐式封锁:该数据对象没有独立加锁,是由于其上级结点加锁而使该数据对象加上了锁显式封锁和隐式封锁的效果是一样的,10.5 封锁粒度-多粒度封锁,系统检查封锁冲突时要检查显式封锁还要检查隐式封锁,10.5 封锁粒度-多粒度封锁,例如事务T要对关系R1加X锁系统必须搜索其上级结点数据库、关系R1还要搜索R1的下级结点,即R1中的每一个元组如果其中某一个数据对象已经加了不相容锁,则T必须等待,10.5 封锁粒度-多粒度封锁,对某个数据对象加锁,系统要检查 该数据对象有无显式封锁与之冲突 所有上级结点检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突:(由上级结点已加的封锁造成的)所有下级结点看上面的显式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突,10.5 封锁粒度-意向锁,引进意向锁(intention lock)目的提高对某个数据对象加锁时系统的检查效率,10.5 封锁粒度-意向锁,如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁对任一结点加基本锁,必须先对它的上层结点加意向锁例如,对任一元组加锁时,必须先对它所在的数据库和关系加意向锁,10.5 封锁粒度-意向锁,常用意向锁意向共享锁(Intent Share Lock,简称IS锁)意向排它锁(Intent Exclusive Lock,简称IX锁)共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁),10.5 封锁粒度-意向锁,IS锁如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。例如:事务T1要对R1中某个元组加S锁,则要首先对关系R1和数据库加IS锁,10.5 封锁粒度-意向锁,IX锁如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。例如:事务T1要对R1中某个元组加X锁,则要首先对关 系R1和数据库加IX锁,10.5 封锁粒度-意向锁,SIX锁如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX=S+IX。例:对某个表加SIX锁,则表示该事务要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)。,10.5 封锁粒度-意向锁,意向锁的相容矩阵,10.5 封锁粒度-意向锁,锁的强度锁的强度是指它对其他锁的排斥程度一个事务在申请封锁时以强锁代替弱锁是安全的,反之则不然,10.5 封锁粒度-意向锁,具有意向锁的多粒度封锁方法申请封锁时应该按自上而下的次序进行释放封锁时则应该按自下而上的次序进行,10.5 封锁粒度-意向锁,例如:事务T1要对关系R1加S锁要首先对数据库加IS锁检查数据库和R1是否已加了不相容的锁(X或IX)不再需要搜索和检查R1中的元组是否加了不相容的锁(X锁),10.5 封锁粒度-意向锁,具有意向锁的多粒度封锁方法提高了系统的并发度减少了加锁和解锁的开销在实际的数据库管理系统产品中得到广泛应用,小结,数据库的重要特征是它能为多个用户提供数据共享。数据共享与数据一致性是一对矛盾DBMS必须提供并发控制机制来协调并发用户的并发操作以保证并发事务的隔离性和一致性,保证数据库的一致性,小结,数据库的并发控制以事务为单位数据库的并发控制通常使用封锁机制两类最常用的封锁,小结,并发控制机制调度并发事务操作是否正确的判别准则是可串行性并发操作的正确性则通常由两段锁协议来保证。两段锁协议是可串行化调度的充分条件,但不是必要条件,小结,对数据对象施加封锁,带来问题活锁:先来先服务死锁:预防方法一次封锁法顺序封锁法 死锁的诊断与解除超时法等待图法,