本帖提供两种做法,可避免让 client-side 程序,持续等待 SQL Server 中事务锁定造成的不正常或长时间阻塞,而让用户也无限期等待,甚至造成 connection pooling 连接数超过容量。
日前公司 server-side 有组件,疑似因撰写时 exception-handling 做得不周全,导致罕见的特殊例外发生时,让 SQL Server 的事务未执行到 cmmmit 或 rollback,造成某些表或记录被「锁定 (lock)」。后来又有大量的 request,要透过代码访问这些被锁定的记录,结果造成了严重的长时间「阻塞」,最后有大量 process 在 SQL Server 呈现「等待中」的状态。
由于 SQL Server 的「事务隔离级别」默认是 READ COMMITTED (事务期间别人无法读取),加上 SQL Server 的锁定造成阻塞时,默认是别的进程必须无限期等待 (LOCK_TIMEOUT = -1)。结果这些大量的客户端 request 无限期等待永远不会提交或回滚的事务,并一直占用着 connection pool 中的资源,最后造成 connection pooling 连接数目超载。
查了一些书,若大家要查询 SQL Server 目前会话中的 lock 超时时间,可用以下的命令:
SELECT @@LOCK_TIMEOUT
默认为 -1,意即欲访问的对象或记录被锁定时,会无限期等待。若欲更改当前会话的此值,可用下列命令: SET LOCK_TIMEOUT 3000
后面的 3000,其单位为毫秒,亦即会先等待被锁定的对象 3 秒钟。若事务仍未释放锁,则会抛回如下代号为 1222 的错误信息,可供程序员编程时做相关的逾时处理: 消息 1222,级别 16,状态 51,第 3 行 已超过了锁请求超时时段。 若将 LOCK_TIMEOUT 设置为 0,亦即当欲访问对象被锁定时,完全不等待就抛回代号 1222 的错误信息。此外,此一 SET LOCK_TIMEOUT 命令,影响范例只限当前会话,而非对某个表做永久的设置。 ------------------------------------------------------------------------------------------- 接下来我们在 SSMS 中,开两个会话 (查询窗口) 做测试,会话 A 创建会造成阻塞的事务进程,会话 B 去访问被锁定的记录。 --会话 A BEGIN TRAN; UPDATE Orders SET EmployeeID=7 WHERE OrderID=10248
--rollback; --故意不提交或回滚 --会话 B SELECT * FROM Orders WHERE OrderID=10248
分别执行后,因为欲访问的记录是同一条,按照 SQL Server 「事务隔离级别」和「锁」的默认值,会话 B 将无法读取该条数据,而且会永远一直等下去 (若在现实项目里写出这种代码,就准备被客户和老板臭骂)。 ------------------------------------------------------------------------------------------- 若将会话 B 先加上 SET LOCK_TIMEOUT 3000 的设置,如下,则会话 B 会先等待 3 秒钟,才抛出代号 1222 的「锁请求已超时」错误信息: SET LOCK_TIMEOUT 3000 UPDATE Orders SET EmployeeID=7 WHERE OrderID=10248 --SET LOCK_TIMEOUT -1
执行结果: 消息 1222,级别 16,状态 51,第 3 行 已超过了锁请求超时时段。 语句已终止。 ------------------------------------------------------------------------------------------- 另根据我之前写的文章「30 分钟快快乐乐学 SQL Performance Tuning」所述: