yangtingkun
===========================================================
网络问题或客户端异常可能导致数据库会话处于僵死状态
===========================================================

最近一段时间,系统的网络不是很稳定,经常发现数据库上出现一些异常的会话,会话占用较大的系统资源。


简单模拟了一下,在数据库上建立了测试用表,然后在客户端上执行一个时间较长的SQL

SQL> CREATE TABLE T1 AS SELECT * FROM DBA_OBJECTS;

表已创建。

SQL> CREATE TABLE T2 AS SELECT * FROM DBA_TABLES;

表已创建。

SQL> SET TIMING ON
SQL> SELECT COUNT(*) FROM T1, T2;

COUNT(*)
----------
190307720

已用时间: 00: 00: 28.57

SQL> SELECT SID FROM V$MYSTAT WHERE ROWNUM = 1;

SID
----------
16

已用时间: 00: 00: 00.01

再次执行这个SQL语句,在SQL语句开始执行且未完成之前,断开客户端和服务器直接的网络连接,并在服务器端观察数据库中相应的SESSION的等待信息:

SQL> select sid, seconds_in_wait, event from v$session_wait where sid = 16;

SID SECONDS_IN_WAIT EVENT
---------- --------------- ---------------------------------------
16 195 SQL*Net message from client

SQL> select sid, seconds_in_wait, event from v$session_wait where sid = 16;

SID SECONDS_IN_WAIT EVENT
---------- --------------- ---------------------------------------
16 224 SQL*Net message from client

SQL> select spid from v$session s, v$process p where s.paddr = p.addr and sid = 16;

SPID
------------
13741

从操作系统上检查进程,也会看到这个进程:

$ ps -ef|grep 13741
oracle 13741 1 8 17:13 ? 00:00:26 oracletest2 (LOCAL=NO)
oracle 13881 13849 0 17:18 pts/4 00:00:00 grep 13741

这种僵死的会话会占用资源,而且Oraclepmon进程不会自动清除该进程,而且,如果这个会话在异常中止之前(比如客户端异常关机或网络异常)还执行了DML操作,并且没有回滚,那么这个僵死会话可能对导致大量的其他会话因无法获取资源而挂起。

DBA应该注意随时监控系统,尤其是网络不稳定的情况下,检查是否有类似的情况产生。在服务器上的sqlnet.ora文件中设置SQLNET.EXPIRE_TIME来检测服务器和客户端的连接是否异常中止。不过这个设置可能会对网络性能带来少量的下降。

yangtingkun 发表于:2007.02.25 19:09 ::分类: ( ORACLE ) ::阅读:(4528次) :: 评论 (11)
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

以前碰到的大部分都是只执行SELECT的,影响不算太大,也就一直没有深究,最近碰到两次执行了DML的,影响了很多其他会话,搞的很郁闷

yangtingkun 评论于: 2007.02.26 11:17
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

如何找到这些僵死状态的进程,然后KILL掉呢

mayitong 评论于: 2007.02.26 11:59
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

观察操作系统的监控命令,比如top,配合v$session, v$process, v$session_wait、v$sql、v$lock等视图。
一般需要处理的是占用大量系统资源的或锁住资源而没有释放的

yangtingkun 评论于: 2007.03.03 14:31
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

我想知道为什么PMON不会去清除这些僵死的进程?

yxyup 评论于: 2007.03.20 16:48
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

怀疑PMON进程无法区分这种僵死进程和普通进程

yangtingkun 评论于: 2007.03.20 23:37
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

杨哥,我测试下来发现这些僵死的进程,过一段时间后(也会这个时间很长)自己释放掉的,但不知为什么PMON不会马上清除?

同时请教一个,用alter system kill session 'sid,serial#'虽然这个session变成了killed,但是好长时间也不会释放掉,这是为什么?

yxyup 评论于: 2007.03.21 17:39
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

用kill session的方法并不会马上释放资源

有的时候alter system kill session甚至会报错,Oracle告诉你该会话以及被标志为KILLED。

一般对于长时间运行的会话,尤其是job会话,我会采用操作系统的kill命令直接杀掉后台进程。

yangtingkun 评论于: 2007.03.21 23:07
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

是的,我一般也都是用OS的kill来清除的。但是不明白为什么alter system kill session不能马上清除释放内存出来,ORACLE还建议我们用这个?

yxyup 评论于: 2007.03.22 08:58
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

Oracle总要提供自己的解决方法,虽然有时候这个方法并不是很好用。

yangtingkun 评论于: 2007.03.22 13:21
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

PMON会定时启动清除垃圾session,但时间较长,我试过得用不到2小时。

joey 评论于: 2007.05.11 14:38
re: 网络问题或客户端异常可能导致数据库会话处于僵死状态 [回复]

Note#1023442.6 HOW TO HAVE ORACLE CLEAN-UP OLD USER INFO AFTER KILLING SESSION.htm

strongliq 评论于: 2007.09.20 13:03

发表评论
标题

在此添加评论
表情符号: smile laughing tongue angry crying sad wassat wink

称呼

邮箱地址(可选)

个人主页(可选)

 authimage


切换风格
新闻聚合
博客日历
文章归档...
最新发表...
最新评论...
最多阅读文章...
最多评论文章...
博客统计...
Blog信息
网站链接...