lunes, 16 de enero de 2012

Data Guard y procesos de archivado terminando su ejecución

Hace algún tiempo configuraste un par de instancias con Data Guard y desde entonces todo funcionó bien, hasta que abriste en modo de sólo lectura tu instancia en espera y entonces los procesos de archivado de la instancia primaria comenzaron a terminar su ejecución y estos mensajes empezaron a aparecer en el alert log de la instancia primaria:

Thu Mar 17 15:32:49 2011
******************************************************************
LGWR: Setting 'active' archival for destination LOG_ARCHIVE_DEST_2
******************************************************************
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_lns1_17449.trc (incident=356411):
ORA-00600: internal error code, arguments: [17113], [0x000000000], [], [], [], [], [], [], [], [], [], []
Thu Mar 17 15:32:53 2011
Sweep Incident[356411]: completed
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_lns1_17449.trc (incident=356412):
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_lns1_17449.trc:
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_lns1_17449.trc:
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_lns1_17449.trc:
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_lns1_17449.trc:
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Thu Mar 17 15:32:57 2011
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_arc0_17142.trc (incident=361859):
ORA-00600: internal error code, arguments: [17113], [0x000000000], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_arc0_17142.trc (incident=361860):
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_arc0_17142.trc:
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []
Errors in file /oracle_11g/product/diag/rdbms/mydb/mydb/trace/mydb_arc0_17142.trc:
ORA-00600: internal error code, arguments: [], [], [], [], [], [], [], [], [], [], [], []

Como quizás sepas, un error ORA-00600 significa algo así como "no tengo idea de qué pasó por lo que voy a mandar un error ORA-00600". Este tipo de situaciones son muy difíciles de diagnosticar, pero después de trabajar duro (mi compañero administrador de bases de datos) nos dimos cuenta que había un problema de falta de permisos en el directorio /var/tmp, donde Oracle pone los sockets para el listener.

Los directorios y permisos de /var/tmp deben ser algo como esto:

myserver> ls -la /var/tmp
total 12
drwxrwxrwt 3 root root 4096 2011-03-18 10:10 .
drwxr-xr-x 16 root root 4096 2010-02-05 13:14 ..
drwxrwxrwt 2 root dba 4096 2011-03-18 08:13 .oracle
myserver> ls -la /var/tmp/.oracle/
total 8
drwxrwxrwt. 2 root dba 4096 2011-05-04 08:17 .
drwxrwxrwt. 3 root root 4096 2011-05-04 09:18 ..
srwxrwxrwx. 1 oracle dba 0 2010-12-17 11:47 s#6115.1
srwxrwxrwx. 1 oracle dba 0 2010-12-17 11:47 s#6115.2
srwxrwxrwx. 1 oracle dba 0 2011-01-12 16:48 s#7018.1
srwxrwxrwx. 1 oracle dba 0 2011-01-12 16:48 s#7018.2
srwxrwxrwx. 1 oracle dba 0 2010-05-12 12:31 s#7662.1
srwxrwxrwx. 1 oracle dba 0 2010-05-12 12:31 s#7662.2
srwxrwxrwx. 1 oracle dba 0 2010-05-11 15:58 sEXTPROC_FOR_XE
srwxrwxrwx 1 oracle dba 0 2011-05-04 08:17 smyserverDBG_CSSD
srwxrwxrwx 1 oracle dba 0 2011-05-04 08:17 sOCSSD_LL_myserver_localhost
srwxrwxrwx 1 oracle dba 0 2011-05-04 08:17 sOracle_CSS_LclLstnr_localhost_0

Por lo tanto, después de arreglar los permisos en /var/tmp y reiniciar el listener de la instancia primaria y el envío de archive logs, el problema desapareció.

No hay comentarios.:

Publicar un comentario