Oracle
 sql >> Datenbank >  >> RDS >> Oracle

KGXGN-Abfragefehler (15)

Beim Versuch, die zweite Instanz in einem RAC-Cluster mit zwei Knoten zu starten, wird die zweite Instanz nicht gestartet. Wenn die Instanz auf Knoten1 ausgeführt wird, wird die Instanz auf Knoten2 nicht gestartet. Wenn die Instanz auf Knoten2 ausgeführt wird, wird die Instanz auf Knoten1 nicht gestartet. Das Warnprotokoll zeigt Folgendes:

Error: KGXGN polling error (15)
Errors in file /u01/app/oracle/diag/rdbms/bsp/bsp1/trace/bsp1_lmon_9151.trc:
ORA-29702: error occurred in Cluster Group Service operation
LMON (ospid: 9151): terminating the instance due to error 29702

Leider gibt die LMON-Trace-Datei nur die gleichen Fehlermeldungen aus, also nichts weiter zu machen.

Dieser Fehler tritt aufgrund einer Fehlkonfiguration für die Clusterverbindung auf. Wenn Sie sich die OCR ansehen, um die Cluster-Verbindung zu sehen, können Sie sehen, dass das NIC-Gerät eth4.1338:

ist

[oracle@myhost bin]$ oifcfg getif -global
eth2 192.168.33.0 global public
eth4.1338 10.0.0.0 global cluster_interconnect

Auf einem Knoten ist das Gerät eth4 korrekt. Auf dem zweiten Knoten ist das Gerät jedoch eth5.1338 und die OCR wird von den Knoten gemeinsam genutzt. Die OCR erwartet, dass das Gerät eth4.1338 ist. Bei beiden Servern muss sich die Cluster-Verbindung auf demselben Netzwerkgerät befinden. Die Netzwerkkonfiguration des Servers wurde geändert, sodass beide Knoten auf dem eth5.1338-Gerät konfiguriert wurden. Nachdem die Server identisch konfiguriert waren, haben wir die OCR-Konfiguration neu definiert:

[oracle@myhost bin]$ ./oifcfg setif -global eth5.1338/10.0.0.0:cluster_interconnect

Wenn wir uns die Konfiguration ansehen, können wir sehen, dass sowohl eth4 als auch eth5 noch in OCR sind:

[oracle@myhost bin]$ ./oifcfg getif -global
eth2 192.168.33.0 global public
eth4.1338 10.0.0.0 global cluster_interconnect
eth5.1338 10.0.0.0 global cluster_interconnect

Also entfernen wir das eth4-Gerät:

[oracle@myhost bin]$ ./oifcfg delif -global eth4.1338/10.0.0.0

Wir haben jetzt die OCR neu konfiguriert. Wir haben CRS neu gestartet und beide Instanzen wurden auf beiden Knoten angezeigt!

Dies war einer dieser Fehler, bei denen die Fehlermeldungen nicht wirklich auf eine Ursache des Problems hindeuteten. Stattdessen musste ich in den Bereichen herumstöbern, von denen ich dachte, dass sie die wahrscheinlichsten Übeltäter waren, als ich die Konfigurationsunterschiede ziemlich blind entdeckte.