mag
15
2008

Errori nella replica tra controller di dominio - Event ID 13561

Da un cliente scopro (diciamo così và) "per caso", investigando su un malfunzionamento di script di avvio, che una Group Policy non viene ereditata correttamente dalla Unità Organizzativa in questione. Il problema nasce dal fatto (grave) che le repliche tra i controller di dominio non funzionano correttamente (uno dei tre server in particolare falliva la replica con i restanti). L'evento registrato nell'event viewer è il 13561, generato dal Servizio di Replica Files (NtFrs):
Nella versione italiana
---
Il servizio Replica file ha rilevato che l'insieme di repliche "DOMAIN SYSTEM VOLUME (SYSVOL SHARE)" è nello stato JRNL_WRAP_ERROR.
 
 Nome dell'insieme di repliche    : "DOMAIN SYSTEM VOLUME (SYSVOL SHARE)"
 Percorso principale della replica   : "c:\windows\sysvol\domain"
 Volume principale della replica : "
\\.\C:"
  Un insieme di repliche è nello stato JRNL_WRAP_ERROR quando non riesce a trovare il record che tenta di leggere nel diario NTFS USN. Ciò può essere dovuto a una delle cause seguenti.
 
 [1] Il volume "
\\.\C:" è stato formattato.
 [2] Il diario NTFS USN nel volume "
\\.\C:" è stato eliminato.
 [3] Il diario NTFS USN nel volume "
\\.\C:" è stato troncato. Chkdsk può troncare il diario se riscontra voci danneggiate al termine del diario.
 [4] Il servizio Replica file non è stato eseguito sul computer da molto tempo.
 [5] Il servizio Replica file non è riuscito a mantenere la stessa velocità dell'attività I/O del disco su "
\\.\C:".
 
 Per ripristinare lo stato corretto, verrà attuata automaticamente questa procedura.
 [1] Al primo poll, che si verificherà entro 5 minuti, il computer verrà eliminato dall'insieme di repliche.
 [2] Al poll seguente l'eliminazione, il computer verrà aggiunto di nuovo all'insieme di repliche. Tale aggiunta attiverà la sincronizzazione dell'intera struttura dell'insieme di repliche.
---
O nella versione inglese
---
The File Replication Service has detected that the replica set "DOMAIN SYSTEM VOLUME (SYSVOL SHARE)" is in JRNL_WRAP_ERROR.

Replica set name is    : "DOMAIN SYSTEM VOLUME (SYSVOL SHARE)"
Replica root path is   : "c:\winnt\sysvol\domain"
Replica root volume is : "
\\.\C:"
A Replica set hits JRNL_WRAP_ERROR when the record that it is trying to read from the NTFS USN journal is not found.  This can occur because of one of the following reasons.

[1] Volume "\\.\C:" has been formatted.
[2] The NTFS USN journal on volume "
\\.\C:" has been deleted.
[3] The NTFS USN journal on volume "
\\.\C:" has been truncated. Chkdsk can truncate the journal if it finds corrupt entries at the end of the journal.
[4] File Replication Service was not running on this computer for a long time.
[5] File Replication Service could not keep up with the rate of Disk IO activity on "
\\.\C:".
Setting the "Enable Journal Wrap Automatic Restore" registry parameter to 1 will cause the following recovery steps to be taken to automatically recover from this error state.
[1] At the first poll, which will occur in 5 minutes, this computer will be deleted from the replica set. If you do not want to wait 5 minutes, then run "net stop ntfrs" followed by "net start ntfrs" to restart the File Replication Service.
[2] At the poll following the deletion this computer will be re-added to the replica set. The re-addition will trigger a full tree sync for the replica set.
---

La soluzione è escludere forzatamente dalle repliche il server, reinserendolo in un momento successivo il che obbliga la ricostruzione completa della replica.
E' importante sapere che durante questa procedura i dati di replica possono non essere disponibili agli utenti per un determinato periodo di tempo; è quindi meglio operare in orari "scarichi" da lavoro.

+ regedit -> HKLM\HKLM\System\CurrentControlSet\Services\NtFrs\Parameters
+ Se c'è la voce "Enable Journal Wrap Automatic Restore" impostarne il valore da 0 a 1;
+ Se la voce non esiste crearla esattamente con dicitura esattamente identica a quella indicata sopra (virgolette escluse ovviamente) e impostare il valore a 1;
+ Riavviare il servizio di Replica File (da un prompt: net stop ntfrs e poi net start ntfrs);
+ Nell'event viewer controllare il log relativo al servizio Replica File attendendo la comparsa dei seguenti eventi:
(ci può mettere un pochino, abbiate pazienza)
 - 13553: Il servizio Replica file ha aggiunto questo computer al seguente insieme di replica...
 - 13554: Il servizio Replica file ha aggiunto le seguenti connessioni all'insieme di replica...
 - 13516: Il servizio Replica file non impedisce più al computer NOMESERVER di diventare controller di dominio...
+ A questo punto dovrebbe ricomparire nel server in questione la share SYSVOL (basta tenere monitorata la cartella \\nomeserver e verificare che compaia la nuova condivisione);
+ Ora dovrebbe partire la replica completa; tenete controllate le sottocartelle di SYSVOL (il tempo dipende dal tipo di link tra i server, può servire anche un po' di tempo);
+ A questo punto torniamo nel regedit e reimpostiamo la voce "Enable Journal Wrap Automatic Restore" a 0.

ATTENZIONE: è fondamentale riportare la voce del registro a 0 (ultimo passo precedente), in modo da evitare un recupero forzato dei dati se il problema dovesse ripresentarsi (causando così una indisponibilità dei dati di replica non controllata da noi).

Add comment

biuquote
  • Comment
  • Preview
Loading

Recent Tweets

Note: For Customization and Configuration, CheckOut Recent Tweets Documentation