Archivio > General
[IMPORTANTE] Cosa è successo?
Niccolò:
--- Citazione ---[cite]Autore: Lantheros[/cite]Ma non era SEMPRE colpa di Domon?
--- Termina citazione ---
tu quoque!
--- Citazione ---[cite]Autore: sigmud[/cite]Per la prossima volta... come ci si puo' tutelare da questi problemi?
--- Termina citazione ---
per una cosa simile l'unico modo che mi viene in mente è un backup in chiaro su due location diverse e uno "swap" ogni 24 ore tra backup e dati. magari gestioto via virtualizzazione?
Renato Ramonda:
Il problema e' che il guasto era invisibile, ragazzi: i backup come scritto CI SONO, ma sono tutti inutili perche' venivano completati con successo... ma non avevano i dati nuovi dentro!
Certo, se fossero stati ripristinati su un secondo vanilla e verificati piu' o meno a occhio si sarebbe visto... il problema si sarebbe notato prima ma difficilmente risolto... ma sono procedure di disaster recovery che non ho visto usare nemmeno in grosse istituzioni :)
Moreno Roncucci:
Ma se, da quanto ho capito, la macchina stava immagazzinando tutto quanto in RAM... non stava rallentando in maniera strana? O erano files così piccoli da non fare differenza?
(più che altro vorrei capire se la cosa può ripetersi o se ci sono "segni premonitori" che adesso si possono vedere...)
Renato Ramonda:
Per quello che ho capito io l'ipotesi piu' probabile e' quella di Khana su un controller impazzito: il problema e' ad un livello talmente profondo (quasi hardware, diciamo) che la macchina (il SO) non poteva accorgersene. Il controller dava OK alle scritture, che poi faceva chissa' dove.
...ma, appunto, nonzo: Michele ed il suo sistemista sono ancora in caccia.
Massimiliano Lambertini:
--- Citazione ---[cite]Autore: renatoram[/cite][p]Il problema e' che il guasto era invisibile, ragazzi: i backup come scritto CI SONO, ma sono tutti inutili perche' venivano completati con successo... ma non avevano i dati nuovi dentro![/p][p]Certo, se fossero stati ripristinati su un secondo vanilla e verificati piu' o meno a occhio si sarebbe visto... il problema si sarebbe notato prima ma difficilmente risolto... ma sono procedure di disaster recovery che non ho visto usare nemmeno in grosse istituzioni :)[/p]
--- Termina citazione ---
Cioè, in poche parole: GcG e non solo hanno girato sulla cache dei controller per oltre due mesi? Renato, su linux ne sai certamente molto più di me, però un qualcosa tipo questo:
http://dev.mysql.com/doc/refman/5.0/en/ha-drbd.html
a 'sto punto è d'obbligo. Va bene che un controller si spacchi o impazzisca, ma due proprio no... (e poi: i backup di MySql sono solo fisici o esistono anche quelli logici?)
Navigazione
[0] Indice dei post
Vai alla versione completa