Perdere tre anni di vita in mezz’ora
Questo pomeriggio ero con un collega a riempire un questionario che riguardava un server di produzione che ospitiamo per un cliente.
nota: questo fine anno ho “ereditato” nella filiale di milano un blade Ibm con tre lame ed ESX Server con una 60ina di macchine virtuali dentro, questo server è una di queste.
Premetto che dell’80% di queste macchine non so’ assolutamente nulla, i sistemi base li gestisco già, file server, exchange, domain controller il server di deploy dell’antivirus symantec (cof cof) ma le altre le gestiscono gli sviluppatori che le hanno messe in pista, un po’ sono di produzione, altre di test altre ancora di sviluppo.
Una di queste, come dicevo, era oggetto di un questionario e mi sono collegato alla console del Vmware per vedere la macchina com’era messa, figuriamoci che non sapevo nemmeno se era un windows o un linux.
Mi sono trovato davanti un windows 2003 enterprise sp2, ho guardato un po’ di cose e ho trovato uno Sharepoint installato e funzionante, prima di scollegarmi mi appare la nuvoletta che mi avverte che ci sono 6 aggiornamenti scaricati dall’aggiornamento automatico da installare.
Io ho ingenuamente pensato che se qualcuno ha lasciato l’aggiornamento automatico attivo e gli aggiornamenti sono solo 6 vuol dire che vengono fatti regolarmente, ho avallato l’installazione e mi sono scollegato.
Il MALE OSCURO E PROFONDO era in attesa dietro l’angolo, infatti dopo qualche minuto mi chiama la collega che gestisce questo bidone di Sharepoint a cui avevo chiesto nome e ip della macchina per chiedermi se ho toccato qualcosa perche il server sembra defunto, io mi ricollego e trovo la finestrella che chiede il reboot e il servizio di Sharepoint spento che non riparte, riavvio ma il servizo rimane giu.

Brivido.
Giro in rete e trovo che una patch ha NOTORIAMENTE ha buone possibilità di spengere Sharepoint, quella chiamata KB932091 che ovviamente è quella che si è appena installata mandando a donnine il mio server di produzione.
Scelgo tra i vari dialetti delle province toscane il livornese che ben si adatta alla situazione ed inizio una fila di maledizioni all’insegna dei signori microsoft che rilasciano queste patch del cavolo che invece di sistemare le cose le rompono e passo una mezz’ora in cerca di un rimedio mentre un collega si mettere a vedere se sia il caso di ripristinare il backup della macchina virtuale fatto qualche settimana addietro e riversarci il backup notturno del database.
Mentre sono tutti in preda al panico urlanti io trovo questa cosa qui sul sito Microsoft
Spiega bellamente che per installare la patch il motore di IIS deve essere spento, altrimenti possono verificarsi problemi.
E ALLORA PERCHE’ LA MALEDETTA PATCH NON L’HA SPENTO LEI ?!?!?!
Stoppo iis, reinstallo la patch che al primo tentativo mi dice picche perche’ necessita di un bel -force tra i suoi switch e tutto riparte automagicamente.
Mi sciugo il sudore, telefono ad un po’ di gente per calmarla e far fare qualche prova, tutto gira a modo. Spengo l’aggiornamento automatico e me ne vado a casa, visto che ormai sono le 19.00.
Come dice il titolo, ho perso tre anni di vita in mezz’ora, e per quest’anno direi che emozioni forti anche basta grazie.
La prima cosa che feci quando presi in mano una quarantina di server fu quela di escluderli dagli aggiornamenti del server WSUS che mieteva vittime da reboot come se fossero noccioline..
Da oggi tutto quello che si aggiorna sui server passa per una conferma a manina.. è una perdita di tempo incredibile ma tant’è..
Nel tuo caso prima di avallare gli aggiornamenti avresti potuto fare una snapshot…
Come dico sempre agli amici.. “un buon amministratore di sistema deve sempre avere un conto all’estero con almento 50.000 euro, un biglietto aereo aperto in tasca, passaporto ed una busta con 2.000 euro o dollari incollata al petto con lo scotch”.. andasse storto qualcosa..
Concordo su tutto, tranne sulla busta attaccata al petto con lo scotch: con i peli che mi ritrovo toglierla sarebbe un ENORME problema…
Boia deh che storia!
E poi Microsoft rimprovera gli utenti ed i SysAdmin che aspettano ad aggiornare il software (vedi caso virus conficker)…