Red Moon D Watch

srijeda, 30.04.2008.

Windowsi u zraku, ali ne duže od 49.7 dana

Jedna pričica iz ne tako davne prošlosti...

Koliko ludi morate biti da živote ljudi povjerite Windows Server operativnom sustavu? Koliko ludi moraju biti ljudi koji misle da je Windows Server dovoljno dobar da se upotrebljava u sustavu za kontrolu leta? Vjerujete li da u jednom takvom sustavu procedura rada zahtijeva restartanje servera svakih 30 dana kako se oni ne bi izvršili shutdown nakon 49.7 dana in order to prevent a data overload. Nepropisno utreninani administratori su zaboravili napraviti restart pa je Južna Kalifornija doživjela radio system shutown u kontroli leta koji je trajao 3 sata tijekom kojeg je 800 aviona u zraku bilo bez kontakta s kontrolom leta.

U Kaliforniji je Microsoft Windows 2000 Advanced Server u upgradeu zamijenio dotadašnje UNIX servere. Ubrzo nakon instalacije otkriven je problem pa je i uvedena tridesetodnevna procedura. Nakon ovog incidenta planira se još jedna procedura koja će dovoljno ranije upozoriti kontrolore na shutdown.

Problem je uzrokovan overflowom Microsoft tick countera i stvar je već dugo poznata. Moji certificirani MS administratori u firmi to ne znaju, ali imaju praksu restartanja naših web servera svaka tri tjedna. Baš danas je jedan od njih popizdio zato jer server nije rastartan čak 23 dana.

IZVORI:
Microsoft server crash nearly causes 800-plane pile-up
Computer Hangs After 49.7 Days
GetTickCount Function

- 13:29 - Komentari (1) - Isprintaj - #