För att få ut en bloggpost till under 2009 (det gäller att inte sätta upp ouppnåeliga mål…) så kopi^H^H^H^H inspireras jag friskt av en nystartad blogg av en viss Ashish Soni.

I datorsammanhang pratar man ofta om Mean Time Between Failure, MTBF. På enskild komponentnivå är det såklart väldigt intressant att veta MTBF för att veta förväntad livslängd på komponenten ifråga.

Men när man tittar på tjänstenivå så kanske det är mer intressant med Mean Time To Recovery, MTTR. Hur lång tid tar det för tjänsten att återställas till normal drift när väl ett problem inträffar? Kombinerat med ett SLA ger MTTR en klarare bild av vilken typ av nedtid man kan förvänta sig från en tjänst man är beroende av.

Ett SLA-åtagande på upptid på 99.9% på årsbasis säger egentligen inte mycket. Det ger utrymme för nästan 9 timmars nedtid på ett år, men man vet ingenting om hur tiden är uppdelad. Är det ett 10-minutersstopp i veckan, eller ett enda stort avbrott på en hel arbetsdag? Beroende på tjänsten kan man föredra olika modeller, men poängen är att man inte vet hur det ser ut.

Om man däremot också fick se en siffra på MTTR så får man en mycket tydligare bild av det genomsnittliga avbrottet.

Problemen med att planera för framtiden efter historiska resultat utelämnar jag passande nog från detta inlägg.