Dafür krempeln wir die Ärmel hoch, und die Technik um. Aber was ist mit uns als Menschen?
Flugunfälle der zivilen Luftfahrt gehen als die großen Katastrophen der Menschheit in Nachrichten und Geschichtsbücher ein. Doch gemessen an der Anzahl erfolgreich durchgeführter Flugbewegungen (d.h. die, bei denen die Anzahl der Starts und Landungen gleich war) ist deren Erfolgsquote sehr hoch. Die Unfallquote liegt in etwa bei 3ppm, d.h. nach ca. drei von einer Million Abflügen geht etwas fundamental schief. Die IT hat leider keine Erfolgsquote von 99,999997/100 – wer macht schon nur 3 schwerwiegende Fehler in 1 Million Changes?
Ein Grund, warum wir nicht so gut sind wie die Luft- und Raumfahrt, ist die Fehlerkultur – vielmehr die nicht vorhandene Fehlerkultur! Es fängt schon beim Debriefing an: Machst Du nach jeder Maßnahme eine Nachbesprechung? War eingeplant, dass Du immer dem Kollegen aus dem Team detailliert erklärst was Du getan hast, damit er seine Meinung äußert? Wann fällt schon mal der Satz "Was, Du hast heute keine Fehler gemacht? Das kann gar nicht sein!" Und, Hand aufs Herz, wie würdest Du diese Aussage aufnehmen?
Doch genau so wird es bei den Profis der Luftfahrt, zivil und militärisch, gemacht: Man stellt selbst dar, was man falsch gemacht hat. Man präsentiert seine Fehler so, wie ein Lehrer von seiner Lebenserfahrung berichtet: Damit die Zuhörer ja denselben Fehler nicht wiederholen!
Menschen sind die hauptsächliche Fehlerquelle bei IT-Ausfällen. Seien es die Planer oder die Betreiber: Mit wachsender Komplexität steigen auch die Anforderungen an die mit dem System befassten Personen. Sich selbst immer wieder in Frage zu stellen, eigene Handlungen zu reflektieren und durch gegenseitige Unterstützung und Überwachung das Lernen aus Fehlern zu institutionalisieren: Das sind die Tugenden, die wir in uns heranzüchten sollten. Nur so können wir auf gute Verfügbarkeit jenseits der Technik kommen.
Wenn es doch mal daneben ging, sind wir dann zumindest in der Lage, zuverlässig gute Recovery Time Objectives (RTO) und Recovery Point Objectives (RPO) abzuliefern.
Danach aber bitte das Debriefing nicht vergessen!
Martin Klier
Themenverantwortlicher „Hochverfügbarkeit“
Bild von mohamed Hassan auf Pixabay


