Hier mal noch das Leid eines ITlers: Bei uns wurden heute die SIM-Karten der mIdentity-Sticks in der Früh getauscht. Danach ging nichts mehr. Wir nutzen Datev nur selten, nur zur Gehaltsabrechnung, also ist erst am Vormittag das Problem bei einer Probeabrechnung aufgefallen. Also gedacht, dass es irgendwo bei uns liegt und gesucht und gesucht, dann zum RZ-Status bei Datev geschaut, keine Fehlermeldung, also weiter gesucht. Nach knapp 5 verbratenen Stunden mit peniblem analysieren der Logdaten nochmal zum RZ-Status geschaut und da stand dann das Problem. Das ist der Teil, der mich so richtig stark ärgert: Warum gibt es eine Statusseite, die nicht aktuell ist??? Fehler können passieren, klar, und wenn ich an den absolut irrsinnigen Programmwulst denke, der nötig ist, nur um eine Gehaltsabrechnung zu machen, wird das sicher noch vom Vatikan als echtes Wunder anerkannt, dass das nicht sehr viel öfter knallt. Und wenn das bei uns Anwendern schon so überkomplex ist, wie mag das dann erst im RZ bei Datev aussehen? Meines Erachtens gibt es absolut keine Rechtfertigung für dieses Übermaß an Komplexität und Menge an Programmen, außer halt, dass es historisch gewachsen ist und sich keiner traut einen Cut zu machen. Aber das ist ja gar nicht das Thema hier, sondern wie schon geschrieben, Fehler passieren, aber was dann m. E. einfach nicht passieren darf, ist dass eine eigens zur Meldung von Fehlern eingerichtete Statusseite nicht funktioniert. Und noch zum Thema Hardwareredundanzen, weil das hier ja so oft erwähnt wird und meines Erachtens zu großen Teilen falsche Vorstellungen vorherrschen: Das bekommen fast alle hin, aber es hilft nichts, wenn die Software, die die Hardware verwaltet, eine höhere Fehlerquote erwarten lässt, als die darunterliegende Hardware. Das ist dann das berümte Storage, bei dem doppelt gespiegeltes RAID 10 gefahren wird, alle Festplatten redundant an zwei Controller angeschlossen sind, die natürlich sämtliche Komponenten (CPU/Boards/Speicher/Netzteile) redundant haben und dann hat halt die Software/Filer/Whatever, die das Storage verwaltet, ein Problem. Gleiches hier, wie ja von Datev geschrieben wurde, dass es bei deren Datenbanken hakt. Ich traue mich, ohne die RZ von Datev zu kennen, zu wetten, dass man jede Komponente von Hardware bis Software lahmlegen kann, und die Datebanken laufen weiter. Das bekommt Datev bestimmt hin. Das schafft praktisch auch jedes größere Unternehmen mit halbwegs begabter IT-Abteilung. Wenn aber Daten, also die Inhalte oder die Programme die Fehler verursachen, dann hilft das alles nichts. Man kann auch nicht einfach den Stand 1 Sekunde vor dem Ausfall wiederherstellen, weil man ja nicht weiß, was den Fehler verursacht hat und wie er entstanden ist. Also hilft nur: Analysieren, richtige Schlüsse ziehen, Fehler eliminieren, vorsichtigen Ramp-Up fahren und dann irgendwann wieder die Kommunikation zu den Systemen ermöglichen, wenn sich die verantwortlichen "sicher fühlen". Theoretisch kann es danach wieder knallen. Kann man sowas verhindern: Nein. geht nicht. Kann man Ausfallzeiten reduzieren: Klar, das geht, indem man Anwendungen und Systeme separiert (macht die Verwaltung, Hardware und Lizenzen in der Regel teurer, daher wird meist das Gegenteil davon gemacht) und wo immer möglich Komplexität reduziert. Ersteres ist eine betriebswirtschaftliche Entscheidung, von denen man kaum Unternehmen abbringen kann. Bei zweiterem vermute ich, gibt es noch extrem viel Potenzial bei Datev. ... bloß meine Meinung...
... Mehr anzeigen