@oschmitt schrieb: Da wir aber nicht zum ersten mal bei solchen Ausfällen über die Ursache sprechen und es immer der Ausfall einer "zentralen Komponente" war, die die Störung verursacht hat, habe ich den Eindruck, dass sich anscheinend niemand gefragt hat, wie man diesen Fehler, das Fehlen einer Redundanz, man zukünftig beheben kann. Es ist reine Spekulation von mir: die DATEV hat an einer zentralen Komponente (die aus Redundanzgründen physisch mehrfach vorhanden ist) ein Firmware-Update vorgenommen. Irgendwann letzte Woche. Das lief alles glatt durch, und eine von mir vermutete Last-Simulation zeigte auch keine Auffälligkeiten. Als dann Montag und Dienstag die zentrale Komponente unter Voll-Last arbeiten musste, hat sie die Grätsche gemacht. Zu viele Anfragen, zu viel was weiß ich. Irgendwie so wird es gewesen sein. Denn nach dem Rollback auf den vorherigen Firmware-Stand scheint es ja jetzt wieder zu laufen... Ein learning könnte sein: ein Firmware-Update nicht auf 100% der betroffenen Geräte gleichzeitig installieren, sondern erst auf der Hälfte, und dann schauen, ob sich unter Normalbetrieb Auffälligkeiten zeigen oder nicht 😉
... Mehr anzeigen