Guten Morgen liebe Community, die Standortausfallübung 2023 beginnt in diesen Minuten. Hier werden wir Sie auf dem Laufenden halten. Wenn Sie Fragen haben oder Feedback abgeben möchten, können Sie gern auf diesen Beitrag antworten.
Guten Tag,
danke für das Angebot, hier Feedback zur Ausfallübung geben zu können.
Ich rege an, regelmäßig und ggfs sogar gleichzeitig zur Ausfallübung auch eine Einfallübung unter den Datev-Mitarbeitern zu veranstalten.
Während man (Gott sei Dank) evtl. vergeblich auf Ausfälle wartet, könnte man wunderbar auch Einfälle (z.B. zu Programmverbesserungen oder zur Optimierung von IT-Prozessen unter den Datev-Mitarbeitern und evtl. sogar in Kollaboration mit der Datev-Community sammeln 😎
Hallo Herr Vogtsburger,
seien Sie versichert, dass die von Ihnen angesprochenen Einfallübungen noch viel häufiger stattfinden 🙂
@Stefan_Maetz schrieb:
Aktuell ist unser Eindruck, dass die Kundenauswirkungen gering sind.
Kann ja nicht anders sein, weil die Last heute im RZ wohl nicht 1:1 mit einem Montagmorgen 8 Uhr vergleichbar ist.
Ich rege an, dass man solche Übungen auch mal im Livebetrieb mitten in der Woche testet. Am Samstag und Sonntag kann das ja jeder 😉. Wenn man bei Servern erst auf einem Stromausfall warten muss, um zu prüfen, ob das 2. Netzteil die ganze Last tragen kann, ist auch ein bisschen lame 😅.
@metalposaunist schrieb:
Kann ja nicht anders sein, weil die Last heute im RZ wohl nicht 1:1 mit einem Montagmorgen 8 Uhr vergleichbar ist.
Ich rege an, dass man solche Übungen auch mal im Livebetrieb mitten in der Woche testet. Am Samstag und Sonntag kann das ja jeder 😉. Wenn man bei Servern erst auf einem Stromausfall warten muss, um zu prüfen, ob das 2. Netzteil die ganze Last tragen kann, ist auch ein bisschen lame 😅.
Ich kann mir nicht vorstellen, dass es im Sinne unserer Mitglieder und Kunden ist, unter der Woche Übungen durchzuführen, die zu einem Totalausfall von kritischen Systemen führen könnten 🙂 Auch bei der verringerten Last am Wochenende ist es uns durchaus möglich, die richtigen Schlüsse aus den Übungsergebnissen zu ziehen.
@Stefan_Maetz schrieb:
die zu einem Totalausfall von kritischen Systemen führen könnten 🙂
Und das DATEV Marketing so: Fort Knox und 4 Standorte und alle immer synchron und mit Ihren Daten kann nichts passieren. Speichern Sie am besten jede FiBu im RZ! Da sind sie sicher.
Na gut. Dann dürfen also die Standorte nur am Samstag und Sonntag auch mal real ausfallen 😂. Und was im Sinne der Kunden und Mitglieder ist ... das lassen wir hier besser großgemacht mal außen vor 😉.
@metalposaunist schrieb:Und das DATEV Marketing so: Fort Knox und 4 Standorte und alle immer synchron und mit Ihren Daten kann nichts passieren. Speichern Sie am besten jede FiBu im RZ! Da sind sie sicher.
Na gut. Dann dürfen also die Standorte nur am Samstag und Sonntag auch mal real ausfallen 😂.
Ich versuche es nochmal zu formulieren: Eine solche Übung zu Hochlastzeiten durchzuführen, bietet uns erkenntnistechnisch keinerlei Mehrwert, weswegen es wesentlich sinnvoller ist, sie zum Beispiel an Wochenenden zu machen.
Ziel der Übung ist es zum Beispiel nicht, die Stromversorgung der RZs oder einzelner Server zu testen. Das geschieht rollierend und unabhängig. Unser Ziel für heute ist es, unsere Redundanzkonzepte im RZ-Verbund zu überprüfen und zu verbessern. Und dafür ist ein Samstag im Oktober ein idealer Zeitpunkt, weil wir dann einerseits Kundenauswirkungen gering halten können und andererseits alle Erkenntnisse bekommen, die wir benötigen.
darf man fragen, wieviel % der 'normalen' Last man heute misst ?
... und falls ja, erhält man auch eine Antwort darauf ?
Apropos "Rückschlüsse ziehen" und "Hochrechnung auf Volllast" :
... ich erinnere mich, dass man bei diversen RZ-Ausfällen oder massiven RZ-Störungen auch nichts Genaues sagen konnte. Da wurde oft von Hardware-Problemen, Datenstau etc. gemutmaßt 😉
Wie macht man denn so Übungen? 🤔
@vogtsburger schrieb:
darf man fragen, wieviel % der 'normalen' Last man heute misst ?
... und falls ja, erhält man auch eine Antwort darauf ?
Eine präzisere Antwort als "vermutlich im Vergleich sehr klein" kann ich leider nicht geben, da mir dazu tatsächlich die belastbaren Zahlen fehlen. Ich kann das im Nachgang aber gern einmal recherchieren.
Apropos "Rückschlüsse ziehen" und "Hochrechnung auf Volllast" :
... ich erinnere mich, dass man bei diversen RZ-Ausfällen oder massiven RZ-Störungen auch nichts Genaues sagen konnte. Da wurde oft von Hardware-Problemen, Datenstau etc. gemutmaßt 😉
Vielleicht machen ein paar Sätze zur Struktur der Übung die Sache generell noch etwas klarer: Nach der Abschaltung und der Wiederanschaltung des beübten RZ werden Tests durchgeführt. Im Rahmen dieser Tests wird Last auf den Systemen erzeugt, wenn das der Erkenntnis dienlich ist.
Ein funktionierendes Redundanzkonzept, also ob ausgefallene Ressourcen automatisch durch andere RZs aufgefangen werden, ist unabhängig von der jeweiligen Lastsituation wichtig.
Was Aussagen zu Störungsursachen angeht: Wann immer es uns möglich ist, machen wir möglichst präzise Angaben oder versuchen das im Nachgang nachzuholen. Oft ist eine Ursache aber nicht gleich klar erkennbar und aufgrund der Komplexität der Systeme kann es auch mal mehrere Wochen dauern, bis belastbare Ergebnisse vorliegen. Bei umfangreichen Störungen wie zum Beispiel dem IT-Notfall im November 2021 machen wir unsere Ursachenforschung dann auch noch später publik.
... obwohl vermutlich hohe rechnerische Last 'nahe an der Realität' generiert bzw. simuliert werden kann, ist es sicher nicht das Gleiche als sich im Normalbetrieb auf den letzten paar Prozent der Volllast zu 'quälen'.
Man weiß ja aus eigener Erfahrung, dass manche Prozesse das System quasi zum Stillstand bringen können, weil sie z.B. die CPU zu 100% belasten.
Apropos Prozent:
ich gebe mal eine Schätzung ab, zu wieviel Prozent das RZ heute im Vergleich zu 'normalen' Arbeitstagen ausgelastet ist :
High
meine Schätzung 4,56 %
4,711%
Gruss Mike
Ich kann mir nicht vorstellen, dass es im Sinne unserer Mitglieder und Kunden ist, unter der Woche Übungen durchzuführen, die zu einem Totalausfall von kritischen Systemen führen könnten 🙂 Auch bei der verringerten
Last am Wochenende ist es uns durchaus möglich, die richtigen Schlüsse aus den Übungsergebnissen zu ziehen.
Vermutlich wären wir hier in der community die ersten - vermutlich auch @metalposaunist - die hier meckern würden wie kann man nur eine solche Übung unter der Woche im Volllastbetrieb durchführen, weil das Risiko das wirklich etwas nicht funktioniert wäre viel zu groß´. Ich selbst würde auch sagen für ein ggf. nicht funktionierendes RZ soll ich meine Gebühren 30 oder 31 Tage im Monat bezahlen ?
Daher ist das aus meiner Sicht völlig ok das an einem Sa der auch nicht direkt vor dem 10., dem Monatsende oder einer anderen Deadline liegt.
Hallo, für mich ist es vollkommen irrelevant, was, wann, wie, in welchem Umfang nicht verfügbar ist. Gerade auch deswegen wurde diese "Übung" auch rechtzeitig angekündigt und normalerweise kein Prozent in diesem Zeitfenster aktiv arbeitet.
Es ist genauso gut richtig und genau so gemacht, wie es sein sollte !
Für alle die immer was auszusetzen haben: Macht halt ! (sonst keine Hobbies...?)
... für mich ist es absolut relevant, was, wann, wie, in welchem Umfang etwas in einem hochsicheren RZ verfügbar ist
... man sieht, wie weit die Meinungen auseinander gehen können ---> wie im 'richtigen', deutschen Föderalismus mit den Bundesländern im Norden, Süden, Osten und Westen.
... mit gewissen regionalen Tendenzen bei der Wortwahl 😎
Der 'Spaß' hört meist schlagartig auf, wenn man selbst von einem Ausfall betroffen ist.
Dann zeigt sich schnell, wie tolerant man ist
Mit PeerToPeer (OnPremises) macht man sich sehr wahrscheinlich nicht so viel Sorgen über die Verfügbarkeit des RZ als mit ASP oder SmartIT
Mit PeerToPeer (OnPremises) macht man sich sehr wahrscheinlich nicht so viel Sorgen über die Verfügbarkeit des RZ als mit ASP oder SmartIT
Ohne Belege online oder meine Steuern kannst du heute wahrscheinlich als digitale Kanzlei nicht mehr arbeiten.
@bodensee schrieb:
Vermutlich wären wir hier in der community die ersten - vermutlich auch @metalposaunist - die hier meckern würden wie kann man nur eine solche Übung unter der Woche im Volllastbetrieb durchführen
Dann meckere ich über meinen eigenen Vorschlag? 😅 OK? Also ich mache das prinzipiell nicht. Wer die Suppe bestellt, muss sie auch auslöffeln. Alles eine Frage der Kommunikation 😉.
@theo: Korrekt. Ohne RZ geht heute so oder so nichts mehr. Ob asp oder on-premises - vollkommen egal. LODAS ohne RZ will ich sehen 😂.
Aber nach @Stefan_Maetz ist ja alles easy 👍. Das RZ fällt nicht aus, weil man alle Erkenntnisse gesammelt hat. Freuen wir uns auf einen störungsfreien Betrieb und auf die Ursache, wenn das RZ dann doch mal ausfallen sollte. Dann ist‘s eh etwas, was man beim Test gestern nicht auf dem Schirm hatte.
Hallo, für mich ist es vollkommen irrelevant, was, wann, wie, in welchem Umfang nicht verfügbar ist. Gerade auch deswegen wurde diese "Übung" auch rechtzeitig angekündigt und normalerweise kein Prozent in diesem Zeitfenster aktiv arbeitet.
Sie interpretieren m.E. mal wieder etwas zu viel in meine Aussage. Es ging hier doch ausschließlich um die Standortausfallübung, die rechtzeitig angekündigt war, aber immer wieder jemand meint, er müsse grundsätzlich etwas auszusetzen haben.
Selbst wenn die Übung am ersten auf den zweiten Weihnachtsfeiertag in der Nacht erfolgt, wird es Anwender geben, denen dies nicht passt. Man muss doch solche Übungen durchführen; diese dienen doch letztlich Allen.
Wenn wir annähernd alle Buchführungen via UO, BO & Co. bearbeiten und auch bei JA einen Belegzugriff benötigen sowie Meine Steuern intensiv genutzt wird, spielt es wohl auch für einen P2Pler eine große Rolle, dass die Systeme und der Zugriff zuverlässig läuft.
Insofern empfinde ich auch jegliche Süffisanz etwas unangebracht. Wie gesagt, geht in diesem Thread um die Standortausfallübung....
... ca suffit maintenant avec la suffisance ... 😎😅
... seien wir doch alle froh, dass die Standortausfallübung anscheinend erfolgreich war ...
... dass also die geplante 'Insuffizienz' des Datev-RZ nicht zum RZ-Stillstand geführt hat
Mit eigenen Servern mache ich gelegentlich (nach einer Komplettsicherung) auch 'Ausfallübungen', indem ich z.B. die Strom-Sicherung ausknipse, um zu testen, wie lange die USV durchhält und ob der Server korrekt herunter- und wieder korrekt hochfährt.
... ist natürlich 'Pipifax' gegenüber der Komplexität in einem RZ
@Stefan_Maetz schrieb:die Standortausfallübung 2023 beginnt in diesen Minuten. Hier werden wir Sie auf dem Laufenden halten. Wenn Sie Fragen haben oder Feedback abgeben möchten, können Sie gern auf diesen Beitrag antworten.
Ich bin Fan. Wenn ich Wörter wie "Standortausfallübung" nur lese, kommt bei mir das wohlige Gruseln der Achtzigerjahre zurück, und ich fange an, meine Taschenlampen zu laden.
Ich sage nur: Reforger. 😍
https://de.wikipedia.org/wiki/Return_of_Forces_to_Germany
Weitermachen!