Liebe Community,
ich würde gerne manchmal oder öfter oder automatisiert und regelmäßig die "Hardwaregesundheit" der Arbeitsplätze, vor allem der Festplatten checken, da ein Festplatten-"Kollaps" oder "-Infarkt" oder "-Schlaganfall" so ziemlich das "Hässlichste" ist, was ich mir im Kanzlei-Alltag vorstellen kann.
Ich weiß, dass es diverse Festplatten- und System-Tools gibt, die solche Checks durchführen, aber mir wären eigentlich "Bordmittel" des Windows-Betriebssystems lieber, da sie überall und zu jeder Tages- und Nachtzeit zur Verfügung stünden.
Falls es keine geeigneten Bordmittel gibt, die man ad hoc starten kann, wären mir natürlich auch frei zugängliche, bewährte Tools recht, z.B aus SYSINTERNALS oder ähnlichen Quellen
Gibt es solche Bordmittel ?
Lassen sich solche Checks auch "planen" und komfortabel auswerten (für ein individuelles Monitoring) ?
Desto näher wir an "automatisiert" und "komfortabel" rücken:
Zabbix, CheckMK, Nagios, Icinga, PRTG, ... bieten sowas alles / können sowas abbilden. Alternativ halt bei Servereye, Datto, Ninja, <RMM Anbieter der Wahl> einkaufen / einmieten.
@janm ,
die genannten Tools und Anbieter bieten Monitoring/Überwachung komplexer Netzwerk-Infrastrukturen an.
Mir ist im Moment aber eigentlich das Hemd näher als die Hose und es geht mir mehr um einzelne Arbeitsplätze, die z.B. manchmal oder aktuell gerade "herumzicken" und bei denen man evtl. Angst vor einem bevorstehenden Festplattencrash hat.
Ich erinnere mich an das Tool "CrystalDiskInfo".
Das Tool bietet jedenfalls jede Menge an Informationen.
Könnte man sich zur Not schon auf das "Urteil" und auf diese Ergebnisse dieses Tools verlassen, um Rückschlüsse auf die Gesundheit und die voraussichtliche Lebensdauer der Festplatte zu ziehen ?
Bei "CHKDSK" erinnere ich mich an mehrere Pannen bzw. an missglückte Reparaturversuche. Auf einem Windows Fileserver würde ich es, ehrlich gesagt', nicht riskieren, "chkdsk /f" anzuwenden
@Fassungsloser schrieb:
Gibt es solche Bordmittel ?
Das cmdlet Get-StorageReliabilityCounter kann erste Anhaltspunkte liefern.
@Fassungsloser schrieb:Bei "CHKDSK" erinnere ich mich an mehrere Pannen bzw. an missglückte Reparaturversuche. Auf einem Windows Fileserver würde ich es, ehrlich gesagt', nicht riskieren, "chkdsk /f" anzuwenden
Ja schon, aber es wurde ja nach Bordmitteln gefragt. Das ist das Einzige. Alles andere sind externe Tools.
Moin Moin,
sprechen Sie von einem Server oder einer sagen wir einzelnen Festplatte?
Bei einem Server sollte die Firmware Auskunft bieten (bei HP beispielsweise ilo).
Bei einer PC-oder externen oder sonst nicht im Verbund stehenden Festplatte hilft gssmartcontrol.. Das Tool liest die SMart-Werte der Festplatte aus. In wieweit das für SSDs funktioniert weiß ich ehrlich gesagt nicht. Für HDDs zumindest liebe ich das Tool.
2 Werte sind da vor allem wichtig:
- Reallocated Sector count (also wieviele Sektoren der Festplatte ausgefallen sind)
- und Spin up Time (also, wie lange die Festplatte brauchte, um hochzufahren).
Wenn bei Reallocated Sector count sich etwas ändert, heißt es aufpassen.
Es kann auch bei neuen Festplatten passieren, dass 2-3 Sektoren ausfallen und die nächsten 5 Jahre ist Ruhe. Nur wenn Sektoren ausfallen, dann unbedingt beobachten, fallen weitere danach auch aus. Wenn ja, heißt es die Daten sichern und die Festplatte ersetzen.
Spin up Time bedeutet, wie schnell die Festplatte hochfährt. Solange der Wert sicheng um einen Mittelwert bewegt ist alles gut. Beginnt sich der Wert aber zu erhöhen (Raw value) bzw. der Normed-Value zu erniedrigen, ist das ein Hinweis, dass die Mechanik langsam ein Problem bekommt. D.h. dann ebenfalls austauschen.
Die ganzen anderen Werte können auch Hinweise geben, nach meiner Erfahrung aber sind diese Werte nicht aussagekräftig über den Zustand der Festplatte. Nur über das Alter.
Ich habe ein HDD mit 100.000 Betriebsstunden gehabt, bei denen halt nur die Smartwert für das Alter anwuchsen.
Ich habe diese Platte nach den 100.000 Betriebsstunden trotzdem außer Betrieb genommen, einfach weil sie so lange durchhielt. Reine Vorsicht. Die normale Lebensdauer einer HDD sollte 4-5 Jahre sein. Neue Festplatten allerdings können vermehrt in den ersten grob 6 Monaten ausfallen. Danach sinkt das Risiko.
Bei Serverfestplatten, die auf 24/7 ausgelegt sind, darf man längere Durchhaltezeiten erwarten. Da diese auch meist im RAID 5 oder ähnlich betrieben werden, bleibt i.d.R. nach Ausfall einer Festplatte immer noch etwas Zeit, diese zu ersetzen ohne Datenverlust.
GSsmartcontrol funktioniert nicht bei Servern. Dafür liefert die Firmware der Server entsprechende Daten.
Wie man die anderen Smart-Werte einschätzen soll, ist Erfahrung. Obwohl, wenn sich ein wert, im Laufe relativ kurzer Zeit stärker ändert, ist es meist schon ein Alarmzeichen.
Bei SSDs ist das anders. Da habe ich beiher nicht genug Erfahrung sammeln können. Immerhin scheint mir, mit 5 Jahren ohne Ausfall kann man wohl rechnen.
Tipp, der von Auswertungen von Google Rechenzentren bestätigt wurde: Je kühler eine Festplatte im Betreib bleibt, desto länger hält sie durch.
HTH
QJ