Synology NAS – Wie man den Defekt einer Festplatte bemerkt

Im Laufe der Zeit kommt es bei Festplatten zu Ausfällen. Manche sterben schon kurz nach dem Kauf, das sogenannte Montags-Modell und wieder andere halten wenigstens bis zum Garantieende durch, was auch wieder schlecht für Sie ist, wenn diese kurz nach Ablauf der Garantie kaputt gehen.

Was sind die Anzeichen für einen bevorstehenden Ausfall einer Festplatte in Ihrer Synology NAS?

Festplatte geöffnet. Schwenkarm mit Lesekopf knapp über dem Platter (Scheibe)
Festplatte geöffnet. Schwenkarm mit Lesekopf knapp über dem Platter (Scheibe)

Auffälligkeiten der Hardware

  1. Sie hören eine Ihrer Festplatten deutlicher als sonst. Sie wird lauter.
  2. Klick- und Klackergeräusche sind auch sehr verdächtig und sollten Sie hellhörig werden lassen.
  3. Die HDD LED’s der Synology NAS verhalten sich auffällig. In Kombination mit dem nicht reagieren der DSM Oberfläche oder bei einer deutlich wahrnehmbaren Trägheit, sollte man dies prüfen. Schauen Sie sich die HDD LED’s gut an. Was sehen sie? In den meisten Fällen sind die gesunden Platten am Dauerleuchten und die Defekte blinkt alleine wie verrückt. Gerade wenn Sie ein RAID (0,1,5,6,10 oder SHRI, SHRII) betreiben, sollten Sie immer bedenken, dass dies nicht normal ist, da bei einem RAID Verbund immer ALLE Platten Lesen, als auch Schreiben müssen. Da das hier aber eindeutig nicht der Fall ist, sehen sie anhand der einzelnen Platte auch direkt, welche voraussichtlich auch kaputt ist. Wie praktisch!

Auffälligkeiten der Software/DSM

  1. Wenn Sie Modell-gleiche Festplatten im System verbaut haben, ist es zudem einen Blick Wert wie warm jede einzelne Platte wird. Auffällig wäre es auch, wenn eine deutlich aus der Reihe tanzt und 5+ C° mehr hat als alle anderen.
  2. Ihre NAS wird träge! Warum? Meistens geht das mit fehlerhaften Sektoren einher. Wenn versucht wird auf defekte Bereiche zuzugreifen, versucht die Platte, den Sektor erneut zu lesen. Das wird ein paar Mal versucht bis dieser letztendlich als Offline_Uncorrectable markiert wird. Bedeutet soviel wie, das der Sektor nicht wiederhergestellt werden kann und somit zerstört/unbenutzbar ist.
  3. Kopier- oder Schreibvorgänge brechen ab oder haken hin und wieder.
  4. Auch ein BSOD des Clients beim Kopieren/Löschen ist keine Seltenheit.
  5. Auftretende Datei CRC-Fehler(Cyclic Redundancy Checksum).
  6. Sie können sich nicht mehr in das DSM einloggen! Ich hatte den Fall auch schon. Ich habe 5 Minuten warten müssen, bis ich alleine mal den Login zu sehen bekam. Eine Anmeldung war gänzlich unmöglich. Ich habe nach 20 Minuten aufgegeben.
  7. Nach dem Login im DSM erhalten sie die Warnung, dass das Volume fehlerhaft/abgestürzt ist was ein Indiz für den bevorstehenden Tod einer der Festplatten sein kann. Sie könnten die aus dem Verbund rausgeworfene Platte zwar meist wieder hinzufügen, jedoch sollten sie unbedingt herausfinden, warum diese ausgeworfen wurde. Schauen Sie sich die S.M.A.R.T. Werte sehr gut an! Es kann jedoch auch daran liegen, dass lediglich die Platte nicht zu 100% richtig im Slot steckt oder die Kontakte eventuell verschmutzt sind. Eine fehlerhafte Festplatte wird zudem immer im Speicher-Manager angezeigt als nicht zugeordnet. Verwechseln sie das bitte nicht mit den Hot Spare Platten, denn diese sind auch solange nicht zugeordnet wie alles läuft. Erst bei einem Ausfall würden diese automatisch zur Wiederherstellung genutzt.

Wie sie sehen haben sie genug Möglichkeiten herauszufinden, welche Platte in welchem Slot defekt ist. Schwierig wird es meist nur dann, wenn sie sich nicht mehr im DSM anmelden können. Ein Festplattenausfall führt nämlich nicht automatisch zu dem Auswurf der Platte aus dem Speicherpool, was dann auch dazu führen würde dass das DSM wieder “normal” funktionieren würde. Daher Obacht! Fehlerhafte Sektoren würde diese unter Umständen nämlich nur richtig träge machen.

In meinem speziellen Fall habe ich 4 Platten je 3TB in einem RAID 5. Ich habe also die Ausfallsicherheit einer Festplatte.

Wie geht man denn jetzt am besten vor, wenn eine Anmeldung in der DSM Oberfläche nicht mehr funktioniert und man somit auch nicht mehr nach gucken kann, was genau das Problem ist?

Das ist nicht so einfach, da wenn Sie falsch vorgehen ist Ihr gesamtes RAID 5 kaputt und auch alle Daten wären dann futsch. Wenn Sie beispielsweise eine gesunde Platte ausbauen würden und dann das System starten würden, liegt die Wahrscheinlichkeit eines Totalausfalls bei 99%, da maximal nur eine Platte ausfallen darf.

Meine Herangehensweise:

Fahren Sie die Synology NAS herunter. In wenigen Fällen können sie das aber gar nicht mehr, da diese einfach nicht reagiert wegen dem Defekt der Platte. Wenn das der Fall bei Ihnen ist, bleibt Ihnen nur die Holzhammer Methode und sie müssen den Netzstecker ziehen.

Ziehen Sie nun die auffällige Platte aus dem Schacht heraus. Entfernen Sie den Rahmen und bauen sie diese Platte temporär in einen Rechner ein. Praktisch wäre, wenn Sie einen Festplatten Wechselrahmen in Ihrem PC verbaut haben.

Vorweg: Ändern Sie nichts an den Partitionen und schreiben Sie auch keine Daten auf die Platte!

Schnappen Sie sich ein S.M.A.R.T.-Tool. Entweder benutzen Sie dafür CrystalDiskInfo unter Windows oder Gsmartcontrol (Über die Anwendungsverwaltung installieren) unter Linux.

CrystalDiskInfo wird sie durch einen Warnton darauf hinweisen, das mit der Platte etwas nicht stimmt.

Auf welche Werte sollten Sie achten (Die wichtigsten! Es gibt noch mehr.)?

  1. Pending Sectors
  2. Offline_Uncorrectable
  3. Relocated Sectors

Sollten die RAW Werte (HEX Werte) nicht 0 sein, so haben Sie die richtige Platte zwischen!

S.M.A.R.T. Werte einer Festplatte
S.M.A.R.T. Werte einer Festplatte mit fehlerhaften Sektoren. In diesem Beispiel ist der Grenzbereich erreicht und ein Arbeiten mit der Festplatte nicht mehr möglich! Ein zusätzliches Klickgeräusch verfeinert das Ableben der Platte.

Meine hatte ~20000 kaputte Sektoren. Totalschaden!

In seltenen Fällen ist selbst das Auslesen der S.M.A.R.T. Werte nicht mehr möglich. Wenn das der Fall ist, so haben Sie jedenfalls die richtige Platte! Das Auslesen von defekten Festplatten dauert meist auch deutlich länger als bei gesunden Platten.

Hier beginnt der schmale Grat!

Sie können die Synology NAS in einem RAID 5 auch ohne die defekte Platte hochfahren. Natürlich werden Sie dann die Meldung erhalten, dass das Volume degraded ist. Klar, es fehlt eine Platte. Was sie sich vor Augen halten müssen ist, dass wenn noch eine weitere Platte ausfällt, ALLE ihre Daten unwiderruflich weg sind. Da sie so oder so eine neue Platte besorgen müssen um die Defekte zu ersetzen, obliegt es Ihnen, wie sie bis zum Eintreffen agieren. Ich würde das System aber schonen und keine wilden Kopierorgien starten! Und am besten lassen Sie die Kiste einfach solange ausgeschaltet.

Als kleine Randnotiz möchte ich aber noch anmerken, das wichtige Daten immer in doppelter Ausführung vorzuliegen haben!

Wie kann man sich schützen um vor dem Ausfall der Platte noch reagieren zu können?

Das DSM bietet die Möglichkeit an, regelmäßige S.M.A.R.T. Tests durchführen zu lassen. Über den Speichermanager, können sie bei HDD/SSD, im Register “Test Planer”, eine zeitlich gesteuerte Überprüfung durchführen lassen. Sie können dabei den Schnelltest oder den Erweiterten Test verwenden oder auch beides. Auch ist eine E-Mail Benachrichtigung möglich bei schwerwiegenden oder kritischen Fehlern. Diese stellen Sie über die Systemsteuerung im Unterpunkt: “Benachrichtigung” ein. Eine fehlerhafte Festplatte wäre jedenfalls ein kritischer Fehler, der eine Benachrichtigung nach sich ziehen würde.

So wirklich gut funktioniert das allerdings nicht. Ich hatte selber schon den Fall, das eine Platte über 7000 kaputte Sektoren hatte, aber der S.M.A.R.T. Test und das DSM immer noch OK angezeigt haben. So wirklich verlass scheint darauf also auch nicht zu sein. Vielleicht war das auch nur ein Bug des DSM’s. Ich weiß es nicht. Ich hatte dies damals auch nur durch Zufall bemerkt. Am sichersten fahren Sie immer noch, wenn Sie selber regelmäßig die S.M.A.R.T. Werte überwachen und sich nicht blind auf die Benachrichtigung verlassen.

Zum Anfang!

7 Antworten auf „Synology NAS – Wie man den Defekt einer Festplatte bemerkt“

  1. Hallo,
    interessanter Beitrag. Ich habe die gleiche Synology Konstellation 4 x 3 TB in Raid 5. Mich irritiert zur Zeit folgendes: auf der Synology werden mir keine Fehler angezeigt; ich habe die Synology jedoch auch in Home Assistant eingebunden und da werden jede Menge unterschiedlicher Daten über Sensoren ausgelesen. Da kriege ich auf allen Platten entweder den Hinweis “Exeeded Max Bad Sectors” oder auch “Below Minimum Remaining Life”. Mich verwundert das sehr, da ich erst vor kurzem eine fehlerhafte Platte ausgetauscht habe und bei dieser Platte auch die gleiche Fehlermeldung erhalte.
    Was sollte ich da am besten machen??
    Gruß,
    Herbert

    1. Im Speichermanager werden dir unter HDD/SSD => Betroffenes Laufwerk auswählen und auf Integritätsstatus klicken, keine Fehler angezeigt? Stehen dort sämtliche Zähler noch auf 0? Bis auf die Betriebsstunden und Temperatur versteht sich. Verlasse dich nicht auf den Text: “In Ordnung” oder auf die Grüne Schrift. Bis sich das mal rot einfärbt ist meistens schon der Super-GAU eingetreten. 😀

  2. Danke für den Hinweis; habe es überprüft: alle Platten stehen noch auf NULL. Dann brauche ich also nichts zu machen? Eigenartig, dass die Sensoren in Home Assistant etwas anderes anzeigen.

    1. Beim NAS scheint ja dann alles okay zu sein.

      Nun, es ist in der Tat merkwürdig, woher die Home Assistant Software die Daten nimmt. Laut der Meldung sind ja angeblich schon eine kritische Anzahl an fehlerhaften Sektoren aufgetreten… Nur, wo bitteschön? Dein NAS kann es nicht sein, denn du hast dich ja davon selbst überzeugt das alle Platten nach wie vor bei 0 stehen. Meint der vielleicht doch einen anderen Rechner/System bei dir? Ich kenne die Home Assistant Software und dein privates Konstrukt aber auch nicht. Aber wenn du schon so eine App benutzt, dann hast du doch bestimmt alle Geräte dort eingebunden oder nur das NAS? Dann wird es wohl eines der anderen Geräte sein.

      Zeigt Dir die App denn explizit an, dass das NAS das Problem ist oder vermutest du das nur, weil du das keinem Gerät zuordnen kannst?

  3. Die Einbindung der Synology in Home Assistent ist eindeutig und erfolgt über die entsprechenden login Daten. Bei meinem NAS werden dann über 40 Sensoren angezeigt, die auch ansonsten alle stimmen: Temperatur, Auslastung etc. pro Platte.
    Die Daten kommen also von der Synology, Frage ist nur, wer die entsprechenden Schwellwerte definiert hat? Schreibt Synology da etwas vor was bad sector etc angeht?

    1. Synology schreibt da gar nichts vor. Die Schwellenwerte für die Festplatten setzt der jeweilige Festplattenhersteller. Die Schwellenwerte interessieren normalerweise aber auch erst mal nicht, denn die Rohdaten sind die eigentlich wichtigen Daten. Sonst musst du Dir wirklich mal die S.M.A.R.T. Werte jeder einzelne Platte im Detail ansehen.

      Steht bei irgendeiner Platte bei Offline_Uncorrectable Sectors, Rellocated Sectors, Pending Sectors ein Rohdatenwert größer als 0? Wenn ja, dann stimmt die Sensormeldung und die Platte segnet wirklich bald das Zeitliche. Frag mich nicht, warum dann die Übersicht keine Mängel anzeigt. Das müsstest du dann Synology fragen.

      Das die Laufzeit einer Platte bemängelt wird kann man ignorieren, wenn es sich um eine HDD handelt und NICHT um eine SSD! Es gibt Platten die erreichen den Laufzeitschwellenwert, halten aber noch Jahre. Viel wichtiger ist die Meldung bezüglich der Sektoren.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.