RAID5 herabgestuft, Festplatte wird nicht ins RAID aufgenommen

  • Hallo zusammen,



    ich habe ein TS-653A mit zwei Speicherpools am Laufen. Raid1 (SSD 1&6), Sowie RAID5 (HDD2-5). Das Raid5 macht aktuell Probleme. Zwei der Platten (HDD3,HDD4) standen aufgrund der SMART Werte auf Warning. Daraufhin habe ich zwei neue Platten bestellt.

    Im Laufenden Betrieb habe ich dann Festplatte 3 entfernt, kurz gewartet und die neue wieder eingesetzt. Raid wurde herabgestuft, ein Rebuild fand jedoch nicht statt. Nach einiger Wartezeit habe ich das NAS neu gestartet. Jetzt ist das Raid immer noch herabgestuft und die Platte wird in der GUI als "Kein Mitglied angezeigt".

    Ich habe schon einiges versucht, leider ohne Erfolg.

    - Unzählige Neustarts

    - Alle Partitionen auf der neuen Platte gelöscht

    - die zweite neu gekaufte Platte eingesetzt - auch ohne Erfolg.


    Die neuen Platten sind 4TB Seagate IronWolf NAS Platten

    Anbei einige Daten vom Script (IP Konfigurationen habe ich entfernt).

    Habt ihr eine Idee was ich noch machen kann?
    Gerne auch CLI Befehle, bin mit Unix nicht auf Kriegsfuß.


    Danke schonmal vorab!


    Viele Grüße

    MoeJoe


  • Bei 2 defekten Platten wird das mit den Rebuild aber nix, ein RAID5 kann nur eine defekte Platte ersetzen, nicht 2 also kommen die Backups ins Spiel.

  • Code
    ...
    Level:          raid5
    ...
    Status:         ONLINE (md1) [U__U]
    ...

    Das ist normalerweise das Ende eines Raid5 (2 Platten weg).

    Evtl. könnte man versuchen mit mdadm -a  und den devices sdb, sdc und sdd versuchen das Raid wiederherzustellen.

    Ein Backup ist vorhanden?


    Gruss

  • Danke für die schnelle Antwort!

    Backup ist da, 8TB Daten will ich nur ungern wieder zurücksichern.

    Die Festplatten sind noch in Ordnung, lediglich SMART Werte waren auf Warning. Das heißt nicht zwingend dass die Platte morgen kaputt geht.

    Die Daten sind auch noch da, das RAID ist derzeit auf "herabgestuft", nicht auf "Fehler".


    Evtl. könnte man versuchen mit mdadm -a und den devices sdb, sdc und sdd versuchen das Raid wiederherzustellen.

    Fraglich ist nur welches die vierte Platte ist?


    Hier noch in Paar Screenshot
    pasted-from-clipboard.png
    pasted-from-clipboard.png

    Datenträger 3 ist getauscht, Datensträger 4 hat noch die SMART Wert auf Warning und muss anschließend getauscht werden
    pasted-from-clipboard.png

    pasted-from-clipboard.png
    pasted-from-clipboard.png

    Einmal editiert, zuletzt von moejoe () aus folgendem Grund: Ein Beitrag von moejoe mit diesem Beitrag zusammengefügt.

  • Welche SMART Werte sind es denn? 2 Platten mit uncrorectable Sectors und das RAID ist hin.


    Aber wenn es unwichtige SMART Werte wären, dann würde der Rebuild ja starten.

  • Anbei der Screenshot

    pasted-from-clipboard.png
    Das RAID ist nicht hin - seit der ersten Meldung und dem Einbau sind 3 Wochen vergangen. Das RAID war in der Zeit weder herabgestuft noch auf Warning (mehrere Neustarts zwischendurch waren problemlos möglich).

    Das einzige Problem das ich aktuell habe, ist dass die Platte 3 nicht erkannt wird (siehe Screenshot). Fraglich ist lediglich wie ich die Platte wieder aufnehmen kann, sodass der Rebuild starten kann.

    Würde ich die Platte 4 raus nehmen wäre das RAID hin ;)

  • Sorry ich kann mich da nur wiederholen, dein Screenshot (immer noch nicht von den eigentlichen SMART Werten) zeigt ID198, der Rebuild wird nicht starten

  • Okay, wie kannst du dir das erklären, dass die Festplatte 3 nicht im Raid Verbund ist, auch kann ich mit der Fesplatte keinen neuen Speicherpool erstellen!?

    Die Platte ist neu, wurde geprüft über das QNAP NAS (Datenträgerprüfung), dennoch kann ich diese nirgends einbinden.

    Das hat aus meiner Sicht nichts mit SMART Werten zu tun.

  • Das Script auf dem QNAP was normalerweise die Platte erkennt und dann den md Befehl zum Einbau ins RAID ausführt, erkennt das eine Situation vorliegt in der das RAID Rebuild scheitern würde und führt das Kommando nicht aus.

  • Das ist wirklich komisch!
    S.M.A.R.T. - Werte dienen ja erst einmal nur zur Information. Defekte Sektoren sind erst einmal auch nicht schlimm, HDDs haben Ausweichsektoren.

    Ein Entfernen 2er Platten bei RAID-5 sollte keinen Zusammenbruch darstellen. QNAP nutzt ein softwaregestütztes RAID, selbst hier sollte ein Rebuild möglich sein.

    Bei Migration der HDDs von einem zum anderen NAS braucht es nicht einmal eine Konfiguration, das RAID wird sofort erkannt.

    Anders als bei reinen Hardware-RAIDs vom Controller gesteuert. Da ist ja schon Ende, wenn im abgeschalteten Zustand der Erhaltungs-Akku leer geht.


    Hast Du schon einmal "Raid Gruppe neu Aufbauen" ausprobiert? Ich bin mir jetzt nicht sicher, ob er den Verbund löst. Aber dann müsste ja eine Warnung kommen...

  • Mod: Zitat ohne Quellenangabe ... korrigiert! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen

    S.M.A.R.T. - Werte dienen ja erst einmal nur zur Information. Defekte Sektoren sind erst einmal auch nicht schlimm, HDDs haben Ausweichsektoren.

    Danke du sprichst mir aus der Seele :)




    RAID Gruppe neu aufbauen verlangt zwei neue Datenträger. Soweit ich das verstanden habe wäre dies wenn ich aus einen RAID5 ein RAID 6/RAID60/whatever machen würde. Ich bin mir nicht sicher ob ich externe Links teilen darf. Wenn man nach den Stichworten "raid mdadm qnap" googelt, dann kommt man auf eine PDF welche ähnliches erklärt, allerdings bin ich mir nicht sicher wie bei mir der korrekte Befehl lauten würde.

    Im Beispiel ist folgendes erklärt.


    Mod: Zitat ohne Quellenangabe ... bitte nachreichen, ansonsten wird das Zitat gelöscht! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen

    Mod: Zitat ohne Quellenangabe ... gelöscht! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen

    Bei mir handelt es sich jedoch nicht um die erste Platte die nicht korrekt erkannt wird, sondern um die dritte.

  • Mal eine ganz dumme Frage: Wenn Du beide "defekte" Platten wieder einsetzt, startet dann das Rebuild?

    Also die bekannten Datenträger mit den schlechten Smart Werten.

  • ...Ein Entfernen 2er Platten bei RAID-5 sollte keinen Zusammenbruch darstellen...

    Nein? Dann würde das allen anderen Angaben (und Erfahrungen) widersprechen.

    Natürlich ist bei Raid5 der Ausfall zweier Platten der GAU.


    Gruss


    moejoe : sieh mal, ob Du in /mnt/HDA_Root eine Zuordnung von Platten zu devices findest.

  • Wie jetzt? Du hast beide gemeldete Platten aus dem Raid?

    Dann war es das.

    Ich hatte es so verstanden, das Du versucht hast, mit beiden neuen eine der gemeldeten zu ersetzen.


    Gruss

  • moejoe : sieh mal, ob Du in /mnt/HDA_Root eine Zuordnung von Platten zu devices findest.

    sorry, kenn mich im QNAP Filesystem nicht so gut aus aber im kmesq habe ich dieses interessante log gefunden, schaut so als ob rebuild complete wäre, an der UI kommt das jedoch nicht an.

    /mnt/HDA_ROOT/.logs/kmsg


    Oder was genau wollt ihr sehen?
    pasted-from-clipboard.png


    Mod: Unnötiges Volltext-/Direktzitat gekürzt! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen

    Wie jetzt? Du hast beide gemeldete Platten aus dem Raid?

    Nein, ich teste derzeit nur mit dem SLOT3, SLOT4 wird nicht angefasst.

    Mir ist klar, dass sobald die zweite Platte ausfällt alles weg ist.

    Einmal editiert, zuletzt von moejoe () aus folgendem Grund: Ein Beitrag von moejoe mit diesem Beitrag zusammengefügt.

  • Nein? Dann würde das allen anderen Angaben (und Erfahrungen) widersprechen.

    Natürlich ist bei Raid5 der Ausfall zweier Platten der GAU.

    Mod: Zitat ohne Quellenangabe ... korrigiert! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen

    Ein NAS arbeitet mit einem Linux Software RAID.

    Sofern kein Hardwareschaden vorliegt, ist das RAID i.d.r. nur out-of-sync, und das kann man oftmals mit ein paar befehlen auf der Kommandozeile wieder hinbekommen.


    Habe ich aus einem anderen Forum kopiert. Es gibt Beiträge ein RAID 5 mit 2 gezogenen Platten wieder hin zu bekommen.


    Ich habe es an meinem alten NAS im Vollbetrieb zum "Spaß" ausprobiert. Rebuild war ohne Eingabe erfolgreich. Zum Zeitpunkt des Ausfalls wurden aber keine Daten von mir verändert.

    Einmal editiert, zuletzt von costa83 ()

  • schaut so als ob rebuild complete wäre,

    Das sind die Spanning RAID1 md9 und md13, die kann man auch noch mit nur einer funktionierenden Platte wiederherstellen. Da sind aber keine Userdaten drauf.

    Vollbetrieb zum "Spaß" ausprobiert

    2 Platten auf nem RAID5 gezogen neue/leere Platten* eingeschoben und die Daten wurden wiederhergestellt ? .. Definitiv die Ghostbusters rufen .. da ist Magie im Spiel.


    *Die gleichen Platten mit dem gleichen Eventcount einschieben ist nicht das Gleiche wie ein Rebuild auf neue Platten.

    Einmal editiert, zuletzt von dolbyman ()

  • 2 Platten auf nem RAID5 gezogen neue/leere Platten* eingeschoben und die Daten wurden wiederhergestellt ?

    Schlecht ausgedrückt von mir: Die selben Platten raus und wieder hinein.

    Ein Rebuild mit leeren Platten ist natürlich nicht möglich.


    Es ging darum, ob der TE beide "defekte" Platten gezogen hat.

    Wenn er beide ursprünglichen Platten wieder installieren müsste das RAID wieder laufen.

    Was es aber nicht tut.


    Ist mir völlig unverständlich, warum das NAS das RAID nicht wieder ans Laufen bringt...


    Was ggf. noch ein Versuch ins Blaue wäre: Ich meine man kann die SMART Datensammlung bei jeder Platte deaktivieren.

    Vielleicht löst die Meldung der 4. Platte tatsächlich aus, dass sich die Rebuild Routine nicht startet.

  • Das sind die Spanning RAID1 md9 und md13, die kann man auch noch mit nur einer funktionierenden Platte wiederherstellen. Da sind aber keine Userdaten drauf.

    nene, er liest die alte 3TB Platte (das RAID1 besteht aus zwei SSDs 128GB)

    Edit: achso sorry hatte ich wahrscheinlich falsch verstanden. D.h. über eine Platte werden immer mehrere RAID gelegt, aufgrund der Systemdaten etc.?
    Wenn ich die Platte heraus nehme, dann sehe ich auch, dass diese partitioniert wurde.

    Ich denke über den richtigen mdadm Befehl lässt sich das wieder fixen, werde heute Abend mal die Manpage durchgehen.


    Code
    2023-01-20 20:31:56 +01:00 <5> [47925.796365] sd 2:0:0:0: [sdg] 5860533168 512-byte logical blocks: (3.00 TB/2.73 TiB)


    Ziemlich seltsam alles. Finds eigentlich etwas schade, RAID wiederherstellen sollte eigentlich default sein. Es steht derzeit noch ein SoftwareUpdate an. Das führe ich mal durch und berichte anschließend. Ich gehe jedoch davon aus, dass sich hier nichts ändert, am generellen RAID Handling wird sich nichts geändert haben.

    Bin gerne für weitere Tipps bereit :)