RAID1 Sync nach Datenträgerfehler

  • Hallo zusammen,


    nach langem, problemlosem Lauf meldete mein TS-251A (RAID1 mit 2 x WD red 4TB, QTS 5.0.1), dass HD2 kritische SMART Werte hat (wurde gelb angezeigt).

    Daraufhin habe ich mein Backup aktualisiert (zumindest großteils, wegen ... egal ...), das dauerte ein bisschen.


    In der Zwischenzeit meldete die HD1 "Fehler" und wurde rot angezeigt.

    Da stieg die Nervosität ...


    Da das System bereits extrem langsam ist, wollte ich nicht unnötig neu booten.

    Ich habe mich vergewissert, dass das System hot swap fähig ist, also HD1 raus, neue & identische Platte eingebaut und abgewartet.


    HD1 wurde zumindest erkannt.

    Unter "Datenträge/VJBOD" ist sie blau eingefärbt, "Status: Bereit", unter "RAID-Gruppe" steht "RAID-Gruppe 1".

    Sah gut aus. Meine Erwartungshaltung war, dass der Rebuild jetzt automatisch startet. Ich wusste jedoch nicht, wie ich das checke.


    Am nächsten Morgen wollte ich den Status des Rebuild wissen.

    Nach einigem Suchen unter "Speicher/Snapshot" oben auf das Zahnrad "Globale Einstellungen" --> Speicher

    Dort in der Tabelle auf "RAID-Gruppe 1" geklickt.

    "heruntergestuft" und Datenträger 1 & Daträger 2 werden als zur Gruppe zugehörig angezeigt.

    Das passt.


    pasted-from-clipboard.png



    Unter "Speicher/Snapshot" den Pool ausgewählt --> "Verwalten"


    pasted-from-clipboard.png


    Da steht, dass Datenträger 1 "Kein Mitglied" ist.

    Das widerspricht doch der Angabe unter dem 1. Screenshot ...!?!?

    Verstehe ich nicht ...


    Dann auf "Verwalten" --> RAID-Gruppe neu aufbauen" (offensichjtlich hat er Rebuild nämlich nicht automatisch gestartet).

    Dann wird verlangt einen freien Datenträger auszuwählen ... als solcher wird meine neue Festplatte offensichtlich nicht erkannt - sie ist ja auch nicht "frei" sondern wird (scheinbar?) schon der RAID-Gruppe 1 zugezählt.

    Der Menüpunkt "RAID-Gruppe wiederherstellen" ist leider ausgegraut.


    pasted-from-clipboard.png




    Irgendwie habe ich einen undefinerten Zustand:

    - die neue Festplatte ist erkannt und gehört zur RAID -Gruppe 1

    - die zweite Festplatte meldet Fehler

    - Rebuild startet nicht automatisch

    - auch nach einigem Lesen auf der QNAP-Seite und im Forum weiß ich nicht, wie ich den Rebuild manuell anstoßen kann

    - es gibt Hinweise bei QNAP, die Partitionen der neuen Festplatte extern am PC zu löschen und dann nach einem System-Neustart einzusetzen. Einen System-Neustart würde ich gerne vermeiden, weil ich nicht weiß, ob das mit nur einer Platte, die dazuhin auch noch Fehler meldet, erfolgreich klappt.


    Mein Ziel:

    Da offensichtlich noch lesend auf die fehlerhafte HD2 zugegriffen werden kann, will ich schnellst möglich den Rebuild mit der neuen HD1 durchführen.

    Wenn der beendet ist, liegt hier schon eine weitere neue HD, die dann die fehlerhafte HD2 ersetzt.

    Aber wie ...???

    Ich bin für jede Hilfe dankbar!

  • Kann sein, daß das Raid schon hinüber ist.

    HD2 kritisch und dann noch HD1 dazu.


    Kannst Du noch lesend auf die Daten zugreifen? Dann mach das Backup zu Ende.

    4TB packt man locker auf die derzeit erhältlichen USB Laufwerke.


    Gruss


    Und evtl. einen Screenshot der Disks anhängen.

    Normalerweise läuft der Rebuild von allein, aber wenn 2 von 2 Platten Probleme haben...

  • Vermutlich war die Belastung beim Rebuild zu groß für die HD 2 und sie hat sich endgültig verabschiedet (Zeitpunkt kann auch Zufall gewesen sein).



    Jetzt hast Du zwar eine gute neue HD1 aber ohne deine Daten. Pech gehabt.



    Jetzt kannst Du nur noch die HD 2 tauschen und anschließend dein unvollständiges Backup zurückspielen.

  • Allenfalls letzter Versuch (ohne Gewähr):

    HDD1 nochmals entfernen, am PC anschliessen und alle Partitionen löschen.

    Dann wieder ins NAS, wenn der Rebuild wieder nicht startet und die HDD nicht in die Raidgruppe kommt, dann dürfte Feierabend sein.


    Gruss

  • Danke für dir guten Hinweise.
    Ich vermute allerdings, dass meine PLatten tatsächlich beide das zeitlich gesegnet haben ...


    Als ich das NAS aufbaute dachte ich noch, ist es gut, zwei identische Platten aus gleicher Quelle mit ähnlichem Herstelldatumdatum zu kaufen? Na ja, warum nicht, wie groß ist die realistsichen Wahrscheinlichkeit, dass beide Platten sich tatsächlich so identisch zum Lebensende verhalten, dass sie gleichzeitig ausfallen ...?
    Ergebnis: Die Wahrscheinlichkit ist größer als erwartet!!

  • Im allgemeinen heisst es (nach meiner Kenntnis), man soll wenn möglich darauf achten dass man keine Festplatten verwendet die aus dem gleichen Batch (Herstellungszeit und Ort) sind.

    Nach meiner Erfahrung ist aber das viel wahrscheinlichere Problem - oder zumindest ein ebenso grosses Problem, die lange Betriebszeit und dann ein aus und einschalten oder Reset und Stress wegen backup oder resync.

    Man muss auf beides achten. Wenn keine Redundanz mehr da ist, sehr vorsichtig mit dem Rest vorgehen: häufige neustarts vermeiden, ggf. die eine sowieso defekte Disk entfernen. GGf. vorsichtigerweise die restliche noch gute Disk mit einem Programm wie ddrescue (das defekte sektoren überspringen kann) versuchen zu kopieren bevor man eine neue disk einsetzt.


    Aber auch jetzt noch könntest Du es mit ddrescue probieren. sowohl mit der einen als auch der anderen disk. Wenn die disks nicht ganz tot sind hat man damit eine gute chance auf 99%+ Erfolg.