TS-431P Rebuild Raid5 fehlgeschlagen

  • Hallo Zusammen.

    Ich hab hier ein TS-431P FW 5.0.0.2055 mit 4x 8TB WD Red im Raid 5.

    Das NAS ist ein reiner Datenspeicher, hauptsächlich Multimediainhalte, wirklich wichtige Daten sind als Backup vorhanden

    Letzte Woche meldete mir das NAS, dass die HDD 1 fehlerhaft wäre, SMART meldete Current_Pending_Sector ~100 Status Warnung.

    OK, ich wollte das Raid eh vergrößern, das Raid war mit 12 TB gut gefüllt.

    Als neue Platte hatte ich mir die Segate Exos X16 ST16000NMN001G ausgesucht, sollte laut Kompatibilitätsliste gehen.

    Also war der Plan die Daten zu sichern, da von einem Großteil der Daten kein Backup vorhanden ist.


    Zu dem Zeitpunkt der Warnmeldung war das NAS noch erreichbar. Ich habe angefangen diverse Daten zu sichern.

    Die Leserate war extrem schlecht.

    Leider hat aber auch gleichzeitig ein anderer Nutzer im Haushalt munter Daten drauf geschrieben, keine Ahnung ob das schlecht war, ich vermute aber mal ja.


    Jedenfalls war auf einmal irgendwann das NAS nicht mehr erreichbar, weder über Web-Interface noch über Qnap App vom Android Handy.

    Es war kein Aktivität am NAS angezeigt, ab und an ein kurzes blinken der HDD LEDs.

    Da irgendwie nix ging, habe ich das NAS neu gestaret, dauerte auch ewig, irgendwann kam ich per Browser wieder drauf.

    Angezeigt wurde mir, dass das Raid (DataVol1) im Resync befand, mit der wahnwitzigen Geschwindigkeit von 500 kb/s, war aber immerhin schon bei 73%.


    pasted-from-clipboard.png


    OK, hab gedacht, las ihn mal. Dummer weise hatten wir dann Anfang der Woche Bauarbeiten in der Straße, wodurch über den Tag wohl mehrfach der Strom ausgefallen ist. Das war dem Ganzen sicherlich auch nicht zuträglich.

    Jedenfalls war dann Abends das NAS ewig wieder nicht erreichbar. Irgendwann kam ich drauf und wurde mit dieser Meldung begrüßt:


    pasted-from-clipboard.png


    Die Prüfung habe ich nicht durchgeführt, da angeblich noch immer ein Resync lief.

    Ein Blick in die Speicherverwaltung zeigte mir an, dass das Raid entladen sei und synchronisiert wird.


    pasted-from-clipboard.png


    Jedenfalls sind Vorgestern die neuen Platten angekommen und ich habe gestern die HDD1 durch eine Neue Segate ersetzt. Nach dem Start des NAS lief auch umgehend ein Rebuild des Raid an, immerhin mit ~50Mb/s.

    Als ich heute Morgen auf das NAS geschaut habe, war der Rebuild bei ca. 80% und eine Restzeit von ~10 Stunden prognostiziert. Ok, wird dann hoffentlich heute Abend wieder verfügbar sein.


    Nach ca. 30 Minuten hörte ich aus meinem Arbeitszimmer den Sound eines Neustarts des NAS.

    Als ich drauf geschaut habe wurde mir ein Fehler der Segate Platte angezeigt und das NAS war Schreibgeschützt.


    pasted-from-clipboard.png


    Die Speicherbelegung wird jetzt nur noch mit 70GB angezeigt.


    Meine Fragen sind nun:

    - Hab ich noch irgendeine Chance die Daten wieder herzustellen? Die Daten sind nicht überlebensnotwendig aber mühsam und zeitintensiv wiederzubeschaffen.

    - Kann ich dem NAS noch trauen oder liegt hier ggf. ein Hardwaredefekt vor?

    - Welches NAS würdet ihr in diesem Fall als Ersatz empfehlen? Keine besonderen Anforderungen, einfach ein Datengrab im Netzwerk



    Danke


    Mat

  • Herrje, da hat Murphy aber wieder mal volle Kanne zugeschlagen - was schief gehen kann geht schief.


    NAS beim Resyncen quälen - schlecht, mehrere Stromausfälle - ohne USV nehme ich mal an - schlecht, das Ganze auch noch während eines Resyncs - sehr sehr schlecht. Aber Dein NAS scheint dies ja soweit alles überstanden zu haben. Aber eine Festplatte mit - wie es scheint - Transportschaden kann nun mal auch das beste NAS nicht wegzaubern.


    Zur Sicherheit würde ich die neue Festplatte mit dem entsprechend Tool des Herstellers am PC prüfen und dann als DOA (Dead on Arrival - also defekt beim Eintreffen) beim Lieferanten reklamieren. Warten bis die neue Festplatte da ist, gegebenen Falls die Festplatte lieber vor dem erneuten Einbau prüfen und dann nochmals einbauen und Resyncen.

    Vielleicht auch über ein Notstrom nachdenken, wenn das NAS permanent läuft und Stromzulieferung nicht immer garantiert ist.

  • Ich hab ja noch 3 weitere neue Segate 16 TB.

    Würdest du versuchen den Rebuild mit einer anderen 16TB nochmal zu starten?

    Das NAS zeigte mir halt an, dass ich Daten sichern sollte bevor ich die HDD tausche.

    Ist aber halt im Augenblick nix zu sehen an Daten.

    Müsste aus den verbleibenden 3 Platten der Rebuild gehen oder sind die Daten jetzt komplett geschreddert?

  • Würdest du versuchen den Rebuild mit einer anderen 16TB nochmal zu starten?

    Ja, aber zur Sicherheit die Festplatte am PC auf etwaigen Defekt und Fehler prüfen.

    Das NAS zeigte mir halt an, dass ich Daten sichern sollte bevor ich die HDD tausche.

    Ich dachte, die hast Du schon gesichert?

    Ist aber halt im Augenblick nix zu sehen an Daten.

    Das kann eigentlich nicht sein. Ein RAID5 funktioniert auch noch mit einer Festplatte weniger. Die anderen 3 Festplatten weisen aber keine Fehler auf? Du hast die Festplatte mit den Fehlermeldung ausgetauscht?

    Müsste aus den verbleibenden 3 Platten der Rebuild gehen oder sind die Daten jetzt komplett geschreddert?

    Das ist eigentlich der Sinn eines RAID5. Mit einer Festplatte weniger können die Daten wieder hergestellt werden. Bei einem RAID5 wird ja eine Festplatte verwendet, um die sogenannt Parität zu speichern. Aus der können die Daten wieder erstellt werden. Ist eine Art Hash-Wert. Die Parität wird aber nicht nur auf einer Festplatte gespeichert, sondern auf allen verteilt. Aber es darf nur eine Festplatte beschädigt sein. Für 2 Festplatten muss es RAID6 sein.


    Was aber sein könnte, da bei Dir so ziemlich alles schief gelaufen ist, was nicht schief laufen soll, dass das RAID auf irgendeine Art Schaden genommen hat. Das kann ich von hier nicht beurteilen. Auf jeden Fall die SMART-Werte der verbleibenden Festplatten prüfen.

    Das beweist wieder einmal, das ein RAID keine Datensicherung ersetzen kann. Wenn Murphy zuschlägt, dann aber richtig.

  • Ja, aber zur Sicherheit die Festplatte am PC auf etwaigen Defekt und Fehler prüfen.

    Witziger Weise zeigte die defekte neue Seagate am PC keinen Fehler über Chrystal Diskinfo oder das Segate Tool SeaTools. Wenn ich aber größere Mengen Daten drauf schreibe, ist sie irgendwann nicht mehr erreichbar, ab zum RMA.

    Ich dachte, die hast Du schon gesichert?

    Ja, die meisten wichtigen Daten. Tatsächlich musste ich aber feststellen, dass mir eine Freigabe fehlt, ausgerechnet die vielen alten Bilder. Ich hatte vor einiger Zeit die externen Platten fürs Backup ausgetauscht und anscheinend diesen Ordner nicht gesichert, selber Schuld.

    Der Großteil der Daten, so rund 10TB sind Daten, die sich wiederbeschaffen lassen und daher nicht als Backup vorliegen. Gerippte CDs, DVDs, BlueRays usw., nichts was ich wirklich vermissen würde.

    Ist halt Aufwand die Sachen wieder alle neu zu erstellen, wäre schön, wenn ich die Daten wieder herstellen könnte.


    Das kann eigentlich nicht sein. Ein RAID5 funktioniert auch noch mit einer Festplatte weniger

    So war eigentlich auch mein Gedanke. Als defekt wurde die HDD1 (WD 8TB) aus dem ursprünglichem Raid5 markiert. Diese habe ich dann gegen eine neue Seagate 16TB getauscht.

    Der Raid rebuild lief an, ging über die ganze Nacht und war am nächsten Morgen bei ~60%, Restdauer 10 Stunden bevor die neue Segate ausgefallen ist.

    Bis zu diesem Zeitpunkt wurde mir das Raid immer als Entladen angezeigt, aber mit einer Größe von ca. 11TB.

    Nach dem Ausfall der neuen Platte während des Rebuilds wird mir das Raid nur noch mit einer Größe von 0,07TB angezeigt.

    Auch nach einem Tausch der defekten, neuen Platte gegen eine andere, vorher am PC geprüften, lässt sich das ursprüngliche Raid nicht wiederherstellen.

    Jedenfalls nicht über Weboberfläche.

    Nach meinem Verständnis sollte doch auf den verbliebenen Platten, die auch alle OK sind, alle Daten zum wiederherstellen vorhanden sein, oder?


    Im Augenblick wird mir nur eine Prüfung des Dateisystems angeboten, die aber irgendwie auch nicht vorwärts kommt, seit Stunden bei 1%.


    Ich habe auch über WinSCP/Putty zugriff auf das NAS, falls das hilft.

  • Sind denn die verbliebenen Festplatte noch i.o.?

    wird mir das Raid nur noch mit einer Größe von 0,07TB angezeigt.

    Das wird Dir in "Speicher & Snapshots" angezeigt?

  • Dann war das Ganze wohl doch zuviel für das RAID. Ist jetzt tatsächliche etwas unglücklich gelaufen. :(


    Das ist jetzt der Punkt, bei dem ich das ganze NAS platt machen, komplett neu aufsetzten und die Daten vom Backup zurückspielen würde. Denn ein RAID reparieren wollen tue ich mir nicht an. Aber leider hast Du ja kein vollständiges Backup. :(


    Eine RAID Reparatur geht nur noch über die Konsole. Ab hier kann nur noch - vielleicht - dr_mike helfen.

  • Das RAID neu zu erstellen war eh der Plan mit den 4 neuen 16TB HDDs.


    Ich schau Mal ob ich mit meinen sehr bescheidenen Linux Kenntnissen weiter komme.

  • Dann kannst Du im ausgeschaltenen Zustand die alten Festplatten einfach rausziehen, die neuen rein tun und das NAS neu einrichten. Die Daten, Apps und Einstellungen sind dann allerdings weg. Eben wie bei einem neuen NAS.


    Aber ohne manuelle Reparatur des RAID läuft es ohnehin darauf hinaus.