Raid 6 Plattenausfall

  • Moin Moin, ich brauch mal Euren Rat.


    Beim Problemkind handelt es sich um meinen QNAP 509pro, der im Raid 6 aufgesetzt ist.
    Alle 5 Laufwerke sind mit 1 TB Western Digital Platten ausgestopft.


    Nun - puenktlich zum Garantieende der einzelnen Platten gibt (gefuehlt) jede einzelne den Geist auf.
    2 vorhandene Ersatzplatten sind auch schon durch.


    Also... gesamt hatte ich 7 Stck. 1TB Platten - 5 montiert - 2 Ersatz.
    Die beiden Ersatzplatten gingen im Januar bereits in den QNAP. Letzte Woche fiel eine weitere aus - heute Abend noch eine.
    Ich meine - bloss gut! Raid 6 duldet ja 2 Ausfaelle...und so humpelt der Server mit 3 von 5 Platten dahin.
    Der Adminbereich ist erreichbar. Ebenso ist er im Netzwerk erreichbar und Datenverlust ist nicht erkennbar.


    Nun die konkrete Frage...
    Wenn ich den QNAP jetzt herunter fahre und in einigen Tagen die neuen (bereits georderten) Platten erhalte, die dann in den QNAP stecke und hochfahre...erstellt der QNAP dann wieder genauso zuverlaessig die Raid 6 Konfiguration?!
    Also bei den bisherigen Plattenfehlern habe ich ja im laufenden Betrieb die jeweilige Platte getauscht.
    Die wurde dann in das Raid eingebunden...gut wars...
    Aber wie ist es hier in diesem speziellen Fall mit 2 ausgefallenen Platten und dann komplettem Neustart?!


    ...oder lasse ich die Kiste laufen, bis die Ersatzplatten da sind?! Um nicht alles neu aufzusetzen...


    Wenn Ihr nicht nur ne Meinung, sondern Erfahrungswerte habt... her damit... :)

  • Die Frage ist:
    Hast Du schon ein Backup oder fürchtest Du Dich noch ?


    Diese Situation ist der späteste Moment, in dem ein Backup erstellt werden sollte, falls noch keins vorhanden ist.
    Danach beantwortet sich Deine Frage durch einfaches Ausprobieren.


    Ein RAID-Rebuild ist üblicherweise neustartsicher und ein degraded RAID auch. Ebenso wird ein Rebuild nach dem Hochfahren üblicherweise automatisch gestartet, wenn Platten getauscht wurden.


    Abgesehen davon halte ich aktuell ein RAID6 aus 5x1TB für nicht mehr zeitgemäss. Ich würde auf 2x3TB@RAID1 umstellen, wenn ich eh neue Platten kaufen muss.
    Oder auf 3TB Einzeldisk mit Backup, RTRR erledigt das komfortabel für Dich. Dann können wir auch die AKWs etwas früher abschalten. 8-)


    GLG GBD

  • Ich kann mich da nur Gorillas Ausführungen anschließen: Mache schleunigst ein Backup, bevor noch eine Platte hops geht, und das Raid mit allen Daten in den Abgrund zieht....
    Was mich aber auch interessiert:
    Warum hat das Nas schon 4 Platten in so kurzer Zeit als defekt gemeldet?
    Verwendest Du Platten , die nicht auf der Kompatibilitätsliste von QNAP stehen (also die nicht explizit für einen Raid-Einsatz vorgesehen sind)???


    Ich frage nur deshalb, weil mein Raid schon seit rund 1,5 Jahren störungsfrei läuft und noch keine Platten "gefressen" hat.


    Ich verwende die Western Digital RED in der 2 TB Version. Bin absolut Begeistert von den Teilen, so etwas leises und kühles habe ich im
    Plattensektor noch nicht gesehen. Die Platten laufen 24x7, also ohne Abschaltung oder Standby. Vielleicht solltest Du mal den Plattentyp wechseln.
    Ich habe fürs Raid auch eine nagelneue Ersatzplatte im Schrank; diese aber noch nie gebraucht. :)


    Bedenke auch: der Rebuilt eines Raid1 oder Raid10 ist einfacher (und daher schneller), als bei einem Raid5, wo noch die Paritätsinformationen geschrieben werden müssen.
    Da Du eh' neue Platten kaufen musst, setze da lieber die 3 TB-Version in einem anderen Raid ein...


    Gruß
    Martin

  • Moin.
    Sicherungen sind ''Kistenweise'' (4 Generationen) vorhanden und Angst vor Datenverlust hab ich darum nicht wirklich. Kribbelig ist sowas ja immer, da ich immer das Gefuehl habe, dass ich was vergessen habe oder die Sicherungen nicht o.k. sind...aber dieses Gefuehl kennt Ihr sicherlich auch...


    Ja - die Platten standen damals auf der Kompadibilitaetsliste. Nur darum habe ich sie auch eingesetzt.
    Nein - groessere Platten werde ich nicht einbauen, sondern bei den 1TB bleiben.
    Auch da ich keine neuen kaufen muss, weil sich der Hersteller auf Kulanztausch eingelassen hat...obwohl die Platten alle zw. 6-10 Monate aus der 3-Jahres-Garantie raus sind.
    Das aber auch nur, weil beim gleichen Plattenmodell bei uns schon mal in 2011 2 Platten ausfielen und alle 7 ungefaehr zur gleichen Zeit gekauft wurden.
    Das Raid 6 lief problemlos seit 2009 - nahezu durchweg online - bis jetzt im Januar 2013.
    Zugegeben, seit ungefaehr einem Jahr war zu bemerken, dass die Startzeit nach Wochenenden (Sa.+So. immer ueber Zeitplan offline) sich nahezu verdreifacht hatte...
    Warum die Platten jetzt also vor-sich-hin-sterben ist mir schleierhaft und liegt hoffentlich nicht am QNAP... _hurted:
    Alle fehlerhaften Platten zeigten nach dem Ausfall im QNAP auch ''zu viele fehlerhafte Bloecke'' beim WD Analysetool.


    Hintergrund meiner Fragen ist eigentlich nur die Sorge um die bislang stabile Konfiguration, sowie die Moeglichkeit der stabilen Neustarts wenn die Platten eingetroffen sind ... und weil ich die 509 kuenftig eigentlich nur noch als Sicherungsteil verwenden moechte.
    Ergo - moeglichst wenig Arbeit reinstecken, weil mir so schon die Zeit fehlt.
    Quasie alles moeglichst automatisch: ...alsooo...runter fahren...wenn da, die Platten rein...hochfahren...mounten lassen...weiter machen!
    In 2-3 Wochen nehmen wir ohnehin einen weiteren 259er in Betrieb. Geplant ist Raid 1 - und den 509er dann (nach aufsetzen der neuen Datenstruktur/-sortierung im 259er) nur noch als Sicherungsgeraet...
    Jo - und bis dahin moeglichst wenig Arbeit! ...und nicht nochmals die alten Daten zurueck sichern.
    Halt nur den Stress aus dem Kopp, ob im herab gesetzten Modus - also mit 3 von 5 Platten - zuverlaessig ein Neustart gelingen KANN.

  • Das bei Dir derzeit ablaufende kollektive Plattensterben ist ein Klassiker aus dem Lehrbuch.


    Die Platten sind gleichen Typs, alle ungefähr gleich alt mit gleicher Laufleistung, und wenn aus womöglich noch dem gleichen Produktionszeitraum oder gar aus dem gleichen Fertigungsbatch, dann auch mit vergleichbarer Lebenserwartung.


    Nach dem Sterben der ersten Platte hast Du einen RAID-Rebuild durchgeführt. Der hat die nun schon alten Platten zusätzlich stark gestresst... ...da stirbt gleich die nächste Platte. Beim nächsten Rebuild wird wieder hoher Stress erzeugt... ...und das weitere Sterben weiterer RAID-Members beschleunigt. Das wird sich also so fortsetzen.


    Das wäre in jeder anderen NAS auch so.


    Zurück zur Eingangsfrage:
    Ja, ein degraded RAID kann normalerweise zuverlässig starten. Eine Garantie dafür gibt es aber nicht. Der Erfolg hängt vom Zustand Deiner Platten ab, und der ist angeschlagen.


    Das weitere Verhalten Deines RAIDs ist völlig unvorhersagbar, nur dass aufgrund der Erfahrungen der letzten Ereignisse meine Prognose eher negativ wäre.


    Erfahrungen anderer dazu nützen Dich dabei auch nichts, denn die haben oder hatten nicht genau Deine Platten in genau deren Zustand in ihrer NAS.


    Im Prinzip kannst Du also tun was Du willst, alles was Dir hier jemand dazu raten kann, kann sich beim nächsten Neustart als richtig oder falsch herausstellen.



    Ich persönlich würde, wenn ich ein vollständiges Backup hätte, die NAS normal weiterverwenden, also nach den üblichen Gepflogenheiten runterfahren und wieder hochstarten. Von Plattenstatistik liesse ich mir nicht meine Stromrechnung diktieren. Ohne Backup würde ich die Kiste laufen lassen, bis eins angefertigt ist.


    GLG GBD

  • Zitat von "mad999"

    (...)Ich frage nur deshalb, weil mein Raid schon seit rund 1,5 Jahren störungsfrei läuft und noch keine Platten "gefressen" hat.
    Ich verwende die Western Digital RED in der 2 TB Version. (...)


    Die WD REDs gibt's doch aber erst seit knapp nem 3/4 Jahr?

  • Ich habe mich da vielleicht nicht richtig ausgedrückt, vorher waren Seagates drin (je 1,5 TB), aber gestorben sind die auch nicht so plötzlich...

    Einmal editiert, zuletzt von bladekiller () aus folgendem Grund: Volltextzitat entfernt! - siehe Forenregeln!