Raid 6 nach Ausfall einer Platte: Wiederaufbau klappt: Danach wird Platte vom System ausgeworfen

  • Frage zu Raid 6 Problem nach Ausfall Platte 8


    Die FPlatte 8 im Raid 6 mußte wegen Sektorenproblem ausgetauscht werden. (Wurde vom System vermeldet)

    Nagelneue 8TB FPlatte von WD auf Garantie erhalten.

    Eingebaut - System zeigt keine Probleme für diese Platte (mehr), inter Check bestanden.

    ok also nun:

    Code
    [Storage & Snapshots] Started rebuilding RAID group "1". Priority: Resync First."

    Nach ca. 50 Std für ca. 20 TB:

    Code
    [Storage & Snapshots] Finished rebuilding RAID group "1". Volume: DataVol1."


    Alle Platten werden mit grün (Kreis) gekenzeichnet, keine Fehler.

    OK, also dann, System neu gestartet:

    Alles gut, kann auf NAS arbeiten und kopiere einige Dateien drauf, und lese auch davon.


    Dann: Ruhezustand für 10 Stunden.


    Nächster Morgen: NAS aufwecken: siehe da: FPlatte 8 wurde abgehängt. (Kreisanzeige weiß)


    Danach diese Meldungen:

    Code
    [Storage & Snapshots] Finished hot-removing disk "Host: Disk 8"."
    [Storage & Snapshots] RAID group "1" is degraded. Volume: DataVol1."
    [Hardware Status] "Host: Disk 8": Disconnected."


    Diese Tour hab ich jetzt zwei Mal durchgeführt - woran kann das liegen und was ist bzw. löst das Problem?

    Danke für Hinweise!


    QNAP 853A, 8x8TB WD RED 5400

    Einmal editiert, zuletzt von Nescafegold () aus folgendem Grund: Ergänzung Systemmeldungen

  • Hallo ☕️,

    sorry, wenn meine Antwort eventuell nicht die richtige ist.

    Ich hatte solch ein Fall an 2 FuijtsuServer, auch RAID6...

    Nachdem die HDDs je 2x erfolglos gewechselt wurden, wurde die BackPlane getauscht - und - alles wieder gut. Mach doch am besten ein Case bei Qnap auf 🖖

  • danke für den Hinweis, auch darüber habe ich schon nachgedacht.
    Werde ich auch machen, wenn ich nicht weiter komme.

    Aber vielleicht gibts ja hier weitere Hinweise von RAID 6 USERN, die das gleiche Problem hatten?

  • Hier wurde mal von einer verspannten Hauptplatine und damit leicht schief eingesteckten Backplane berichtet.


    Lief über Jahre und dann flog immer ein bestimmter Steckplatz raus.


    Mobo entspannt, Backplane neu gesteckt und seit dem ist er wieder zufrieden im Betrieb mit seiner NAS.


    Kannst ja mal einen Blick riskieren.

  • DANKE SEHR, hatte auch schon an Kontaktprobleme gedacht und daher die Platte 8 mehrmals rein und rausgeschoben.
    Die Platte ist aber, nachdem die obigen Fehlermeldungen kamen, sofort nach einmaligem erneuten Einschieben wieder integierbar, allerdings geht dann wieder die 50 Std Aktion los, indem die Platte ins Raid6 aufgenommen wird. Daher scheint doch eigentlich kein Kontaktproblem zu bestehen - oder?


    Nebenfrage: Kann man eigentlich die Platte8, wenn Raid 6 degrated ist auch alleine durch den SMART Test von Qnap führen ?

    Wenn ja, wie?

  • Das war bei dem anderen Modell auch, die ist auch erst später wieder raus geflogen.


    Er hat es auch erst nach der Demontage des Gehäuses gesehen, wenn das Modell über einen PCIe Steckplatz verfügt, muss man das ja öffnen können um an die Karte zu kommen, dabei hat er es dann gesehen.

  • Ist eine 8 TB Red 5400 Platte von WD:

    Tool dazu: Data Lifeguard Diagnostic for Windows

    https://support.wdc.com/downloads.aspx?p=3&lang=de

    Platte zeigt Sektoren Fehler im ausführlichen Test!


    Diese Platte ist eine Original Platte (Garantie) von WD, da ich jetzt schon zum zweiten Mal das Raid 6 wieder vollständig haben möchte.

    Also 2x Plattenfehler - sofern mein QNAP TS-853A die Platten nicht beschädigt - aber das kann ja wohl nicht sein. (?)


    Oder gibts hierzu noch Hinweise, dass das NAS eine Platte zerstören kann?



    Danke bis hierher

    Hab wieder auf Garantie eine neue Platte per RMA "bestellt".

  • Diese Platte ist eine Original Platte (Garantie) von WD,


    Deswegen kann sie doch defekt sein.


    Hab wieder auf Garantie eine neue Platte per RMA "bestellt".


    Das Spielchen hatte ich 2 mal gemacht. Die dritte lief endlich.

    Sie hatten aber immer ein schwarzes Label und es stand Recertifed drauf ... :)

  • Oder gibts hierzu noch Hinweise, dass das NAS eine Platte zerstören kann?

    Ich kann mir gut vorstellen, dass ein erfolgreicher Rebuild auch davon abhängt, ob Hardware-RAID-Controller zum Einsatz kommen oder eben wie bei den "kleinen" QNAPs eine Softwarelösung. Auch die CPU-Leistung dürfte hier eine Rolle spielen.


    Ab einer gewissen Größe eines RAID sieht es laut diversen "rebuild failure chance calculators" nicht allzu rosig aus, dass ein Rebuild durchläuft.


    Du kannst Deine Konfiguration z. B. in diesen Calculator eingeben und die Wahrscheinlichkeit eines erfolgreichen Rebuild berechnen lassen.


    Hier der Link auf den zum Thema "RAID" passenden Teil in der Wikipedia: Statistische Fehlerrate bei großen Festplatten


    Gruß!

    Tim

    Einmal editiert, zuletzt von Timpov () aus folgendem Grund: Wikipedia-Link nachgetragen.

  • Hallo,

    aber dies wäre doch ein Software Problem, und keine pysische Zerstörung der Platte, sprich defekte Cluster etc.- oder?

  • Hallo Nescafegold!

    Ich verstehe das so, dass es - bedingt durch die heutzutage große Kapazität der Platten und somit des RAID - beim Rebuild zu Plattenfehlern innerhalb der normalen, statistischen Verteilung kommt, bzw. kommen kann.


    Gruß!

    Tim

  • Es kann zu Lesefehlern kommen, die wiederum dann dazu führen, das ein Rebuild nicht möglich ist, da die CRC Prüfung der Daten unplausible Werte ergibt.


    Die frage ist, fällt das beim Block Rebuild auf oder erst später beim lesen der entsprechenden Datei.


    Aber auch so kann es alle x Bits zu einem solchem Fehler kommen, kann muss aber nicht.


    Der eine hat Glück und ihm fliegt jeden Tag eine Datei um die Ohren, der andere hat es nicht nicht...


    Ist halt wie mit jeder Wahrscheinlichkeit, alles kann nichts muss, also weiter mit dem Lotto spielen, denn nichts anderes ist das lesen von Daten von einer HD.

  • Hi Dennis!

    Es kann zu Lesefehlern kommen, die wiederum dann dazu führen, das ein Rebuild nicht möglich ist, da die CRC Prüfung der Daten unplausible Werte ergibt.

    Ich denke, es geht nicht darum, ob es "nur" zu Lesefehlern oder dergleichen kommt und deshalb ein Rebuild nicht durchläuft.


    Vielmehr geht es um die Frage, ob durch ein Rebuild eine Platte in einem - von der Kapazität her - sehr großen Verbund wirklich geschädigt werden kann.


    Gruß!

    Tim

  • Das kommt darauf an, was man in dem Moment noch alles auf dem Raid anstellt.

    Ein Rebuild ist ein sequenzieller Prozess, der wenn nicht gestört, ohne viel Stress für die HDs abläuft.


    Problematisch wird das erst, wenn gleichzeitig auf die Daten zugegriffen wird, eine VM läuft, der Mediaserver Aufnahmen und Transcodierungen händelt usw.

    Dann wird das ganze zum mega Stress für die HDs und die Köpfe fliegen wie wild von einer Spur zur nächste.


    In dem Fall ist die Chance das eine HD unter der extremen Belastung aufgibt größer, also wenn die sich nur um eine Sachen kümmern muss.

    Reduziert man also die Arbeitslast, so dass sich das System nur um das Rebuild kümmern kann/muss, verhindert man den Stresslevel der HDs massiv und das Ausfallrisiko wird minimiert.


    Aber von einem Rebuildschaden kann man nicht sprechen, denn der Prozess ist ja nichts weiter wie eine Blockkopie von vielen HDs auf eine neue.

  • von der Kapazität her - sehr großen Verbund wirklich geschädigt werden kann.


    Bin mir nicht ganz sicher ob man die "normalen" WD Red in einem vollbesetzten 8-Slot-NAS einsetzen kann oder ob man schon die Pro Serie braucht wegen dem Vibrationssensor.

  • Hi Jagi!

    Die "normalen" WD Red sind auch für 8-Slot NAS, bzw. Erweiterungen "zugelassen".

    Ich verwende in einem UX-800P 8x 6TB WD Red (WD60EFRX).


    Gruß!

    Tim

  • Also 2x Plattenfehler - sofern mein QNAP TS-853A die Platten nicht beschädigt - aber das kann ja wohl nicht sein. (?)

    Tippe eher nicht auf das NAS, wenn du die Disk nicht gerade von weitem in das NAS reingehauen hast ;)


    Ne im Ernst, bin jahrelang mit den WD's sehr gut gefahren und habe sie nur im üblichem Rahmen nach einigen Jahren tauschen müssen (beginnende Lesefehler).

    ABER (!) die letzten drei WD Red 4TB, die ich zweck Tausch gekauft hatte, waren alle schon ab Lieferung komplett defekt, liefen nicht mal im PC hoch sondern "klackerten" nur herum …


    Keine Ahnung was WD da geritten ist, war mir zu viel Aktion alle drei per RMA zu tauschen -> zurück zum Händler und gegen Seagate getauscht.

    Aktuell habe ich jetzt die Seagate auf dem Radar und werde wohl in den nächsten Jahren alle WD durch die Ironwolf getauscht haben.


    Nicht dass ich jetzt irgendwem die WD ausreden will, laufen gut, auch die, die noch bei mir verbaut sind. Aber wenn mal das Vertrauen weg ist, und mir der Stress mit drei defekten Platten in Serie zu Kopf steigt, dann ist ein anderer Hersteller am Zug :whistling: