Fehlerhafte HDD im RAID 6 temporär verbleiben oder herausnehmen

  • Hallo zusammen,

    ich habe folgende Konfig:


    TVS-863+

    5x WDD 6TB

    RAID 6

    Belegt sind aktuell 14,5TB von 16TB.

    USV hängt davor


    Seit heute meldet eine HDD einen Fehler,

    Code
    Unrecovered read error, Run a bad block scan on the drive

    etc. Der Bad block Scan liefert 6 fehlerhafte Blöcke. In der Oberfläche wird sie aber "nur" als "Warnung" vermerkt und nicht als "Fehler", sie ist also noch im RAID-Verbund.


    Ich habe direkt eine neue Festplatte bestellt, lieferzeit bis zu 3 Tage.


    Nun meine Frage an euch:

    Da die fehlerhafte HDD sporadisch weiter den Alarm meines QNAP triggered, allerdings im Webinterface nur als "Warnung" tituliert wird, soll ich erstmal nicht unternehmen und sobald die neue HDD geliefert ist tauschen? Oder ist es sinnvoller diese beschädigte HDD direkt aus dem RAID zu nehmen und wenn ja wie am besten? Bin ein Fan von "Keep it simple", also entweder laufen lassen bis der Server von sich entscheidet wann sie komplett tot ist oder einfach ziehen und auf die neue warten?


    Die Datenkonsistenz sollte mit einem RAID 6 ja erstmal unkritisch sein, es fühlt sich aber echt komisch an, zu wissen dass eine beschädigte HDD noch im RAID mitläuft.


    Vielen Dank

  • Wenn es NAS Platten sind, sollte ein Defekt nichts machen da TLER ein ständiges auslesen der Platte zur Fehlerkorrektur unterbindet. Falls es Desktop Platten sind dann würde ich die raus nehmen.

  • Gibt doch gar keinen Grund, die zu ziehen, wenn die neue noch nicht da ist.

  • soll ich erstmal nicht unternehmen und sobald die neue HDD geliefert ist tauschen?

    Ich würde sie nicht ziehen, weil dann ein Resync durchgeführt wird. Sobald die neue Platte dann da ist und du sie einbaust und in das RAID hinzufügst, muss wieder ein Resync gemacht werden. Das bedeutet für die verbleibenden Platte eine starke Belastung, welche wieder - je nach Alter - wieder zum Ausfall oder Fehler führen kann. Und bei 14,5 TB Daten würde ich behaupten, dass es mehr als 40 Stunden dauert würde. Das bedeutet, dass der Resync direkt nacheinander durchgeführt werden würde.

  • Mod: Unnötiges Volltext-/Direktzitat entfernt! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen


    Wenn er die Platte aus dem Slot zieht, wenn sie noch nicht als Fehlerhaft oder Defekt und aus dem RAID ausgeschlossen wurde, dann sind wir uns doch einig, dass das System das erkennt und die Referenzen der Daten von der Platte die gezogen wurde, mit den verbleibenden Platten aktualisieren muss.

  • Nö. wird die Platte gezogen meckert das System, aber passieren tut nix. Paritätsberechnungen werden erst geschrieben wenn ne neue Platte reinkommt.

  • Vielen Dank für die Infos an alle.


    Hier meine Fazit, vielleicht hilfreich für andere:

    Ich hab die HDD stecken lassen, was in meinem Fall gar kein Problem, auch wenn ich für kurze Zeit ein paar "Warnings" wegen fehlerhafter Blöcke bekommen habe.

    Als die neue HDD da war, hab ich die defekte (Warnings, keine fatal failure) währen Betrieb einfach gezogen. Nach ca. 10 Sekunden bemerkt der Server dass die HDD entfernt wurde und gibt eine "red Warning".

    Die neue HDD hab ich in den gleichen Slot gesteck. Wieder nach ein paar Sekunden wurde das seitens des Servers registriert und direkt mit dem resync / wiederaufbau des RAID begonnen. Ich musste nichtmal irgendwas in der Oberfläche schalten oder umstellen.

    All in all war der RAID wie oben beschrieben (16 TB gesamt, 14,5TB belegt) nach 14h wiederhergestellt ohne irgendwelcher Probleme.

    Danke an alle und an QNAP, genau so wünscht man sich das als Endanwender :)

  • Wieder nach ein paar Sekunden wurde das seitens des Servers registriert und direkt mit dem resync / wiederaufbau des RAID begonnen. Ich musste nichtmal irgendwas in der Oberfläche schalten oder umstellen.

    Nun ja, das ist doch ein Feature eines RAID. Unterbrechungsfrei (man kann weiter arbeiten) eine defekte HDD tauschen...