Festplatte mit I/O Error - Raid 5 - Problem

  • Hallo zusammen,


    ich habe gerade ein Problem mit meinem QNAP-NAS und hoffe auf die Hilfe eines erfahrenen Mitglieds.


    Ich habe ein QNAP TS-419 PII (FW: 4.3.3.0154) mit 4 x WD Red 3TB - Platten (WDC WD30EFRX-68AX9N0) im Raid 5 laufen.
    Bisher hatte ich hiermit keine Probleme und alles lief stabil 24/7. Auch habe ich bisher nie irgendwelche Festplattenfehler aus den Tests heraus angezeigt bekommen.


    Heute dann gab es das erste Mal folgenden Festplattenfehler mit einer Warnung im Systemprotokoll:

    Code
    [Harddisk 3] I/O error, sense_key=0xb, asc=0x0, ascq=0x0, CDB=2a 00 00 10 2d b2 00 00 05 00

    gefolgt von:

    Code
    [RAID5 Disk Volume: Drive 1 2 3 4] Drive 3 removed.

    und:

    Code
    [RAID5 Disk Volume: Drive 1 2 3 4] RAID device in degraded mode.

    und:

    Code
    [RAID5 Disk Volume: Drive 1 2 3 4] Drive 3 failed.

    danach kommt dann ca. alle 30 Minuten:

    Code
    [Harddisk 3] I/O error, sense_key=0xb, asc=0x0, ascq=0x0, CDB=88 00 00 00 00 01 5d 4d 1e 48 00 00 00 08 00 00 .

    Im Speichermanager/Datenträgerverwaltung werden alle 4 Platten mit SMART-Info = "Gut" aufgeführt.


    Die RAID-Verwaltung zeigt folgendes an:


    RAID 5-Datenträger: Laufwerk 1 2 4 ---> 3 fehlt
    mit dem Status: "Im herabgesetzten Modus"


    Die LED über dem 3. Einschub leuchtet durchgehend rot und die Status-LED blinkt durchgehend rot.


    Unter Datenträger-Smart für Laufwerk 3 wird in der Zusammenfassung für Datenträgerstatus und Datenträger-I/O-Status in rot "Anomal" angezeigt.
    Unter SMART-Info selbst werden alle Werte in grün mit "Gut" angezeigt.


    Ich habe versucht den schnellen Test durchzuführen und dies wird gleich abgebrochen mit der Systemmeldung:

    Code
    [Disk S.M.A.R.T.] HDD 3 Rapid Test result: Interrupted (host reset).

    Hat die Platte tatsächlich Probleme? Im übrigen sehe ich meine Freigabeordner noch immer über einen Windows10 Rechner und kann auch Dateien öffnen.
    Da ich nicht viel Erfahrung mit so einem Fehler habe würde ich gern eine Empfehlung bekommen was ich in welcher Reihenfolge tuen sollte.


    Bisher habe ich keine weitere Aktion durchgeführt und ich habe das NAS auch erstmal nicht neu gestartet, da mir der Gedanke schon kam.


    Kann ich Platte 3 irgendwie prüfen und wie stelle ich das RAID 5 wieder her? Was bedeutet der Raid Status "Im herabgesetzten Modus" und welche Auswirkung hat der Status?


    Zur Not hätte ich noch eine weitere WD Red 3TB Platte, um was zu tauschen...falls erforderlich. Momentan sind da noch andere Daten drauf. Wie müßte ich diese Platte dann vorbereiten? Welche Schritte wären bei einem Tausch durchzuführen?


    Ich würde mich freuen wertvolle Tips von Euch zu erhalten.


    Danke vorab und viele Grüße!

  • Ich tippe auf defekte Festplatte in Slot 3...tauschen! Die andere Festplatte löschen und alle Partitionen entfernen und ab ins NAS damit. Im Normalfall sollte der Rebuild automatisch starten, wenn nicht manuell anstoßen. Backup aktuell? Wenn nicht sofort aktualisieren, steigt jetzt noch eine Festplatte aus sind deine Daten weg!


    Die Festplatte aus Slot 3 mit den WD-Tools am PC prüfen, aber die wird dahin sein.

  • Vielen Dank für die Rückmeldung. Ich habe heute bereits das beschriebene Vorgehen genauso umgesetzt.
    Backup war aktuell und im Moment läuft auch noch der Rebuild. Steht jetzt nach 6,5h bei 45%. Bisher keine Komplikationen.


    Dies war/ist meine erste Aktion dieser Art. Ich hoffe mal es läuft dann auch komplett erfolgreich durch.


    Gibt es für danach noch ergänzende Hinweise oder Doings?


    Die anscheinend defekte Festplatte wurde im PC ohne Probleme erkannt (verbunden per eSATA) und die Datenträgerverwaltung zeigt auch die typischen RAW Partitionen.
    Ich werde dann auch mal die WD-Tools drüber laufen lassen. Welches ist hier das geeignete und welche Tests sind aussagekräftig? Ich hatte schon mal das "Data Lifeguard Diagnostic" versucht, aber hier wird der Quicktest sofort abgebrochen und S.M.A.R.T. Infos will er mir auch nicht anzeigen. CrystalDiskInfo wollte mir auch keine Zustands- bzw. S.M.A.R.T. Infos anzeigen für die Platte. Nur die reinen Hardfacts wie Firmware, Seriennummer usw.


    VG

  • Merkwürdig, dass keine Smart-Werte angezeigt werden. Ich führe dann immer einen vollständigen Lesetest durch und/oder komplette Löschung. Kommt es hier zu Fehlern/Abbrüchen, dann ist die Festplatte definitiv hin.

  • Danke für die Tips...werde ich dann mal machen. Das Rebuild ist inzwischen erfolgreich durchgelaufen und "completed". Der Raid5-Datenträger für die Laufwerke 1,2,3,4 steht jetzt auch wieder im Status "Bereit". Sieht also alles schick aus :)


    Da schein ich ja meinen ersten Plattenausfall gut überstanden zu haben.


    Ich habe einen wahren Satz gelesen in diesem Zusammenhang: "Die Frage ist nicht ob eine Festplatte ausfällt sondern wann eine Festplatte ausfällt."


    Denkt also immer an ein aktuelles Backup...für den Fall der Fälle. Ein erfolgreiches Raid-Rebuild wird nicht immer die Lösung bringen.


    VG