TVS-463 RAID-Controller defekt?

  • Hallo zusammen,

    seit einigen Tagen habe ich Probleme mit einer meiner 4 HDDs im TVS-463. Anfangs war es noch ein I/O-Error, der im Systemlog ausgegeben wurde. Nachdem ich die Platte gegen eine baugleiche, andere HDD ausgetauscht habe, lief anfangs der Recovery-Prozess meines RAID 6-Verbundes. Allerdings kamen nach etwa 1 Stunde erneut die Fehlermeldungen

    Code
    "A drive has been detected but is inaccessible. Please check it for
    faults."

    oder Warnmeldungen

    Code
    "[Volume DataVol1, Pool 1] The file system is not clean. It is suggested
    that you go to [Storage Manager] to run "Check File System"; "[Pool 1] RAID Group 1 is in Degraded mode."

    usw. Mittlerweile habe ich fast schon den verdacht, dass der RAID-Controller in der TVS-463 ein Problem hat. Hat jemand hier schonmal Erfahrungen gesammelt oder kennt sich sonstwie aus?


    Danke!

  • Meines Wissens verwendet QNAP keinen Raid Controller sondern benutzt Software Raid.

    Hast Du vor dem Rebuild auch einen Filesystemcheck gemacht?


    Wenn Du schon im Log I/O Errors siehst, hast Du danach wenigstens mal einen Check gemacht?


    Ansonsten kann es natürlich sein das der Filesystem Error immer noch vorhanden ist und der Rebuild darüber stolpert.

    Ein Backup ist vorhanden? Das würde ich als allererstes nun machen.


    Leider komme ich in letzter Zeit auch immer mehr zu der Einschätzung das das Software Raid wie es von QNAP umgesetzt wird, nicht verlässlich ist.

    Ohne Änderungen kommt es auch bei mir immer wieder zu den I/O Fehlern. Bemerkt werden diese, wenn meine Sicherungs- und Kopierjobs mit einem Fehler enden.

    Wochen-/Tagelang geht das ohne Probleme, und von heute auf morgen I/O Fehler. Die werden (meist) durch den Filesystemcheck behoben, dann läuft auch der Job wieder, aber das Vertrauen schwindet.


    Seltsamerweise ist das aber nur bei meinen TS859 der Fall, die Celvins haben noch nie ein Problem damit gehabt. Die 459 auch nicht.


    Gruss

  • Hat jemand hier schonmal Erfahrungen gesammelt oder kennt sich sonstwie aus?

    Da müsste man auch das Umfeld in Betracht ziehen, da fehlen viele Infos


    Welche HDD's sind verbaut (NAS-Platten oder Desktop)?

    Wie alt sind die Platten?

    War die "baugleiche" eine neue Platte, oder nur "unbenutzt" und gleich alt wie die anderen?

    Wo steht das NAS, wie lange laufen die Platten, sind sie im Dauerbetrieb 24/7 oder nur stundenweise?

    Wie schaut die Temperatur der Disk aus?

    Was sagen die SMART-Werte?

    Was sagt das HDD-Hersteller Testtool zu den Platten?

    ...


    Ich tausche bei mir im Schnitt ALLE HDD's ca. alle 3 Jahre, ab da fangen die kleineren Probleme an, die ganz schnell GANZ GROß werden!

    D.h. alle paar Monate werden 1-2 Platten durch neue getauscht, in 3 Jahren bin ich durch und fange von vorne an ... Falls der Platz mittlerweile zu wenig wird, wechsle ich auch schon mal auf das nächst größere Modell.

  • Seltsamerweise ist das aber nur bei meinen TS859 der Fall, die Celvins haben noch nie ein Problem damit gehabt. Die 459 auch nicht.

    Dann kann es auch nicht an der FW liegen. Die Treiber und RAID-Software dürften in allen drei Fällen identisch sein.

  • Sicher? Die Celvins haben HAL Firmware, bei 859+459 denke ich auch das gleich ist.


    Gruss

  • Was sagt denn mdadm --version bei den Celvins?


    Code: TS-459 Pro II
    [~] # mdadm --version
    mdadm - v2.6.3 - 20th August 2007
  • Die Celvins:

    Code
    [~] # mdadm --version
    mdadm - v3.3 - 3rd September 2013
    [~] #


    Die x59er:

    Code
    [~] #  mdadm --version
    mdadm - v2.6.3 - 20th August 2007
    [~] #


    Gruss

  • Ok, dann haben die Celvin (HAL-NAS) ne aktuellere Version.

    Relativiert aber nicht meine Aussage oben, da auf den x59 die gleiche Version läuft.;)

  • Welche HDD's sind verbaut (NAS-Platten oder Desktop)?

    - NAS-Platten, 4 x WD40EFRX

    Wie alt sind die Platten?

    - 3 x 2 Jahre; die jetzt defekte wurde vor genau einem Jahr schonmal getauscht

    War die "baugleiche" eine neue Platte, oder nur "unbenutzt" und gleich alt wie die anderen?

    - die neue im Austausch ist eine vom WD jetzt zur Verfügung gestellte. Ein Produktionsdatum sehe ich leider nicht

    Wo steht das NAS, wie lange laufen die Platten, sind sie im Dauerbetrieb 24/7 oder nur stundenweise?

    - HomeOffice-Bereich, üblicherweise 24/7

    Wie schaut die Temperatur der Disk aus?

    - alles im grünen Bereich bei 35 bis max. 40 Grad

    Was sagen die SMART-Werte?

    - alles "grün"; keine Auffälligkeiten

    Was sagt das HDD-Hersteller Testtool zu den Platten?

    - im Schnelltest "passed", keine Auffälligkeiten. Der "Extended Test" läuft derzeit noch.


    Die Firmwareversion der bisherigen 4 HDDs war gleich; von der Austauschplatte kann ich die Version aktuell nicht auslesen, weil die Platte zwar erkannt wird, aber nicht darauf zugegriffen werden kann.

  • Genau, das gilt es herauszufinden: sind es die Platten oder doch Hardware vom NAS.

    Ich habe heute die beiden Platten, also meine bisherige und die, die ich von WD zum Austausch erhalten habe, ausführlich mit deren Diagnoseprogramm getestet. Ergebnis jeweils: Passed! Aber, direkt mit einem USB-Adapater an den PC angeschlossen, werden die Platten zwar auch erkannt, aber es ist kein Zugriff möglich. Ich tendiere und hoffe ja irgendwie auch, dass es "nur" an der Platte liegt.

  • Was heisst genau "kein Zugriff möglich"?

    Sieht man in der Datenträgerverwaltung die Partitionen?


    Gruss

  • Es heißt ausnahmsweise mal genau das, was die Meldung aussagt:
    der Datenträge wird beispielsweise als USB-Drive erkannt; ein (File-)Zugriff ist aber nicht möglich. Entsprechend kann ich auch keine Partitionen o. ä. sehen. Ähnlich verhält es sich eingebaut im NAS: die HDD wird anfangs erkannt und hochgefahren, dann jedoch aus dem RAID-Verbund entfernt und meldet, dass die HDD ejected wurde. Auch hier, kein Zugriff auf die Platte selbst möglich.

  • Hast Du das im Gerätemanager gecheckt? Ncht im Fileexplorer.

    Das der PC nicht an die Daten kommt ist normal.

    Die HDDs haben ein ext4 Filesystem, das kennt Windows nicht.

    Ausserdem erstellt das NAS mehrere Partitionen, die sieht man im Gerätemanager unter Datenträgerverwaltung.

    Wenn dort nichts ist, dann ist vermutlich der USB Chip oder die Elektronik der HDD hinüber.

    Das hatte ich bei einigen USB Platten leider auch schon einge Male.

    Auch der Einbau in ein neues USB Gehäuse half hicht.


    Gruss

  • Ich kann die "primäre Basic-Partition" in der Datenträgerverwaltung sehen, aber auch hier geht nicht mehr. Wenn ich darauf klicke, sagt zumindest Windoofs, dass die Partition bzw. der Datenträger formatiert werden müsste.

  • Aktuell läuft die Löschung der Platte! Danach nochmal ein Schnelltest und dann wird die Platte nochmal im NAS probiert.


    Ich halte euch auf dem Laufenden!


    Update, 08:00 Uhr: der Löschvorgang für die HDD ist nach rund sieben Stunden abgebrochen! Die Partition lässt sich nicht löschen.

  • Die Partition lässt sich nicht löschen.

    Nicht? Wie löscht du die Partition?

    Da muss doch nur der 1. Sektor (Partitionstabelle) gelöscht werden, das dauert doch keine Stunden.


    Ich würde, auf einem Windows-System, mal die Commandline mit Diskpart bemühen ... DAS löscht alles, was es in die Finger bekommt!!!


    Also VORHER mal die Parameter dazu im Internet checken, da du damit auch ganz easy dein Windows löschen kannst ...

  • Aktuell habe ich mit Data Lifeguard Diagnostics gelöscht bzw. versucht zu löschen. Das ist erstmal die Vorgabe vom WD-Support. Mir geht es initial auch eher darum einzugrenzen, ob das QNAP NAS womöglich einen Hw-Defekt hat oder das ganze Drama von den WD-HDDs ausgeht. So oder so möchte ich keine Platte im Austausch haben, die schon bei der Einrichtung rumzickt und Probleme macht. Ich bin allerdings im Moment erstmal in der Beweis- und Lieferpflicht, dass es an der Platte hängt.

  • Und das Problem besteht weiter: heute die nächste Festplatte im Austausch eingesetzt. Anfangs wird sie noch erkannt, dann aber der RAID-Verbund "degraded" und schlussendlich die HDD abgeschaltet. Die Meldungen der Reihe nach:

    Code
    Warnung: [Pool 1] Rebuilding skipped with RAID Group 1.
    Warnung: [Pool 1] RAID Group 1 is in Degraded mode.
    Fehler: Host: Disk 4 unplugged.
    Fehler: [Volume DataVol1, Pool 1] Host: Disk 4 failed.
    Fehler: A drive has been detected but is inaccessible. Please check it for
    faults.


    und diese Meldung kommt jetzt weiterhin in regelmäßigen Abständen.