disk error bay 3 immer wieder: backplane defekt?

  • Hallo!

    Ich bin mittlerweile mit meiner Qnap TVS-673 wirklich kurz vorm Verzweifeln. Seit dem vorletzten Firmware-Update tun sich bei mir immer neue Abgründe auf. Zuerst funtkionierten die exfat-Treiber nicht mehr (immer noch ungelöst). Jetzt bin ich mit einem leider wahrscheinlich wirklich massivem Problem konfrontiert:

    Vor ca 1 Monat fiel die HDD in bay 3 aus, disk error (es handelt sich um eine WD Red 4 TB; raid 10 mit 4 Platten in bay 3-6). Ok, Platte mittels hot swap ausgetauscht, Raid 10 rebuilden lassen und gedacht, das Problem wäre gelöst. Ich habe die ausgetauschte Platte mit dem WD Data Lifeguard Tool getestet und keine Fehler gefunden, erwartungsgemäß funtkioniert die Platte auch an anderen PCs. Jetzt, am letzten Wochenende wieder disk error an Bay 3. Wieder Platte ausgetauscht gegen neue, wieder die ausgetauschte Platte am PC gecheckt und wieder keine Fehler gefunden. (es wäre ja auch wirklich sehr unwahrscheinlich, dass eine neue Platte in genau dem gleichen bay wieder ausfällt) Das Raid wurde auch diesmal mit der neuen Platte rebuildet und im Moment läuft alles. Ich habe jedoch das ungute Gefühl, dass es nur eine Frage der Zeit ist, bis sich die HDD in bay 3 wieder verabschiedet, vor allem, nachdem ich das hier gefunden habe:

    https://forum.qnap.com/viewtopic.php?t=134212

    Wenn ich das richtig verstehe, dann hat Qnap bei mehreren Modellen (unter anderem auch die x73 -Reihe) ein Problem mit fehlerhaften backplanes. Zur Reparatur muss (sofern noch Garantie), das Qnap eingeschickt werden und es dauert wochenlang, bis man es wieder retour bekommt, und auch dann ist der Fehler nicht immer behoben.

    Seltsam finde ich nur, dass wenn es sich um ein hardware-Problem handelt, warum ich vor der Oktober-Firmware nie ein Problem hatte. Außerdem finde ich es einen komischen Zufall, dass meine beiden aktuellen Probleme (exfat und bay3) beide mit der Thematik sata-Anschluss/Treiber/etc. zu tun haben. Ich habe irgendwie den Verdacht, dass sich mit der neuen Firmware irgendwas bei den Sata-Treibern geändert hat.
    Hat von euch schonmal dieses Problem mit seiner Qnap gehabt, dass Platten in einem bestimmten bay, obwohl Platte einwandfrei, immer wieder gecrasht sind? kennt ihr den verlinkten Thread?

    Meine bisherige Begeisterung von Qnap schwindet immer mehr und wandelt sich in Ärger.

  • Da musst Du gar nicht im US Forum suchen, etwas ähnliches gab es hier vor kurzem auch. Ob es jetzt Bay 3 oder eine andere war weiß ich nicht mehr.

    Aber durch ein FW Update wurde wohl auch für einen Controller das BIOS/FW geändert und es gab Ausfälle auf einer Bay.

    Dazu gab es aber einen Patch.


    Gruss

  • hallo,

    erstmal danke für eure Antworten. Bin im Moment auf Arbeit und kann den step 2 nicht ausprobieren. Wenn ich wieder daheim bin, werde ich es testen und dann berichten.


    PS:

    verstehe ich das richtig:

    sollte ich Asmedia firmware version 420 haben, dann muss ich nur laut Anleitung downgraden und alles ist wieder ok?

    sollte ich nicht version 420 haben, dann ist meine backplane defekt und ich kann einschicken? oh mann, hoffentlich ist es die firmware.


    pps:

    wo ist den der thread zu dieser Problematik hier im Forum? Würde ich gerne mal durchlesen.

    2 Mal editiert, zuletzt von Robertson23 ()

  • hallo,

    danke gforce für den link.


    also, ich habe jetzt gerade den step 2 der anleitung aus dem link probiert, aber irgendwas mache ich offenbar falsch.

    ich habe die 3 files in das Public Verzeichnis gelegt, dann putty ssh mit cd /share/Public in das Verzeichnis, dann Befehl "chmod a+x asm1061_ver" eingegeben und enter, da passiert nichts. dann den 2 Befehl "./asm1061_ver" eigegeben und enter und auch da hupft er nur weiter für eine neue Eingabe. Ich habe leider so gut wie keine Linux-Kenntnisse. Was mache ich denn falsch?

    Siehe Screenshot im Anhang:

    asmedia.jpg

  • Das könnte bedeuten, dass dieser Controller bei dir nicht verbaut ist.

    Ich bin mir aber nicht sicher, da ich es selbst nicht testen kann.

    Meine QNAP hat diesen Controller nicht.

  • frosch2


    ja wahrscheinlich hast du recht.

    also, die neue Platte (also die 2. neue, um genau zu sein), läuft jetzt seit ca 6 Tagen ohne Probleme. Bisher habe ich auch noch nicht rebootet.

    Was soll ich jetzt machen? Einfach abwarten ob die Platte wieder aus dem raid fliegt? Ich befürchte, dass das wieder passieren wird, aber klopf auf Holz dass nicht.

    Im amerikanischen Forum hat einer gesagt, dass das Firmwareproblem mit dem asmedia Treiber NUR bei dem Qnap ts253 pro auftritt, und demnach auch die Lösung mit mit dem downgrade des asmedia treiber nur da funktioniert. Bei meinem TVS-673 muss es was anderes sein, schlimmstenfalls die backplane.

    Bin mittlerweile echt schon am Überlegen, ob mein nächstes NAS ein Synology wird, soviel Ärger wie das Qnap verursacht.

  • An deiner Stelle würde ich Support kontaktieren (Ticket) und, wenn noch Gewährleistungsanspruch besteht, diesen beim Händler anmelden.

  • hallo nochmal,


    die neue hdd in bay 3 (also die jetzt insgesamt 3 hdd) läuft seit über 10 Tagen ohne Probleme. Gestern habe ich das NAS einmal komplett heruntergefahren und nach ein paar Minuten neu gestartet, um zu sehen, ob sich das irgendwie auswirkt. Keine Probleme.


    ich habe mit dem Diagnostic Tool eine Kernel-Auswertung gemacht und diese Ergebnisse:

    Code
    ata6: SError: { RecovComm PHYRdyChg 10B8B Dispar } -- Count:46
    ata6: SError: { RecovComm PHYRdyChg 10B8B Dispar BadCRC TrStaTrns } -- Count:107
    ata6: SError: { RecovComm PHYRdyChg CommWake 10B8B Dispar DevExch } -- Count:14
    ata6: error: { UNC } -- Count:9
    ata6: hard resetting link -- Count:284
    ata6: softreset failed (device not ready) -- Count:1
    sysRequest.cgi[24815]: segfault at 7fff6a2b8 ip007f75ee568351 sp007fff6a282eb0 error 4 in libuLinux_statistics.so.0.0[7f75ee560+0] -- Count:0
    exception -- Count:724
    bus error -- Count:311


    Stehen diese Fehlermeldungen mit einer defekten backplane oder mit einer defekten HDD in Verbindung??? Könnt ihr was dazu sagen?

    Die SMART-Werte der neuen Festplatte sind laut Diagniostic Tool folgende (da die 2 internen m.2 Plätze als bay 1 und 2 gezählt werden, ist bay 5 eigentlich bay 3):


    Ich habe mir gedacht, dass ich jetzt noch so ca 2 -3 Wochen abwarte, was passiert. Sollte die hdd wieder rausfliegen, kann ich wahrscheinlich von einem backplane Defekt ausgehen, oder?

  • push.

    kann niemand was zum kernel protokoll sagen?


    werde heute fw 4.3.5.0756 build 20181110 updaten. im changelog steht:

    - Using the Asmedia ASM1061 controller (firmware version 4.20) would cause disk errors.


    keine Ahnung, ob ich diesne controller habe (und ich weiss auch nicht, wie ich das mittels ssh überprüfen/nachsehen kann, die Anleitung von weiter oben hat mich da nicht weiter gebracht), aber vielleicht ist das ja die Lösung?

  • ja eh, schon klar. Wäre halt gut, schon mal "was in der Hand zu haben", wenn ich ein Ticket eröffne, um den Support bereits in die richtige Richtung zu lenken.


    habe fw update gestern eingespielt. Qnap läuft, keine Platten-Probleme (noch).


    Was mich generell interessieren würde:

    Listet dieses kernel Protokoll alle jemals aufgetretenen (und damit auch bereits gelöste) Fehler auf, oder sind die bei mir gelisteten Fehler aktuell vorhanden?

  • Listet dieses kernel Protokoll alle jemals aufgetretenen (und damit auch bereits gelöste) Fehler auf, oder sind die bei mir gelisteten Fehler aktuell vorhanden?

    Nein, es ist liegt in einem Pufferspeicher. Dieser wird beschrieben bis er voll ist und dann der jeweils älteste Eintrag überschrieben.

  • verstehe ich das richtig:

    auch wenn die bei mir aufgezeigten Fehler mittlerweile bereits gelöst sein sollten, scheinen sie dennoch so lange im kernel protokoll auf, bis sie durch neue Fehler überschrieben werden? das würde ja bedeuten, dass ich nie mehr ein protokoll mit "no errors found" haben werde. find ich seltsam...

  • Nach dem Reboot ist der Speicher auch geleert. Mit der Option "C" kannst du ihn auch leeren.

  • Siehe zum selben Thema bzw Problemkonstellation das hier. Probleme Schacht 3 bei TVS 473 - Serien-Problem ?


    Siehe dazu auch die Tatsache, das z. B. bei Firma Alternate quasi alles von Qnap, was in diese Richtung geht, seit

    1. über ner Woche auf (min) 9 Tage Lieferzeit steht und

    2. diese Angabe mit schöner Regelmäßigkeit wieder auf 9 hochgesetzt wird.

    2a. Anfrage von mir ergab: Liefertermin unbekannt, der Vorlieferant kann mangels Bestand nicht liefern.

    3. Meine vor inzwischen 6komma irgendwas Wochen eingeschickte TVS 473 steht nachwievor in irgendwelchen Qnap eigenen Räumen herum bzw. ist noch nicht wieder auf dem Rückweg..


    Intuitiv beurteilt, scheint es da nen was anderes als kleines 'Problem' zu geben..

    Einmal editiert, zuletzt von DerTigga ()

  • Ganz ehrlich ? Ich befürchte, das das das nen größeres Problem ist.

    Ich lasse mich gerne besserem belehren, das ich das folgende nicht tun solle..weil... aber ich nehme da mal die Webseite der Firma Alternate und Telefonate mit denen als Indikatoren für.

    Aufgrund der langen Zeitspanne, die meine TVS 473 nun schon eingeschickt ist, habe ich mich recht ausführlich mit gangbaren Alternativen dafür beschäftigt. Habe daher einige Stunden mit (auf der Qnap HP) suchen und vergleichen verbracht. Und dann mit vorhandenem Istbestand bei Alternate verglichen, denn die sind die, die mir die Gutschrift für jene eingeschickte NAS ausstellen würden bzw. im Moment schon haben.

    Daher weiß ich auch, das es bis vor ner Woche noch so einiges an NAS der *73er Reihe bei denen zu kaufen gab. Auf Lager vorhanden eben. Selbst die relativ teuren 8Bay Geräte waren vorrätig. Die sind inzwischen alle weg, durch die Bank stehen massenweise Geräte "auf einmal" auf der genannten langen nicht Verfügbarkeit. Ums im O-Ton Mailkontakt und wie schon geschrieben auszudrücken: nichts ist lieferbar.

    Kann mich z.Z. nur bedingt gegen das Gefühl wehren, das da ne der Öffentlichkeit verschwiegene und relativ große Rückrufaktion am laufen ist..

    Die von mir als Ersatz auserkorene und bestellte TS-673 ist ebenfalls nicht verfügbar + nicht absehbar, wann sich das ändert und ich ringe mit mir, auch das / die sicherheitshalber wieder zu canceln - da intuitiv und auch, wegen der starken Ähnlichkeit deiner Schilderung zum erlebten, befürchte, das die ebenfalls betroffen sein könnte.

  • DerTigga


    Das versaut mir jetzt echt den Tag.

    Deine Ausführungen klingen einleuchtend. Ich werde jetzt jedenfalls ein Ticket beim qnap support öffnen.

    Mein Hauptproblem ist: auf dem tvs-673 läuft nakivo backup and replication (für meine vmware Umgebung), auch Speicherziel der backups ist diese Qnap. Diverse iscsi-luns sind auch noch drauf. Wochenlang will ich da nicht auf eine Reparatur/Austausch warten.

    Oh Mann, so ein verdammter Mist...


    habe dir die frage zwar auch im anderen thread gestellt, aber wenn du es hier liest:

    Wie lange hat es denn bei dir nach einem hdd-Austausch gedauert, bis die Platte wieder gezickt hat? Bei mir läuft es jetzt schon über 2 Wochen.