Array Slot und Array State failed

  • Hallo Leute,


    nachdem Tante Google und der QNAP Support nicht zu einer Lösung beigetragen haben jetzt mein Versuch an die Community.
    Ich habe das NAS eines Bekannten jetzt bei mir stehen, da es immer mal wieder die Festplatten 4 und 5 aus dem RAID Verbund schmeißt, wenn das NAS einen Reboot durchführt.
    Fährt man das NAS in diesem Fehlerzustand komplett herunter und startet es neu wird die Festplatte 4 wieder in den Verbund aufgenommen, so das man die Daten jetzt retten kann, HDD5 bleibt aber entladen und kann nur per SSH Verbindung händisch wieder eingebunden werden. Hat man HDD5 per Kommandozeile manuell eingebunden, dann syncronisiert sich das RAID wieder und die Status LED wird auch wieder grün. Fährt man das NAS jetzt aber ordnungsgemäß herunter und startet es später wieder neu ist HDD5 wieder entladen.
    Was bei diesem Fehlerbild auch merkwürdig ist, ist dass wenn das RAID nach dem Reboot vorübergehend komplett tot ist im Speichermanager die Festplatten 1 und 2 verschwunden sind und die Festplatten der übrigen Positionen nach vorn gerutscht sind (HDD3 sitzt also an Position 1 obwohl sie in Schacht 3 steckt und so weiter).
    Ich habe das NAS nach dem ersten auftreten des Fehlers komplett neu aufgesetzt (inkl. FW Update), HDDs wurden teilweise getauscht und trotzdem passiert es zeitweise wieder.
    Merkwürdig sind auch die mdadm-Ausgaben auf der Konsole, welche anzeigen das etwas mit den Schächten nicht stimmen würde, man findet im Netz zwar einige Berichte dazu, aber nie eine Lösung. Die SSH Ausgaben welche ich angehangen habe, sind zwar während der Neuerstellung angefertigt worden, zeigen aber schon die Auffälligkeiten, die auch nach Abschluss des resync auch nicht verschwinden.
    Die Daten sind bereits alle gerettet, mit dem NAS kann ich momentan alles anstellen was notwendig ist, um es wieder in einen betriebssicheren Zustand zu bringen.


    NAS: TS559II
    FW: 4.2.6-20171208



    Gruß Rico

  • Wenn Du schon mit dem QNAP-Support Kontakt hattest, was hat denn der dazu gemeint?

  • Die Haben mir nur einen Verweis auf auf eine FAQ geschickt, wie man das RAID manuell zusammensetzten kann.

  • Was ja wohl zu klappen scheint aber nicht von Dauer ist.


    Da die QNAP ja komplett neu aufgesetzt wurde scheiden die üblichen Fehlerquellen schon mal aus.
    Ähnliche Probleme hier im Forum erwiesen sich als defektes Netzteil, defektes Backplane oder ein Update des BIOS wurde fällig. Aber ob und welches bei Dir zutrifft kann ich Dir auch nicht wirklich sagen.
    Wie sieht es mit Garantie aus?

  • Garantie ist leider schon lange abgelaufen. Ich vermute ja auch was in Richtung BIOS oder Backplane. BIOS Updates gibt es wohl nur direkt über QNAP wenn der Support sie einen zukommen lässt und das mit der Backplane lässt sich ja auch nur schwer testen.

  • Gehe ich richtig in der Annahme, dass es sich bei dem Gerät um ein TS-559 Pro II handelt, denn ein TS-559 II kann ich nirgends finden.


    Backplane dürft in mehrfacher Hinsicht schwierig sein: Mal abgesehen vom Herausfinden/Test, wird es vermutlich schwer sein eines zu bekommen und wenn ja wird es auch nicht gerade billig sein, vermutlich mehr als der Restwert des NASes. Für das TS-559 Pro II konnte auf die Schnelle keines finden, aber für das TS-559 Pro kostet es 158.00 €.


    Netzteil gibt es noch, mit 139,00 € oder US$159.00 aber auch nicht gerade billig. Wenn es nicht das Problem ist... Leihweise ein passendes Teil wäre gut zum Testen. Aber da ein internes Netzteil auch nicht gerade einfach und mit Aufwand verbunden. Vielleicht was passendes aus dem PC-Bereich oder Dritthersteller.


    Am Besten nochmals an den Support wenden.

  • Mavalok2: Du hast natürlich Recht es handelt sich um ein TS-559 Pro II


    dr_mike: Da ich noch mal verschiedenes probiert habe und ein möglichst sauberes Log liefern möchte, hab ich das NAS noch mal neu aufgesetzt. Deswegen gibt es nur eine Datei mit Kernelmeldungen, die aber vom Start über die Erstinitialisierung bis jetzt zu laufenden resync.


    Ich hab auch noch einmal ein Ticket bei QNAP mit der expliziten Frage nach einem möglichen Hardwaredefekt bei solchen Statusausgaben gestellt.

  • Das ist der Drang zum Aufgeräumten, Korrekten, zum "Sauberen", dann ist es übersichtlicher. Das wurde mir schon in der Ausbildung beigebracht, dass nach dem Lösen des Problems die Event-Logs gelöscht werden. So ein Blödsinn. :S Bei mir wird nie ein Log gelöscht, nur die alten Daten werden von den neuen überschrieben, wenn das Log voll ist. Das muss ich externen Mitarbeitern immer wieder eintrichtern, dass Logs bei mir nicht gelöscht werden.


    @Trekki80
    Nicht böse gemeint und nicht auf Dich bezogen. Mich nerven nur meine externen "IT-Spezialisten", denen ich das immer wieder einprügeln muss. :cursing: Das musste ich jetzt einfach los werden. Sorry. :saint:

  • Hallo ihr beiden ich verstehe zwar eure Kritik, dass bei jungfräulichen Logs die wichtigen Einträge unter Umständen fehlen können aber gerade bei diesem Gerät ist es ja so, dass trotz einer Neu-Initialisation die Statusausgaben des Superblock Fehlerinformationen beinhalten. Wo die herkommen, das ist ja die Frage. Das übliche QNAP-Prozedere lautet ja Daten sichern und mit aktueller Software neu starten. Und das Log wo der RAID-Verbund sich gelöst hatte war schon längst über dem Jordan gegangen, da da schon einige Neustarts und Reboots ins Land gegangen sind, bis ich jetzt von euch auf die Notwendigkeit selbigen hingewiesen wurde.
    Gut jetzt haben wir uns gegenseitig die Meinung zu diesem Thema gesagt und versuchen weiter das Problem zu lösen, mal sehen wann QNAP antwortet.


    Gruß Rico

  • Und das Log wo der RAID-Verbund sich gelöst hatte war schon längst über dem Jordan gegangen, da da schon einige Neustarts und Reboots ins Land gegangen sind

    Nein, diese Logs waren in kmsg.1 und kmsg.2 die es nun durch das Neuaufsetzen nicht mehr gibt.


    Was den Superblock betrifft, hier würde ein komplettes Überschreiben/Löschen der Platten helfen.

  • So, QNAP hat sich wieder gemeldet und nachdem ich ihnen noch einem kompletten Dump des Diagnose-Tools zugeschickt habe, meinen sie das Gerät ist in Ordnung und die "failed"-Meldungen wären an dieser Stelle normal / unbedenklich.


    @dr_mike: Wie intensiv müsste das Löschen der Festplatten denn durchgeführt werden? Alles komplett nullen oder genügt der clean-Befehl von Diskpart, so dass die Festplatte nur neu initialisiert wird?


    Ansonsten weiß ich ja jetzt Bescheid, dass ich die Log die jetzt im Laufe der Zeit entstehen nicht einfach durch eine Neu-Initialisierung wegwerfe, sondern Sie erst sichern werde.


    Gruß Rico

  • Ich denke, dass das Clean reichen müsste. Ich verwende immer dd dafür und überschreibe die ersten 4GB mit Nullen.
    dd if=/dev/zero of=/dev/'Laufwerk' bs=4K count=1073741824
    bs und count entsprechend der Blockgrösse der Platte.

  • So ich habe mehrere Versuche mit 2 Festplatten als RAID 1 in diesem Gerät durchgeführt. Weder das Re-Initialisieren per clean-Befehl unter Diskpart, noch das nullen der ersten 4 GB der Platten lassen den Fehler verschwinden. Entweder hat dieses Gerät oder diese Modellreihe ein sehr merkwürdiges Verhalten oder es liegt doch ein sehr seltener versteckter Fehler vor.
    Da QNAP das Gerät für i. O. befindet werde ich es jetzt mit einem RAID 6 betreiben und hab dadurch ein wenig mehr gefühlte Sicherheit.
    Falls jemanden noch etwas einfällt kann er es ja gerne vortragen, ansonsten ist das Thema für mich erst mal durch. Gelöst ist es zwar nicht aber mal ausgiebig diskutiert.


    Gruß Rico