Speicherpool "Status unbekannt"

  • Hallo zusammen,


    ich bin neu hier und auch kein hauptberuflicher Admin, aber in unserer Firma (ca. 25 Mitarbeiter) mitverantwortlich für die IT. Wir haben eine QNAP TS-879U-RP im Einsatz, 8 Bay mit je 4 TB Western Digital HDDs, in einbem Speicherpool als Raid5 angelegt und in mehrere Volumes unterteilt, mit aktueller Firmware 4.3.4.0486, auf die wir seit gestern nicht mehr zugreifen können. Aber der Reihe nach:


    Nach einem Systemabsturz der NAS am gestrigen Abend gegen 18 Uhr habe ich die Nacht damit verbracht, wieder Zugriff auf das NAS-System zu bekommen. Es kam im Display am Gehäuse ständig die Warnung "Error Message. Pool Error" und anfangs die Meldung in der Weboberfläche, dass Flash-Speicher und HDDs abweichende Firmware-Versionen benutzen. Ein Firmwareupdate scheiterte allerdings immer daran, dass der Updateprozess jedesmal mit dem Hinweis auf "Nicht genügend Speicherplatz" abbrach und die NAS neu startete. Irgendwann (nach dem 10. oder 15. Reboot) führte das dazu, dass das Web-UI nicht mehr verfügbar war. Zusammen mit einem externen IT-Dienstleister konnten wir über die Linux-Oberfläche auf der Systemplatte eine 400 MB große Log-Datei ausfindig machen und löschen (auf USB-Stick verschieben). Gegen 2 Uhr war es dann wieder möglich, das Firmware-Update der Version 4.3.3 einzuspielen und damit wieder Zugriff auf das Web-UI zu erhalten.

    Danach war das System ca. 8 Stunden mit der Durchführung von Datenträgertests beschäftigt (alle erfolgreich ohen Fehler abgeschlossen). Der Speicherpool steht aber seither auf "Status unbekannt", d. h. er zeigt auch kein einziges Volume an, sondern nur die runden Lade-Symbole:


    Bildschirmfoto 2018-03-27 um 10.32.47.png

    Zwischenzeitliche "saubere" Reboots (nach den abgeschlossenen Datenträgertests) brachten auch keine Verbesserung.


    Kann mir jemand Auskunft darüber geben, ob

    1. dieser Zustand normal ist,

    2. wie lange er anhält und

    3. wie wir wieder an unsere alten Volumes rankommen?



    Viele Grüße

    Ronsen


    P.S.: Ein NAS-to-NAS Backup vom Wochenende existiert zwar, aber wir reden hier von Datenmengen in einer Größenordnung von ca. 12 TB, die über das Internet (mit 20 MBit/s) zurückgespielt werden müssten – plus 1-2 Arbeitstage, die uns verloren gingen. Daher würde ich eine (mögliche?) einfachere Lösung präferieren... ;)


    P.P.S: Den QNAP-Support habe ich auch bereits heute Nacht informiert. Eine Antwort steht noch aus...

  • kann das externe NAS für den ggf. notwendigen Restore der Daten nach intern geholt werden? Das löst aber nur den kleinsten Teil der Probleme...

  • Das wäre evtl. auch möglich, aber wohin mit den Backup-Daten? Das Backup-NAS als Produktivsystem zu benutzen, hieße, kein Backup mehr zu haben, bzw erst ein neues NAS kaufen (oder leihen) zu müssen.



    Noch ein Nachtrag zum Ursprungspost: Ich habe im Speichermanager als Einziges die Option "Pool entfernen":


    Bildschirmfoto 2018-03-27 um 12.00.05.png


    Das habe ich mich bisher aber aus Angst vor Datenverlust nicht getraut... Hat damit jemand Erfahrung?


    Viele Grüße

    Ronsen

    Einmal editiert, zuletzt von Ronsen ()

  • Mir st nicht ganz klar geworden - habt ihr jetzt FW 4.3.3 oder 4.3.4 drauf?

    Der Zustand ist eher nicht normal - und wird auch meiner Ansicht nicht von alleine weggehen.

    Was zeigt die Ausgabe von


    cat /proc/mdstat

    cat /proc/partitions

  • Gut aufgepasst, sawachika! :)

    Wir hatten ursprünglich FW 4.3.4 installiert, haben dann aber auf 4.3.3 "downgegradet", nachdem heute Nacht zwischenzeitlich gar nichts mehr ging... Die Probleme haben auch eine Vorgeschichte, denn seit wir erstmals auf Version 4.3.4 "upgegradet" hatten, fiel das NAS sporadisch immer mal wieder aus (so ca 2-3x im Monat), startete aber jedes Mal wieder von selbst neu (außer gestern). Daher kam die Entscheidung, erstmal die letzte bei uns stabil laufende FW-Version 4.3.3 aufzuspielen.


    Die Ausgaben der Linux-Befehle habe ich anghängt. Ich habe keinen Plan, was der Bericht aussagt. Bin wie eingang erwähnt kein gelernter Admin...

  • Mit den Downgrades ist das so eine Sache. Das kann gut funktionieren, muss es aber nicht immer.

    Ich wäre hier tendenziell eher mit der aktuellen Firmware (derzeit übrigens 4.3.4.0516.) weitergefahren und hätte ein Support-Ticket bei Qnap aufgemacht.

    ihr könntet das NAS nochmal sauber neu booten, dann

    /etc/init.d/init_lvm.sh

    und schauen, ob sich in der Oberfläche was ändert.

    Bitte auch nochmal die Ausgabe von

    cat /proc/mdstat 

    posten, nachdem das vorherige Kommando gelaufen ist.


    Möglich ist auch, dass die 4.3.4 Version etwas an den Signaturen geändert hat und 4.3.3 diese nicht kennt. Da würde ich dann ggf. nochmal probieren, dass 4.3.4 drauzspielen - immer im Hinterkopf, dass es ja ein backup gibt.

  • das externe NAS würde ich nur zum Restore zurückholen, nicht, um damit zu arbeiten.


    Die schnellste Lösung ist die radikalste: neues NAS kaufen. Gezielt zurücksichern von Einstellungen und Daten. Das bisherige NAS kann dann in Ordnung gebracht werden und dann als Backup-System vor Ort genutzt werden.

  • Hallo an alle,


    herzlichen Dank für die vielen Antworten und Bemühungen. Ich weiß das wirklich zu schätzen! :thumbup:


    @ Christian: Ein Ticket hab ich bereits heute morgen gegen 7:00 Uhr erstellt. Wie lange dauert es denn erfahrungsgemäß, bis sich der QNAP-Support meldet?

  • Ronsen scheinbar ist viel los beim Support und das gepaart mit Krankheit, führt augenscheinlich zu längeren Wartezeiten. :(


    Sofern die Zeit drängt und mit dem Wissen, dass ein Datensicherung vorhanden ist, kannst du natürlich einiges versuchen. Hier kann sawachika sicherlich besser behilflich sein :D

  • Also...


    ...da die Zeit drängte und der QNAP-Support sich – wie befürchtet – nicht bei mir gemeldet hat, bin ich der Anleitung von sawachicka gefolgt, habe es aber erst mit dem Firmware-Update versucht. Das Ergebnis war ernüchternd: Anstatt "Status unbekannt" zeigte der Speicherpool nun "Status Fehler" und ich kam auch nicht mehr auf die Verwaltung des Speicherpools (der Ladebilschirm blieb jedesmal bei 85% hängen).


    Ich war schon kurz davor ein neues NAS-System zu bestellen und die Backup-NAS hier in die Firma liefern zu lassen und sah mich an Ostern schon hier meine Eier im Serverraum suchen... ;)


    Dann aber kam dieser spezielle Glücksmoment: Mit dem Kommando /etc/init.d/init_lvm.sh hat es tatsächlich funktioniert (siehe Text-Datei im Anhang). Das Raid5 wird wieder angezeigt und macht direkt eine Resync, der noch ca. 6 Stunden dauert. Alle unsere Volumes sind wieder im Speicherpool vorhanden. sawachika: Ich weiß gar nicht, wie ich Dir danken kann, aber Du hast mir den Tag – nein, eher die ganze Woche – gerettet. Danke, Danke, Danke!!!! :thumbup::)


    Viele Grüße und frohe Ostern!

    Ronsen