Qnap Abgestürzt

  • Guten Abend,


    Vor wenigen Minuten ist meine NAS einfach abgestürzt und neu gestartet. In den Logs finde ich nur die Meldung darüber, dass die NAS nicht sauber herunterfahren wurde und dass das Filesystem geprüft werden muss. Für mich natürlich nicht so geil, da das Backup nach extern momentan noch läuft und heute abend das reguläre Backup auch läuft. Die Prüfung würde ich morgen starten. Was hält blöd ist, ist die Tatsache, dass meine volumes wohl während dieser Zeit nicht erreichbar sein werden. Das kann ich mir eigentlich nicht erlauben..


    Hat das schon mal jemand gehabt und kann mir hierzu vielleicht etwas sagen?


    Ich danke euch!


    Edit: heute abend fand ziemlich viel Schreibzugriff durch mich statt. Die Hdds sind alle in Ordnung und hatten max. 40 Grad. Die Platten sind allgemein noch nicht alt (bis auf eine, die hat aber erst knapp 300 Tage auf dem Buckel. Der Rest hat um die 40 Tage)

    Ich habe ein Raid6 mit momentan 6x8TB Platten. Das System läuft auf einer Ssd, die auch in einem einwandfreien Zustand ist.

    Ich habe caching (r/w) auf einer M2 SSD aktiviert. Hoffe, dass ich nach dem unerwarteten Neustart nichts zu befürchten habe. Auch die M2 ist in Ordnung.

    Aktuell findet eine Synchronisation meiner Raid2 Gruppe statt. Das wird wohl noch ein weilchen dauern.

    Falls euch sonst noch was an Infos fehlt, immer her damit.

  • Hatte ich auch schon mehrmals unter verschiedenen FW Versionen/NAS, z.B. 4.2.6 und 4.3.4.

    Einmal war es defekte HW, aber auch FW war mal buggy.

    Letztendlich kannst Du nur nach und nach alle Dienste deaktivieren und sehen, ob das NAS stabil läuft.

    Als Alternative das NAS neu aufsetzen.

    Wenn allerdings ein HW Defekt vorliegt, dann hilft das auch nicht.


    Gruss

  • Hmm meine Hardware ist neu. Probleme mit Strom schließe ich erst mal aus, weil eine USV davor hängt und mein Server ohne weiteres weiter lief.

    Die Platten sind alle geprüft. Die sind in Ordnung. Hier hatte ich auch vor ein paar Tagen Tests laufen lassen.

    Ich weiss gerade nicht, welche Version ich installiert habe. Aber es ist jedenfalls nicht die neueste. Die automatischen Systemupdates habe ich gleich deaktiviert, weil ich hier schon mehrfach gelesen habe, dass die Versionen hier nicht immer das gelbe vom Ei sind.

  • Rate dir das Dateisystem direkt zu prüfen!

    Wird hier ein Fehler verschleppt kann er sich fortpflanzen und im worst case das ganze Dateisystem soweit schädigen das wirklich Daten verloren gehen könnten.

  • Ich bin grad dabei noch schnell ein paar Daten umzuziehen. Danach starte ich die Prüfung. Ich habe ca. 17TB an Daten.

    Weiss jemand, wie lange der Ausfall dauern wird und ob ich dies während der Prüfung machen kann?


    2021-11-08 08_07_30-Window.png


    Danke.

  • Während der Prüfung ist das Volume offline, da ist kein Zugriff möglich.

    Dauer kann zwischen 10 Minuten und Stunden liegen, je nachdem, ob Fehler wirklich gefunden werden.


    Gruss

  • Okay, darf ich die Prüfung starten, auch wenn die Synchronisierung da noch läuft?

  • Hab ich nicht getestet, würde ich aber nicht machen.

    Jedenfalls nicht während der Raid Synchronisation. Den Sync Job kann man abbrechen.


    Gruss

  • Ich weiss nicht, was der Syncjob macht und ob das wichtig ist. Wenn dies nicht wichtig ist, würde ich das ggf wirklich abbrechen um dann das Dateisystem zu prüfen.

  • Die Raid Prüfung auf niedrige Prio setzen, dann kannst du das Dateisystem prüfen.

    Der Sync Job muss aber dafür abgebrochen werden, da das Volume offline geht.

  • Alles klar, ich danke dir. Den Sync Job kann ich abbrechen. Das ist egal. Ich habe natürlich oben die Raid Prüfung gemeint. Bei der wusste ich nicht, ob die wichtig ist. :D

    Dann starte ich mal. Vielen Dank. Ich melde mich nachher zurück.



    EDIT:


    Was hat dies nun zu bedeuten? Es sieht aus als wäre die Prüfung schon durch oder irre ich mich?


    pasted-from-clipboard.png


    Zusätzlich habe ich diese Meldung in der Log:

    pasted-from-clipboard.png


    Dies könnte das Problem sein:


    pasted-from-clipboard.png


    Kann ich das ohne weiteres machen? Es läuft halt noch die Raid Prüfung.

    Vielen Dank.

  • Mir ist mal ein MacBook abgestürzt, weil in dem Moment zwei ICEs vor dem Büro aneinander vorbeigefahren sind. Es gibt Abstürze, deren Ursachen sich im Nachhinein nicht nachvollziehen lassen, wenn man nicht direkt dabei war, zumal bei einem Absturz des ganzen Systems oftmals auch kein Log-Eintrag mehr geschrieben werden kann.


    Wenn der Absturz nicht wiederholt auftritt, würde ich keinerlei Energie in die Ursachenforschung stecken. Ansonsten muss man versuchen, den Absturz zu reproduzieren, um mehr Erkenntnisse zu gewinnen. Wenn man viel Last im Verdacht hat, Last lässt sich testweise erzeugen.


    Hmm meine Hardware ist neu.

    Das hat nichts zu sagen. In der Chipherstellung können die Hersteller nicht alle fehlerhaften Chips ausfiltern. Manche Fehler zeigen sich erst nach einigen Tagen oder Wochen, andere wiederum erst bei höheren Temperaturen, welche durch Last verursacht werden können.