[QNAP Helpdesk V.3.0.2 (20200210)] - Wie LOGS richtig auslesen?

  • Hallo liebe Freunde des QNAP.


    Bitte verzeiht mir, falls es dazu bereits Infos gibt, aber ich konnte auch mit der SUFU nichts finden...


    Mein NAS startet manchmal unkontrollliert von selbst neu.

    In den Ereignisbenachrichtigungen heisst es dann nur, dass das System beim letzten Mal nicht ordnungsgemäß runter gefahren wurde etc...

    Aber keinerlei Info WARUM das NAS neu gestartet hat.


    Was also liegt näher, als die LOGS zu durchsuchen :)

    Meine Frage daher: Kann mir jemand erklären wie und wo ich diese am besten auslesen kann?

    Soweit ich weiß kann man über das "HELP Desk" unter dem Punkt "Diagnosewerkszeug" wunderbar "Protokolle download" machen und bekommt eine ZIP Datei mit allerhand Informationen.


    Doch wie kann ich diese Informationen deuten? Ich habe in der ZIP ein paar Ordner (etc, mnt, proc, sys, tmp, var) und eine html Datei.

    Wenn ich die html Datei öffne, bekomme ich eine Wunderbare Page, wo ich nahezu ALLE Logs durchsuchen kann.


    Aber wie soll ich nun wissen wonach ich suche?

    Das erschlägt mir mit etlichen verschiedenen LOGS und ich sehe vor lauter Bäumen den Wald nicht mehr (ähhh... oder so ähnlich).


    Gibt es hier eine Anleitung oder Informationen wie man das deuten kann?

    Woher weiß ich, unter welchen LOGS ich nun nach den ungeplanten selbstständigen Neustarts suchen muss?


    Vielen Dank schon mal für Eure Hilfe - und bitte falls ich hier im Bereich falsch bin meinen Beitrag einfach verschieben...

    Ich wusste nicht wo genau meine Frage passt...


    LG

  • weder user noch qnap wissen weiter

    wow... wusste gar nicht, dass es hierzu bereits etwas gibt..
    Danke für die Info und den Link - eine weitere Enttäuschung von QNAP...

    - Keine Benachrichtigungen bei erfolgreichen Logins möglich (hier)

    - OpenVPN bricht immer wieder ab (hier)

    - Problem beim Update mit den MAC Adressen (hier)

    - Problem beim Update (hier)

    - und und und...

  • Habe auch diese Neustarts

    Code
    "" Schweregrad	Datum	Uhrzeit	Benutzer	Quellen-IP	Anwendung	Kategorie	Inhalt
    Warnung	2020/08/15	19:35:44	System	127.0.0.1	Power	NAS Power Status	[Power] The system was not shut down properly last time.""

    gibt es Abhilfe?

  • Das ist bei spontanen Neustarts eben genau das Problem: das Ereignis tritt VORHER auf, nur kann in diesem Moment wenn rebootet wird nichts mehr geloggt werden.

    Es gibt keinen NVRAM oder ähnliches, in dem solche Ereignisse vermerkt werden.

    Und nach dem Start kann das NAS nur melden, das der Neustart unplanmäßig war, aber kennt die Ursache nicht mehr.

    Insofern also für eine Ursachenforschung leider recht sinnfrei,


    Gruss

    Einmal editiert, zuletzt von FSC830 ()

  • Insofern als für eine Ursachenforschung leider recht sinnfrei,

    Es sei denn, man hat zufällig eine entsprechende Sitzung auf dem NAS gerade offen, während dies passiert. Ist mir schon einige Male passiert, so dass ich vermuten konnte, dass es die gleiche Ursache war, wenn ich keine entsprechende Sitzung offen habe. Bei mir schlägt eine QTS-Systemüberwachung zu, die einen unsauberen Reboot durchführt. QTS versucht nicht einmal, ob ein sauberer Reboot noch möglich sei. Und Ursache für den Auslöser der Systemüberwachung ist bei mir immer ein Resourcenmangel gewesen, entweder dass der verfügbare Hauptspeicher nicht mehr ausgereicht hat und das Gerät mit Swappen anfängt, oder dass die CPU nach Auffassung von QTS in eine Überlastsituation gerät. Wobei zumindest auf schwachen NAS-Modellen das Swappen früher oder später ohnehin auch zur Überlastung der CPU führt. Es handelt sich nicht um Throtteling, das auf Hardwareebene (Firmware oder Microcode) auf Grund des thermischen Zustandes ausgelöst wird.


    Von daher gebe ich FSC830 beschränkt recht. Wenn das Symptom nur selten sporadisch auftaucht, ist Ursachenforschung reine Spekulation. Wenn das Symptom dagegen regelmäßig oder häufig auftritt, könnte man Glück haben, und noch Hinweise auf die Ursache erhalten, z.B. durch Ressourcenüberwachung kurz bevor und während dem Symptom. Und nur wenn dies zufällig gelingt, lässt sich an der Ursache auch etwas ändern. Bei mir liesse es sich nur dann komplett verhindern, wenn ich einen weiteren Hintergrunddienst deaktiviere. Im jetzigen Zustand tritt es seltener als einmal im Halbjahr auf meinem schwächsten NAS auf.

  • Was für Hardware-Watchdogs sollen dies sein?


    Hatte diese Symptomatik auf allen verwendeten NAS erlebt: TS-431P, TS-453Be und TS-873.


    Und in der Prozesstabelle finde ich Systemüberwachungen in QTS von QNAP. Deren Namen enden jeweils mit soldier. Einen Hardware-Watchdog kann ich ja in der Prozesstabelle nicht sehen. Aber ob nun ein Hardware-Watchdog oder eine Systemüberwachung in QTS zugeschlagen hat, kann ich nicht mit Sicherheit beurteilen. Hatte nichts davon gelesen, dass eines oder alle meine NAS ein Hardware-Watchdog hätten, und hatte daher gefolgert, dass es nur diese Systemüberwachung sein könne.

  • Deren Namen enden jeweils mit soldier.

    Du meinst nas_soldier und mem_soldier?

    Das sind zwei Shellskripte aus den Diagnosetools. Die resetten und rebooten nichts.


    WatchDog Timer sind (meist in der CPU integrierte) Zähler, die, wenn sie nicht innerhalb einer programmierten Zeitspanne getriggert werden, einen Reset auslösen.

  • Im jetzigen Zustand tritt es seltener als einmal im Halbjahr auf meinem schwächsten NAS auf.

    Möglicherweise würde hier ein Neustart alle 3 Monate helfen. So werden Ressourcen wieder freigegeben und Zombies (Wie sagt man da, gekillt? Aber Zombies sind ja schon tot. Hmm :) ) beendet.

  • Du meinst nas_soldier und mem_soldier?

    Das sind zwei Shellskripte aus den Diagnosetools. Die resetten und rebooten nichts.

    Möglich, dass diese mal so hießen. Inzwischen finde ich diese nicht mehr und statt dessen qdesk_soldier.


    WatchDog Timer sind (meist in der CPU integrierte) Zähler, die, wenn sie nicht innerhalb einer programmierten Zeitspanne getriggert werden, einen Reset auslösen.

    Was WatchDogs sind, weiß ich. Können so sein, wie Du schreibst. Können aber auch eine Implementierung in Firmware oder Microcode sein, die interne Sensoren auswerten und darauf reagieren. Können in CPUs stecken oder auch auf der Hauptplatine oder dem Chipsatz. Habe halt bislang nichts von WatchDogs im Zusammenhang mit den CPUs und Boards gelesen, die in meinen NAS stecken. Wo finde ich Angaben dazu, um zu prüfen, ob es solche Komponenten bei meinen Systemen gibt?