Temporärer Ausfall TS-332X

  • Hallo,

    wir haben zwei QNAPs TS-332X, welche beide mit PRTG via SNMP gemonitort werden.

    Nun hat PRTG häufiger für kurze Perioden (1-5 Minuten) gemeldet, dass eine QNAP nicht erreichbar ist.

    Es handelt sich hierbei um SNMP Abfragen von mehreren OIDs.

    Um zu prüfen, was los ist habe ich das Webinterface aufrufen wollen, welches auch für kurze Zeit nicht erreichbar war.

    Nach kurzer Zeit ist danach wieder alles in Ordnung und funktioniert auch wie gewollt.

    Dieser Fehler trat nun jedoch leider in den letzten Tagen mehrfach auf, was für den Betrieb nicht ideal ist.

    In den Systemlogs waren keine Einträge vorhanden.

    Ist dies ein bekanntes Problem und gibt es noch weitere Logfiles, in denen ich auf Fehlersuche gehen kann?


    Mit freundlichen Grüßen,

    Marco Riechen

  • Mehr Infos und Logs zum NAS bekommst Du über die QNAP Diagnostic Tools:

    Dienstprogramme – QNAP Diagnostic Tool: Dem NAS auf den Zahn fühlen


    Das geht auch über die Konsole:

    Erste Hilfe - Wenn das NAS nicht mehr will (Teil 2): Für Fortgeschrittene


    QNAP-Überwachung funktioniert sehr gut mit Q'Center von QNAP selbst:

    Dienstprogramme – Mit Q‘Center einzelne oder mehrere QNAP-NAS verwalten


    Zum Problem selbst:

    Klingt für mich irgendwie nach Netzwerkproblemen. Ob bei der QNAP selbst oder im Netzwerk ist mit den vor Dir gegeben Informationen recht schwierig zu sagen.

    Welche QTS Version wird eingesetzt?

    Im lokalen Netzwerk oder Remote?

    Irgendwelche speziellen Apps im Einsatz?

    Welche Dienste?

  • Was ich noch vergessen hatte zu schreiben ist, dass bei den Ausfällen die Status LED der betroffenen QNAP nicht leuchtet.

    Die QNAP ist im lokalem Netz und wird nur als externer Speicher zur Datensicherung mit Altaro eingesetzt (als offsite location). Das verwendete QTS ist: 4.3.6.0993

    Weiterhin ist der Fehler nun auch auf der zweiten QNAP aufgetreten. Exakt das gleiche Fehlerbild, die Vermutung mit Netzwerkproblemen liegt also nahe, jedoch verwundert mich, dass die Status LED während das Problems auftritt nicht leuchtet.

  • Du meinst hier das Status LED der QNAP selbst und nicht die der Netzwerkkarten oder?

    Das NAS läuft aber weiterhin? Kein Stromausfall oder Absturz etc.?

  • Genau die Status LED der QNAP ist genau in dem Zeitraum aus, die NAS läuft weiterhin und ist auch per Ping erreichbar. Die Weboberfläche zeigt den eigenen QTS "Laden..." Bildschirm an, bis das Problem sich von alleine aufhebt und die Seite normal lädt.

  • Hmm, also normal kann dieses Verhalten jedoch nicht sein. Seit wann ist dies so? Seit dem letzten Firmwareupdate oder wurde sonst etwas geändert? Muss aber wohl bei beiden NAS durchgeführt worden sein.

  • Das Problem ist anscheinend nach dem Einrichten von PRTG Sensoren zur Abfrage der Physischen Disks entstanden. Ansonsten haben wir an der NAS in letzter Zeit nichts geändert und auch kein Firmwareupdate gemacht.

    Die Sensoren fragen jeweils 3 OIDs ab für die Temperatur, den S.M.A.R.T. Status und den HD Status.

    Mit Wireshark erkennt man, dass jeweils nur SNMP abfragen und Pings an die QNAP gesendet werden.

    Ich lass jetzt beide QNAPs laufen, jedoch habe ich bei einer die neuen Sensoren abgeschaltet, eventuell liegt es wirklich an den SNMP abfragen.

  • Also die Status-LED geht normalerweise dann aus, wenn die Platten (und/oder die NAS) in den StandBy gehen. Für mich hört sich das grade SO an: Platten gehen in StandBy - StatusLED geht aus - PRTG (über SNMP) bekommt keine Infos mehr. Plattenzugriff -> Platten/NAS kommt aus dem StandBy, SNMP-Daten sind wieder verfügbar. Wäre zwar ein seltsames Verhalten, aber zumindest darüber erklärbar...



    Gruß,


    Lauri

  • Das glaube ich eher nicht. Die Ausfallzeiten betragen manchmal rund 10 Minuten. PRTG hat einen Momentanen Abfrageinterval von einer Minute und bekommt während des Ausfalls keine Antwort auf Netzwerkebene. Außerdem sollten die Ausfälle dann nicht sporadisch sein. Die Ausfälle haben manchmal einen Abstand von ein paar Minuten und manchmal von mehreren Stunden (Der Standby ist auf 30 Minuten eingestellt).

  • Also wenn das NAS im Standby-Betrieb ist, ist in diesem Zustand auch kein Netzwerkzugriff mehr möglich bis das NAS wieder im normalen Betriebsmodus ist. Aber normalerweise, wenn solche Überwachungs-Tools zum Einsatz kommen ist nichts mehr mit Standby oder Festplatten-Ruhemodus. Ist mit Q'Center das selbe. Da ist das Interval standardmäßig so bei 5 Minuten. Das Aufwachen aus dem Standby kann allerdings schon einen Moment dauern.


    Zum Testen würde ich auf einem NAS PRTG mal komplett deaktivieren oder gar deinstallieren. Bleiben die Probleme aus ist der Fall relativ klar. Ein Problemüberwachungstool welches selbst die Probleme verursacht ist nutzlos.

  • Aber normalerweise, wenn solche Überwachungs-Tools zum Einsatz kommen ist nichts mehr mit Standby oder Festplatten-Ruhemodus.

    Deshalb sagte ich, dass es ein seltsames Verhalten wäre... aber im Moment mit das einzige, was das Verhalten erklären würde.

  • Die MIBs passen, hast mal einen Walk laufen lassen, nicht das eins sich anders verhält und du es mit MIBs bombadierst die es ggf. anders versteht.

  • Ganz ehrlich? Wenn ich mir Lösung 3 und meinen vorher geschriebenen Text so ansehe... ein Schelm, wer böses dabei denkt ;)



    Lauri