Neighbour table overflow - wilder _thttpd_ Prozess? ==> Systemcrash?

  • Guten Morgen zusammen,
    so ein wirklich passendes Unterforum habe ich nicht gefunden. Falls ein Admin den Beitrag besser zuordnen kann :arrow: bitte verschieben.


    Folgende Situation: Wir haben hier ein TS-419PII stehen, welches bis Dienstag vor einer Woche (15.09.) mit Firmware 4.2.1 seit 169 Tagen einwandfrei lief. Webserver aktiv, FTP aktiv, Foto und Video Station aktiv, einwandfrei laufendes Forum aktiv, Dokuwiki aktiv. Ca. 10 aktive Nutzer.


    Am Dienstag war eine der Platten hinüber, also die QNAP heruntergefahren, Platte getauscht, hochgefahren, Rebuild initialisiert. Bei ca. 30% Rebuild war das NAS plötzlich nicht mehr erreichbar (HTTPS Weboberfläche, SSH, FTP, Dateizugriff - nichts. Völlig tot), der Blinkcode hat mir aber signalisiert, dass wohl noch der Rebuild läuft. Ok, in dieser Situation lieber Finger weg lassen und bis zum nächsten Morgen gewartet. Alle LEDs am NAS waren dann grün, also dachte ich, der temporär nicht mehr mögliche Zugriff läge am Rebuild. War allerdings nicht so.


    Auch ohne laufenden Rebuild (welcher offenbar wenigstens erfolgreich war) hatte ich überhaupt kein Zugriff auf das Gerät. Einzige Option: "Hartes" Ausschalten und Neustart. Nach dem Hochfahren konnte ich mich einloggen und alles lief normal für ca. eine Stunde. Die grundlegenden Protokolle (Logins etc.) zeigten keine Auffälligkeiten. Nach ca. einer Stunde ging wieder überhaupt nichts mehr. Also wieder das gleiche Prozedere. Nach ca. einer weiteren Stunde nochmal.


    Da wurde es mir dann zu bunt und ich habe mir sämtliche Prozesse über Putty mal anzeigen lassen, und siehe da: Ich hatte fast 30000 _thttpd_ Zombieprozesse drin. Also habe ich direkt nach dem nächsten Reboot mal vor allem den Webserver abgeschaltet, aber auch zur Sicherheit sämtliche Stationen, den selten benötigten FTP-Zugang etc.


    Damit lief das System dann stabil und gegen Ende letzter Woche habe ich dann den Webserver samt Photo und Video Station wieder aktiviert, was auch übers Wochenende keine Probleme bereitet hat. Am gestrigen Donnerstag habe ich dann noch die neueste 4.1.4 aufgespielt, auch völlig unkritisch. Heute Morgen aber hängt sich das Teil aber wieder auf, genau das Gleiche wie in der Woche zuvor.


    Über das Diagnostic Tool habe ich dann nach dem obligatorischen Reboot die Logs gedumpt. Hier fallen aberhunderte Zeilen folgenden Inhaltes auf:



    Jetzt habe ich wieder alles abgeschaltet, so dass das Gerät wirklich nur als Datenlager dient und scheinbar läuft es gerade.


    Meine Fragen an die Experten:
    1) Kann das evtl. ein sich ankündigender Hardwaredefekt im Bereich eines Netzwerkcontrollers sein oder sowas in der Richtung?
    2) Ist es möglich, dass jemand im Netzwerk versucht, das NAS über einen Überlauf gezielt lahmzulegen?


    Zu Punkt 2) möchte ich noch erwähnen, dass die Kollegen nebenan auch eine QNAP haben (ich meine eine 410er auf einer 4.0.x-Firmware), und denen ist letzte Woche und heute vor 10 Minuten genau das gleiche passiert, allerdings mit dem Unterschied, dass das Teil seitdem läuft, ohne Änderungen am Webserver oder Diensten). Immer nacheinander.


    Was mir auch noch aufgefallen ist: Sollte man zum Zeitpunkt des Ausfalls gerade eingeloggt sein, kommt im Webinterface eine Meldung mit einem Inhalt von etwa "das Gerät ist ausgelastet" als Popup. Will man sich danach einloggen, kommt eine Seite mit einem sehr großen Einfahrt-verboten Schild (das rote runde mit dem weißen Querbalken).


    Bin für jeden Input dankbar!


    VG
    Marc