unregelmäßige abstürze und über 13000 Z prozesse

  • Hi,
    ich habe immer mal wieder das Problem das mein TS-421 FW: 4.1.4 (2015/05/22) abstürzt.
    Die Weboberfläche gibt noch ein nettes "Page not found" zurück.
    Keine der Apps geht mehr. SSH & telnet geht nicht mehr. Selbst am Gerät kommt nur noch ein helles Display ohne Text wenn man die Tasten up/down drückt.
    Ich muss dann immer den harten Weg gehen und PWD gedrückt halten.
    Ich habe mir dann mal meine proc liste angeguckt...
    Ich habe über 13k Z Prozesse...
    Eigentlich ja kein Problem aber ich glaube Sie werden bei der Anzahl trotzdem zum Problem.
    Nachdem ich das NAS hart neustarten muss habe ich auch keine logs oder ähnliches. ich kann zumindest nix finden.
    Ich bekomme noch das Feedback das es hart ausgeschaltet wurde und dem RAID nicht gefällt.
    Ich habe keine Idee mehr...
    Ihr?


    Infos:
    TS-421 FW: 4.1.4 (2015/05/22)
    4x 4 TB Raid 5
    installierte Apps: HappyGet2, autorun, JRE, Optware IPKG, SAVnzbdplus, Python, Pyload


    Danke & Gruß

  • Hi,
    sorry für die späte antwort und danke für dein Feedback.


    Da der output von ps über 10k zeilen hat habe ich ihn mal als textfile hochgeladen.
    vom tag des beitrages:
    qnap-ts421-2015-08-04-0030-ps-fauwx.zip

    Code
    [admin@NASD56AD2 ~]# /opt/bin/ps fauwx |grep defunct | wc -l  13581[admin@NASD56AD2 ~]#


    Code
    TS-421FW: 4.1.4 (2015/05/22)HappyGet2autorunJREOptware IPKGSAVnzbdplusPythonPyload


    von gerade eben:
    qnap-ts421-2015-08-08-1552-ps-fauwx.zip

    Code
    [admin@NASD56AD2 ~]# uptime 15:52:36 up 21:53, load average: 2.46, 2.86, 2.82


    Code
    [admin@NASD56AD2 ~]# /opt/bin/ps fauwx |grep defunct | wc -l   5025



    HDDs sind übrigends 4x Toshiba MD-Series 4TB, SATA 6Gb/s, retail (PX3009E-1HP0)


    gestern habe ich gesehen das es ein Update gibt.
    Habe ich auch mal eingespielt aber wie bei den letzten 5 glaube ich nicht das es einen unterschied macht.
    Generell spiele ich alle updates asap ein.


    Zu dem verlinkten Beitrag.
    Wenn ich das richtig überflogen habe meinst du das ich prüfen soll ob es übernommen wurde bzw ob es Zugriff aufs netz bzw vom netz gibt.
    nein gibt es nicht. qnapcloud wurde zu beginn sofort deaktiviert. UPnP ist fürs nas deaktiviert. ich greife von extern nur per vpn auf mein nas zu.
    der vpn läuft auch nicht übers nas sonder über die fritzbox.
    unter /share/MD0_DATA/ liegen keine Daten die ich nicht dort abgelegt hätte. ich sehe zumindest nix.
    Falls du noch andere Spezielle Punkte weißt gucke ich selbstverständlich nach.


    Danke für deine Hilfe

  • Ich kann den ps Auszug weder als Datei anhängen. noch als externer link anfügen. noch kann ich den text einfügen.
    "Dein Beitrag besteht aus 1641027 Zeichen.
    Es sind maximal 60000 Zeichen erlaubt."


    :(

  • na dann...


    EDIT:
    Ich habe mir jetzt einen cron gemacht der mir alle 30 min ein ps macht und das wegschreibt. einfach mal um die Entwicklung zu sehen...

  • Zitat von "Viperdriver2000"

    was genau suchst du was ich übersehe?

    Anzeichen für Malware. Mir sind das ein paar zu viele wget. Leider sieht man nirgends die PPID, um herauszufinden, wer die startet.

  • Hi Viperdriver,


    kannst da dazu bitte ein Ticket bei QNAP erstellen und dann gleich hier die Ticket Nummer posten? Ich werde diese dann direkt an die richtige Person beim Support weiterleiten!


    Danke
    Christian

  • Hi,


    die Ticketnummer habe ich erhalten. Vor einigen Stunden habe ich dein Problem bereits mit dem Support diskutiert, dieser sollte nun auf dich zukommen und mit dir an einer Lösung arbeiten!


    Lass mich wissen, wenn es nicht voran geht!


    Danke
    Christian

  • Hier mal ein Feedback.
    Ich habe mittlerweile auf die 4.2.0 Beta geupdatet (Wunsch des Supportes).Die Probleme blieben die gleichen.

    Zitat

    Ok, ich mache schon ein intern Ticket auf gegen unsere Entwicklung.


    Somit habe ich die nächste eskalationsstufe erreicht.
    Ich habe mittlerweile mal alle apps zurückgeschraubt bis auf autorun, Optware IPKG.
    Ergebnis ist aber noch das gleiche.

  • UPDATE:
    Wir sind mittlerweile soweit das ein Entwickler aus Taiwan auf das Gerät möchte.
    Leider schaffen wir es Zeitlich nie und wenn ich einen Rechner über Nacht auf dem NAS verbunden lasse stürzt es immer wieder ab.
    Ist also alles suboptimal im Moment.


    Dann man noch was anderes...
    Seit diesen ständigen Reboots habe ich auf einer platte auf einmal Fehler...
    Siehe Anhang. Muss/soll ich mir da jetzt sorgen machen?

  • UPDATE:
    Wir hatten es jetzt hinbekommen das ein Techniker auf dem Gerät war.
    Leider können Sie nicht weitermachen da die crontab bearbeitet wurde.

    Code
    # USER CRON
    0 1 * * * chown -R Viperdriver2000:everyone /share/MD0_DATA/Multimedia/_BD/
    */5 * * * * chown -R Viperdriver2000:everyone /share/Download/sabnzbd/complete/
    */5 * * * * chown -R Viperdriver2000:everyone /share/Download/pyload/
    0 1 * * * chmod 770 -R /share/MD0_DATA/Multimedia/_BD/


    Das geht so ja nicht...oO


    Zitat

    wenn die Konfiguration von selbe geändert, kriegen wir auch keine Support von unserer Head Quater Entwicklung. [...] Daher schlage ich vor, Sie bringen den Zustand wieder in default Konfiguration von QNAP. Eine "Reset" tut es schon einfach.


    Ein Reset würde bedeuten alles wird zurückgesetzt. Vorher müsste ich alle Daten runterkratzen...Bei ~8 TB und einer Onlinezeit von ~2 Tagen könnte das spannend werden...zumal ich erstmal ausreichend Platten bräuchte...


    Irgendwie kenne ich das verhalten von HP..."keep the customer busy"


    Ich habe die Änderungen jetzt wieder rückgängig gemacht.
    Ist ja kein Hexenwerk...mal sehen ob Sie auf ihrem Reset bestehen...


    Gruß
    Vip