TS-439 mehrmaliger Absturz

  • Seit ein paar Tagen habe ich massive Probleme mit einer TS-439, Firmware 4.0.3.
    Das erste mal wurde unvermittelt ein Reboot durchgeführt.


    Im Log stand dann:


    Code
    534934,"Warning","2014-03-17","15:31:01","System","127.0.0.1","localhost","The system was not shut down properly last time."534936,"Warning","2014-03-17","15:31:23","System","127.0.0.1","localhost","[RAID6 Disk Volume: Drive 1 2 3 4] The file system is not clean. It is suggested that you go to [Storage Manager] to run "Check File System"."


    Das RAID wurde dann erfolgreich überprüft.


    Heute nun das gleiche. Aber ohne Restart. Das NAS war nicht mehr nutzbar. Das Display hat nichts mehr angezeigt gehabt, ein Ping an die IP wurde beantwortet, aber nicht über den DNS-Name. (der DNS-Server ist ein DC, also nicht die NAS)
    QFinder hat nichts gefunden.


    Restart des QNAP und dann wieder die bekannten Meldungen:


    Code
    534988,"Warning","2014-03-20","08:52:55","System","127.0.0.1","localhost","[RAID6 Disk Volume: Drive 1 2 3 4] The file system is not clean. It is suggested that you go to [Storage Manager] to run "Check File System"."
    534986,"Warning","2014-03-20","08:52:34","System","127.0.0.1","localhost","The system was not shut down properly last time."


    Gibt es irgendwo im System erweiterte Log-Dateien? (ich würde gerne wissen, wass sich zum Beispiel der QNAP 'abgemeldet' hat)
    Muss ich damit rechnen, dass die Hardware ein Problem hat?
    Kann man ein RAID + alle NAS-Einstellungen von einem älteren Gerät wie das TS-439 auf ein neueres einfach übertragen, indem man die Platten aus- und einbaut?

    Einmal editiert, zuletzt von GorillaBD () aus folgendem Grund: Code Block hinzugefügt! Siehe Forenregeln!

  • Genau. Und wenn der Fehler nicht ausschliesslich in der NAS-Hardware zu begründen war, wird dieser Fehler gleich ganz akkurat mit in das neue System migriert und sich dort wieder genauso verhalten. :(


    Die NAS-Hardware ist in den wenigsten Fällen die Absturzursache, weit häufiger sind die Ursachen bei den Festplatten oder der Software zu finden, die lassen sich durch eine Migration also nicht lösen.


    GLG GBD

  • Und wie kann ich nun herausfinden, was der Grund der Abstürze ist?!


    Die Festplatten sollten ja okay, sein. Laut Smart und 'Check File System'.
    Es sind 4x WD Red 3 TB, die in der Kompatibilitätsliste stehen.


    Ich habe nach dem zweiten Absturz auch alle Dienste wie Photostation u.ä. deaktiviert. Als externe App war nur Twonky Server installiert, den habe ich jetzt auch deinstalliert.


    Nach dem ersten Absturz war auch die externe Festplatte (zum Sichern) korrupt, musste sie neu formatieren und bin noch mit den Backups beschäftigt :( - das erste Backup dauert bei USB 2 leider Ewigkeiten.


    Viel Zeit zum Testen habe ich nicht. Einen erneuten Check des FileSystems kann ich erst in der Nacht oder am WE durchführen, da währenddessen alle Dienste heruntergefahren werden und der QNAP somit in dieser Zeit unbrauchbar ist.


    Hat jemand schon einmal eine Migration durchgeführt? Wie lange dauert so etwas? 1h, 1d, ...?

  • Wenn das RAID-System technisch (HDDs!) und logisch (Dateisystem, Superblock, etc.) in Ordnung ist und keine Bedienerfehler passieren, dauert eine Systemmigration von einem NAS-Gehäuse in ein anderes etwa 30min, inclusive Umbau der HDDs, Heraussuchen und Herunterladen der Firmware auf den PC und Durchführen der Migration selbst.


    Und inclusive des Durchlesens und der genauen Beachtung des entsprechenden Abschnitts der Bedienungsanleitung:
    --> http://docs.qnap.com/nas/4.0/Home/de/system_migration.htm



    EDIT
    Die NAS testen kannst Du beispielsweise, indem Du alle 4 Platten entfernst (Schachtzuordnungen merken!) und mit einer einzelnen leeren HDD, die gestestet wurde und augenscheinlich fehlerfrei funktioniert, die NAS im Einzeldiskbetrieb neu aufsetzt und die wichtigsten Basisfunktionen durchprüfst. Dies für jeden Schacht nacheinander einzeln, um Controllerfehler oder Fehler der Backplabe auszuschliessen. Wenn dieses Testing positiv verläuft, kann ziemlich sicher von den HDDs bzw. dem RAID-System als Ursache ausgegangen werden... ...beim dem dann ein Gehäusewechsel nichts bringen würde.


    Die Bordmittel der NAS und das SMART-System der Festplatten sind für eine sichere Diagnose nicht ausreichend, weil sie nicht alle Fehlermöglichkeiten und -Einflüsse erfassen/überprüfen können, weder technisch, noch logisch.


    GLG GBD

  • Ich kann den Absturz nicht provozieren.
    Das bedeutet ja, wenn ich Deine Worte richtig interpretiere, dass auch ein Aufsetzen eines Einzelsystems mit nur einer Platte nicht 100% aussagekräftig ist.
    Denn wenn es 48h normal läuft, dann bin ich nicht viel schlauer. Nur wenn es auch dann abstürzt, dann bin ich 'glücklich'.


    Zeit ist Geld - und die 439 hat nur einen Core und USB2.
    Wir werden morgen auf eine 469 migrieren und hoffen, dass es wirklich die QNAP war.


    Da es anscheinend keine anderen Mittel als try-and-error in unserem Fall gibt, bleibt uns kaum eine andere Wahl.

  • Vergiss vor der Migration bitte nicht, ein Backup zu erstellen. Ging schon mal schief. ;)

    Einmal editiert, zuletzt von biboca ()

  • Zitat von "TM71131"

    Deine Worte richtig interpretiere, dass auch ein Aufsetzen eines Einzelsystems mit nur einer Platte nicht 100% aussagekräftig ist.


    Eine 100% sichere Aussage würde erfordern, das System mit 4 gründlich getesteten Platten im RAID6 neu aufzusetzen und mit Defaulteinstellungen unter Last mindestens 48h zu testen. Damit wäre das Gehäuse dann das Verursacher eingekreist oder entlastet. Unter Zeitdruck ist sowas natürlich nicht immer möglich, also könnt ihr nur nach der try-und-error Methode vorgehen.


    Was wir Euch dazu mitgeben können, ist die Erfahrung, dass die Gehäuse als Problemursache die niedrigste Wahrscheinlichkeit haben, zumindest ist das in der Breite der Fälle der hier im Forum Hilfesuchenden so.


    Die ungleich häufigeren Fehlerursachen sind: Festplattenstörungen, Störungen nach (Firmware-)Updates, Störungen während RAID-Rebuilds, Störungen durch defekte externe Geräte, Störungen durch Stromausfälle oder kalte Abschaltungen, Störungen durch Bedienerfehler, Störungen durch Firmware-Bugs.


    Tückisch sind Controllerfehler der Festplatten. Die können sporadisch bis regelmässig auftreten und es kann eine derartig defekte HDD reichen, um die ganze Maschine mit unklaren Symptomen instabil bis zum "Abschmieren" zu machen. Der SMART bekommt da gerne nix von mit, und gegen solche Errors, die den ganzen Datenbus beeinflussen können, ist jedes RAID machtlos, weil es dann gar keine Chance bekommt, im Sinne seiner Bestimmung tätig werden zu können.


    Für kleinere Unternehmen oder Arbeitsgruppen, die eine hohe Verfügbarkeit auch bei solchen (nicht seltenen) Störungen brauchen, wurde daher der Spiegelserver erfunden. ;) Der zieht regelmässig ein Backup der Daten der Produktivmaschine und übernimmt deren Job, wenn sie instabil werden oder ausfallen sollte. Die gestörte Maschine kann dann offline getestet und "wiederbelebt" werden.


    GLG GBD

  • Festplatten wurden nun in eine TS-469 eingebaut und es läuft. Das Backup machen hat länger gedauert als der Umbau.


    Und nix mit Migration oder ähnlichem. Ich musste überhaupt nichts einstellen.


    Und das Beste - die bunte Mehr-Fenster-Oberfläche ist weg und ich habe endlich wieder die schöne alte Oberfläche wieder (trotz 4.0.3).


    Jetzt muss ich nur hoffen, dass es keine Probleme mehr gibt.

  • Na auf das Bild bin ich gespannt, FW 4.0.3 mit alter Oberfläche der 3er FW. :D
    Von der x39 auf die x69 wird die Firmware nicht aktualisiert, deshalb wurde auch nicht "migriert". Du hast garantiert eine 3er FW.

  • Schau mal bitte in das Systemereignisprotokoll.
    Dort würde ich nun einen Hinweis erwarten, dass die Firmwareversionen von Flash und Festplatten nicht übereinstimmen, und die Aufforderung, die Firmwareversionen aus Stabilitätsgründen anzugleichen.


    Eine Migration hast Du in jedem Fall durchgeführt, auch wenn es bei Migrationen auf eine Atom-NAS halt weniger zu tun gibt, als bei einer ARM-NAS. Die Firmwareangleichung bleibt aber noch auf dem Radar und ohne den Migrationsprozess hätte die NAS eine Erstinstallation gefahren mit der Aufforderung, die HDDs zu formatieren.


    GLG GBD

  • Du hast Recht;


    Code
    2014-03-21	15:59:46	System	127.0.0.1	localhost	The firmware versions of the system built-in flash (3.8.4 Build 20130816) and the hard drive (4.0.3 Build 20130912) are not consistent. It is recommended to update the firmware again for higher system stability.


    Welche Firmware sollte ich wo aktualisieren?
    Unter Firmware-Aktualisierung wird mir nur gesagt, dass ich die aktuellste Version hätte.
    Muss ich das manuell machen und welche ist dann gemeint? Die Version 3.8.4 Build 20130816?
    Das wäre ja eigentlich ein Downgrade. Ist das möglich?

  • http://www.qnap.com/v3/en/prod…hp?temp_name=TS-469%20Pro


    Für die 469 scheint es aber auch die 4.0.3 Firmware zu geben.
    Was sollte man in meinem Fall machen?
    Die TS-469 auf 4.0.3 upgraden oder die 3.8.4 einspielen und somit die 'Festplatten' downgraden?
    Ich würde lieber auf der v3 bleiben, befürchte aber, dass das mehr Probleme bereiten wird.



    ---Edit---



    Ich habe jetzt auf die 3.8.4 downgegraded.


    Leider kann ich jetzt keine Dateien mehr löschen. Weder mit Total COmmander noch mit Windows Explorer.
    Der Prozess hängt sich praktisch auf.



    ---Edit---



    Ich muss mich korrigieren - ein Löschen geht, aber es dauert 1-2 Minuten um eine 1kb große Datei zu löschen. Also nicht akzeptabel.
    Aber ich habe auch gerade festgestellt, dass nur die Freigaben, die über AD gesetzt wurden, betroffen sind.
    Dann ist die Lösung anscheinend gefunden.

    Einmal editiert, zuletzt von bladekiller () aus folgendem Grund: Doppelde Beiträge vermeiden - siehe Forenregeln