Selbsttest des NAS?

  • Hallo, ich habe die Befürchtung, dass entweder meine neuen HDDs oder irgendeine andere Komponente zu Problemen bei meiner ts-509 führt. Ich wüsste nun gerne von einem etwas erfahrenerem Benutzer, ob von QNAP Tools mitgeliefert wurden, mit denen man die Integrität des Systems testen kann. Da ich nicht wirklich versiert in diesem Linuxsektor bin, wäre ich auch sehr dankbar über vermeintlich selbstverständliche Testmöglichkeiten.


    Die Probleme die bei mir Auftreten waren und sind folgende:

    • Das System braucht ungewöhnlich lange beim Bootvorgang.
    • Im Webinterface werden bestimmte Bereiche nicht geladen, beispielsweise bleiben bei den Feldern "Current Disk Volume Configuration : Physical Disks" und "Current Disk Volume Configuration : Logical Volumes" unter Volume Management die entsprechenden Informationen auch nach Minuten aus.
    • Es existieren sehr viele identische Prozesse z.b.

      Code
      # ps -A | grep device_info.cgi 3409 admin      1232 D   device_info.cgi23263 admin      1600 S   device_info.cgi23318 admin      1364 S   device_info.cgi23320 admin      1604 S   device_info.cgi23431 admin      1368 S   device_info.cgi23473 admin      1364 S   device_info.cgi23477 admin      1368 S   device_info.cgi23599 admin      1368 S   device_info.cgi23641 admin      1600 S   device_info.cgi23683 admin      1596 S   device_info.cgi23781 admin      1600 S   device_info.cgi23791 admin      1608 S   device_info.cgi23967 admin      1356 S   device_info.cgi24016 admin      1364 S   device_info.cgi24062 admin      1364 S   device_info.cgi24081 admin      1356 S   device_info.cgi25234 admin       556 R   grep device_info.cgi


    • Die Raid-Erweiterung lief so langsam, so dass ich den Verbund komplett auflösen musste, um wieder normal arbeiten zu können.

      Code
      md0 : active raid5 sda3[0] sdc3[2] sdb3[1]
            2927139200 blocks super 0.91 level 5, 64k chunk, algorithm 2 [4/3] [UUU_]
            [========>............]  reshape = 41.4% (607155840/1463569600) finish=123293.2min speed=115K/sec


    • Der Warnton für das Auswerfen einer Festplatte kommt nicht mehr kurz nachdem man ein Laufwerk entfernt hat, sondern ~1-2min verzögert.


    Zu meinen 'Umständen':

    • TS-509 Pro
    • Firmware Version 3.1.1 build 0815T
    • 3x WDC WD15EADS-00P8B0 01.0 (1.5TB) [ext4] + 2x SAMSUNG HD103UJ 1AA0 (1.0TB) [ext4+aes]

    Einmal editiert, zuletzt von murloc ()

  • Auch Hollo ;)


    Ich werde mal versuchen auf einige der Symptome einzugehen:
    - langer Bootvorgang: Wenn der Bootvorgang erheblich länger benötigt als gewöhnlich, könnte es am "Rebuild" des Dateisystems liegen. Sollte das System nicht sauber heruntergefahren oder schon länger nicht neugestartet worden sein, wird dieser Vorgang ausgelöst und nimmt einige Zeit in Anspruch. Konkret hilft aber hier ein Blick in die Systemprotokolle.
    - Webinterface: Hier hilft u.U. das Löschen des Browsercache
    - identische Prozesse: sorry, fällt mir gerade nix zu ein ;)
    -Raid-Erweiterung: ist zwar möglich, aber "Backup, Plattentausch, Einrichtung und Backup zurückschreiben" geht schneller ;)


    Tip: ggf. die Firmware nochmals flashen...


    Grüße
    Jody

    • Also heute morgen hat er mal wieder das Journal von den WD15EADS-00P8B0 restauriert. Allerdings verstehe ich nicht warum er das überhaupt macht, das System wurde normal herunter gefahren. :?

      Code
      2009-09-12 163	11:56:09	System	127.0.0.1	localhost	[Single Disk Volume: Drive 2] Recovering journal.
      	2009-09-12 162	11:55:03	System	127.0.0.1	localhost	[Single Disk Volume: Drive 1] Recovering journal.
      	2009-09-12 161	11:54:47	System	127.0.0.1	localhost	System started.
      	2009-09-12 160	01:37:58	System	127.0.0.1	localhost	System was shut down on Sat Sep 12 01:37:49 BST 2009.


    • Am Browser kann es nicht liegen, da ich es mit unterschiedlichen Clients getestet habe. Auch das leeren des Cache hat keine Abhilfe geschaffen.
    • Die Raid-Erweiterung habe ich auch wieder abgebrochen ... :x


    Leider hat auch das neu Einspielen der Firmware und ein kompletter Reset des NAS keine Besserung erzielt. Die Probleme sind nach wie vor die Selben, alles reagiert schleppend langsam, obwohl nur die wichtigstens Services aktiviert sind.

  • installier mal bitte:
    ipkg install procps
    ikpg install dstat
    und dann lass den /opt/bin/top und den dstat mitlaufen
    ich habe auch tierische IO-Hänger auf meinem System und bei mir ist dann immer wie %wa (IO-WAIT) ganz oben. Danach geht natuerlich die Load-hoch, weil kein Prozess mehr schnell genug seine IOs durchkriegt. Ich bin gespannt, ob du das gleiche Problem hast wie ich. Wenn ja, dann koennte man ja vermuten, dass es an den WD 1,5GB Platten liegt.
    Sag mal bitte deine Wait-Werte durch, während du deine Systemhänger hast.

  • Testsituation: Es wurden Daten von einer meiner alten Festplatten auf eine der neuen WD15EADS-00P8B0 kopiert.
    /opt/bin/top gab Werte im Bereich von 50%wa bis 85%wa aus, der Schwerpunkt lag bei ~70%wa.
    /opt/bin/dstat ergab währenddessen folgende Ausgabe:

    Code
    ----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw  0  83   0  15   1   1|  61M   67M| 476B 7360B|   0     0 | 638   837  1  60   0  37   0   2|  63M   60M| 478B 1914B|   0     0 | 539   785  2  82   0  12   1   3|  60M   59M| 128B  700B|   0     0 | 588   839  0  70   0  28   1   1|  55M   56M| 384B 7232B|   0     0 | 583   857  0  84   0  14   0   2|  61M   61M| 128B  700B|   0     0 | 611   861  2  78   0  17   1   2|  57M   58M|2278B 2042B|   0     0 | 591   824  1  82   0  14   1   2|  61M   60M| 476B 7360B|   0     0 | 607   863  1  56   0  41   0   2|  66M   63M| 128B  700B|   0     0 | 556   768  1  80   0  17   1   1|  59M   63M| 128B  700B|   0     0 | 701   952  1  74   0  23   1   1|  63M   66M| 476B 7360B|   0     0 | 690   878  1  81   0  15   0   3|  61M   56M| 128B  700B|   0     0 | 569   862  0  76   0  22   1   1|  53M   59M| 128B  700B|   0     0 | 574   765  2  78   0  17   1   2|  62M   62M| 384B 7200B|   0     0 | 606   840  1  76   0  20   1   2|  60M   58M|2278B 2042B|   0     0 | 583   964  0  76   0  22   1   1|  61M   62M| 128B  700B|   0     0 | 619   824  1  83   0  14   0   2|  63M   36M| 384B 7232B|   0     0 | 470   862  1  30   0  68   1   0|  70M   57M| 128B  700B|   0     0 | 582  1113  1  31   0  67   0   1|  66M   69M| 128B  700B|   0     0 | 636  1148  2  30   0  66   0   2|  64M   64M| 476B 7328B|   0     0 | 615  1250  0  32   0  65   1   2|  64M   68M| 128B  700B|   0     0 | 713  1336  1  25   0  71   1   2|  55M   76M| 128B  700B|   0     0 | 522  1140  1  21   0  77   0   1|  49M   26M|2148B 5552B|   0     0 | 339   730  1  35   0  62   1   1|  67M   87M| 128B  700B|   0     0 | 782  1549


    Ich habe auch mal das alte Modell und das neue Modell in meinen Computer eingebaut und HDTune drüber laufen lassen. Das Ergebnis sieht für mich relativ ähnlich aus, also keine großartig abweichenden oder gar viel schlechteren Werte der WD15EADS-00P8B0. (Ergebnisse im Anhang)


    EDIT:
    Ich habe nun überhaupt nichts geändert (kopiert immernoch Daten) und nun liegt die Wait-Time bei praktisch nahezu 100% :?

  • ok, dann wuerde ich sagen, haben wir das gleiche problem: die %wa bei knapp 100% und das aendert sich dann meist nicht mehr. danach hilft bei mir nur ein reboot.
    was haelst du davon, wenn wir mal einen thread mit thema "WD15EADS-00P8B0" aufmachen? werden vielleicht noch andere sein, die das gleiche problem mit den platten haben.


    EDIT:


    habe folgendes im forum gefunden:
    -->
    Aufgrund einigen Vorfällen mit zwei Western Digital Green Power HDD Modellen (WD15EADS und WD2002FYPS) hat QNAP beschlossen diese temporär von der Kompatibilitätsliste zu entfernen. Man hatte zuvor zwar viele ausführliche Tests bei diesen Modellen durchgeführt und konnte keine Probleme feststellen, aber es ist dennoch bei einigen aus bisher ungeklärten Gründen zu Schreib-/Lesefehlern gekommen. Auch WD selber konnte diesbezüglich keine Aussage machen. QNAP hat beschlossen das Phänomen nun genauer zu prüfen und die Festplatten erst wieder auf die Liste zu setzen, wenn man sich 100% sicher ist, dass kein Problem besteht resp. dieses behoben wurde.
    <--
    Werde meine Platten austauschen und auf anderen Hersteller gehen.

    Einmal editiert, zuletzt von christian () aus folgendem Grund: Doppelte Beiträge sind zu vermeiden, siehe Forenregeln!

  • Kannst du mir mal den direkten Link zu dem Thread schicken?
    Auf welchen Hersteller würdest du ausweichen?


    Eigentlich kann es doch nur am eingesetzten Kernel liegen, unter meinem Ubuntu Systemen treten auch keine Probleme auf. Aber ich bin nun auch nicht so der Linux Guru. Komisch an der ganzen Situation finde ich nach wie vor, dass beide HDD-Modelle auch die selbe Firmware (FW) verwenden. *shrug*


    Mich würde interessieren, ob das eventuell mit dem neuen FW Release zusammen hängt. Weiß jemand, ob man die FW problemlos downgraden kann?


    Hat jemand schon mal Erfahrungen mit dem Umtausch von HDDs innerhalb der 14 Tage Rückgabefrist gemacht?

  • Hey Irix, komme leider erst jetzt zum Antworten. War bzw. bin etwas im Streß wegen Diplomarbeit etc. ...


    Ich werde nun einmal testen, was die neue Firmware an der Situation ändert - oder eben nicht ändert. ;)

  • Hi,


    ich bin dann ja letztendlich doch auf die Seagate 1,5Tb umgestiegen und hatte in den ersten Tagen noch Probleme. Als ich dann den HDD Standby deaktiviert hatte, lief alles problemlos. Seit einigen Wochen laeuft das System jetzt stabil und ich bin echt zufrieden mit dem NAS. Hoffe du erreichst auch bald diesen Status ;)


    Gruß,
    irix

  • Hi Leute,


    da könnte ich mal richtig heulen.


    Ich habe mir nen neuen TS-410 und 3 Platten von WDC WD15EADS-00P8B0 01.0 und habe jetzt genau das gleiche prob.


    Frage gibbet da mittlerweile von Qnap ne lösung für das Problem ???


    THX