Kein Zugriff auf den QNAP Server

  • Hallo,
    ich habe einen QNAP TS-659 Pro 2. Das Problem liegt darin das er sporadisch einfach irgendwann piept und die rote Status LED an geht.
    In den Systemprotokollen vom Webinterface steht folgendes:


    Den QNAP Server kann ich daraufhin nicht mehr administrieren und Neustarten/Herunterfahren. Sobald ich versuche auf das Webinterface zu gelangen, bekomme ich die Meldung: Access Denied.
    Ich muss mit 5 sekunden langem drücken den QNAP Server ausschalten. Danach startet er aber auch wieder sobald ich die Power Taste normal drücke. Er läuft ein paar Stunden bis dahin wenn der Fehler wieder auftritt.


    Laut dem QNAP Support sollte ich das Gerät zur Reparatur einschicken. Ich habe dann bei meinem Händler den QNAP Server komplett tauschen lassen
    (neues Gerät).


    Nach dem Austausch habe ich die HDD Platten des alten QNAP Server wieder eingebaut und siehe da, das Problem ist wieder vorhanden.
    Somit kann ich ein Hardware defekt des QNAP Servers ausschliessen.


    Jetzt habe ich vom QNAP Support die Mitteilung erhalten, das ich von den HDD Platten ein Backup machen soll und danach diese formatieren.
    Da aber der QNAP Support schon einmal falsch lag, möchte ich erstmal eure Meinung hören.


    Ich vermute selbst, das es evtl. an einer Applikation liegt die auf dem Server läuft und den Server zu Auslastung bringt.
    Bei welchen Fehlern die rote Status LED blinken soll und somit der QNAP Server das piepen anfangen soll das weiß ich auch nicht, vielleicht weiß er aber einer von euch?


    Gruß Dany

  • Gibt es eigentlich irgendwie noch ein anderes Log File die mehr mitloggt als das was im Webinterface Namens Systemprotokoll aufgeführt ist?


    Gruß Dany

  • Und was ist da was? :shock:

    Einmal editiert, zuletzt von bladekiller () aus folgendem Grund: Volltextzitat entfernt! - siehe Forenregeln!

  • In der Datei steht soviel drin.. Ich kann da eig. garnix drauß lesen.
    Siehe hier:
    (Ich habe sie mit der Endung .txt versehen müssen, da sie sonst hier nicht hochgeladen werden konnte.)


    Kannst du mir vll. noch sagen, welcher Befehl chkdsk bei QNAP macht?, denn sobald ich versuche über das Webinterface unter dem Reiter Datenträgerverwaltung mein RAID 5 Verbund der 4 HDD´s zu überprüfen, bricht es ab und im Systemprotokoll des Webinterface steht nur [RAID5 Disk Volume: Drive 1 2 3 4] Examination failed.


    Deshalb bräuchte ich den genauen Befehl mit Attributen, die zum RAID 5 Verbund passen. Und vermutlich auch noch den Befehl wie ich diese zuvor unmounte.


    Gruß Dany

  • Zitat von "BMWfan"

    In der Datei steht soviel drin.. Ich kann da eig. garnix drauß lesen.


    Das ist das Kernel-Logfile. Darin werden alle Kernel-Messages geloggt.
    Könntest du bitte mal deine Konfiguration kurz beschreiben (aktive Dienste und QPKG/IPKG) und die gezippte kmsg1 noch mit anhängen? In der kmsg steht nur das Log nach dem aktuellen Reboot drin. Interessant wären aber die Logs vor dem Reboot aus der kmsg1.


    In deinem RAID5 hast du als 4. Platte eine WD20EADS-00R6B0. Diese sind dafür bekannt, dass sie im RAID Ärger machen und stehen deswegen auch in der Not recommended Liste

  • Zitat von "dr_mike"


    Das ist das Kernel-Logfile. Darin werden alle Kernel-Messages geloggt.
    Könntest du bitte mal deine Konfiguration kurz beschreiben (aktive Dienste und QPKG/IPKG)


    Hier die QPKG Liste:



    Und die sonstigen Dienste:



    Zitat von "dr_mike"

    und die gezippte kmsg1 noch mit anhängen? In der kmsg steht nur das Log nach dem aktuellen Reboot drin. Interessant wären aber die Logs vor dem Reboot aus der kmsg1.


    Hier die gezippte/gerarrte Datei:


    Ich habe dir einfach alle drei kmsg Files mit rein gepackt ;)


    Zitat von "dr_mike"


    In deinem RAID5 hast du als 4. Platte eine WD20EADS-00R6B0. Diese sind dafür bekannt, dass sie im RAID Ärger machen und stehen deswegen auch in der Not recommended Liste

    Okey das wusste ich jetzt nicht. Zurzeit sind die 4 TB Platten noch zu teuer, sonst hätte ich mir 6 x 4 TB Platten geholt und die getauscht.


    Gruß Dany

  • Zitat von "BMWfan"

    Ich habe dir einfach alle drei kmsg Files mit rein gepackt ;)


    Das war auch goldrichtig. Der Fehler Zeigte sich in der kmsg2.
    segfault mit anschliessendem reboot in der alten FW Version (3.7.1)

    Code
    <5>[    0.000000] Linux version 2.6.33.2 (root@NasX86-5) (gcc version 4.1.3 20070929 (prerelease) (Ubuntu 4.1.2-16ubuntu2)) #1 SMP Fri Jun 15 03:33:25 CST 2012...<6>[84360.000846] lcdmond[8096]: segfault at 0 ip 00000000f7288445 sp 00000000ffd9a370 error 4 in libc-2.6.1.so[f7231000+12e000]<6>[84521.950191] bcclient[7603]: segfault at 0 ip 00000000f7188445 sp 00000000f7110a90 error 4 in libc-2.6.1.so[f7131000+12e000]<5>[    0.000000] Linux version 2.6.33.2 (root@NasX86-5) (gcc version 4.1.3 20070929 (prerelease) (Ubuntu 4.1.2-16ubuntu2)) #1 SMP Fri Jun 15 03:33:25 CST 2012


    und hier nochmal mit der Neuen (3.7.2)

    Code
    <5>[    0.000000] Linux version 2.6.33.2 (root@NasX86-5) (gcc version 4.1.3 20070929 (prerelease) (Ubuntu 4.1.2-16ubuntu2)) #1 SMP Thu Jul 19 01:29:37 CST 2012...<6>[ 9489.199456] lcdmond[8837]: segfault at 0 ip 00000000f72a0445 sp 00000000ffbd19e0 error 4 in libc-2.6.1.so[f7249000+12e000]<5>[    0.000000] Linux version 2.6.33.2 (root@NasX86-5) (gcc version 4.1.3 20070929 (prerelease) (Ubuntu 4.1.2-16ubuntu2)) #1 SMP Thu Jul 19 01:29:37 CST 2012


    Das sind die Auslöser für dein Problem mit dem Smart Fan Control. Die direkte Ursache dafür könnte nur QNAP klären. Eventuell stehen aber auch in der Config Werte, die lcdmond nicht verarbeiten kann. Möglich wäre auch, dass das System auf eine libc eines QPKG verweisst, welche nicht zum System passt oder korrupt ist.


    Ausserdem scheint irgendein Dienst zu verhindern, dass dein RAID beim Reboot entladen wird.

    Code
    <4>[   98.253561] md: md0 still in use. <-------------------------------------------------<6>[   98.816856] md: bind<sdb3><6>[   98.817164] md: bind<sdc3><6>[   98.817443] md: bind<sdd3><6>[   98.817706] md: bind<sda3><6>[   98.819153] raid5: device sda3 operational as raid disk 0<6>[   98.819264] raid5: device sdd3 operational as raid disk 3<6>[   98.819363] raid5: device sdc3 operational as raid disk 2<6>[   98.819466] raid5: device sdb3 operational as raid disk 1<6>[   98.829118] raid5: allocated 68512kB for md0<4>[   98.829332] 0: w=1 pa=0 pr=4 m=1 a=2 r=4 op1=0 op2=0<4>[   98.829443] 3: w=2 pa=0 pr=4 m=1 a=2 r=4 op1=0 op2=0<4>[   98.829544] 2: w=3 pa=0 pr=4 m=1 a=2 r=4 op1=0 op2=0<4>[   98.829647] 1: w=4 pa=0 pr=4 m=1 a=2 r=4 op1=0 op2=0<4>[   98.829748] raid5: raid level 5 set md0 active with 4 out of 4 devices, algorithm 2<4>[   98.829909] RAID5 conf printout:<4>[   98.829998]  --- rd:4 wd:4<4>[   98.830101]  disk 0, o:1, dev:sda3<4>[   98.830197]  disk 1, o:1, dev:sdb3<4>[   98.830298]  disk 2, o:1, dev:sdc3<4>[   98.830397]  disk 3, o:1, dev:sdd3<6>[   98.830563] md0: detected capacity change from 0 to 2995794739200


    Um herauszufinden, inwieweit dein RAID korrekt arbeitet, kannst du folgenden Befehl verwenden

    Code
    mdadm --detail /dev/md0


    Einen Überblick über alle RAID's erhältst du mit

    Code
    cat /proc/mdstat


    Zitat von "BMWfan"

    Und die sonstigen Dienste:


    Hier ist mir aufgefallen, dass in der neuen FW in der Diensteliste der Telnet/SSH Dienst gar nicht mehr angezeigt wird. :shock: Was aber mit deinem Problem erstmal nichts zu tun hat (ist bei mir genauso).

  • Hey dr_mike,
    vielen vielen Dank für die nette Hilfe. Ich hoffe jetzt nur, das mir der Support helfen wird und er mir nicht nur wieder die Antwort gibt, das ich doch die HDD Platten wieder neu aufsetzten soll.


    Ich habe dir mal hier die Befehle ausgeführt evtl. kannst du mir sagen ob da dann alles okey ist? :D


    Zitat von "dr_mike"


    Um herauszufinden, inwieweit dein RAID korrekt arbeitet, kannst du folgenden Befehl verwenden

    Code
    mdadm --detail /dev/md0


    Code
    mdadm --detail /dev/md0/dev/md0:        Version : 00.90.03  Creation Time : Sat Dec  3 19:37:23 2011     Raid Level : raid5     Array Size : 2925580800 (2790.05 GiB 2995.79 GB)  Used Dev Size : 975193600 (930.02 GiB 998.60 GB)   Raid Devices : 4  Total Devices : 4Preferred Minor : 0    Persistence : Superblock is persistent    Update Time : Sat Jul 28 18:44:11 2012          State : active Active Devices : 4Working Devices : 4 Failed Devices : 0  Spare Devices : 0         Layout : left-symmetric     Chunk Size : 64K           UUID : 723a7c9f:3486c508:4cccc406:6111f5a1         Events : 0.1227923    Number   Major   Minor   RaidDevice State       0       8        3        0      active sync   /dev/sda3       1       8       19        1      active sync   /dev/sdb3       2       8       35        2      active sync   /dev/sdc3       3       8       51        3      active sync   /dev/sdd3


    Zitat von "dr_mike"


    Einen Überblick über alle RAID's erhältst du mit

    Code
    cat /proc/mdstat


  • Zitat von "BMWfan"

    vielen vielen Dank für die nette Hilfe. Ich hoffe jetzt nur, das mir der Support helfen wird und er mir nicht nur wieder die Antwort gibt, das ich doch die HDD Platten wieder neu aufsetzten soll.


    Naja, da das Problem FW und NAS unabhängig ist, liegt der Verdacht nahe, dass die Ursache auf den Platten liegt. Sei es eine korrupte Config, sonstige Datei oder einfach nur eine Unverträglichkeit mit einem QPKG. Daher ist ein Neuaufsetzen die simpleste Möglichkeit dies zu beheben. Zumal du mit 998GB noch nichtmal sehr viele Daten auf dem NAS (RAID5) hast. Tritt der Fehler allerdings dann immernoch auf, dann kann mit grosser Wahrscheinlichkeit gesagt werden, dass es an irgendeinem QPKG liegt.


    Ein solches scheint auch dafür verantwortlich zu sein, dass dein RAID nicht korrekt entladen wird. Allerdings sieht das RAID erstmal konsistent aus.
    Versuche mal, alle QPKG zu deaktivieren und danach den Datenträgertest durchzuführen.

  • Hey dr_mike, ja ich dachte es mir schon das es an einem QPKG liegt. Ich vermute das es an Zarafa liegt. Problem ist nur irgendwie das auch wenn ich Zarafa über das Webinterface lösche immer noch einträge da sind und meine Vermutung liegt nahe, das dies das Problem auslöst.

    Einmal editiert, zuletzt von bladekiller () aus folgendem Grund: Volltextzitat entfernt! - siehe Forenregeln!