TS-409 in den Abgrund gejagt?

  • Hallo zusammen!


    Ich bin etwas schweissgebadet...


    Folgendes ist passiert: Ich habe bisher eine TS-409 mit 4 Stück 1GB Samsung HDD's betrieben. 3 davon (Disk1, 2 und 3) waren als RAID5 eingerichtet, Disk4 als einzelnes Laufwerk, das ich eigentlich nutzen wollte, um wichtige Daten als Kopie dort abzulegen. Man traut so einem Software-RAID5 ja nicht so 100%ig :)


    Dann habe ich eine andere Lösung für Datensicherungen gefunden und gedacht, dass ich dann auch die Disk4 nutzen könnte, um das vorhandene RAID5 zu erweitern. Gesagt getan: Expanding angestoßen und mit Schrecken gesehen, dass das wohl mehrere Tage laufen würde...


    Nachdem der Prozess nun (gestartet am Samstag nacht um 1:00 Uhr) heute morgen am Sonntag um 10:30 mit einem Fehler abgebrochen ist ("[RAID5 Disk Volume: Drive 1 2 3 4] Expanding Raid Device failed."), dachte ich mir, dass das schon o.k. sei, weil ich noch auf meine Daten des RAIDs kam und schon überlegt hatte, ob ich nicht vielleicht besser ein RAID5 mit HotSpare anlegen solle...


    Also wollte ich nun die Disk4 (die weiterhin als einzelne Disk in der Konfiguration angezeigt wurde) als Hotspare einrichten, was aber nicht angeboten wurde. Also erstmal versucht, sie zu formatieren, was mir - auch nach einem Neustart - mit "[Single Disk Volume: Drive 4] Formatting failed." und "[Single Disk Volume: Drive 4] Formatting failed(Cannot unmount disk)." quittiert wurde.


    Daraufhin habe ich dann die Disk4 mal aus der TS-409 herausgenommen und einen Neustart durchgeführt.
    Jetzt habe ich leider den Katastrophen-Zustand: Ich komme nicht mehr drauf. Sogar ein Ping ist nicht mehr möglich.


    Edit: Die TS409 hatte mir nach der Aktion auch noch folgende Meldungen per Mail zugeschickt:
    Edit: "Re-launch process [proftpd]."
    Edit: und dann kam im minütlichen Abstand ein
    Edit: "[RAID5 Disk Volume: Drive 1 2 3] Error occurred while accessing Drive 1."
    Edit: Ich habe nur das Problem, dass ich nicht mehr sicher sagen kann, wann genau das passierte...


    Was kann ich nun tun, damit ich wieder gückliche Gesichter sehe? Hat da jemand eine Idee?


    Ich habe vor einiger Zeit die letzte Firmware (2.1.0 Build 080904) installiert, der QFinder findet das Gerät (mit fester IP) leider auch nicht :(


    Hilfe....


    Grüße aus Hamburg,
    Martin


    Edit:


    Nachtrag: Ich habe jetzt (nachdem ich nochmal tief durchgeatmet habe) die kiste wieder eingeschaltet.
    Der QFinder findet die TS-409 jetzt zumindest unter einer per DCHP zugeteilten Adresse.


    Und: erstaunlicher/erfreulicherweise kann ich mich per Telnet mit dem bisherigen Passwort des Admins anmelden!


    Kann es sein, dass sich die Maschine gerade mit einer "Selbstheilung" beschäftigt?


    Hat sowas schon mal jemand erlebt?

    Einmal editiert, zuletzt von christian () aus folgendem Grund: Doppelte Beiträge vermeiden, siehe Forenregeln!

  • Hallo,


    ich brauche ja jetzt nicht mehr zu erzählen das man mit seinen Daten so etwas nichtmachen sollte wenn man kein Backup hat.


    Nun zu einem Lösungsansatz. Ich schätze das du dir deine Platten zerschossen hast (config). Ich würde erst einmal die Platten aus dem System nehmen und eine neue Festplatte einsetzen. Mit dieser kannst du dann dein System neu aufsetzen und solltest wieder an dein qnap via IP dran kommen.


    Dann solltest du auf alle Fälle mit dem QNAP Support direkt kontakt aufnehmen. Diese haben dann die Möglichkeit sich dein Gerät über das Internet anzusehen (wenn du es frei schaltest (via SSH). Ich denke das sie dir dann weiter helfen können. Wichtig ist, das du die Konfig mit einer anderen Platte machst als die 4 die drin waren, damit nicht noch mehr zerstört wird.


    Berichte uns bitte wie es weiter geht. Ich (wir) drücken dir die Daumen. :thumb:


    Edit:



    Du solltest deine Daten am besten mal extern sichern und das Raid neu erstellen. Wer weiss was da im unargen ist. Mir wäre das für meine Daten zu unsicher.

    Einmal editiert, zuletzt von christian () aus folgendem Grund: Doppelte Beiträge vermeiden, siehe Forenregeln!

  • Hi!


    Also: Das wirklich lebenswichtigste (Fotos etc) sind als Sicherung vorhanden - soweit habe ich schon vorgebaut.
    Allerdings ist da noch vieles mehr, was mir soch auch ganz schön fehlen würde...


    Derzeit ist folgender Stand aktuell:


    Bisher: feste IP 192.168.1.9
    Jetzt: dynamische 192.168.1.118
    Ich komme mit Telnet und auch WinSCP drauf, sehe aber meine Daten nicht wirklich :(


    Ich dachte mir, jetzt die Platten erstmal weiter drin zu lassen. Könnte es sein, dass jetzt ein Resync des RAIDs läuft?


    Wie erreicht man den Supoprt am besten?


    Grüße,
    Martin

  • Dies hier zeigt mir "ps":


    Code
    [~] # ps  PID  Uid     VmSize Stat Command    1 admin       544 S   init    2 admin           SWN [ksoftirqd/0]    3 admin           SW< [events/0]    4 admin           SW< [khelper]    5 admin           SW< [kthread]   39 admin           SW< [kblockd/0]   42 admin           SW< [khubd]   60 admin           SW  [pdflush]   61 admin           SW  [pdflush]   62 admin           SW< [kswapd0]   63 admin           SW< [aio/0]   64 admin           SW< [cifsoplockd]   65 admin           SW< [cifsdnotifyd]  685 admin           SW< [scsi_eh_0]  686 admin           SW< [scsi_eh_1]  687 admin           SW< [scsi_eh_2]  688 admin           SW< [scsi_eh_3]  730 admin           SW  [mtdblockd]  783 admin           SW< [pegasus]  981 admin           SW< [md9_raid1] 1035 admin           DW< [md13_raid1] 1094 admin           DW< [kjournald] 1108 admin      1196 S   /sbin/daemon_mgr 1111 admin       612 S < /sbin/qwatchdogd 1124 admin      1272 S   /sbin/qLogEngined 1125 admin      1272 S   /sbin/qLogEngined 1126 admin      1272 S   /sbin/qLogEngined 1127 admin      1272 S   /sbin/qLogEngined 1175 admin           SW< [kjournald] 1188 admin           SW< [md4_raid1] 1341 admin       884 S   /sbin/hotswap 1349 admin       768 S   /sbin/qsmartd -d 1363 admin       768 S   /sbin/qsmartd -d 1364 admin       768 S   /sbin/qsmartd -d 1365 admin       768 S   /sbin/qsmartd -d 1474 admin       164 S N /sbin/dhcpcd -h NASAD1234 -t 30 eth0 1575 admin      1172 S   /usr/local/sbin/Qthttpd -p 80 -nor -nos -u admin -d / 1594 admin      2800 S   /usr/local/samba/sbin/smbd -l /var/log -D -s /etc/con 1595 admin      1644 S   /usr/local/samba/sbin/smbd -l /var/log -D -s /etc/con 1600 admin      1616 S   /usr/local/samba/sbin/nmbd -l /var/log -D -s /etc/con


    Was sieht der Fachmann?


    Edit:


    Ein "top" ergab folgendes:

  • Am top kann man sehen das deine Maschine nicht wirklich viel macht. Der Prozess des resync würde viel Last verursachen. Und deine Maschine idled vor sich hin.

  • Hallo sze!


    Hatte ich mir auch schon gedacht :)
    Auch per WinSCP sehe ich eigentlich gar nichts - viele Verzeichnisse, allerdings sind im /share ausschließlich "external" und dann "HDA_DATA" bis "HDZ_DATA". In allen Verzeichnissen ist leider nix :(
    Meint Ihr, dass der Support noch 'ne Chance hat?
    Wenn der bei mir drauf will: Wenn ich Port 22 im Router aufmache auf die TS-409 umleite, kommen die drauf?


    Wird ja ein trostloser Abend... :)


    Grüße,
    Martin

  • Hallo Martin,


    buhh war wohl zu langsam. Ja der Support kommt drauf. Das beste wäre eine Supportanfrage starten und gleich admin+pw mitsenden und natürlich eine DDNS Adresse.
    Ich würde vorerst nichts ändern!


    Christian

  • Zitat von "mfahs"

    Wenn der bei mir drauf will: Wenn ich Port 22 im Router aufmache auf die TS-409 umleite, kommen die drauf?


    Wird ja ein trostloser Abend... :)


    Grüße,
    Martin


    Na so Trostlos auch nicht. Ist doch recht spannend zuzusehen wie sie deine NAS wieder zum leben erwecken. Und wenn die viel Zeit hast, dann mach doch das Quiz mit :D


    Port 22 reicht. Firewall öffnen und User+Passwort zusenden. Weiterleitung auf die NAS nicht vergessen und DDNS Adresse mit angeben. Wenn du möchtest, können wir das von extern testen. Aber bitte kein Zugang mit geben. DDNS reicht. Dann bist du dir sicher das es auch geht. Zugang (User+Passwort) kann man ja auch von Intern testen.

  • Vielen Dank für die vielen Tipps und aufmunternden Worte :)


    Ihr könntet ja mal versuchen, Euch bei mir draufzuhängen: mf-hh.homeip.net
    Damit solltet Ihr in putty eigentlich die Anmeldung sehen...


    Martin

  • Besten Dank. Habe ich auch nochmal aus der Firma kontrolliert :)
    Wie lange dauert es denn, bis die QNAPper sich normalerweise irgendwie melden?
    Bisher ist Schweigen im Walde :(


    Gruß,
    Martin


    Edit: auch jetzt (16:47) immer noch keine Reaktion auf meine Mail...

  • Versuche es mal via Windows messanger. Wenn sie Online sind, bekommt man sehr schnell eine Antwort. Ich hatte nur 10 Minuten warten müssen. :D

  • Besten Dank für den Tip, ich habe mittlerweile per Skype halbwegs Erfolg gehabt.
    Am Dienstag morgen hatte ich Zoe dran, der sich bei mir aufs NAS gehängt hatte und zumindest die tote Konfiguration halbwegs wieder auf Kurs gebracht hatte. Abends (nachdem ich wieder zuhause war) konnte bzw. sollte ich die Grundkonfiguration durchführen und das NAS neu starten. Leider war dann immer noch ziemliche Ruhe im Server :-). Ich konnte aber zumindest die Platten in der Übersicht sehen. Dort war mein RAID5 als "not active" gekennzeichnet. Die Disk4, die ich eigentlich in das RAID5 integrieren wollte war "Unmounted". Zusätzlich (weil sonst ja nichts war :-)) war der Smart-Status der Disk1 "Abnormal".


    Mit dem Stand habe ich dann heute morgen Simon wieder per Skype dran. Er hat mir dann mitgeteilt, das ich erstmal das NAS ausschalten, dann alle HDDs entfernen, das Gerät wieder einschalten und dann im laufenden Betrieb Disk2+3 wieder hinzufügen soll. Als letztes sollte ich (da Disk4 noch leer war) Disk4 als Ersatz für Disk1 einwerfen. Das habe ich dann getan, leider ist mein Array nun immer noch "not active". Außerdem konnte ich anschließend dann keinen Kontakt zu Simon herstellen, obwohl er mir sagte, dass ich mich melden solle.


    Nun hoffe ich, dass ich morgen Erfolg habe und das Array dann wieder rebuildet wird. Es ist schon toll, dass die Jungs am anderen Ende der Welt einem so helfen können und wollen. Allerdings ist das ganze doch etwas holperig und nur bedingt lustig. Man kommt auf diesem miesen Kommunikationsweg (auch wegen der grausamen Zeitverscheibung) nicht so richtig voran. Das Thema hätte wohl schon längst durch sein können - jetzt hänge ich immer noch damit rum. Wenn mir morgen dann evtl. auch noch erzählt wird, dass meine Daten eh' im Eimer sind, wär's ziemlich ärgerlich - ich müsste einfach mal wieder das Gerät nutzen können.


    Ich werde berichten!
    Gruß,
    Martin

  • Moin Christian,


    aber gerne: SAMSUNG HD103UJ. Man kommt ins Grübeln, ob die Dinger was taugen...
    Andere Frage: Hast Du eine Idee, wie man das Array aus dem Status "not active" wieder aufwecken könnte?
    Bei mir sieht es zur Zeit so aus:



    Simon sagte gestern (O-Ton):


    Code
    [15.10.2008 12:50:05] QNAP Support (English or Chinese) : actaully, I need you to turn off your NAS
    [15.10.2008 12:50:20] QNAP Support (English or Chinese) : then remove all hard disks
    [15.10.2008 12:50:52] QNAP Support (English or Chinese) : turn on your NAS again, without any hard disk
    [15.10.2008 12:51:38] QNAP Support (English or Chinese) : hot plug disk 2 and 3 back, and replace disk 1 with 4
    [15.10.2008 12:52:15] QNAP Support (English or Chinese) : then contact us, I will ask one of our RD engineer to remotely connect to your NAS and rebuild your RAID 5 for you


    Dann wollen wir mal hoffen, dass heute ein RD engineer erreichbar ist ...


    Grüße,
    Martin

  • Bleibt wohl auch nichts anderes, es sei denn ich verzichte auf einige Daten...
    Das kam eben nochmal:


    [09:08:01] QNAP Support (English or Chinese) : sorry our RD is not available now can you just leave the NAS?


    und:


    [09:29:37] QNAP Support (English or Chinese) : I have forwareded this problem to our software team leader but i am not sure when they will check it


    Hmmm. Was das wohl bedeutet? :)

  • So, Update!


    Heute nachmittag habe ich es mal per MSN versucht. Und hatte Fan am Draht.
    Der hat sich die Sache ebenfalls angesehen und dann die Platten-Umsteckerei, die Simon mir geraten hatte, mit einem "ohh." kommentiert und alles wieder rückgängig gemacht. Nun ja.


    Das Gute zuerst: Er hat - auch wenn die Platten-Systematik komplett durcheinander ist - mir die Daten und Freigaben wieder zurückgeholt.
    Das Schlechte: Ich muss alles runterkopieren und dann die TS-409 komplett neu aufsetzen. Aber wofür gibt es Wochenenden? :)


    Eine Sache würde ich noch gerne hinbekommen: Ich habe eine MySQL-Datenbank angelegt, die ich gerne retten würde. Ich komme aber per phpAdmin nicht mehr an die Datenbank - "#2013 - Lost connection to MySQL server during query" ist das einzige, was ich beim Anmeldung zu sehen bekomme.
    Kann ich später die Datenbank neu "createn" und dann einfach das Verzeichnis "/share/MD0_DATA/.@mysql/cpg" (cpg ist der Name der DB) wieder zurücksichern? Der MS-SQL-Server ist mir gut bekannt, bei MySQL tappe ich etwas im Dunkeln :)


    Und dann wäre da noch die Konfiguration von MLDonkey. Weiss jemand, was ich sichern muss, um möglichst wenig Streß bei der Neueinrichtung zu haben?


    Grüße,
    Martin