TVS 463 Raid5: Festplatte meldet Fehler und keinerlei Zugriff mehr auf die Daten, bitte um HILFE!!

  • Hallo zusammen,


    ich habe ein TVS463 mit 4x4TB WDRED (die dürften so 4 Jahre alt sein) und zusätzlich ein UX500P mit 4x6TB WDRED (2 Jahre alt). Aufgesetzt ist ein Raid5 und alles zusammengefasst in einem einzigen Volume, heute morgen dann piepste das QNAP ein paar Mal und meldet nun den Fehler, dass auf Festplatte 4 des Erweiterungsgehäuses Fehler festgestellt wurde. Die Festplatte wird im Speichermanager orange dargestellt. Was aber komisch ist: Das Volume wird als "degraded" und zusätzlich als voll angezeigt, obwohl eigentlich noch 2 TB frei waren. Über den Windows-Explorer kann ich auf keinen der Ordner mehr zugreifen, die VMs sind auch stehen geblieben, ich kann die Virtualization Station nicht öffnen. An sich sollte doch beim Ausfall nur einer Platte noch alles normal weiterlaufe?!?


    Hab direkt eine neue Festplatte bestellt, kommt aber erst morgen.


    Was kann ich nun tun? Bitte um Eure Hilfe!

  • Michi240281

    Hat den Titel des Themas von „TVS 463 Raid5: Festplatte meldet Fehler aber keinerlei Zugriff mehr auf die Daten, bitte um HILFE!!“ zu „TVS 463 Raid5: Festplatte meldet Fehler und keinerlei Zugriff mehr auf die Daten, bitte um HILFE!!“ geändert.
  • ich hoffe es waren externe backups vorhanden


    Im Prinzip sollte es weiterlaufen bei nur einer defekten Platte...sicher das die anderen Platten ok sind ?


    mal via ssh md_checker laufen lassen?

  • Lokales BackUp der wichtigsten Daten ist vorhanden, aber viele andere wichtige Sachen (wie die VMs) habe ich nicht gesichert.


    Folgendes ist denkbar:


    Festplatte 4 (die jetzt den Fehler gemeldet hat) hat zum ersten mal vor 2 Monaten Schreibfehler gehabt, per SMART Check war sie aber "grün". Gestern Mittag habe ich versucht, einer VM eine USB-Verbindung durchzureichen. Dabei habe ich wohl aus Unwissenheit die USB-Verbindung von Festplatte 1 aus dem Erweiterungs-Gehäuse erwischt. Daraufhin meldete dann das NAS, dass Festplatte 1 entfernt wurde. Hab dann die USB-Weiterleitung in der VM wieder entfernt, die Festplatte rausgezogen und wieder reingeschoben. Dann wurde Festplatte 1 wieder eingebunden und da stand, dass das 23h dauert. Und evtl. ist jetzt während dieses Prozesses die Festplatte 4, die ja schon Probleme gemacht hatte und jetzt stark beansprucht wurde, abgeraucht, die Einbindung von Festplatte 1 war aber noch nicht abgeschlossen und somit sind jetzt 2 Festplatten ausgefallen?!? Könnte sein, oder? Und was jetzt?

  • wenn 2 Platten ausgefallen sind ..dann sind alle Daten futsch..wenn du die internen und externen Platten gepoolt hattest .. sind alle Daten futsch


    was sagt denn das Oben gennante Kommando ?

  • aber viele andere wichtige Sachen (wie die VMs) habe ich nicht gesichert.

    Das nennt man ein Oxymoron.

    Entweder sind die Daten wichtig, dann hat man ein Backup, oder eben nicht.


    Dabei habe ich wohl aus Unwissenheit die USB-Verbindung von Festplatte 1 aus dem Erweiterungs-Gehäuse erwischt.

    Und diese Information enthältst Du uns im Eingangspost mal eben vor...!?

    Damit ist das Raid hinfällig, Raid5 heißt, es darf genau eine Platte ausfallen.

    2 defekte Platten -> Daten im Nirwana.

    Könnte sein, oder? Und was jetzt?

    Kopf auf den Tisch schlagen, warten bis der Schmerz nachläßt.

    Dann das NAS am besten neu aufsetzen, die vorhandenen Daten aus dem Backup zurückholen.

    Alles andere musst Du neu einrichten, z.B, die VMs.


    Ja, es ist sarkastisch, oder was willst Du sonst hören?

    Durch Handauflegen kommen keine Daten wieder.

    Sieh es sportlich: für die Zukunft unbedingt eine Backupstrategie erstellen (und testen).


    Außerdem: eine HDD, die vor 2(!!!) Monaten Fehler geliefert hat, wird nicht ersetzt???

    Das kommentiere ich nicht.


    Gruss

  • Jo mir ist das erst soeben eingefallen, hatte da gar nicht dran gedacht!


    Ja ich hatte einen gemeinsamen Speicherpool, dann ist jetzt alles weg? Gibts sonst keinerlei Möglichkeiten, zumindest nen Teil wieder zu bekommen?


    Die Festplatte hatte vor 2 Monaten mal einen Schreib-/Lesefehler, im Smart stand aber, dass sie normal arbeitet, daher hab ich sie noch nicht ersetzt!

  • SMART ist gut und schön, aber bei 90% der Festplattenausfälle in meinen NAS waren die SMART Werte bis zum Ausfall alle gut und die Disk grün.

    Bei einem Ausfall kündigte sich das Ereignis durch I/O Errors an.


    Insofern traue ich dem nicht wirklich und ersetze beim ersten Anzeichen die entsprechende Platte.

    Die Chancen, einen Teil der Daten zu retten, sind eher minimal. Mit Hausmitteln würde ich das nicht mehr versuchen, kann nur schlimmer werden.

    Als Alternative und wenn unverzichtbar bliebe eine professionelle Datenrettung übrig.

    Ausgang ungewiss, Kosten mit Sicherheit 4-stellig (vor dem Komma ;)).


    Gruss

  • So es gibt ein paar Neuigkeiten von mir.


    Ich kam gestern dann nicht mehr per Windows Explorer aufs NAS, allerdings habe ich dann über die QFile-App bemerkt, dass ich darüber sehr wohl noch alle Daten sehen konnte. Daraufhin bin ich dann in die FileStation gegangen und habe alle meine Daten sehen können. Habe daraufhin alles auf eine externe Platte gesichert, was wichtig war.


    So und da der Raid-Verbund sowie das Volume "nur" auf orange waren, habe ich dann die als orange markierte Platte entfernt, eine neue eingesetzt und dann in der Speichermanager Verwaltung die Wiederherstellung angestoßen. Das ganze hat dann 1min gerödelt und dann kam die Meldung, dass die Wiederherstellung fehlgeschlagen ist. Daraufhin gingen dann die "Lampen" von orange auf rot, das Volume wurde auf inaktiv gesetzt.


    Verstehe das ganze nicht, ich konnte vorher auf alle Daten zugreifen, habe ne neue Platte eingebaut und das wiederherstellen schlägt fehl.


    Welche Optionen habe ich jetzt noch? Die neue Platte wurde als "neu" markiert, muss ich die erst dem RAID zuweisen und dann wiederherstellen?


    Wenn alles scheitert auch nicht schlimm, dann setze ich neu auf. Ich würde jetzt nur 15TB an Filmen/Aufnahmen verlieren, das wäre nicht tragisch, aber wenn ich es verhindern kann, wäre es natürlich besser.

  • Ok das probiere ich nachher direkt! Weiß nur nicht, ob SSH geht, weil scheinbar alle Dienste am NAS stehengeblieben sind. Aber ich probiere es und melde mich wieder.

  • 4x4TB WDRED (die dürften so 4 Jahre alt sein)

    Falls es doch noch gelingen sollte, dein RAID wieder "online" zu bringen, würde ich da auf die restlichen Disks keinen Cent mehr wetten.

    Sind alle 4 Platten gleich alt und womöglich von der selben Charge, dann ist die Chance, dass sie "zeitgleich" ausfallen, SEHR HOCH !!!


    D.h. solltest du das RAID wieder zum Laufen bringen und es mit einem Rebuild anfangen, kann gleich mal die nächste Platte verrecken. Also kannst du auch gleich 4 neue Platten bestellen (und die 5. auf Reserve legen) und mit Neuinstallation von Vorne beginnen ...


    §-4 Jahre ist ungefähr das maximale Alter meiner WD Red, in dieser Zeit sind alle mal durch Neue ersetzt worden.

  • So, md_checker Resultat:


  • try


    Code
    1. mdadm -AfR /dev/sdf3 /dev/sdi3 /dev/sdj3 /dev/sdg3

    if it is set to online again, do


    Code
    1. /etc/init.d/init_lvm.sh
  • Jetzt sieht es irgendwie anders aus:


  • sorry hab aus versehen oben in Englisch geschrieben (Macht der Gewohnheit)


    egal .. also das sieht nicht gut aus, dann hast du eine Platte die im rebuild Status ist und eine die sich verabschiedet hat.. Daten futsch..

  • Code
    1. mdadm -AfR /dev/sdf3 /dev/sdi3 /dev/sdj3 /dev/sdg3

    Wenn mich nicht alles täuscht, wird so ein RAID mit dem Namen sdf3 erzeugt.

    Oder anders ausgedrückt - da fehlt das /dev/md2.


    mdadm -AfR /dev/md2 /dev/sdf3 /dev/sdi3 /dev/sdj3 /dev/sdg3

  • Yap, da haste Recht habe das Zielmount vergessen, aber da jetzt eine Platte ganz fehlt und eine noch im Rebuild steckt, sehe ich schlechte Chancen fuer das RAID

  • Ich denke ich hätte das Kommando "md_checker" früher wissen müssen, dann hätte ich gesehen, dass die Platte 1 noch im rebuild steckte. Denn im WebIf war weder was im Speichermanager noch in den Hintergrundaufgaben zu sehen. Da wurde nur die Platte 4 orange markiert und bei den Meldungen stand, dass Platte 4 einen Fehler hat. Daher hab ich dann die Platte 4 ersetzen wollen und in dem Moment ging der Pool auf inaktiv und alle Daten waren zum Teufel. Das kann meiner Meinung ja gar nicht angehen, den als Otto-Normal-User muss man sich ja auf die Hinweise im WebIF verlassen können, nicht jeder kann mit SSH umgehen oder kennt das überhaupt.

    Naja sei es drum, wieder was gelernt. Konnte alle wichtigen Daten retten, 15TB Filme sind weg aber egal. Hab jetzt 2x RAID10 erstellt mit 2 Volumes, auf dem einen wichtige Daten und auf dem anderen unwichtige. Von den wichtigen Sachen mache ich dann BackUps auf das andere Volume und einmal monatlich auf ne externe HDD, dann sollte es ok sein. Hab dann jetzt auch denke ich mehr Performance, mehr Ausfallsicherheit, nur halt weniger Platz.

  • Hab jetzt 2x RAID10 erstellt mit 2 Volumes, ...

    Hab dann jetzt auch denke ich ... mehr Ausfallsicherheit, nur halt weniger Platz.

    Mehr Ausfallsicherheit wegen dem Backup, oder wegen dem RAID10?

    Beim RAID10 darf auch nur eine Platte ausfallen, sind es mehr, ist es auch beim RAID10 vorbei ...

  • RedDiabolo : es dürfen m.E. zwei Platten ausfallen, solange es die beiden richtigen Platten sind ;).


    Gruss