Plötzlich kein Speicherpool mehr

  • :?:

    Bevor ich mein Problem schildere kurz was zur Konfiguration:

    Ich betreibe 2 QNAPs verschiedener Modelle. Aber hier geht es um das Modell TS-451A. Das Gerät ist ca. 1 1/2 Jahre in Betrieb, bei nur geringer Auslastung (er dient als Massenspeicher).

    Die Firmware ist die Original-Firmware 4.3.4.0516. Updates habe ich nie gemacht


    Bestückt ist er mit 4 HDDs von Seagate à 8 TB (aus der Kompatibilitätsliste). Aus Disk 1 bis Disk 3 habe ich ein gemeinsames Laufwerk ("DataVol1") gemacht. Disk 4 ist ein einzelnes Volume ("DataVol2").


    Außerdem hängen noch 2 USB-Festplatten dran.


    Von heute auf morgen (ich habe nichts verändert!) wurden die Verzeichnisse, die auf DataVol1 freigegeben worden sind nicht mehr unter Windows erkannt, Aber auch in der FileStation wird dieses Volume nicht mehr angezeigt.

    Unter "Speicher & Snapshots" hat DataVol1 den Status "Fehler". DataVol2 und die USB-Festplatten sind dagegen OK.

    Zunächst waren die HDD-LEDs für alle Platten grün. Genauso wurden unter "Speicher" alle 4 HDD mit dem Status "gut" angezeigt. Nach 2 Neustarts hat HDD3 plätzlich eine rote LED. Unter "Speicher" hat jetzt Disk 3 den Status "Anomal" und den Text "Es wurden Fehler festgestellt. Es wird empfohlen, die Festplatte zu ersetzen". Allerdings: Ich habe den Test unter "Datenträgerstatus" mehrfach ausgeführt und jedesmal das Ergebnis "Test abgeschlossen und keine Fehler..." erhalten, Auch unter "Smart-Info" ist jeder Status "gut".


    Was kann ich da machen, um die Daten wieder zu erhalten? Wie es nicht anders sein kann, habe ich kein Backup.


    Vielen Dank für eure Tipps.

    Klaus


    NACHTRAG: Vorhin hat der QNAP hektisch gepiepst. Und jetzt ist wieder die LED für Disk 3 grün. Auch unter "Speicher" hat jetzt Disk 3 den Status "gut". ABer an dem Hauptproblem hat sich nichts geändert: Ich muss wieder an den Speicherpool kommen.

    Einmal editiert, zuletzt von KDL () aus folgendem Grund: neue Beobachtungen

  • hat jetzt Disk 3 den Status "Anomal" und den Text "Es wurden Fehler festgestellt. Es wird empfohlen, die Festplatte zu ersetzen"

    Dann mach das mal … aber idealerweise machst du VORHER ein Backup …


    Was sagt den der Speichermanager, sind die Volumen noch da? (Bilder wären hilfreich)

    Was sagt der Filemanager, sind die Ordner in den Volumen noch da?

    Was geht mit WinSCP, sind da die Ordner noch da?

  • Also Backup geht leider gar nicht, weil die Verzeichnisse und Dateien nirgendwo angezeigt werden. Weder unter Windows noch im Filemanager "FileStation" (hier werde nur die beiden USB-Disks und die Verzeichnisse/Dateien, die zu DataVol2 - das ist das Volume, das nur aus Disk 4 besteht - angezeigt. DataVol1 ist hier nicht existent.


    Ich lade mal einen Screenshot hoch. Viel sagt er nicht aus, außer: alle 4 Disks sind OK, es gibt keinen Speicherpool, auf DataVol1 gibt es einen Fehler und DataVol2 hat nicht mehr viel Speicherplatz (letzteres ist aber kein Problem).

  • OK, ich habe mich vielleicht unsauber ausgedrückt: Das Volume ist nicht das Problem, sondern der Speicherpool. Ich habe ja außer dem Problem-QNAP "QNAP3" noch einen neueren QNAP "QNAP4" (mit aktuell nur einer Disk). Und dort sieht es unter "Speicher & Snapshots" so aus, wie man in Bild3 sehen kann: Es gibt einen Speicherpool. Und genau der fehlt bei dem Problem-QNAP.

    Dementsprechend sieht es im File-Manager so aus, wie man in Bild 2 sehen kann (links der Problem-QNAP und rechts der neuere QNAP): Der Zweig "DataVol1" fehlt komplett (was dort irreführend "Volume" heißt, ist nichts anderes als eine 2. USB-Disk).


    Ich füge einfach mal die Systemlog-Datei bei. Es fällt auf, dass die Probleme vor ca. einer Woche angefangen haben und dass Disk 3 offensichtlich immer Ärger macht

  • dass die Probleme vor ca. einer Woche angefangen haben und dass Disk 3 offensichtlich immer Ärger macht

    Ich möchte mich ja jetzt nicht selber zitieren, aber ich habe dir gleich zu Beginn geantwortet, tausche die Disk 3, wenn sie die Ursache ist.

    Dein Log sagt ja auch, dass das der Fehler ist Host: Disk 3 Read I/O error.


    Egal was du auch jetzt noch alles versuchst, solange die Disk nicht in Ordnung ist, wird auch dein RAID nicht mehr funktionieren ...

  • Die Antwort verstehe ich dennoch nicht. Nach meinem sehr laienhaften Verständnis von RAIDs sind die Dateien auf allen 3 Disks verteilt. Wenn eine Disk defekt ist, dann sollten die Daten auf allen Disks verloren sein. Aber falls nicht: Warum sollte nach Austausch einer Platte das RAID wieder da sein? Oder fragt das OS nach Austausch einer Platte, ob es das RAID wieder erstellen soll? Ich habe leider keine leere Disk zur Verfügung, um das einfach auszuprobieren.

  • Ob die Daten nach dem Tausch der Disk wieder da sind, kann ich nicht sagen.

    Zum Thema RAID gibt es im I-Net genügend gute Erklärungen, da will ich gar nicht ins Detail gehen.


    Bei einem RAID5 (ab 3 Disk möglich) darf immer GENAU EINE Disk ausfallen, dann können die Daten wieder hergestellt werden. In deinem Fall Daten auf 2 Disk, Prüfsumme auf Disk 3, wobei die Disks je Block "Reihum" gehen, d.h. es hat jede Disk mal eine Prüfsumme, mal reine Daten ...


    Ob du nun eine Disk herumliegen hast, oder extra kaufst, du wirst nicht daran vorbeikommen, das RAID mit einer neuen Disk zu "rebuilden".


    Und nein, das System fragt nach dem Tausch nicht, ob es das RAID wieder herstellen soll, es fängt einfach damit an ... außer, es sind bereits die DAten auf den anderen Disks auch beschädigt ... dann ist es eh egal und du kannst neu aufsetzen ...

  • Ich habe mal interessehalber die Problem-HDD (Disk 3") sowie zum Vergleich eine der guten HDDs (Disk 2) in einen HDD to USB-Adapter gesteckt und mir die Dateistruktur im FileManager angesehen. Den Screenshot der Struktur von Disk 3 habe ich hier mal hochgeladen. Diese ist völlig identisch mit der Struktur von Disk 2. Das bestätigt deine Aussagen von eben.


    Aber man sieht auch, dass die HDD in Ordnung ist, sonst würde nichts angezeigt. Jedenfalls fast immer, mindestens 99,9% der Zeit. Nur gibt es halt gelegentlich spontane Aussetzer, somit kann man der Disk nicht vertrauen. Ganz logisch ist es für mich aber nicht, denn wenn die Disk die meiste Zeit zur Verfügung steht, warum erstellt das System dann nicht einfach einen neuen Speicherpool?


    Ach ja, vorhin poppte zum ersten Mal das Fenster auf: "Das System hat erkannt, dass das Dateisystem auf einem oder mehreren Volumes nicht bereinigt ist. Sie sollten ... eine Dateisystemprüfung vornehmen. Möchten Sie den Speichermanager jetzt öffnen und eine Prüfung vornehmen?" Das habe ich gemacht, Und nach ca. 15 Minuten kam die Meldung "Systemcheck failed. Es sieht also gar nicht gut aus.


    Mein Problem ist, dass ich kein Backup habe und unbedingt irgendwie das Volume zum Laufen kriegen muss, um dann die Dateien runterzuziehen. Wenn ich sicher wäre, dass dein Vorschlag, einfach Disk 3 zu ersetzen zum Ziel führt, würde ich das machen.

  • Du musst die HDs mit dem passendem Tool des Herstellers prüfen, dann wirst du sehen was da defekt ist.

    Ich vermute defekte Blöcke und daher ist dir auch das Raid auseinander geflogen.


    Einfach mal die Verzeichnisstruktur an zu schauen reicht nicht im Ansatz.


    Was sagen denn die SMART Werte der HDs im Detail?

    Gibts da Auffälligkeiten.


    Da du kein Backup hast, sind die Daten nicht wichtig, von wichtigen Daten hat man mindestens ein Backup, wenn nicht sogar zwei und dann noch räumlich getrennt gelagert.

    Alles andere erfüllt nicht die Anforderungen eines richtigen Backups.

  • Was ich nicht verstehe ist, dass das Volume weg ist.

    Wird das Volume nicht mehr gemountet, wenn das Raid degraded ist?

    Oder ist das Raid komplett im Eimer?

  • @ frosch2

    Ja, das Raid ist komplett im Eimer.


    @ Crazyhorse


    Zunächst: Ich bin in keiner Firma, sondern Privatmann. Von daher ist ein Datenverlust nicht verhängnisvoll. Aber es stecken halt viele persönlichen Dokumente dahinter.


    Also gestern war mal Disk 3 unter "Speicher & Snapshots" kurzzeitig nicht existent (eine 3 im weißen Kreis). dann gab es viel Gepiepse, und dann war sie plötzlich wieder da (3 im blauen Kreis), Der Speicherpool war dennoch nicht vorhanden.


    Aber ich konnte die Smart-Daten aufrufen: Bei allen Punkten stand da ein "gut". Heute nach einem erneuten Neustart wird Disk 3 hier nicht mehr angezeigt (3 im weißen Kreis; dieLED am Gehäuse ist trotzdem grün). Dann kann man natürlich auch keine Daten zum Zustand der Disk mehr abrufen.


    Aber wie ich unter #9 geschrieben habe, habe ich die Disk heute in einen HDD to USB-Adapter gesteckt und sie mir im FileManager angesehen: Viel kann man dort ja nicht sehen, aber es gab keine Anzeichen von Problemen.


    Nachtrag: Ich hatte übersehen, dass du Festplattentools des Herstellers empfohlen hast. Also: Ich habe mir von Seagate Seatools für Windows installiert, die Disk im HDD to USB-Adapter diesmal mit dem Windows PC verbunden und mehrere Tests durchgeführt : "Smart-Test", verschiedene Kurztests (aber keinen Langtest). Alle wurden bestanden!

    Einmal editiert, zuletzt von KDL () aus folgendem Grund: hatte ich übersehen

  • Ich meine die SMART Rohdaten, vor allem 187 und 197, ist erster nicht 0 hat die HD einen Schaden.

    197 ist noch kein Beinbruch, das kann die HD ggf. wieder gerade biegen.

    Beides zusammen, HD Schrott oder reif für den Service.


    Ich bin auch privat, daher habe ich ein Versioniertes Backup der wichtigsten Dokumente usw.

    Dann zwei HDs auf die ich im wechsel sichere und die eine lagert immer einige KM entfernt.


    Kostet nicht viel, aber ein Neuaufsetzen ist so ohne den Verlust einer einzigen Datei möglich.


    Einen Schrott Ordner habe ich aber auch, wenn der weg ist, was solls.


    So gut war mein Backup aber auch nicht immer organisiert, früher habe ich durch experimente 1-2 mal den Inhalt einer ganzen HD verloren, seit dem ist man halt sensibel was das angeht.

    War nix wildes, aber alle Bilder usw. würde ich jetzt ungern hops gehen sehen.

  • Nach dem Wiedereinsetzen der Platte in den QNAP stand die Platte wieder zu Verfügung. Ich habe die Smart-Daten aufgerufen: Alle waren wie gestern "gut". 187 und 197 waren 0. Aber ne MInute später piepste es und die Platte ist wieder weg aus der Anzeige! Das muss man nicht verstehen...

  • Wenn du di HDs extern getestet hast und die OK sind, dann hat es vermutlich deine Backplane erwischt oder dein NAS.


    Hast du noch Garantie auf dem NAS?

    Dann Ticket beim Support erstellen.

  • Ja, das Raid ist komplett im Eimer.

    Woraus erschließt sich dir das?

    Schonmal auf der Konsole cat /proc/mdstat ausgeführt?

    Ein raid5 sollte in der Lage sein, den Ausfall einer Festplatte zu verkraften und dann "read only" zur Verfügung stehen. Wozu brauche ich sonst ein raid5?

    Es geht doch jetzt erstmal darum, die nicht gesicherten Daten zu retten. Völlig egal was nun mit der Festplatte ist. Das Rumgewurschtel mit der betroffenen Festplatte kannst du dir (wir uns) sparen.


    Nun noch das Wort zum Freitag, zu Backups.

    Klar gibt es Unterschiede zwischen privat und gewerblich.

    Hier gibt es aber eigentlich nur den Unterschied der eingesetzten Software und oder der Häufigkeit, nicht den Unterschied zwischen ja und nein.

    Privat habe ich genug Daten, auf die ich in Zukunft nicht verzichten möchte, egal was passiert.

    Ich investiere doch nicht in ein NAS, auf dem ich mehrere TBs an Daten vorhalte, um morgen bei 0 anzufangen.


    Jetzt noch einige Worte zu LVM.

    LVM in Verbindung mit einem raid, ist für Privatnutzer eigentlich Schwachsinn.

    Was macht LVM?

    Es fügt mehre Partitionen, Raids zu einem Volume zusammen.

    Ich kann es erweitern oder reduzieren.

    Toll, und das brauche ich, wenn ich ein raid >0 habe?

    Das macht für mich nur im Einzelfestplatten-Bereich Sinn.

    Einmal editiert, zuletzt von frosch2 ()

  • Nur leider gehen Snapshots ohne lvm nicht... Klingt zwar doof, ist aber so...


    Ob man die braucht ist zweifelhaft, Qnap wirbt nur massiv damit und schlägt jetzt immer vor Thick oder Thin Volumes zu erstellen...

    Ich fahr zwar aktuell auch alle noch mit Statics, aber bin auch schon am überlegen, ob ich die neue, große Büchse nicht mit Thick provisioning und Snapshots ausstatte...

  • Ja völlig richtig, ich will die Daten retten und dann am besten die Festplatten 1 bis 3 plattmachen und alles neu aufsetzen.

    Das mit "read only" klingt gut.Aber Konsole? Ich habe mal auf dem NAS gesucht , aber keine gefunden.


    Aber davon abgesehen, bin ich nicht sicher, dass wirklich die Festplatte 3 die Probleme macht, denn diese ist mal da, und mal weg. Zeitweise werden alle 4 Platten angezeigt, dann piepst es und sie ist wieder weg ("A drive has been detected but is inaccessible. Please check it for faults"). Um dann irgendwann wieder da zu sein, usw. Da habe ich eher den Verdacht, es liegt an der Hardware,


    Zu deinen Anmerkungen: Ich habe halt ganz wichtige Daten, von denen habe ich Backups. Einen Verlust der anderen kann ich verschmerzen, ich muss die halt mühsam wieder zusammensuchen. Und um alle Dateien zu backuppen fehlt mir das Kleingeld. Man muss im Leben halt Kompromisse machen.


    Ich hatte seinerzeit Gründe für eine große Partition. ABer spätestens jetzt ist mir klar geworden, dass einzelne Disks für mich sinnvoller sind. Im Falle einer defekten Disk verliere ich auch nur die Daten von dieser Disk.

  • Aber Konsole?

    [Video] Mit Putty via SSH auf QNAP NAS Konsole zugreifen (0:52 Minuten)


    Mangoon2008

    Ja LVM bietet Snapshots, wenn man sie braucht und man weiß wozu.

    Sie ersetzen aber kein Backup, es sei denn, du exportierst sie auf ein anderes Medium.

    Das war jetzt nicht explizit an dich gerichtet, nur allgemein.

    Einmal editiert, zuletzt von frosch2 ()