Speicherpool herabgesetzt und nicht verfügbar

  • Hallo,


    ich habe ein kleines oder großes Problem mit meinem RAID 5.


    Die HDD in Schacht 3 hatte schlechte SMART Werte.

    Hab die Platte dann heute morgen ersetzt und der rebuild hat bekommen.


    Kurz danach ist die HDD aus Schacht 1 auch mit einer SMART Meldung gekommen.


    Jetzt habe ich gesehen, dass die neue Platte aus Schacht 3 einen i/o Fehler zeigt.


    Was mich wundert ist jetzt, dass der ganze Pool nicht erreichbar ist. Die Platte in Schacht 1 ist ja noch Betriebsbereit.


    Bekomme ich den Pool wieder herabgesetzt an den Start? Ist denke besser, bevor ich die Platte aus 3 nochmal tausche bzw noch einen Anlauf mache.


    Die Bilder sind leider im Hochformat, da sieht man in der Vorschau nicht viel....


    Screenshot_20221116_193101_Chrome.jpgScreenshot_20221116_193107_Chrome.jpgScreenshot_20221116_193116_Chrome.jpgScreenshot_20221116_193612_Chrome.jpg

  • Moin,

    die Bilder sind leider auch sehr unscharf / klein...


    Was für SMART Fehler werden denn für Disk 1 angezeigt?

    Der Rebuild ist dann denke ich mal abgebrochen? Dann würde ich versuchen den Fehlerverlauf zurückzusetzen und den Rebuild nochmal neu anlaufen zu lassen:


    Backup vorhanden?

  • So,


    hab gestern noch die beiden Festplatten auf defekte Sektoren prüfen lassen.


    Schacht 3 ist jetzt wieder okay.

    Schacht 1 meckert noch über die SMART-Werte.


    Screenshot_20221117_091212_Chrome.jpg


    Wenn ich die Festplatte testen möchte meldet er sich mit "read failure".


    Kann ich irgendwie prüfen, ob die HDD 3 gestern korrekt in das RAID übernommen wurde?

    Weiß nicht, ob der I/O-Fehler nachdem oder bevor die Platte fertig eingebunden wurde gekommen ist.


    Die RAID Gruppe stimmt.

    Screenshot_20221117_091657_Chrome.jpg

  • Schacht 1 meckert noch über die SMART-Werte.

    Die würde ich im Auge behalten und wahrscheinlich alsbald ersetzen, nicht korrigierbare Sektoren sind nicht so toll und eventuell kommen bald noch 8 weitere dazu.


    Kann ich irgendwie prüfen, ob die HDD 3 gestern korrekt in das RAID übernommen wurde?

    Schau Dir mal das Systemlog an, da sollte Beginn und Ende aufgeführt sein.

  • Die kommt auf jeden Fall raus.

    Scheint komplett kaputt zu sein wenn die Tests nichtmal starten.


    Finde nicht, dass er fertig ist.

    Heute morgen habe ich das System. Neugestartet, danach war der Pool wieder da.


    Code
    Informationen    2022-11-16    12:13:37    System    127.0.0.1    Hardware Status    Drives    [Hardware Status] "Host: Disk 3": Connected.
    Informationen    2022-11-16    12:20:02    admin    127.0.0.1    Storage & Snapshots    RAID Group    [Storage & Snapshots] Started rebuilding RAID group "1". Storage pool: 1, Priority: Resync First.
    Informationen    2022-11-17    08:53:13    admin    127.0.0.1    Power    NAS Power Status    [Power] The system has started.
    Warnung    2022-11-17    08:53:11    admin    127.0.0.1    Storage & Snapshots    Volume    [Storage & Snapshots] Volume "DataVol2" has reached the space alert threshold of "95%". Storage pool: 1, Free space: 30.28 GB. Insufficient storage space might lead to decreased performance.
    Warnung    2022-11-17    08:53:12    admin    127.0.0.1    Storage & Snapshots    Volume    [Storage & Snapshots] File system not clean. Volume: DataVol2, Storage pool: 1. Run a file system check.
    Warnung    2022-11-17    08:53:13    admin    127.0.0.1    Firmware    Digital signature check    [Firmware] Detected expired digital signature for 5.0.0/20211221 while booting.

    In der Reihenfolge steht es im Log. Ohne was zwischen.


    Edit

    Gibt es evtl eine Option, um das RAID auf Konsistenz zu prüfen?

    Einmal editiert, zuletzt von SM52 ()

  • Hm, da frage ich mich erstmal, was zwischen 2022-11-16 12:20:02 und 2022-11-17 08:53:13, also Beginn des Rebuils und dem Hochfahren passiert ist. Hart abgeschaltet?

    Läuft bei den Hintergrundaufgaben denn noch was?

    pasted-from-clipboard.png

  • Dann jetzt ganz schnell ans Backup gehen (die Frage nach einem Backup wurde noch nicht beantwortet!).


    Gruss

  • Keine Ahnung was in der Zwischenzeit war.

    Das nas wurde heute morgen runtergefahren (allerdings hängt es sich da IMMER irgendwo auf, wo ich dann den Powerknopf lange drücken muss).


    Aktive Aufgaben gibt es nicht.


    Die wichtigen Sachen werden täglich per vpn auf ein anderes nas gesichert.


    Gibt es noch ein ausführlicheres Log wie hier:

    Screenshot_20221117_095734_Chrome.jpg

  • Das nas wurde heute morgen runtergefahren (allerdings hängt es sich da IMMER irgendwo auf, wo ich dann den Powerknopf lange drücken muss)

    Dann würde ich nach Ursachen forschen, denn das ist definitiv nicht normal!

    Das kann auch ein Dienst sein, der nicht ordnungsgemäß beendet wird.


    Zur Not muss man das NAS neu aufsetzen und die Apps/Dienste wieder schrittweise aktivieren, bis man die Ursache gefunden hat.

    Es einfach so weiter zu betreiben ist nicht sinnvoll.


    Gruss

  • Dazu hatte ich schon mit qnap Kontakt. Die schieben es auf ein Bauteil am Mainboard. Das nas hat das schon seit dem ersten Tag.

    Nur hatte ich damals leider keine Zeit es zu ersetzen....


    Beim Neustarten werden auch alle Sachen beendet. Da sieht man ja wie die nach und nach abgeschaltet werden.

    Wenn das Maß dann nicht erreichbar ist (auch nicht per ping) bleibt es hängen.

  • Das nas hat das schon seit dem ersten Tag.

    Und das hast Du einfach akzeptiert? Bei mir wäre das zurück zum Händler.

    Erst recht, wenn QNAP hier einen Hardwarefehler angibt.


    Gruss

  • Nur hatte ich damals leider keine Zeit es zu ersetzen....

    :| :| :|

    Dann würde ich aber Gas geben, solange noch Garantie drauf ist...

    Beim Neustarten werden auch alle Sachen beendet.

    Das NAS ist zu diesem Zeitpunkt ja nichtmal heruntergefahren worden. Es war Aus und ging dann wieder an bzw. ist einfach direkt neugestartet.

    Unter solchen Umständen brauchen wir uns glaube ich gar nicht erst Gedanken machen, wie man den Pool oder das RAID wieder sauber bekommt...

  • Wenn die neue Platte nicht ganz eingebunden wurde bekomme ich aber Fehler, wenn ich die Daten über smb auf einen Rechner kopiere/sichere oder?

    Oder kopiert der einfach munter Datenmüll?


    Naja, jetzt hat das RAID aber einen Schlag weg.

    Und vermutlich sollte man erst danach schauen bevor man an andere Dinge des Systems geht und es ggf weiter beschädigt.

    Einmal editiert, zuletzt von SM52 () aus folgendem Grund: Ein Beitrag von SM52 mit diesem Beitrag zusammengefügt.

  • Oder kopiert der einfach munter Datenmüll?

    Die Daten sollten eigentlich intakt sein, wenn sie noch zugänglich sind.

    Grundsätzlich sollte eine Datensicherung aber halt schon vor einem Fehlerfall gemacht werden ;)


    Und vermutlich sollte man erst danach schauen bevor man an andere Dinge des Systems geht und es ggf weiter beschädigt.

    Ich glaube das NAS hat insgesamt einen Schlag weg, wie Du ja selbst beschrieben hast sogar "offiziell". Das sollte erstmal behoben werden!

  • Kann ich sehen, warum der Pool herabgesetzt ist?

    Die (gezeigten) Smartwerte führen doch normal nicht dazu oder?

  • Grad mal den Thread überflogen


    Seh ich das richtig?:


    - Platte war defekt

    - Platte wurde getauscht

    - Während des Rebuilds hatte ne andere Platte defekte Sektoren (uncorectable Sectors)


    Dann ist der Fall ja klar, das RAID ist hinüber. Oder übersehe ich da was ?

  • Was genau passiert ist weiß man nicht...

    Offensichtlich während des rebuild ist das NAS einfach von selbst (evtl wegen Defekt) aus und wieder eingeschaltet worden. Nun steht soweit ich es verstanden habe nur der Pool degraded, Rest scheint zumindest iO.

    Ich glaube wir brauchen nochmal Screenshots...

  • Nein, nicht während des rebuild.

    Dieser sollte 9h dauern.

    "Neugestartet" habe ich es nach ca 20 Stunden.


    Ob der rebuild fertig war weiß ich nicht. Finde im Log nicht wo die neue Platte den i/o Fehler hatte.

  • Also hast du doch selbst eingegriffen... Hatte es so rausgehört, dass du nichts damit zu tun hattest... Aber egal, weil der Rebuild laut deinem Log in Post 5 beim "Neustart" scheinbar nicht fertig war und das NAS scheinbar auch nicht neugestartet ist, sondern lediglich eingeschaltet wurde... Das Ausschaltereignis wurde gar nicht geloggt, was auf ein Problem /Absturz zurückzuführen wäre. Da scheint also einiges faul... Im Log, im RAID und irgendwie im ganzen NAS...