Speicher-Pool nach defekter Backplane Herabgestuft & mehrere HDDs "Kein Mitglied"

  • Hallo in die Runde,
    nach einer defekten Backplane (TS-1273U) wird eine von acht Festplatten des RAID-6 als Fehlerhaft erkannt (Datenträgerzugriffsverlauf(I/O)).

    (eine Ersatz-HDD liegt daneben, wenn ich sie insetze kann aber das Raid nicht wiederhergestellt werden sagt er.)
    Das Volume ist "Heruntergestuft" und in der Übersicht werden 3 HDDs als "Kein Mitglied" angezeigt (die mit Fehler und 2 weitere).
    Ich habe soweit das "RAID wiederherstellen", das er vorgeschlagen hat, angeklickt, seit dem macht er glaube ich irgendwas (Rein von der Lüfterdrehzahl her), zeigt aber keine Aktivität/Status an.

    Ein Backup vom meisten ist vorhanden, aber leider nicht von allem.
    Mir ist nicht klar was ich hier tun kann / soll, weil ich die Ursache des Problems nicht verstehe und auch nicht warum manche HDDs kein Mitglied in dem RAID mehr sein sollen.

    Anbei ein Screenshot des Speicherpools. Ich wäre für konstruktive Vorschläge sehr dankbar,
    LG Nico

  • Was war denn der Defekt? Was wurde unternommen um den zu beheben ? (Austausch, Reparatur,?)


    Am besten mal via SSH ein md_checker abfeuern und das Ergebnis ins Forum posten

  • Da kommt leider nur

    Code
    Welcome to MD superblock checker (v2.0) - have a nice day~ 
    /usr/bin/md_checker: line 25: /mnt/HDA_ROOT/md_backup_2024-07-26_01.34.24: Permission denied 
    Scanning system...

    Zum (Hardware)-Defekt:

    Ich vermute die Stromversorgung, da der Fehler eine ganze Reihe (HDD 5-8) zufällig disconnected (und reconnected) sind, die Backplane hat nach einem Urlaub im Ofen aber alle Slots wieder dauerhaft erkannt. Ein Serverwechsel ist aber in mittlerer Zukunft geplant.

    Einmal editiert, zuletzt von Mr.Spock91 ()

  • Sorry, jetzt erst rausbekommen, das man der "orginal Admin" sein muss um das zu machen... (der war halt deaktiviert...)

    Da nur bei einer Platte "Missing" steht und bei der anderen "Rebuild" interpretiere ich mal, dass er was tut und das Volume nicht fucked ist, weil es im Redundanz-Rahmen ist?
    Finde es aber interessant das gerade HDD-Slot 7 "Missing" ist, der einzige der als Gut und Vorhanden in der Reihe angezeigt wurde...


    hier noch die Auswertung von: mdadm --detail /dev/md1:

  • Aber es werden dennoch in der Übersicht 3 fehlende HDDs angezeigt [UUUUU...] ?( .

    Auch der mdadm --detail hat 3 fehlende/defekte HDDs.


    Damit ist auch bei Raid6 das Raid hinüber.


    Und wenn ich lese:

    ...die Backplane hat nach einem Urlaub im Ofen...

    dann wäre ein guter Backup Plan längst überfällig gewesen. Eine solche "Backofen Reparatur" ist eher als unzuverlässig einzustufen und ein deutliches Indiz für die Überalterung.

    Danach immer noch keine vernünftige Backup Strategie zu haben ist eigentlich schon grob fahrlässig.


    Gruss

  • Da wird Platte /dev/sda3 als eigene RAID-Gruppe mit anderer UUID erkannt. Das ist dann die dritte fehlende im RAID6 welches 8 Platten haben soll.

  • Mod: Unnötiges Volltext-/Direktzitat entfernt! :handbuch::arrow: Forenregeln beachten und Die Zitat Funktion des Forums richtig nutzen


    Das sollte die Cache-SSD im M.2 Slot 2 sein...


    Der Qnap-Support meinte dazu folgendes:

    Ich sehe zwar nicht, das dies den Zuordnungsfehler erzeugt, aber auch interressant zu wissen...

    Einmal editiert, zuletzt von Mr.Spock91 () aus folgendem Grund: Ein Beitrag von Mr.Spock91 mit diesem Beitrag zusammengefügt.

  • Das sollte die Cache-SSD im M.2 Slot 2 sein...

    Dann mach ich mal eine Kerbe ins Holz, wo Einzelplatten Cache ne Schlechte Idee war (Also Zusätzlich zu QTS Cache im Allgemeinen)

  • Also QNAP Support hat reingeschaut und meinte, das Problem sei bekannt und habe damit zutun, das es seit Volume ein Firmware-Upgrade gab, das die anderen Partitionen auf den HDDs anders handhabt und durch den Ausfall versucht wurde es auf den neuen Stand wiederherzustellen.

    Zum fixen habe ich für den 5.8. n Online-Termin mit dem Support.