Einzelplatte im RAID1, aber im Speicherpool mit anderer Platte ausgestiegen. Systemwiederherstellung

  • Hallo zusammen,


    nachdem mir die sich gegenseitig sichernden Rechner wegen gleichzeitig aussteigender Intel-Sandybridge-Controler ausgestiegen sind und ein heilloses Daten-Durcheinander hinterließen, wollte ich mal alles richtig machen... (ich war schon vor Spectre und Meltdown geheilt).


    habe mir also vor Jahren (2018) ein

    >>>>>>>>> TS-453A <<<<<<<<<<<<<<

    gekauft und es so nach und nach mit Festplatten beschickt. Ich glaube, dasz daher auch die eigenartige Konstruktion kommt, die mir nun virtuell auf die Füße fällt, mit der spitzen Kante voran, Au.


    Also es sind im Schacht 1 und 2 zwei baugleiche WD Rot 6TB.

    Die 1. Platte ist <<<<verschlüsselt>>>>.

    Jede Platte/Schacht bildet für sich ein RAID1. Ich weis nicht mehr warum, ich glaube ohne RAID ging es nicht.

    Beide bilden den Speicherpool1.

    Darauf gibt es zwei Volumen.


    Schacht 3 und 4 haben eine 8TB und eine 10TB Platte von Seagate. Darauf habe ich, soweit ich mich erinnere, alle Daten nochmals als Backup, mit entsprechender tägl. Versionierung


    Mir ist Schacht 2 ausgestiegen. (Sektoren waren ausgefallen Smart 197 von 200). Es gab eine Meldung. Speichervolumen degradiert, konnte aber noch auf alle Daten zugreifen, die ja auf der ersten Platte liegen. Ich hatte die 2. Platte dann ausgebaut in der Hoffnung, dasz sich der Speicherpool 1 dann erholt. Konnte aber die 2. Platte nicht vom Speicherpool lösen. Sie wurde immer als defekt angezeigt. Habe es wieder eingebaut. Fehlersuche, keine Besserung. Inzwischen ist die 2. Platte so kaputt, sie klackert, dass sie nicht mehr erkannt wird.


    Interessant ist sicherlich auch der Grund.Beim Ausbau der 2. Platte fand ich seitlich dicke Staubflusen. Sie war gefühlt schon recht warm. Das System hatte ich auf Temperaturwarnung mit Voreinstellung gelassen. Ich denke, dasz das 55°C waren. Nun habe ich auf 48°C reduziert. Die Platte 2 war eigentlich Reserve, nur wenige Daten drauf, Thick-Volumen mit 1TB, der Rest leer (daher auch die Annahme zum Hitzetod). Das System gab keine Hitzewarnung aus!!!


    Da die Platten in 1 und 2 eigene RAIDs bildeten, wollte ich die 2. Platte ausbauen und ersetzen, konnte aber den Speicherpool nicht auflösen, so dasz nun auch die erste Platte nicht mehr lesbar ist, obwohl sie technisch ohne Probleme ist.


    Ich kann jetzt ja alles einfach neu machen und die Daten von Schacht 3/4 holen. Ich musz dann aber die ganzen Einstellungen (Pfade, Freigaben) neu machen. Daher die Hoffnung, irgendwie an Platte 1, die voll intakt ist, heran zu kommen, so dasz ich die Datenstrukturen auf die neue Platte Seagate 10TB kopieren kann.


    Dazu habe ich sie an einen Linuxrechner angeschlossen und mit dd if=/dev/sdg ... begonnen, die Daten in ein Image zu schreiben. Ich habe aber in Yast-Partitionierer schon gesehen, das dort kein normales Dateisystem drauf ist. Eigentlich gehören die Strukturen doch zum RAID1?


    Code
    /dev/sdg         5,46 TiB (usb 0x174c ASMT ASMT 2105)

    (über Festplattengehäuse mit USB-Kabel angeschlossen)

    Code
    /dev/sdg1       0,51 GiB   Windows Daten Partition
    /dev/sdg2       0,51 GiB   Windows Daten Partition
    /dev/sdg3       5,45 TiB   Teil von 1_0
    /dev/sdg4       0,51 GiB   Windows Daten Partition
    /dev/sdg5       7,97 GiB   Windows Daten Partition

    Wie kommt ich da strukturiert heran? <------------------- Frage


    Code
    # cryptsetup luksOpen /dev/sdg3 naspl1
    Gerät »/dev/sdg3« ist kein gültiges LUKS-Gerät.

    Noch ein paar Gedanken zur Struktur und zum Zweck. Das NAS ist nur für die Familie die erste Adresse. Fürs Büro habe ich einen Server, dessen Sicherungen auf dem NAS liegen. Zudem hat das NAS ein Verzeichnis, an welches der Scanner angeschlossen ist, weil das NAS ja stets angeschaltet ist.

    Daher musz ich keinen Regelbetrieb aufrechterhalten. Wenn es ein paar Tage klemmt, ist's in Ordnung, daher brauche ich kein RAID (weder für Performance noch für Redundanz). Redundanz erhalte ich durch die Platten an Schacht 3/4. Die sind übers Netzwerk nicht zu erreichen (Kryptotrojaner sollen es so schwerer haben). Bei RAID wäre Alles im Zugriff von außen.

    Ist langsam, reicht aber und hält unabhängig und flexibel, ...eigentlich jedenfalls, ...dachte ich, ...heul.


    Danke für Eure Hilfe

    und Gruß

  • Hier kommt einiges zusammen, was nicht passt: eine Einzelplatte kann kein Raid 1 sein! Ist u.U. eine Raidgruppe1 gemeint?

    Hilfreich wären wahrscheinlich auch einige Screenshots vom Speichermanager, denn die Beschreibung ist doch "unorthodox".

    Man kann m.W. keine einzelne HDD aus dem Pool entfernen ohne den Pool aufzulösen (Datenverlust!).

    Nett wäre es auch, wenn Du die eingesetzte QTS Version nennen könntest.


    Ein "Backup" im selben Gehäuse ist kein Backup im Sinne des Wortes, das ist lediglich eine Duplizierung der Daten!

    Fällt das NAS aus (mit Deiner "Spielerei" mit den Platten bist Du nah dran ;)), dann kommst Du an gar nichts mehr ran!


    Ein Backup gehört immer! auf ein externes Medium!


    Und das man nicht so einfach mal eben auf ausgebaute NAS Platten zugreifen kann um die Daten zu retten, sollte mittlerweile doch bekannt sein.

    In gewissen Fällen geht das weniger problematisch (Cat1 NAS, Einzellaufwerk oder Raid1), bei anderen (Cat2 NAS mit Pool) erheblich aufwändiger, wenn überhaupt!


    Also bitte genauere Infos, dann sieht man u.U. auch, ob und wie etwas zu retten wäre.


    Gruss

  • Ich habe die Platte gerade noch am Linuxrechner um den Inhalt zu spiegeln. Ich muss wegen der Fehlermeldung bzw des Screenshot Speichermanager das abbrechen und erst mal umbauen. Ich schick das gleich nach.


    Vorerst soviel, ich wollte nie RAID haben. habe es auch nie eingestellt. Demnach wird es wohl eine Raidgruppe sein.


    hier nun die Bildschirmschuesse

    NAS_ControlpanelUebersicht_2021-03-17_10-19.png

    NAS_Datentraeger_2021-03-17_10-19.pngNAS_Speicher_2021-03-17_10-19.pngNAS_StorageSnapshot_VerwaltungVolumes_2021-03-17_10-20.pngNAS_StorageSnapshots_2021-03-17_10-20.png

  • Sieht nach JBOD aus, gz. das wars mit den Daten.


    Neue HDs rein, neuen Pool bauen und Freigaben fix neu anlegen und Daten von den verbleibenden HDs rüber.


    Und wenn der Kryptolocker auf dem NAS los legt, sind alle 4 HDs verschlüsselt!

    Dann fängst ohne externes Backup halt bei 0 an.

  • Das es bei mir solange gedauert hat, lag daran, dass mit den zusätzlich eingehängten Platten im meinen Linuxrechner, das Netzteil abgeraucht ist. Es ist ja ein ständig laufender Server, mit dem kleinstmöglichen Netzteil.


    Ich hätte ein Recover-Szenario durchspielen können. Habe mit HybridBackup auf die anderen Platten abgelegt, die eine eigene Volumengruppe bilden. Da ist aber nichts zu finden. HybridBackup startet nicht, weil die App-Daten wohl auf LV1 gelegen haben

    Ich will lieber den Schlüsseldienst beauftragen, anstatt das Haus neu zu bauen. Bitte, ein bis'chen Konsole und ssh kann ich auch noch lernen. Ich habe mich in LVM etwas eingelesen.


    Ich habe Zugriff über ssh aufs NAS. Dort finden sich die Datei vg1, die offenbar die Volumengruppe (VG) 1 betrifft, die vom Ausfall des 2. phys. Volumens (pv) betroffen ist.

    Dort werden offenbar die Physikal Extends (pe) dargestellt. Die lv1, welche die Daten enthält, umfasst folgendes:

    Code
    start_extent = 0
    extent_count = 917504 # 3.5 Terabytes

    die anderen lv sind deutlich kleiner, so dasz ich von der Richtigkeit des Volumens ausgehe.

    Das pv0 der Volumengruppe erstreckt sich aber über:

    Code
    pe_start = 2048
    pe_count = 1428360 # 5.44876 Terabytes

    Die zweite Platte pv1 ist genau so groß.

    Ich darf daher annehmen, dasz die PE's des LV1 allein auf pv0 liegen.

    Die zweite Platte hatte ich beim Aufbau des NAS später eingehängt, soweit ich mich erinnere.

    Die Platte in Schlitz1 (pv0) habe ich wieder eingehängt habe. Anschließend:

    01.txt 02.txt

    Ich habe mir das namentlich passende ausgesucht:

    03.txt

    Wenn ich mich recht entsinne, lag die Datei vg1 und vg1 im Ordner Backup (siehe Anhang).

    Auch beigefügt ist die Datei lvm.conf aus /etc/lvm/ (lvm.conf.txtvg1.txt). Soweit zur Gefechtsfelderkundung.


    ich habe mir nach: https://www.linux-howto.info/mount-qnap-encrypted-volume/

    die Schlüssel für die Datenträger umgerechnet und den Datenträger eingehängt, hernach entschlüsselt.

    Dann geht es ans einhängen. Was ist aber einzuhängen?

    04.txt

    cachedev3 ist die zweite VG und intakt. Dazu gehören auch die Geräte der pv3 und 4 über drbd3 und 4. Die höchste Stufe der Platte in Schlitz1 ist drbd1 (?)

    es läuft ohne Fehler ab. Man musz beim Aktivieren der VG mit partial die Unfehlbarkeit ausräumen.

    Code
    # vgchange vg1 -a y --activationmode partial
    PARTIAL MODE. Incomplete logical volumes will be processed.
    Found duplicate PV 0tWf8TraJHf2nSNm0Z46d5UwTX1sm7ju: using /dev/drbd1 not /dev/md1
    Using duplicate PV /dev/drbd1 from subsystem DRBD, ignoring /dev/md1
    WARNING: Device for PV KChQPt-FHCp-LjaD-2Omc-vd7L-iAZL-yEYUxx not found or rejected by a filter.
    4 logical volume(s) in volume group "vg1" now active

    für --activationmode gibt es anstelle der Option 'partial' noch 'degraded'. Mir ist nicht klar, was der Unterschied ist. Dann:

    Code
    [/mnt/HDA_ROOT/.config/lvm] # cryptsetup luksOpen /dev/vg1/lv1 schlitz1
    Enter passphrase for /dev/vg1/lv1:

    ohne Fehlermeldung.

    Hier taucht dann das logische Volumen 1 'lg1'

    mit der richtigen Benennung 'DataVol1' auf,

    was den Voreinstellungen entspricht.

    der Datenträger soll eingehängt werden.

    Dazu ein neues Verzeichnis:

    Code
    # mkdir neuMED (neu Mein encrypteder Datentraeger)

    Der Datentraeger soll eingehängt werden:

    Code
    # mount -t ext4 -o ro /dev/mapper/schlitz1 /mnt/neuMED
    mount: wrong fs type, bad option, bad superblock on /dev/mapper/schlitz1,
    missing codepage or other error
    In some cases useful info is found in syslog - try
    dmesg | tail or so
    (readonly!)

    Dort bin ich damit hängen geblieben.

    Wahrscheinlich ist das sehr diffus, ein Denkfehler.

    Kann mir bitte jemand auf die Sprünge helfen. Vielleicht bekommen wir sogar eine allgemein verständliche Anleitung hin.

    Dann: 05.txt

    Einmal editiert, zuletzt von BertholdBrecht () aus folgendem Grund: Formatierung Kürzung, Auslagerung, da Beitragsgröße begrenzt