RAID1 während Kapazität erweitern defekt - wie weiter?

  • Hallo,


    Seit vielen Jahren läuft auf meinem QNAP TS-219P II ein RAID1 mit zwei 3TB Platten (WD Red plus). Nun wollte ich die Kapazität erweitern und habe mir dazu zwei 6TB Festplatten (WD Red plus) gekauft. Dann wollte ich die Kapazität über den Speichermanager erweitern: nach Anweisung habe ich eine alte 3TB-Platte "Nr.1" entnommen und eine neue 6TB-Platte eingesteckt. Während des Syncs gab es leider auf verbliebenen alten 3TB-Platte "Nr.2" diverse Lesefehler - kaputte Blöcke :( Der "Reallocated Sector Count" schnellte hoch von 0 auf 15. Die ersten Lesefehler hat der Sync noch überlebt, nach weiteren Lesefehlern aber brach der Sync entgültig ab.


    Nun stellt sich für mich die Frage wie ich weitermachen soll. Mit meinem rudimentären Wissen stelle ich mir folgende Vorgehensweise vor:

    • defekte alte 3TB Platte "Nr.2" ausbauen
    • neue 6TB-Platte (die "halb gesynct ist" ebenfalls ausbauen
    • alte 3TB-Platte "Nr.1" einbauen - die wurde ja ausgebaut als das RAID1 noch gesynct war und sollte noch den vollständigen Datensatz enthalten
    • das NAs erkennt dann hoffentlich ein RAID1 mit nur einer Festplatte
    • jungfräuliche 6TB-Platte einbauen und einen erneuten Sync anstoßen.
    • Wenn der erfolgreich durchgelaufen ist dann 3TB-Platte gegen zweite 6TB-Platte ersetzen und RAID erneut syncen

    Kann das so funktionieren? Oder wäre eine andere Vorgehensweise ratsam?


    Glücklicherweise habe ich unmittelbar vor der Erweiterung der Kapazität ein komplettes Backup gemacht . Ich möchte aber zunächst versuchen, das alte RAID1 zu reparieren. Wenn das zu nichts führt kann ich ja immer noch alles platt machen, ein frisches RAID1 mit den neuen Platten aufsetzen und dort das Backup einspielen.


    Mein QNap ist ein TS-219P II; die Firmware-Version ist mir aktuell unbekannt 4.3.3 nochwas..?!).


    Ich würde mich sehr über Anregungen und Tipps freuen.


    Grüße, Thomas.

  • Ich würde das NAS ausschalten, beide Platten rausnehmen.

    Die alte, zuerst entfernte 3TB Platte einstecken und das NAS starten.

    Wenn es hochkommt sollte das Raid "degraded/herabgestuft" sein.

    Dann die unbenutzte 6TB Plattestecken und hoffen, das der Rebuild durchläuft.

    Wenn ja, die zweite Platte (deren Partitionen Du zuvor am PC gelöscht haben solltest) stecken und auch hier den Rebuild abwarten.

    Wenn nein, NAS neu aufsetzen und Daten per Restore zurückholen.


    Aber das zeigt wieder einmal, wie wichtig ein Backup vor solchen Aktionen ist (und nicht nur dann) ;).


    Gruss

  • Danke, ich habe es genauso gemacht. Der erste Teil der Operation lief ohne Fehler. Leider hängt es nun, nachdem ich die zweite 6TB eingesetzt habe. (alte 3TB raus und neue 6TB rein im laufenden Betrieb). Natürlich hatte ich zuvor alle Partitionen an einem Windows-PC gelöscht. Ich erhalte dann die nicht sehr ausführliche Fehlermeldung:

    Code
    Fehler	2021/01/18	17:23:27	System	127.0.0.1	localhost	[Mirror Disk Volume: Drive 2 1] Add drive 2 to the volume failed.


    Ich habe die Platte erneut entfernt und am Windows-PS die Partitionen erneut gelöscht (das NAS hatte offensichtlich die notwendigen Partitionen angelegt) und sicherheitshalber mit einer NTFS-Partition drüber formatiert. Dann zurück in's NAS - leider mit dem gleichen Fehler. Was nun? Bekommt man raus, was das NAS zurückhält die zweite Platte ins RAID1 zu integrieren?

  • Findest Du noch was im SystemLog?

    Ansonsten kann man noch versuchen ob man den Rebuild manuell anstarten kann.

    Eine NTFS Partition muss man nicht zur Sicherheit erstellen, die vorhandenen Partitionen löschen reicht vollkommen aus.


    Gruss

  • Wie kann ich das Systemlog auslesen? Ich nehme an ich sollte per SSH zugreifen? Meine Bash-Kenntnisse liegen ein gutes Jahrzehnt zurück :-/

    Einmal editiert, zuletzt von Chorknabe ()

  • Ganz einfach über die GUI -> Control Panel -System Logs, da braucht man keine Shell ;).


    Gruss

  • Dort hatte ich bereits nachgesehen - für mich wenig erhellend:


    Code
    2021/01/18	17:33:20	System	127.0.0.1	localhost	[Mirror Disk Volume: Drive 2 1] Add drive 2 to the volume failed.
    2021/01/18	17:32:45	System	127.0.0.1	localhost	Drive 2 plugged in.


    Weitere Meldungen kann ich nicht finden. Gibt es eine ausführlicheren Log?


    Die Platte hatte ich mit einer NTFS Partition "überschrieben" weil ich sichergehen wollte das alle Spuren der alten Partitionen wirklich verschwunden sind.

  • Nicht wirklich, wenn da nichts weiter drin steht :(.

    Kannst Du mal das komplette Log vom vorherigen Rebuild einstellen?

    Von dem Zeitpunkt nachdem der erste Rebuild mit der 6TB Platte fertig war bis zum Zeitpunkt des Steckens der zweiten 6TB HDD.

    (Bitte mit Spoiler oder Code Tags).


    Gruss

  • Hallo,


    hier das Log. Für meine Begriffe stehen dort nur die absoluten Basics drin. Im Hintergrund passiert ja viel mehr - bspw. wir ddie neue Platte partitioniert und formatiert. Das muss doch in irgend einer (low level) Logdatei auftauchen?

  • Das mit dem remap gefällt mir nicht so, das war noch ein altes cat1 NAS. Ich vermute, das die Platten nicht so in den Slots sind, wie sie zuvor waren.

    Auch "Filesystem is not clean" ist nicht gut, da muss zuerst ein Filesystemcheck laufen! Das ist aber passiert "Examination..."


    Backup ist vorhanden?

    Wenn nein, mach erst eines, denn in diesem Zustand kommst Du noch an die Daten!

    Wenn ja, NAS runterfahren, beide Platten raus. Die 6TB Platte die funktioniert hat in den anderen Slot, NAS starten.

    Sollte dann wieder mit einem degraded Raid online sein. Das Log kontrollieren, ob dort wieder remap auftaucht.

    Auf der anderen Platte wieder die Partitionen entfernen und diese stecken. Und hoffen, das der Rebuild nun durchstartet.


    Gruss

  • Ich würde alles sichern und die Kiste dann neu machen, so würde ich mich nicht mehr trauen da Daten ab zu legen. Da könnte noch eine Macke im Raid sein, die dazu führt, das es sich dann im Hintergrund still und heimlich auflöst.

  • Backup ist vorhanden. Ich hatte noch einmal versucht die Partition zu löschen, diesmal mit prtdisk unter windows 10 - wieder ohne Erfolg. Dann hatte ich das NAS einfach mal neu gestartet. Nun bekomme ich diverse Meldungen, die mich etwas verwirren:

    Hier liegt offensichtlich mehr im Argen?!

  • Qsync ist da auch noch im Spiel, sollte aber trotzdem nicht stören.

    Aber ich würde mittlerweile Crazyhorse zustimmen: neu aufsetzen, da bist Du auf der sicheren Seite.

    Bei nur zwei Platten und 3 TB Volumegröße (altes Raid1), sind das überschaubare Zeiten.


    Gruss

  • Heute Raid neu bauen, morgen vor der Arbeit Backup zurück spielen, morgen Abend freuen weil fertig.

  • Ihr habt mich überzeugt. Wie gehe ich dazu vor: wird im Speichermanager das Raid platt gemacht, Platten formatiert und ein neues Raid aufsetzen? Oder muss das gesamte NAS zurück gesetzt werden (wie auch immer das geht)?

  • Die 6TB HDs rein, wenn nicht schon drin, dann Raidpool oder Static was fehlerhaft ist killen, kurz warten bis die Alarme verschwunden sind und dann neu erstellen was du haben willst.

    Also Pool oder Static.

  • Crazyhorse: Wenn Du ihm dann noch sagst wie er auf einem alten cat1 NAS (TS 219) einen Pool bauen kann... :beer:.


    Chorknabe: Also nein, Pool geht nicht, das wird ein altes Legacy Volume.


    Gruss

  • Ok, hatte das letzte CAT 1 NAS vor 10+ Jahren bei einem Kunden installiert, sorry die Teile und eingeschränkten Funktionen kenne ich echt gar nicht mehr.

    Asche über mein Haupt.

    Das kleinste was ich hier habe ist das TS-231P.

  • Ein kurzes Feedback:

    Ich habe versucht, ein frisches RAID1 aufzusetzen. Es scheiterte aber schon daran, das alte RAID1 zu löschen. Nach dem Klick auf "Entfernen" war das Raid weiterhin sichtbar?! Dann wollte ich das NAS auf Werkseinstellung zurücksetzen, aber auch das schlug fehl: nach dem fälligen Neustart war alles so wie vorher. Am Ende habe ich beide 6TB-Platte entfernt und die Partitionen unter Windows gelöscht. Dann habe ich das NAS ohne Platten hochgefahren und das System komplett frisch aufgesetzt. Irgend etwas war völlig verbastelt.


    Ich befürchte dass ich das selbst ausgelöst habe: beim Backup bemerkte ich 100% CPU-Auslastung und vermutlich deswegen sehr dürftige Schreibrate über USB3.0 von ca 5MB/s. Mehrere Prozesse namens "mysqld" waren dafür verantwortlich. Nach etwas googlen hatte ich dann Medienserver etc. ausgeschaltet, aber das Verhalten wurde nicht besser. Am Ende habe ich mittels SSH alle gleichnamigen Prozesse gekillt. Danach war die CPU-Auslastung wieder OK und die Transferrate stieg auf ca 20MB/s (was immer noch sehr langsam ist). Ganz sicher war das keine so gute Idee - man sollte nicht in den Tiefen eines Systems herum fummeln ohne genau zu verstehen was man tut. :rolleyes:


    Zuletzt eine kurze Nachfrage: was ist ein CAT1 NAS? Mein QNAP ist sicher schon ziemlich alt, aber viel mehr als ein RAID1 mit Samba-Freigaben und Zugang per FTP für die Nutzung zu Hause benötige ich nicht; daher habe ich bislang nie über ein Upgrade nachgedacht.