TS-1673U-RP - mehrere RAID - ReBuild parallel geht nicht mehr

  • Ich habe schon jahrelang QNAP-Geräte im Einsatz, erst kleinere 2-Bay-Modelle, dann 4-Bay und jetzt ne "Große" 16-Bay-QNAP.
    Ich bin begeistert von der Möglichkeit ein gespiegeltes RAID aufzusetzen und 1-2x pro Woche eine der Platten "hart" rauszuziehen, auf das Piepen zu warten, eine gleiche Platte wieder reinzustecken und nach paar Stunden ist die QNAP wieder intakt weil sich das RAID von allein Rebuildet (im Gegensatz zu Synology, wo man jedes mal erst ins Web-IF muss).
    Der Vorteil für mich, wenn Daten komplett weg sind - QNAP runterfahren, alte Platte rein, QNAP starten, alles ist wieder "alt", Dateien holen, QNAP runterfahren, neue Platten wieder rein, einschalten und Dateien zurückkopieren - eine einfache und wirksame Variante der Datensicherung offline.


    Nun habe ich in der 16-Bay Variante mehrere gespiegelte RAIDs aus zwei Platten angelegt. Auch hier das gleiche Szenario, eine 6GB HDD raus, auf das Piepen warten, andere 6GB HDD rein, der Rebuild-Prozess startet. Andere 4GB HDD (von anderem RAID) raus, andere 4GB-Platte rein, auch hier startet der Rebuild-Prozess. Nach ca. 7h sind beide Rebuild-Prozesse parallel durchgelaufen und fertig - alles ist wieder top.


    Die QNAP ist immer auf dem aktuellen Firmwarestand.


    Jetzt ist jedoch - vermutlich mit Einführung des neuen Speicher- und Snapshot-Verwaltungsprogrammes - Anfang diesen Jahres eine Änderung eingetreten um dessen Behebung ich bitte.
    Vor diesem neuen Verwaltungs-Programm habe ich unmittelbar hintereinander die beiden RAIDs per Plattenwechsel rebuildet und beide RAIDs starteten direkt nach HDD-Wechsel den Rebuild-Prozess. Seit der Umstellung auf das neue Verwaltungsprogramm stehen beide RAIDs auf Aktualisierung, aber nur das erste der beiden führt den Rebuild-Prozess wirklich durch (Datendurchsatz ersichtlich) - das andere RAID steht in Warteschlange (Datendurchsatz im Rebuild 0MB/s). Unmittelbar nachdem das erste RAID fertig mit Rebuild ist, startet automatisch das zweite RAID mit dem Rebuild-Prozess (Datendurchsatz)
    Performance-Technisch war es bislang nie ein Problem mehrere RAIDs parallel zu Rebuilden. Aktuell geht das aber programmatisch nicht mehr.


    Daher bitte ich um Fehlerbehebung das wieder mehrere Rebuilds parallel möglich sind - oder um Benennung wo ich parallele Rebuild einstellen kann.


    Das Problem in der aktuellen Vorgehensweise: ein Rebuild dauert ca. 7h - in der Zeit ist das andere RAID "ohne Schutz". Der gesamte Vorgang war früher in 7h fertig, jetzt dauert er 14h!!! Das würde mich sehr freuen wenn es wieder wie vorher gehen würde - der Fehler ist so seit den letzten ca. 4-5 Firmware-Updates, kann aber auch noch bisl länger sein.

  • Ich denke auch da ist ein Ticket an den QNAP-Support berechtigter und ein Downgrade der Firmware kannst du ja auch noch machen, um deinen ursprünglichen Zustand wieder herzustellen.
    Ich könnte es nicht mal testen mit meinen Geräten und noch was, ein RAID 1 im Rebuild ist immer gefährdet. Backup Backup Backup!

  • Meine 431+ mit der aktuellen Firmware zeigt das Verhalten nicht...


    Slot 1+2 / 3+4 je in Raid !


    2 Platten gezogen:


    Code
    [admin@MisakaNET-Q ~]# cat /proc/mdstat Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath] md1 : active raid1 sda3[0]      966807616 blocks super 1.0 [2/1] [U_]md2 : active raid1 sdd3[1]      966807616 blocks super 1.0 [2/1] [_U]md322 : active raid1 sdd5[3] sda5[0]      7340032 blocks super 1.0 [2/2] [UU]      bitmap: 0/1 pages [0KB], 65536KB chunkmd256 : active raid1 sdd2[3] sda2[0]      530112 blocks super 1.0 [2/2] [UU]      bitmap: 0/1 pages [0KB], 65536KB chunkmd13 : active raid1 sda4[0] sdd4[3]      458880 blocks super 1.0 [32/2] [U__U____________________________]      bitmap: 1/1 pages [4KB], 65536KB chunkmd9 : active raid1 sda1[0] sdd1[3]      530048 blocks super 1.0 [32/2] [U__U____________________________]      bitmap: 1/1 pages [4KB], 65536KB chunkunused devices: <none>


    Die beiden Platten am PC formatiert und wieder rein:


    Beide Platten gehen parallel in den resync.


    Wäre mal interessant zu sehen, wie deine /proc/mdstat aussieht, wenn Du zwei Platten gleichzeitig in die Qnap gesteckt hast.
    Vermutlich steht dann bei einer Platte resync=DELAYED ?

  • weil?

    Das NAS kein Wechselplattensystem ist. Nach 50 Steckzyklen ist der SATA-Stecker theoretisch hinüber.
    Praktisch kann es dann zu Performanceeinbusen und vermehrten Plattenfehlern wegen schlechter Kontaktierung kommen.

  • Ich bin begeistert von der Möglichkeit ein gespiegeltes RAID aufzusetzen und 1-2x pro Woche eine der Platten "hart" rauszuziehen, auf das Piepen zu warten, eine gleiche Platte wieder reinzustecken und nach paar Stunden ist die QNAP wieder intakt weil sich das RAID von allein Rebuildet

    Komisches Hobby hast du :)
    Mal im Ernst, dir ist schon klar das ein Rebuild ziemlich streßig für die Platten sind und die Gefahr besteht das dir eine andere Platte abraucht und der Verbund dadurch unbrauchbar wird ?

  • Du magst recht haben, aber:

    Zum Einen - ja - davon hab ich auch schon gehört, kann diesen Umstand jedoch seit über 10 Jahren nicht bestätigen.

    Bzw. zum Anderen - überleg mal die Möglichkeiten: Ich hatte z.B. schon einen Wasserschaden und konnte mit der zuletzt herausgezogenen HDD und einem anderen QNAP direkt ohne Ersteinrichtung o.ä. direkt weiter arbeiten.

    Oder zum Dritten - ich hatte auch schon das Problem das jemand (trotz Papierkorb) Daten endgültig gelöscht hatte. Also QNAP runterfahren, beide RAID-Platten raus - die eine zuletzt gewechselte Platte rein - QNAP hochfahren - die jetzt wieder vorhandenen Daten irgendwo auf den eigenen PC kopieren - QNAP wieder runterfahren - die beiden "aktuellen" RAID-Platten wieder rein - QNAP hochfahren, alles wieder wie normal und die ursprünglich gelöschten Daten wieder zurück auf die QNAP kopieren - fertig!


    Also in Summe für mich persönlich mehr Vorteile wie Nachteile. Ich hab zu einem gespiegelten RAID in Summe 4 HDD, zwei sind drinnen und die beiden anderen sind die Offline-Sicherung (die man im übrigen immer haben sollte, egal für welche Art der Sicherung man sich entscheidet - denn nur OHNE Strom ist ne Sicherung auch ne Sicherung). Ich tausche jeden Freitag eine HDD mit einer der Offline-Platten - rolliere diesen Plattentausch - habe daher immer den QNAP-Stand der letzten beiden Wochen offline vorrätig.

    Ach und noch ein kaufmännisches Thema bei all den Überlegungen: gute NAS-Platten haben mittlerweile bis 5 Jahre Garantie. Innerhalb dieser Zeit werden die Platten kostenneutral getauscht - nach 5 Jahren (meist eher) hab ich aber bislang auch immer schon modernere, auf jeden Fall größere, meist auch schnellere 4 Festplatten erworben um den gesteigerten Bedarf abzudecken. Auch hierfür eignet sich das Verfahren aus meiner Sicht - nach 2 Wochen HDD-Tausch sind beide Platten auf größere Umgezogen - dann muss ich nur einmal noch im QNAP-System das RAID vergrößern und schon ist alles bestens. Auf diesem Wege bin ich von vor 10 Jahren 2TB-Platten bis mittlerweile bei 12TB-Platten angekommen - ohne jegliche Ausfälle oder andere beschriebene Horror-Szenarien.


    Ach und sollte der Crash wirklich eintreten - was soll schon passieren? Die soeben herausgezogene Platte hat doch alle Daten drauf - die vor einer Woche herausgezogene Platte hat den Stand von letzter Woche (also die vorherige Platte rein, QNAP einschalten, eine weitere Platte rein, der Rebuild-Prozess läuft durch - alles wieder da) - die Platten lassen sich alle auch am PC auslesen, da Standart-Dateisysteme drauf sind - also für mich mehr wie ausreichende Sicherheit. So viel Datenänderung hab ich nicht auf dem System - es dient in der Hauptsache als "Datengrab". Kannste unter den Umständen mein Vorgehen ein wenig nachvollziehen?

  • weil?

    Noch ein Grund:


    Die HD im Zugriff ist und die Schreib/LeseKöpfe nicht geparkt sind wenn du die HD ziehst. Du kannst im Moment des ziehens nicht sicherstellen, dass vom System nicht doch auf die HD zugegriffen wird.


    Dann passiert das:


    https://de.wikipedia.org/wiki/Head-Crash >>> Ursachen


    Aber da es ja schon Jahre gut geht >>> weiter so ;):thumbup:


    Zu der Kontaktierung hat dr_mike schon den Sachverhalt geschildert.

  • Naja den Headcrash durch Rausziehen wuerde ich heutzutage mal außen vor lassen. SATA AHCI sieht hot plugging von Festplatten ausdruecklich vor, wenngleich definitiv nicht in der Häufigkeit (siehe 50 Steckzyklen fuer den Anschluss), in der das hier vollzogen wird. Solange die Platten nach dem Entriegeln Zeit bekommen, auszudrehen und nicht regelrecht rausgerissen werden, passiert da normal nichts an der Hardware - Das Dateisystem were ein anderes Thema.


    Ich persoenlich halte von der Vorgehensweise auch nicht viel, aber jeder hat seine Vorlieben und solange immer irgendwo genug Backup vorhanden ist und Verschleiß egal ist...warum nicht?

  • Zum Einen - ja - davon hab ich auch schon gehört, kann diesen Umstand jedoch seit über 10 Jahren nicht bestätigen.

    Wow. Ok. Wenn man derart gute Erfahrung mit dieser Methode gesammelt hat

    würde ich auch dabei bleiben.:thumbup:

  • Danke für euer Feedback.

    Natürlich ziehe ich die Platten vorsichtig raus und lasse sie im Schacht noch verweilen bis es piept (dauert so ca. 10sek). Damit ist die Drehbewegung weg und ich kann sie gefahrlos ablegen.

    Und natürlich ist das Problem mit bewusst - Platte ziehen während Dateien darauf geschrieben werden - Aber auch hier bislang keine Probleme. Gerade wegen der Nutzdaten - mache ich dies meist abends oder früh morgens - wenn keiner das System nutzt - zu dem Zeitpunkt sind die Platten meist im Ruhemodus (HDD-LEDs blinken nicht - stehen nur). Meine SSD habe ich nur als Lese-Cache konfiguriert - damit auch hier keine Schreibvorgänge verzögert werden - denn dann wäre die Methode unbrauchbar.


    Ansonsten habe ich jetzt das Beitrags-Thema des parallelen RAID-Rebuilds direkt über das Help-System in der QNAP gemeldet - vielen Dank für die Hinweise hierzu - mal schauen was es für Feedback gibt. Im Übrigen hatte ich vor 10 Jahren - vor dem ersten NAS-Kauf - mit Synology und QNAP verglichen - stellte diesen Umstand des automatischen Rebuilds (nur bei QNAP) fest und schrieb darauf hin (weil ich es mir gar nicht erklären konnte) Synology auf diesen Umstand hin an - als Antwort kam das dies ein QNAP eigenes Feature wäre und Synology dies nicht vorsehe (es klang so ein wenig als ob QNAP da ein Vorrecht hat und Synology es nicht implementieren darf). QNAP habe ich darauf hin auch angeschrieben - Sie schrieben zurück das das Feature für ein Hot-Plug der Platten sorgt und somit auch andere Platten genutzt werden können. Weiterhin beinhalte die extrahierte Platte das gesamte System und wäre vollumfänglich einsatzbereit.


    Die Platten sind ja ext2 (oder war es ext4) formatiert. Ich kenn mich da jetzt nicht so aus, aber wenn eine Datei geschrieben wird - ist es bei den EXTx nicht so, das erst der Inhalt auf die HDD und dann das Inhaltsverzeichnis geschrieben wird? Das - zumindest mein Verständnis - würde dem Problem fehlerhafter Dateien entgegenwirken - die Datei ist ja - so gesehen - zu dem Zeitpunkt noch gar nicht vorhanden - erst wenn das Inhaltsverzeichnis den Verweis auf die Datei enthält.


    Na wie auch immer - bei mir geht's seit Jahren gut - für mich ist es eine preiswerte, stromlose, simple Backup-Methode - ich kann nicht klagen...