Probleme bei RAID1 Wiederherstellung (TS 219P, FW 3.8.2)

  • Hola ins Forum,


    eine der beiden RAID1 konfigurierten HDDs in meinem NAS (TS-219P) hat in den letzten Tagen Schreib/Lese Fehler vermeldet (nach dem zunächst 17 defekte Blöcke gefunden wurden). Das RAID1 war dann atomatisch im degenerated modus. Heute sind dann jedenfalls meine beiden neuen HDDs angekommen, aber leider wird nichts automatisch auf die neue Platte gespiegelt. Die Daten sind aber sowohl von clients als auch über den web file manager noch zugreifbar.


    Was habe ich bisher gemacht: Zunächst habe ich die NAS runtergefahren, dann eine Platte rausgenommen und beim Hochfahren geguckt ob die Festplattenverwaltung immer noch den Schreib/Lese Fehler für die verbliebene Platte meldet (da nicht klar in welchem Schacht Platte 1). Da dem so war, habe ich die NAS erneut runtergefahren, die andere *alte* Platte und in den anderen Schacht eine der Neuen eingeschoben. Nach erneutem Hochfahren habe ich die neue Platte EXT3 formatiert, obwohl das eigentlich laut Hinweis auf der Administation page automatisch geschehen sollte.


    Soweit so gut, nur leider weiss ich nicht wie ich mein RAID nun wiederherstellen soll. Der POWER button blinkt schnell und rot (2 mal pro Sekunde?), Muss ich die Kapazität erweitern, da die neue Platte ja 4TB Kapazität hat oder muss ich ein ganz neues RAID initiieren? Oder...


    in der RAID-Verwaltung steht: Aktuelle Datenträgerkonfiguration
    Datenträger Gesamtgröße Bitmap Status Kommentar
    Einzeldisk: Laufwerk 2 3666.08 GB -- Bereit Mit dieser Laufwerkkonfiguration können keine Vorgänge durchgeführt werden.
    Datenträgermirror: Laufwerk 1 915.42 GB Ja Bereit Sie können folgende Vorgänge ausführen:
    - Kapazität Erweitern
    - Migrieren
    - Bitmap deaktiviert


    und in der Datenträgerverwaltung
    Festplatte Modell Kapazität Status Fehlerhafte Blöcke suchen SMART-Info
    Laufwerk 1 SAMSUNG HD101UJ 1AA0 931.51 GB Bereit Jetzt suchen ---
    Laufwerk 2 Seagate ST4000DM000-1CD1ZZZZ 3726.02 GB Bereit Jetzt suchen Gut
    --
    Bedankt


    NAS TS-219P
    Firmware 3.8.2 Build 20130301

    Einmal editiert, zuletzt von Robert@ ()

  • Hallo und Willkommen im Club !


    Ich verstehe nicht ganz, warum Du zunächst die i.O.-Platte aus der Station gezogen hast und dann mit der defekten Platte gestartet hast. Das hat vermutlich die Wiederherstellungsautomatik aus dem Tritt gebracht. Wenn ein RAID in den degraded Mode geht, wird die defekte Platte ja auch durch die rote HDD-Kontrolleuchte angezeigt, so dass diese zweifelsfrei identifizierbar ist.


    Ich würde jetzt folgendes tun, wenn ich partout wieder ein RAID1 wollte:


    1) Daten sichern :!:
    2) Die HDD1 (das sollte die i.O.-Platte mit den Daten sein ?) mit der HDD2 in ein RAID1 migrieren.
    --> http://docs.qnap.com/nas/3.8/de/raid_management.htm
    Damit sollte wieder ein funktionsfähiges RAID1 vorliegen
    3) Die Kapazitätserweiterung mit der 2. HDD durchführen, dabei genau nach Handbuch vorgehen:
    --> http://docs.qnap.com/nas/3.8/de/raid_management.htm


    Alternative:
    1) Das RAID1 mit den beiden 4TB-Platten komplett neu aufsetzen
    2) Die intakte 1TB-HDD mit den Daten extern an die NAS anschliessen per USB oder eSata
    3) Einen RTRR-Job aufsetzen und mit dem die Daten von der externen HDD auf das RAID1 rückkopieren
    --> http://docs.qnap.com/nas/3.8/de/remote_replication.htm


    GLG GBD

  • vielen Dank für die sehr strukturierte und klare Antwort. Ist es für Alternative 1 notwendig, dass die Platte mit den Daten in Schacht 1 steckt?
    Wenn ich die Migration (nämlich mit der Datenplatte im originären Schacht2 anstosse) wird automatische eine Migration nach RAID5 konfiguriert und ich sehe keine Möglichkeit das nach RAID1 zu ändern.


    Regarding zweifelsfreier Identifizierung, die LEDs leuchten im Panel vertikal neben den (horizontal nebeneinander installierten) Platten und zumindest in meinem NAS gibt es (glaube ich) keine Kennzeichnung welcher Schacht denn nun der 1te oder 2te ist.
    Bitte nicht falsch verstehen. Ich sage nicht, dass ich alles richtig gemacht habe ... aber zweifelsfrei fand ich es in der Situation eben nicht und habe dann eben meinen Teil zur Verwirrung beigetragn ;). Verstehe ich richtig dass man der NAS auch nicht sagen kann, vergiss den Unsinn den ich zuletzt gemacht habe?
    --
    Regards

    Einmal editiert, zuletzt von Robert@ ()

  • Die Schachtreihenfolge liest sich wie ein Buch: Von links nach rechts. ;)
    Bei einer 219P ist also die HDD1 die linke, HDD2 die rechte Platte, wenn man frontal auf die NAS schaut.
    Die Kennzeichnung der HDDs sollte auch auf den Trays stehen, wenn man diese aus der NAS zieht.


    Wie Dir eine 2-bay NAS ein RAID5 als Option anbieten kann, erschliesst sich mir nicht.
    Dies sollte bei einer 2-bay NAS gar nicht geschehen können und wäre ein Bug des Betriebssystems.


    Ich würde dann die RAID-Wiederherstellung aussen vorlassen, die scheint mir bereits zu sehr durcheinander gebracht worden zu sein.
    Ich würde den alternativen Weg gehen: NAS komplett neu aufsetzen und Daten von der i.O.-Platte extern zurückspielen.


    GLG GBD

  • Die Migration kann ich nur anstossen, wenn ich in der RAID-Verwaltung zunächst die gespiegelte Platte auswähle. Nach einem Klick auf Migration wird die neue Platte gefunden, es passiert aber zunächst nichts. Wenn ich diese dann ebenfalls mit einem Häckchen versehe, wird mir die RAID5 Migration mit einer geschätzten Plattenkapazität von GB920 angeboten.


    Gut dann versuche ich mich an der Einspielung der Daten von extern.
    --
    Bedankt



    ---Edit---



    WTF ...


    Wollte wie vorgeschlagen ein neues RAID1 aufsetzen und dann die Daten von extern zurückspiegeln. Leider hatte mein NAS schon Probleme die zweite HDD die sich nur in der SN unterscheidet zu formatieren. Irgendwie wurde sie in der RAID Verwaltung auch nicht richtig erkannt
    Folge:; Ein Gewürge mit rauf und runterfahren, formatierungsversuchen und jetzt hat sich die gesamte NAS verabschiedet. Reagiert nicht mal mehr auf ping requests. Sorry, aber in puncto Datensicherheit scheint mir das die falsche Wahl

    Einmal editiert, zuletzt von bladekiller () aus folgendem Grund: Editierfunktion nutzen und doppelte Beiträge vermeiden, siehe Forenregeln!

  • Naja,
    vielleicht ist wieder mal die NAS unschuldig und eine oder beide HDDs böse. Das ist eher die Regel, denn die Ausnahme. 8-)



    So schaut eine Festplatten-Inbetriebnahme bei mir daheim üblicherweise aus:


    1) Mindset: Ich gehe mit ca. 25% Wahrscheinlichkeit davon aus, dass die neue HDD nicht in Ordnung ist (bei zweifelhafter Verpackung mit 50%)
    2) Vollständiges Testprogramm am PC mit HDTunePro (ausser vollständiger Oberflächentest)
    NTFS-Formatierung
    3) Realer Dateitransfertest, mindestens 200GB
    4) Realer Test mit konfliktären Schreib-Lese-Zugriffen - Plattenzugriffsgeräusch darf nicht "ungesund" klingen
    6) Sämtliche Kurzzeitteste mit den herstellerspezifischen Tools
    Partitionslöschung
    7) Wiederholung HDTunePro Schreib-Lese-Benchmarks
    7) Kontrollieren der S.M.A.R.T. Werte
    8) Einbau in NAS und Formatierung als Einzeldisk
    9) Erstellen einer Testfreigabe und Tests der Datenübertragungsraten dieser NAS-HDD zum PC, schreibend und lesend
    10) Übertragung von mind. 200GB Daten
    11) wie 8)
    12) S.M.A.R.T. Kurzzeittest in der NAS, Kontrolle der S.M.A.R.T. - Werte


    Falls dann i.O., Testfreigabe löschen und Aufnehmen des Regelbetriebs. BADBlockScan auf der NAS einmal alles ca. 3 Monate.


    Falls irgendeiner der Testpunkte nicht gschafft wird oder es Auffälligkeiten oder ungewöhnlich Geräusche gibt: HDD back to Sender.



    Unregelmässigkeiten auf der NAS nach regelmässiger HDD-Vorprüfung dieser Art nach mehr als 18 Monaten auf mehreren NASsen: KEINE
    Erfolglose NAS-Inbetriebnahmen: KEINE


    Aussortierte schlechte Platten während dieser HDD-Vorprüfung in 18 Monaten: ca. jede 3. (meist Transportschäden) bis 4. HDD, markenübergreifend.


    Ich würde an Deiner Stelle auch auf die FW 3.8.3 gehen, das ist von der 3.8.x die am wenigstens verbuggte.
    Die betriebssicherste FW ist möglicherweise immer noch die FW 3.7.x, daher bin nich auf meinen produktiven NASsen immer noch bei dieser Version.
    Bzw. bei Syno auf der letzte DSM 4.1 - Version.



    GLG GBD

  • Die Regel ist doch eher der DAU oder nicht? Anyway, habe ich diese mal so ziemlich nichts gemacht ... ausser am Anfang ev. eine alte Platte in den falschen Schacht geschoben.
    IMHO sollte das ein Storage-System nicht zum Kollaps bewegen, hat es aber in meinem Fall getan.
    Übrigens sind weder die neuen noch die alten Platten kaputt. Die eine hat halt ein paar defekte Blöcke, thats all. Warum das RAID dann degenerated wird, erschliesst sich mir nicht.


    Mich überzeugt das jedenfalls nicht und mir scheint die LINUX-Gemeinde da mit zweierlei Maß zu messen. Ich bin aber begeistert von Deiner Hilfsbereitschaft und Souveranität ;)
    --
    Danke noch mal
    Robert


    achso ein Nachtrag noch: Deine Prozedur vor Inbetriebnahme klingt für mich nicht nach SOHO ;)

    Einmal editiert, zuletzt von Robert@ ()

  • 17 defekte Blöcke sind einem Plattendefekt gleichzusetzen, die HDD ist damit ein Gewährleistungs-/Garantiefall, zumal Defekte solcher Art zügig fortschreiten, also sich verschlimmern können.


    Die NAS wirft eine solche HDD dann aus dem Verbund, weil ein zuverlässiger Simultanbetrieb aus ihrer Sicht nicht mehr gegeben ist - aus meiner Sicht eine durchaus richtige Entscheidung. Der "Rauswurf" aus dem Verbund verhindert, dass Daten noch geschrieben würden, aber hinterher nicht mehr lesbar wären.


    Für einen einwandfreien RAID-Rebuild erwartet die NAS, dass die i.O.-Platte an ihrem Platz verbleibt, und der Schacht der "rausgeworfene" Platte leer bleibt oder mit einer neuen Platte wieder gefüllt wird. In den allermeisten Fällen ist das ja auch so und der automatische Rebuild wird dann auch allermeistens gestartet und einwandfrei zu Ende gefahren.


    Das System gegen jeden möglicher fehlerhaften Usereingriff resistent zu machen, kann man sich wünschen. Das ist aber aufwendig und auf jede verrückte Idee eines Misshandlings muss man ja auch erstmal kommen, als Programmierer. Dazu wüsste ich jetzt auch nicht, ob allein durch die Sensorik oder Programmierung überhaupt jeder erdenkliche Userfehler abgedeckt werden kann. Und ob dann möglicherweise auch bewusste Manipulationen als Userfehler missinterpretiert werden könnten und auf falsche Art und Weise reagiert würde, von der NAS.


    Nevertheless, jetzt bist Du mal in eine der möglichen "Fallen" getappt - und wirkliche Fehler sind ja nur welche, die man mindestens zweimal macht. Alles andere sind Lerneffekte. :)


    GLG GBD

  • So ist es. Die Daten sind ja auch nicht weg. Und ich habe die verbliebene Platte zwischenzeitlich noch auf eine dritte Platte kopiert (für den Fall der Fälle ;). Konfiguration des NAs ist eben falls gesichert, so...


    Trotzdem stimme ich Dir nicht in allen Punkten zu. Eine NAS ist zunächst einmal Storage (auch wenn all die anderen Sachen nice to have sind) und daraus egeben sich IMHO bestimmte Anforderungen. Wenn ich denn überhaupt etwas falsch gemacht haben sollte, dann eben nur das ich die richtige Platte im falschen Schacht hatte. Wenn das meinen Storage zum kollabieren gebracht haben sollte, dann ist das IMHO inakzeptabel. Daüber hinaus wäre es auch nicht wirklich schwer zu erahnen und könnte über die Sensoric auch abgefangen werden...


    aber wie Du schon sagst, ich bin wieder ein bischen schlauer.
    --
    Gruß



    ---Edit---



    Auch das (Ich meine den RTRR-Job) funktioniert nicht.


    Ich habe den RTRR-Job wie auf der Referenzpage beschrieben konfiguriert und gestartet. Das Systemprotokoll vermeldet auch einen bzw. mehrere Erfolge, nur getan hat sich nichts. Weder gibt es jetzt einen wiederhergestellten Ordner QDownload noch seine Inhalte.


    Typ Datum Uhrzeit Benutzer Quellen-IP Computername Inhalt

    Code
    2013-06-19	15:38:27	System	127.0.0.1	localhost	[External Drive] Job Qdownload-->Qdownload finished.
    2013-06-19	15:28:39	System	127.0.0.1	localhost	[External Drive] Job Qdownload-->Qdownload created successfully.
    2013-06-19	15:28:38	System	127.0.0.1	localhost	[External Drive] Job Qdownload-->Qdownload started.
    2013-06-19	15:08:06	System	127.0.0.1	localhost	[USBDisk4] Device detected. The file system is ext3.
    2013-06-19	15:07:58	System	127.0.0.1	localhost	[USBDisk3] Device detected. The file system is ext3.
    2013-06-19	15:07:51	System	127.0.0.1	localhost	[USBDisk2] Device detected. The file system is unknown.
    2013-06-19	15:07:45	System	127.0.0.1	localhost	[USBDisk1] Device detected. The file system is ext3.


    Da es mir komisch erschien, dass die externe Platte als 4 verschiedene USB-Platten erkannt wurden habe ich zunächst nur ein 3 Ordnerpaare QDownload (QUsb ans QWeb) versucht zu synchronisieren. Wie man sieht hat QDownload angeblich geklappt (und die anderen beiden?) nur leider kann der Web File Manager garnix finden.


    Spricht irgendetwas dagegen, die Initialkopie via Web File Manager vorzunehmen? Und warum legt das NAS Sample-inhalte im Ordner QMultimedia an, die man nicht löschen kann (Kommentar habe ich mir gespart ;)
    --
    QVerwundert
    Rob

    Einmal editiert, zuletzt von bladekiller () aus folgendem Grund: Editierfunktion nutzen und doppelte Beiträge vermeiden, siehe Forenregeln!

  • Wenn eine interne Platte extern angeschlossen wird, werden auf dieser Platte 4 Partitionen erkannt.


    Die dritte und grösste Partition ist die Datenpartition, die anderen sind Systempartitionen für Teile des Betriebssystems, Konfigurationsdateien usw.


    Du musst nun im RTRR die jeweiligen Ordnerpaare mit der USBDisk3 (hierauf befinden sich als Unterordner die ehemaligen Freigabeordner der internen Platte) und den Freigaben der Zielplatten bilden.


    GLG GBD

  • Genau das habe ich gemacht, da die 3. Partition in etwa meiner Erwartug bzgl. Größe etc. entsprach. Ich konnte dann auch die Ordnerpaare auswählen, nur wird eben sichtbar nicht synchronisert. Wenn Du in mein Protokoll schaust wirst Du sehen, dass der Zielordner angelbich erstellt wird und dann 10 Minuten später der Synchronisationsvorgang abgeschlossen wird.
    Leider gibt es danach aber keinen Ordner QDownload (und auch die meisten anderen 'Freigaben') auf der Zileplatte und es ist auch nicht signifikant mehr Plattenplatz belegt.
    --
    Rob

    Einmal editiert, zuletzt von Robert@ ()

  • wie eben bereits erwähnt gibts auf der neuen Platte nur 3 'Freigaben' (Public; Qmultimedia, ...Recycle Bin 1)


    Jobstatus
    Auftragsname: Qdownload-->Qdownload
    Zeitplantyp: Jetzt reproduzieren Ordnerpaare: 3
    Datei(en) insgesamt: 26681 Ordner insgesamt: 31534
    Dateigröße insgesamt: 11.159 GB Durchschnittliche Übertragungsgeschwindigkeit: 1.0 MB
    Verstrichene Zeit: 00:09:56 Verbliebene Zeit: 00:00:00
    Status: Beendet 19.06.2013 16:14:48


    Jobprotokolle
    Datum Uhrzeit Inhalt

    Einmal editiert, zuletzt von GorillaBD () aus folgendem Grund: Code Block hinzugefügt.

  • Der RTRR ist keine Synchronisation, sondern eine Replikation.
    Im Gegensatz zur Synchronisation, die Veränderungen auf Quelle und Ziel beidseitig miteinander abgleicht, bringt eine Replikation nur das Ziel auf den Stand der Quelle.
    Heisst, eine Replikation funktioniert immer nur in einer Richtung.


    Deine Jobdefinition sieht mir nun verdächtig danach aus, dass Du als Quelle die interne HDD und als Ziel die externe HDD im Job definiert hast.
    Damit wäre der Job natürlich ziemlich schnell fertig durchgelaufen, weil nur wenig oder nichts zu kopieren ist.


    Ist meine Vermutung richtig ?


    GLG GBD

  • wenn ich noch richtig gucken kann, eher nicht. Da ich nicht weiss, wie man hier einen Screenshot einfügen kann, ohne diesen zuvor irgendwo anders hochzuladen:


    Quellordner: Zielordner:
    /USBDisk3/Qdownload /Qdownload
    /USBDisk3/Qusb /Qusb
    /USBDisk3/Qweb /Qweb


    oder haben die Begriffe Quell- bzw. Zielordner hier eine Zweifelsfreiheit, die mir verborgen geblieben ist?


    Habe das Problem mittlerweile lokalisiert. Der definierte Job war korrekt. Das Problem ist jedoch das die meisten Default-Ordner auf den eneun Platte nicht automatisch wiederhergestellt werden. Auch die Zugriffsrechte waren bei mir verloren. Das allein könnte man eventuell noch erklären auch wenn ich persönlich mehr erwarte. Allerdings wurden 3 Default-Ordner doch automatisiert wiederhergestellt. Für mich uíst das nicht nachvollziehbar.
    --
    Rob