TS-859 Pro+ Raid 5 entladen ohne sichtbare Defekte

  • Hallo Leute,


    wie viele vor mir habe ich ein Problem mit einem entladenem Raid-5 auf meinem TS-859 Pro+. Ich habe diverse Beiträge hier im Forum gelesen, aber meinen konkreten Fall nicht gefunden. Hier nun die Vorgeschichte.


    Ich habe seit Jahren ein Raid-5 bestehend aus den Platten 1-5. Vor ein paar Tagen habe ich die folgende Fehlermeldung erhalten:

    Code
    "[Media Library] Your disk volume has less than 5% free space on /share/MD0_DATA/. Related functions will be stopped unless you free up additional space. Please free up more space for the Media Library to continue running."


    Also „schnell“ ein weiteres Raid-5 bestehend aus den Platten 6-8 wie folgt ergänzt:

    * Log-Files angeschaut => soweit OK, bis auf die o.g. Fehlermeldung

    * Update suchen lassen, aber aktuellste Version 4.2.6 ist installiert

    * NAS herunter gefahren, Platten 6-8 eingesteckt

    * Neustart und neues Raid-5 eingerichtet => nach knapp 14 Stunden erfolgreich beendet


    Dann habe ich einen Teil des Inhalts des alten Raid-5(1-5) (ca. 4TB) auf das neue Raid-5(6-8) wie folgt verschoben:

    RAID-5(6-8) => Neues Verzeichnis VERZEICHNIS_NEU erstellt

    RAID-5(1-5) => Verschieben Inhalt VERZEICHNIS_ALT nach RAID-5(6-8) VERZEICHNIS_NEU

    RAID-5(1-5) => VERZEICHNIS_ALT gelöscht (war auch leer)

    RAID-5(6-8) => Neues Verzeichnis VERZEICHNIS_ALT angelegt (ich will den Namen beibehalten)

    RAID-5(6-8) => Verschieben Inhalt VERZEICHNIS_NEU nach VERZEICHNIS_ALT

    RAID-5(6-8) => VERZEICHNIS_NEU gelöscht (war auch leer)


    Jetzt tauchten die ersten beiden Fehlermeldungen auf, beide Raid-5 waren aber bereit und über die FileStation ansprechbar:

    Code
    * "[RAID5 Disk Volume: Drive 6 7 8] The file system is not clean. It is suggested that you go to [Storage Manager] to run Check File System."
    * "[RAID5 Disk Volume: Drive 1 2 3 4 5] The file system is not clean. It is suggested that you go to [Storage Manager] to run Check File System."

    Vielleicht dummerweise habe ich zuerst einen Neustart durchgeführt (hilft ja manchmal, wenn sich das OS verschluckt hat), anschließend war das RAID-5(1-5) als entladen gekennzeichnet. Was war mein Fehler? Beide Verzeichnisnamen (s.o.) hatten ein „ö“ im Namen.


    Ich habe das RAID-5(6-8) dann vollständig überprüft und es wurde als OK angezeigt, ich habe auch Zugriff über mein Netzwerk. Die Festplatten des alten RAID-5(1-5) sind nach Überprüfung (Datenträger-SMART) auch alle in Ordnung.


    Nach meiner Vermutung (bzw. nach dem Lesen diverser ähnlicher Beiträge) muss ich das alte Raid-5 wahrscheinlich nur wieder laden, richtig?


    Jetzt kommen meine Fragen (und ich bin nach eigener Einschätzung nur versierter Windows-User):

    1. Oft sehe ich den Zugriff auf das NAS auf Dateiebene (Beispiel # md_checker). Wie erfolgt ein solcher? Ich habe keine Eingabeaufforderung oder ähnliches gefunden.

    2. Mit welchem Befehl könnte ich (möglichst risikolos) versuchen, das Raid-5 wieder zu laden? Im aktuellen Handbuch habe ich unter diesen Begriffen nichts gefunden (außer für eine Neuanlage).


    Ich bin für jeden Tipp dankbar!!!!


    Micha

  • * NAS herunter gefahren, Platten 6-8 eingesteckt

    Warum ? Immer alles HOT machen .. NAS also NICHT herunterfahren !


    Warum wurde irgendwas hin und hergeschoben und nicht einfach das bestehende RAID erweitert ?


    Bestehen Backups ? .. Vor solchen Stunts sollte man ja auf jedenfall die Funktionalität von Backups prüfen.



    1. SSH, Client starten (oder runterladen) und verbinden (wer schon so fragt sollte 2. besser lassen)

    2. Unklar was passiert ist, am besten ein Ticket mit QNAP aufmachen bevor hier irgendwelche Kommandos gefahren werden.

  • Ticket kann man vergessen, das NAS ist EOL!

    Ich verstehe auch nicht wieso man immer hinterher laut Hilfe schreit, anstatt sich vorher zu melden und fragen was wie geht.


    Filesystem not clean heißt, das das NAS nicht sauber runtergefahren wurde. Entweder lief noch ein Dienst oder es gab einen harten Shutdown (z.B. Netzkabel aus der Buchse oder Steckdose gerutscht/gezogen).


    Hier hilft meistens nur die CLI, also eine Verbindung per Putty zum NAS und die Ausgabe von


    cat /proc/mdstat posten.

    Wenn Putty und Linux aber schon Fremdworte sind, dann am besten bleiben lassen, es kann nur schlimmer kommen!

    Und ohne Backup ist alles Risiko!


    Gruss

  • Warum nicht Hot? Dummheit (gepaart mit Unerfahrenheit)!


    Zwei Raid-5 fand ich besser erweiterbar, da ich nicht direkt den gesamten Datenbastand sichern muss (findet auf diversen Einzelplatten statt), wenn ich ein größeres Raid-5 neu aufbauen müsste (war mit Platte 1-5 nämlich bei 16TB).


    Backups sind vorhanden, wenn auch 14 Tage alt. Würde mich etwas ärgern, aber nicht seelisch ruinieren.


    Mit Putty (kenne ich noch von früher) habe ich den Zugriff gecheckt, der funktioniert. Aber mit Linux hatte ich fast nie etwas zu tun. Was kann ich nach der Anmeldung tun?


    Sorry, hatte die 2. Antwort nicht gesehen. Hier die Ausgabe:


    Hilft das weiter?

    2 Mal editiert, zuletzt von miku1765 () aus folgendem Grund: Antwortdetail vergessen

  • Wenn Du das noch in eine Code-Block schreibst, wird es sogar lesbar ;).

    Da sieht dann so aus:


    Code
    md0 : active raid5 sda3[0] sde3[4] sdd3[3] sdc3[2] sdb3[1]
    
    15621798144 blocks super 1.0 level 5, 64k chunk, algorithm 2 [5 /5] [UUUUU]

    Teste bitte, ob auf Deinem NAS auch md_checker verfügbar ist. Wenn ja, bitte die Ausgabe posten.


    Gruss

  • Codeblock heißt wahrscheinlich das Format? Werde ich versuchen zu beachten.


    Leider ist md_checker nicht verfügbar. Kann ich das irgendwie nachinstallieren?

  • ich weiß nicht mehr in welcher App das war, entweder in der DiagnosticApp oder im Helpdesk.

    Helpdesk kannst Du hier noch kriegen, die Diagnostic gibt es dort nicht mehr.


    hast Du nochmals versucht, einen Filesystemcheck auf dem Volume laufen zu lassen?

    Denn üblicherweise wird danach das Volume wieder gemountet.


    Gruss

  • Im Speichermanager ist bei dem Riad-5(1-5) Dateisystem prüfen ausgegraut, ich kann nur Formatieren oder Entfernen auswählen.


    pasted-from-clipboard.pngpasted-from-clipboard.png


    Danke für die Tipps, werde ich morgen Vormittag mal in Ruhe austesten. Habe im "Helpdesk" unter Diagnosewerkzeuge den Festplattenbereitschaft Test, meinst du diesen? Im Dropdown-Menü gibt es nur die Möglichkeit "NAS host" - soll ich mal starten?

  • Nein, in der GUI nichts machen.

    In der CLI nachsehen, ob da jetzt md_checker vorhanden ist.


    Wenn nicht, war der Befehl doch in der Diagnostic App.


    Gruss

  • Moin,


    habe gerade nochmals mit installiertem Helpdesk getestet, aber md_checker kennt er nicht. Und das QNAP Diagnostic Tool wird nicht mehr angeboten. Kann ich eine andere App hierfür nutzen, die im AppCenter angeboten wird? Oder andere Lösungsansätze?


    Wollte mir gerade noch im Verzeichnis /etc die Datei fstab anzeigen lassen, aber so ein Verzeichnis gibt es nicht (also auch kein klassischer Linuxunterbau).

  • Die App ist unterwegs.

    Was ich noch gefunden habe sind die Befehle, den Check manuell auszuführen:


    Code
    /etc/init.d/services.sh stop && /etc/init.d/opentftp.sh stop && /etc/init.d/Qthttpd.sh stop
    lsof +f -- /dev/md0
    umount /dev/md0
    e2fsck_64 -f -v -C 0 /dev/md0
    reboot

    1. Zeile: damit werden alle Dienste gestoppt.

    2. Zeile: damit kann man nachsehen, ob es noch Dienste gibt. die trotz 1. noch auf /dev/md0 zugeifen. Dieser Dienst (Prozess) muss dann mit kill beendet weren!

    3. erklärt sich von selbst, sollte die Meldung "device is busy" erscheinen -> zurück zu 2.

    4. erklärt sich von selbst
    5. erklärt sich auch von selbst ;)


    Gruss



    P.S. Falls nicht /dev/md0 geprüft werden soll, sind die Befehle entsprechend anzupassen!

  • Vielen Dank für die App, wurde gerade installiert. Hier das Ergebnis von md_checker:

    Hilft dir das bei der Fehleranalyse weiter? Ich hoffe!!!!!

  • Sieht eigentlich alles ganz normal aus.

    Wie ist denn die Ausgabe von mount?


    Gruss

  • Hier die Ausgabe:

    Kannst du damit etwas anfangen bzw. hast du einen Lösungsvorschlag für mich? Vielen Dank für ein kurzes Feedback.


    Gruss

    Micha

    Einmal editiert, zuletzt von miku1765 ()

  • Da haut was überhaupt nicht hin. In der Ausgabe von md_checker werden zwei RAID5 gefunden - /dev/md0 und /dev/md7.

    Eingebunden ist aber als einziges /dev/md1.=O


    Was sind die Ausgaben von:

    cat /etc/config/raidtab

    cat /etc/config/mdadm.conf

    cat /etc/storage.conf

  • Hier die Ausgabe von cat /etc/config/raidtab:

    Hier die Ausgabe von cat /etc/config/mdadm.conf:

    Code
    ARRAY /dev/md0 devices=/dev/sda3,/dev/sdb3,/dev/sdc3,/dev/sdd3,/dev/sde3
    ARRAY /dev/md1 devices=/dev/sdf3,/dev/sdg3,/dev/sdh3

    Und hier noch die Ausgabe von cat /etc/storage.conf:

    Gibt es jetzt einen Sinn?

  • Nein, weil auch da kein /dev/md7 auftaucht. Warum md_checker dem /dev/md1 den Namen md7 gibt erschliesst sich mir nicht.

    Code
    ...
    Name:           md7                    <----
    Chunk Size:     64K
    md Version:     1.0
    Creation Time:  Mar 27 07:32:32 2021
    Status:         ONLINE (md1) [UUU]     <----
    ...

    Fakt ist, /dev/md0 wird nicht eingebunden.


    Was sagt ein mdadm -D /dev/md0?

  • Richtig, obwohl beide Raid-5 bei der Ausgabe von md_checker als Online gekennzeichnet sind und die jeweiligen Angaben (nach Recherche tagsüber im Forum) wohl stimmig sind.


    Hast du noch eine Idee?


    Kann man vielleicht das Raid-5 md0 über die Konsole einmal auf OFFLINE (vermutlich entladen) und dann wieder auf ONLINE (laden) setzen (ohne es "richtig" aufzulösen)? Du siehst, ich greife nach jedem Strohhalm.

  • Moin, hier die entsprechende Ausgabe:

    Der Wert für Used Dev Size mit etwa 4 GB ist aber komisch, da ich etwa genau diesen Wert bei ursprünglicher 95% Belegung auf das neue Raid-5 verschoben habe. Daher müsste der Wert bei etwa 11 GB liegen.