Thin-Volume alle paar Tage schreibgeschützt

  • Hallo,


    unser NAS (TS-469U mit QTS 4.3.4.2451 4x4TB HDD Raid5) schaltet alle paar Tage den Speicherpool auf schreibgeschützt und ist damit dann auch nicht mehr als Dateifreigabe zu nutzen. Der Datenträgerstatus der HDD's steht bei allen Platten ( 4x4TB Raid5) auf gut. Starte man dann eine Überprüfung des Volumes scheitert diese, da das Volume nicht dismounted werden kann. Nach einem Neustart des NAS läuft alles wieder normal, für die nächsten paar Tage. Fehlermeldungen im NAS werden keine angezeigt mit Ausnahme der fehlgeschlagenen Überprüfung.

    NAS ist zu ca. 75% gefüllt.

    Habt ihr eine Idee ich das Problem weiter eingrenzen oder noch besser beheben kann?


    Vielen Dank für Eure Hilfe

    Viele Grüße

  • Moin, bitte mal Screenshots von Storage und Snapshots (Datenträger- und Volumeverwaltung) und auch mal ins das Log schauen, was unmittelbar in dem Zusammenhang noch für Meldungen auftauchen (auch Infos).

  • Hallo ,

    pasted-from-clipboard.png


    - Snapshots sind keine

    - Systemereignisprotokoll hat keine Einträge (Warnungen) auch keine Mitteilung, das auf schreibgeschützt geschaltet wurde


    Ich merke es nur daran, das miene Sicherung nicht funktioniert hat bzw. der Zugriff auf die Freigabe nicht funktioniert. Zu welchem Zeitpunkt genau kann ich nicht feststellen.

  • Das Bild ist sehr klein und nicht lesbar. :(


    Es könnten mehr Bilder sein.

  • Jo, dass es keine Ereignisse gibt ist unvorstellbar. Auch mal das Dumplog aus der Helpdesk App herunterladen und die betreffenden Zeiten raussuchen und posten (in diesem Log gibt es zwei Abschnitte wondie Zeiten auftauchen).

  • Um 02:15 wurde ein RAID Scrubbing gestartet, welches zum Zeitpunkt des Abschaltens nicht abgeschlossen war, das könnte das Problem sein.

    Eigentlich sollte das oben unter den Hintergrundprozessen angezeigt werden.


    Prüfe mal ob es solche einträge schon vorher gab. Wenn der nie abgeschlossen wurde und daher immer wieder neu startet aber nie zum Ende kommt, dann kann sich das so äußern...

    Einmal editiert, zuletzt von tiermutter () aus folgendem Grund: Ein Beitrag von tiermutter mit diesem Beitrag zusammengefügt.

  • Hallo,

    Die Raidbereinigung läuft doch normal nur einmal im Monat, wenn ich das richtig gelesen habe. Und das Problem trat ja irgendwann vor dem Neustart auf. Laut Datensicherungsprotokoll des Servers gegen 23:05 Uhr. Nach dem Neustart läuft das NAS erstmal für einige Zeit. Ältere Protokolle zeigen den Eintrag nicht.

  • Hast du dann auch einen Eintrag, wo das Problem mitten im Betrieb auftritt? Bislang taucht es in den Logs nur nach einem Neustart auf, eben eventuell weil das Scrubbing noch nicht durch war als heruntergefahren wurde.

  • Da hab ich keinen Eintrag.


    Das NAS wird zur Datensicherug eingesetzt, in der die Server Nachts einImage auf dem Serverablegen, welches dann vom NAS auf ein RDX per BackupSync gespielt wird. Der Sync auf das RDX funktioniert auch nach der Störung noch (lesender Zugriff ist ja möglich). Log Meldungen die auf einen Schreibfehler oder ähnliches hinweisen sind im Systemereignisprotokoll nicht zu finden. Ich merke es nur wenn ich die Datensicherung prüfe. Deshalb steh ich auf dem Schlauch. Im Zweifel würde ich das NAS neu aufsetzen, aber ob es etwas nutzt?

  • aber ob es etwas nutzt?

    Dazu müsste man wissen, was das eigentliche Problem ist, ansonsten ist es nur ein Blindversuch.

    Poste doch einfach mal die Logs der letzten Wochen samt Info, zu welchen Zeiten die Probleme aufgetreten sind... bevor Du das Log mit dem Scrubbing gepostet hast, warst Du ja auch der Meinung, dass nichts Brauchbares im Log steht ;)


    Wie sieht es mit dem Dumplog aus?

  • Warum ein Thin bei so statischer Nutzung?


    Das erzeugt mehr IO Last für die HDs und bremst.

    Bei einem Volume ist Thick hier besser geeignet.


    Ggf. läuft das Backup mit Bereinigung die immer Nachts startet zusammen dann in den Fehler.

    Ich würde es in ein Thick konvertieren und dann mal weiter beobachten.

  • Hallo,


    das ist ein Auszug aus dem Log mit einer Fehlermeldung aus dem Juni. Danach hatte ich das Volume nach Thin konverteirt.



    Könnte da was schief gelaufen sein?

  • Code
    "10954","Warning","2023-06-22","22:45:18","System","127.0.0.1","localhost","[Volume DataVol1, Pool 1] The storage space has been set to read-only mode: Parent storage pool is full. 32.00 GB of free storage pool space is required for recovery."

    Hier ist ja schonmal das Problem benannt: Der Pool und/ oder das Volume ist vollgelaufen. Vermutlich das Volume, da für das Volllaufen des Pools selbst Snapshots erforderlich wären.

    Also ist die Frage: was lief zu diesem Zeitpunkt? Wurde hier etwas auf das NAS übertragen?


    Könnte da was schief gelaufen sein?

    Klar, aber die Probleme haben ja schon vorher begonnen, die Konvertierung fand erst später statt (warum? wie Crazyhorse schon schrieb macht es bei einem Volume nicht viel Sinn)

  • zu dem Zeitpubnkt läuft die Sicherung, die damals noch mehr Daten enthielt und knap an die Grenze des Volumes heran kam. Wurde aber nicht überschritten. Deshalb tippte ich auf den StoragePoolSpace. Das ließ sich durch konvertieren nach Thin beheben. Ich würde es ja wieder zurück wandeln, bekomm aber den Menüpunkt unter Peichermanager>Speicherplatz>DataVol1>Verwalten nicht angeboten.