Volume geht regelmäßig in Status "read-only"

  • Hallo liebes Forum,


    ich habe vier Uralt-QNAPs vom Typ TS-879U-RP aufgefrischt. Upgrade auf 16GByte RAM, Dual-Port 10GB SFP+, 2*4TB SSD als Cache, 6*8TB Toshiba Platten, alle verbauten Komponenten sind gegen die Kompatibilitäts-Matrix geprüft. Alle diese QNAPs dienen zur dauerhaften Speicherung von VMWare-Images und dienen einem ESX-Cluster als Speicherplatz für Test/Abnahme-VMs.

    Jede der QNAPs hat exakt einen SpeicherPool und ein Volume.


    Alle vier QNAPs sind über Jahre problemlos durchgelaufen.

    Seit dem Upgrade geht eine der QNAPs mit Ihrem einen Volume ohne für mich erkennbaren Grund in den readonly-mode. Nach einem Reboot + Filesystem-Check läuft das Teil wieder ein paar Tage, dann ist das Volume erneut im Status read-only. Ich sehe keine Probleme mit den Platten, auf Ebene GUI gibt es keine brauchbaren Hinweise.


    Gibt es auf Ebene CLI ein ausführliche(re)s Fehler-Log.

    Hat jemand eine Idee woran es liegen könnte ?


    Seit ich die Box nur noch als Target für die Synchronisation verwende komme die Fehler deutlich seltener vor.


    LG

  • Upgrade auf 16GByte RAM, ...


    Seit dem Upgrade geht eine der QNAPs mit Ihrem einen Volume ohne für mich erkennbaren Grund in den readonly-mode.

    Aus der Ferne kann man nur mutmaßen, was die Ursache sein könnte.


    Ein nicht "originaler" RAM in Verbindung mit einem Upgrade wäre für mich die erste Adresse für die Fehlersuche.


    Das ließe sich auch leicht verifizieren:

    • einmal nur mit dem original RAM laufen lassen
    • wieder zur vorherigen QTS-Version zurück und damit laufen lassen
  • ich habe vier Uralt-QNAPs vom Typ TS-879U-RP aufgefrischt. Upgrade auf 16GByte RAM, Dual-Port 10GB SFP+, 2*4TB SSD als Cache, 6*8TB Toshiba Platten, alle verbauten Komponenten sind gegen die Kompatibilitäts-Matrix geprüft.

    Und wie ist Dir diese Prüfung gegen die Kompatibilitätsmatrix gelungen? Auf der Kompatibilitätsmatrix von QNAP stehen weder Hauptspeicher noch Netzwerkkarten, wohl aber SSD und Festplatten. Wie hast Du diese Hauptspeicher und Netzwerkkarten gegen welche Kompatibilitätsmatrix geprüft? Und welche Version von QTS verwendest Du, da QNAP ja nur noch eingeschränkten Support für dieses Legacy-Modell liefert, und das auch nur noch bis Ende diesen Jahres?

    Und hast Du die VMWare ESX-Kompatibilität bereits geprüft? Hast Du auf eine aktuellere Version von ESX aktualisiert, für die keine Kompatibilität geprüft wurde?


    QNAP hat die Angewohnheit, unvollständige Spezifikationen zu veröffentlichen. In diesem Fall habe ich selbst aus dem QNAP-Shop keine Hinweise erhalten, von welchem Hersteller der Hauptspeicher stammt oder wie die vollständige Spezifikation laute. Bei Drittquellen habe ich sowohl Hinweise auf Standardspeicher (PC3-12800 CL11 240 pin SDRAM alias DDR3-1600 11-11-11 1,5V) als auch auf ECC-Speicher und UDIMM mit DDR3-1333 gefunden.

    Gibt es auf Ebene CLI ein ausführliche(re)s Fehler-Log.

    Habe weder ein derartiges Modell noch eine derartige QTS-Version. Daher kann ich nur vermuten, dass über CLI durchaus Logs mit Fehlern existieren könnten. Würde ich so erwarten und als wahrscheinlich ansehen. Und wenn die angesprochenen Hardware-Kompatibilitätsaspekte bereits vollständig geprüft sind, würde ich insbesondere diese ESX-Kompatibilität prüfen, sowohl hinsichtlich Versionen als auch Konfigurationen. Kommen bei älteren ESX-Versionen die gleichen Phänomene?

  • Hallo liebes Forum,


    vielen Dank für die Unterstützung.


    Zuerst die Frage nach dem RAM und der Kompatibilität. Ich schließe das RAM als Fehlerquelle aus.

    1. Ich hatte die Probleme schon vor dem RAM Upgrade mit dem Original-RAM und hatte gehofft, die Probleme würden damit vielleicht verschwinden.
    2. Ich habe die QNAP daraufhin mit dem ausgebauten RAM identischer Modelle (ich habe vier QNAPs dieses Typs im Einsatz) ausgestattet - nach spätestens einer Woche Einsatz habe ich wieder den Effekt.
    3. Um zu Prüfen ob die 2*8GByte stabil laufen habe ich diese in einer anderen QNAP identischen Typs verbaut - keine Probleme
    4. Das RAM selbst stammt von einem Händler der QNAPs vertreibt und zumindest laut Label auf diesem RAM diese Riegel für das Modell freigegeben hat.

    Jedes Argument für sich bietet keine 100% Sicherheit, aber in Kombination wird IMHO RAM als Root Cause schon unwahrscheinlich.


    Dann die berechtigte Frage nach den Netzwerkkarten.

    1. Ich habe die nachgerüsteten Netzwerkkarten (laut Kompatibilitäts-Matrix supportete SFP+ Karten) wieder ausgebaut und durch zwei originale 10GB Single-Port-Karten von qnap ersetzt - keine Änderung
    2. Ich habe die nachgerüsteten Netzwerkkarten komplett ausgebaut und nur die "onboard Ports" genutzt - keine Änderung


    VMWare-Kompatibilität habe ich nicht geprüft, ich nutze für die alten Dinger ausschließlich NFS und kein iSCSI, insofern muss das unabhängig sein. Aber Ihr habt ja recht - um das auszuschließen habe ich die QNAPs seitens vSphere nur noch read-only gemountet.

    ESX läuft unter 6.7 auf der letzten Version. ESX schließe ich inzwischen auch aus als Fehlerquelle - die Probleme treten auch schon auf, wenn ich die "garstige" qnap per NAS-to-NAS Copy befülle.



    =================== Neue Erkenntnisse =====================


    Test gegen eine alte QTS-Version habe ich nicht gemacht. Ich habe vier völlig identische Modelle die auch identisch ausgestattet sind. Jeweils zwei Pärchen haben auch völlig identische Platten aus derselben Charge (dicht aufeinanderfolgende Seriennummern). Eine alte QTS-Version ist für mich keine Option, ich will wenigstens identische Modelle auf identischen QTS-Stand.


    Ich habe deshalb die betroffene QNAP komplett neu aufgesetzt. Dazu habe ich alle Inhalte per NAS-to-NAS Copy auf andere QNAPs verteilt. Dabei gibt es grundsätzlich keine Probleme, nur "Schreiben" ist das Problem. Nach dem Zurücksetzen auf Factory-Default und komplette Neueinrichtung habe ich die Inhalte wieder zurückgespielt (NAS-to-NAS). Hierbei ist die QNAP wieder mehrfach in "read-only" gewechselt. Die Wahrscheinlichkeit steigt (gefühlt) proportional zur Schreibrate auf den Platten. Je mehr Jobs ich parallel laufen lasse um so schneller tritt der Fehler auf.


    Im Anhang zwei ScreenShots

    Screenshot 2020-07-24 at 08.36.52 AM.png

    Screenshot 2020-07-24 at 08.36.04 AM.png



    Ich habe mir mal die Historie der qnap anhand unserer Unterlagen angeschaut. Sie stammt von einem italienischen Reseller, wurde von uns nicht "neu" gekauft und hat leichte Gehäuseschäden. Ich behaupte, die hat einen Absturz aus moderater Höhe hinter sich oder wurde mal ohne Verpackung transportiert. Die Platten von damals sind längst entsorgt, aber definitiv hat es eine mechanische Erschütterung gegeben. Haarriss auf einer der Platinen wäre auch denkbar. Ich nehme das Teil jetzt erstmal außer Betrieb und suche 1:1 Ersatz.


    Ich schreibe aber noch wie es ausgeht.