TS-653B - Plötzlicher Leistungseinbruch von SSDs an SATA3 Ports auf 135MB/s

  • Guten Abend zusammen!


    Nach einem Jahr des Mitlesens ist das mein erstes Post, bitte daher etwaige Formalfehler nachsehen.
    Ich hoffe auch, dass ich das richtige Brett erwischt habe.


    Ich bin seit etwa einem Jahr ein zumeist zufriedener Benutzer einer TS-653B, bestückt ist er mit sechs Samsung 860evo 1TB im RAID6 Verbund (RAID Resynch in Standardgeschwindigkeit). Der RAM ist auf 16Gb erweitert worden. Es hängen vier externe Datenträger über USB an dem Gerät. So weit alles gut.


    Seltsamerweise sind von Anfang an zwei der SSDs (Slot 5+6) um ca. 80MB/s schneller, als der Rest. Ich habe hier gelesen, dass Zwei Slots direkt und die restlichen vier über einen Controller an der CPU hängen könnten und das der Grund für Geschwindigkeitsdifferenzen sein könnte.

    Nicht weiter störend, aber ein wenig befremdend, könnte womöglich aber mit meinem eigentlichen Problem zusammenhängen, kanns zumindest nicht ausschließen.


    Vor einiger Zeit ist mir aufgefallen, dass die SSDs laut Datenträgerinfo mit 1,5Gbps angebunden wären. Die wöchtentlich automatisch durchgeführten Geschwindigkeitstests waren SSD-würdig, bis auf die oben beschriebene kleine Abweichung . Die max. Geschwindigkeit wurde mit 6Gbps erkannt.

    Folglich habe ich mir keine weiteren Gedanken gemacht.


    Ca. zwei Wochen nach dem Firmware Update auf 1495 kriege ich gestern eine Fehlermeldung, dass die Leistungstests der SSDs zu niedrige Werte ergeben haben: alle um 135MB/s.

    Erstmal Firmware verdächtigt und Sicherheit auf 1465 downgegradet, keine Änderung.



    Mein einziger Ansatz für die grottigen Leistungswerte ist die scheinbare "Bandbreitengeschränkung" der SSDs.

    Bis auf die Firmware ist keine Änderung am System erfolgt, kann mir einfach nicht erklären, wieso die SSDs auf einmal statt mit 6Gbps auf einmal mit 1,5Gbps angesteuert werden sollten (siehe Screenshot anbei). Wobei ja 1,5Gbps 187MB/s wären, die auch deutlich über den 135MB/s liegen.

    Das NAS steht im Keller, wird also nie zu warm, thermische Probleme können daher ausgeschlossen werden (worst value Airflow Temp 42°). Alle SMART-Werte unauffällig, die SSDs haben noch 100% Restlebenszeit.

    Derzeit läuft mal ein volles Backup, danach kann ich rumexperimentieren.


    Für sachdienliche Hinweise wäre ich dankbar, was das Problem sein könnte, obwohl kein Dau, bin ich etwas überfragt, wo es zwicken könnte.


    Euch allen ein Frohes Fest und bleibt gesund...

    Dan


    Update 24.12.: Ist natürlich eine 653B und keine D, my bad - korrigiert.

  • TeHaiX

    Hat den Titel des Themas von „TS-653D - Plötzlucher Leistungseinbruch von SSDs an SATA3 Ports (135MB/s)“ zu „TS-653B - Plötzlicher Leistungseinbruch von SSDs an SATA3 Ports auf 135MB/s“ geändert.
  • Kleines Update:


    Am Morgen, nachdem das komplette Backup gezogen wurde, sind zwei SSDs ausgefallen (Slot 1+3) und das RAID degraded.

    Habe daraufhin beide SSDs auf einem Rechner durchgecheckt, sie waren okay, also testweise wieder ins NAS gesteckt.


    Und - oh welch Wunder - sie wurden beide wieder mit 6Gbps erkannt, Rebuild hat automatisch angefangen. Mittlerweile sind alle SSDs getauscht (getrennt, entfernt und wieder eingesetzt) und wurden alle mit 6Gbps erkannt, Leistungstest liefert zwischen 427MB/s und 540MB/s.

    Sonst noch wer einen Ansatz oder eine Idee, wo das Problem liegen könnte?
    HW-Fehler? Firmware? Bin echt ratlos...


    Dan

  • Man kann nur raten, ich würde das NAS mal komplett runterfahren, alles SSD und HDD raus, und mit Druckluft das Gehäuse aus pusten (bitte mit Verstand und nicht nur voll max.) , meistens hat man Glück und der Fehler ist gegessen, es kann auch eine kalte Lötstelle oder defekter Kondensator ggf. auch das Netzteil sein. Nach dem aus pusten alles wieder rein und hochfahren und testen.


    Es muss nicht unbedingt ein Kompressor sein, ich puste oft Rechner usw. mit einer elektrischen Gebläsepumpe (für Luftmatratzen usw) aus, geht hervorragend.

    Die Firmware 4.5 hat auch viele Macken von dieser habe ich bisher aber nichts gelesen

  • An Staub habe ich auch schon gedacht - Keller ist aber wirkich sauber, alle zwei Wochen wird gesaugt.


    Staub erklärt - zumindest für mich - auch nicht unbedingt Leseraten von 400-500MB/s bei 1,5Gbps (physikalisch unmöglich), dann den plötzlichen Einbruch.:/


    Die SATA Anschlüsse der SSDs habe ich vorm Einsetzen ausgeblasen, bei dem NAS hab ich nicht dran gedacht, schaden wirds aber nicht...

  • Wie sieht es mit TRIM aus und in welchen Abständen wird der gefahren?

    Dann war noch was mit Overprovisioning, was den SSD auch beim Trab helfen soll. Ob sich das über RAID einrichten lässt, kann ich allerdings nicht testen.

  • TRIM und Rückforderung monatlich.

    OP ist mit 15% festgelegt (über das HW-seitige, automatische OP hinausgehend, auf das man eh keinen Einfluss hat), die SSDs sind aber nicht mal zur Hälfte voll, sodass das OP bei weitem nicht relevant sein sollte.


    Bin leider Linux-Dau, daher kann ich zur Qualität oder zu Details des TRIM Vorganges keine Infos abrufen.

  • Damit sind die Möglichkeiten weiter eingeschränkt. Vielleicht liegt es wirklich an 4.5.1, vielleicht sogar an der eher unüblichen SSD-Vollbestückung der 653 in Verbindung mit 4.5.1 und den Eigenheiten der Backplane.

  • SSDs sind aber nicht mal zur Hälfte voll, sodass das OP bei weitem nicht relevant sein sollte.

    OP wird nur in vollkommen freien Bereichen benutzt. Der Bereich darf nicht formatiert sein, denn dieser wird dafür nicht benutzt.



    Ich muss bei Staub immer an Murphy denken, Der Rechner meiner Frau hat auch so eine Macke, wenn man den nicht jedes 1/2 Jahr komplett ausbläst spinnt dieser rum, warum verstehe ich bis heute nicht.

  • OP wird nur in vollkommen freien Bereichen benutzt. Der Bereich darf nicht formatiert sein, denn dieser wird dafür nicht benutzt.

    Okay, ich dachte, OP bzw. das damit verbundene Wear-Leveling sich auf die komplette unbenutzte (unbeschriebene) Kapazität bezieht, wobei die 15% eben garnicht beschrieben werden.


    Warum Trim nur Monatlich?

    Pfuh, weil das NAS eigentlich reiner Fileserver ist und nur minimal Daten hinzukommen (~200Gig in einem Jahr)... wirklich begründen kann ich das nicht. Zu selten?



    Ich werde jetzt mal das RAID6 heute Nacht neu aufsetzen und die Platten neu befüllen... vielleicht bin ich nachher schlauer.

  • So, kleines, aber überraschendes Update:


    Heute Nacht RAID6 komplett neu aufgesetzt, OP 15%, NAS im Laufe des Tages wieder mit allen Daten befüllt. Trim täglich aktiviert. SSDs werden mit 6Gbps angefahren.

    Danach QLogitechMediaServer 2.21.00 (wieder) installiert, das Ding findet kaum Mediendateien (1371 statt 15.000). Bisschen den den Rechten der Ordner rumgeändert, danach den NAS neu gestartet.

    NAS fährt wieder hoch und SSDs werden wieder nur mehr mit 1,5Gbps angefahren, SSD in Slot 2 ausgefallen, RAID degraded.


    Ich fahre das NAS herunter, baue alles aus und ab (SSDs, USB Laufwerke, Tastatur, etc.), blase die Kiste wie empfohlen aus, baue alle SSDs und stecke das zwingend notwendige USB-Laufwerk wieder ein, starte alles wieder.

    Beim Hochfahren keine Meldung, dass RAID degraded wäre, die LEDs aller Slots waren grün, als wäre alles okay. Auch kein Piepsen oder rot blinkende Status-LED beim Hochfahren. Schien alles okay.


    In der Datenträgerverwaltung sehe ich dann, dass SSDs in Slots 1&2 ausgefallen sind. SSDs ausgebaut, wieder eingesetzt... alles okay, mit 6Gbps erkannt, RAID rebuild läuft wieder an.
    QLMS hab ich jetzt mal deinstalliert, immerhin ist es keine signierte App, nicht dass es Schuld sein sollte, was ich mir aber nicht wirklich vorstellen kann.


    Bin mittlerweile echt ratlos, eventuell Hardware Defekt?
    Sonst noch Ideen?


    Kopfkratzende Grüße

    Dan

  • Samsung 860evo 1TB

    Ja, stehen sie (bzw standen sie zum Zeitpunkt des Kaufes), extra deswegen gekauft.

    Was das Wert ist (Chips und Archtiektur bleibt ja im Laufe eines Produktlebens ja nicht gleich), steht natürlich auf einem anderen Blatt...



    Edit: Ja, stehen noch immer drauf, auch die Firmware passt.

    Einmal editiert, zuletzt von TeHaiX ()

  • Dann mache ein Ticket auf, das ist dann ein Fehler in der neuen Firmware.


    Hatte das mal mit Adata X6000er, waren aber auch nicht auf der Liste.

    QNAP hat es dann fixed, 2 Updates später.


    Also ggf. mal ein Firmware Downgrade versuchen.

  • Jetzt erst gelesen und mir scheint, du könntest Recht haben.


    Bin vorhin auf 1381 wieder runter und das NAS läuft, alles wird richtig erkannt... werde mal weiter beobachten und berichten.


    Und wieder einmal bestätigt sich: never change a running system!

  • Und wieder einmal bestätigt sich: never change a running system!

    [OT]Hat noch nie gestimmt und sich erst recht nie bestätigt. Such dir einen beliebigen Zeitpunkt in deiner Geschichte oder der deines Ortes oder der Weltgeschichte: meistens hat zu der Zeit alles gut funktioniert, aber trotzdem geht es heute besser. Weil man "runnings systems" geändert hat.


    Mein erster privater PC Mitte der 90er mit MS-DOS (oder wars schon WfW 3.11?) lief prima, dennoch habe ich ihn immer wieder mal durch einen besseren ersetzt und bin auch betriebssystemseitig über diverse Zwischenstufen bei Windows 10 angekommen.

    Ich setze dir also mal ein "Das Bessere ist des Guten Feind" entgegen - und das kann manchmal auch eine ältere Firmware sein. ;)


    Du meinst wohl eher "never change a winning team" :D

    [/OT]

  • Guten Morgen zusammen.


    Mit dem TS-453D mit zwei SSD 860 EVO 1 TB im Raid 1 habe ich seit Einbau der Netzwerkkarte QNAP QXG-5G1T-111C auch das Problem, dass die Übertragungsrate laut Leistungstest von 540 MB/sec auf 135 MB/sec gesunken ist (aktuelle Geschwindigkeit 1,5 Gbps zu max. Geschwindigkeit 6 Gbps). Zuvor mit einem QNA-UC5G1T 5G USB 3.0 Adapter gab es dieses Problem nicht (siehe Messwerte unten).


    Zuerst dachte ich, es liegt an der neuen Netzwerkkarte, aber dann sah ich auch die reduzierte Geschwindigkeit von nur 1,5 Gbps.

    PC und TS-453D sind direkt über ein Cat7 Kabel verbunden. Für das SSD-Raid (Speicherpool 1) ist SED aktiviert (Nutzung der Samsung eigenen Verschlüsselung). MTU ist auf 9000 eingestellt.


    Werte mit CrystalDiskMark für das SSD-Raid

    PC (ASUS XG-C100C 10G Karte) zu TS-453D (QNA-UC5G1T 5G USB 3.0 Adapter): Read 453 MB/s, Write 347 MB/s

    PC (ASUS XG-C100C 10G Karte) zu TS-453D (QXG-5G1T-111C 5G Karte): Read 360 MB/s, Write 138 MB/s


    Vergleichswerte für das zweite Raid1 mit 2 Seagate IronWolf Platten 10 TB (Speicherpool 2)

    PC (ASUS XG-C100C 10G Karte) zu TS-453D (QNA-UC5G1T 5G USB 3.0 Adapter): Read 444 MB/s, Write 264 MB/s

    PC (ASUS XG-C100C 10G Karte) zu TS-453D (QXG-5G1T-111C 5G Karte): Read 360 MB/s, Write 233 MB/s


    Ein Neustart brachte keine Verbesserung. Ob der Ausbau der Karte eine Änderung bewirkt, muss geprüft werden.

    Weiterhin fällt auf, dass z.B. im Read der USB 3.0 Adapter eine höhere Geschwindigkeit erreicht (ca. 3,6 Gbps zu 2,9 Gbps). Dies liegt wahrscheinlich an der Begrenzung durch den PCIe 2.0 Slot in dieser Konfiguration mit 4 Gbps (minus Protokoll-Anteil). Außer der MTU Einstellung habe ich im QNAP Menü keine weiteren Konfigurationsmöglichkeiten für die Netzwerkkarte gefunden. Die Asus Karte konnte ich z.B. wunderbar am PC optimieren.


    Alle Komponenten sind neu und ohne Staub :) Die Firmware-Version ist 4.5.1.1495.


    Ich werde wohl ein Ticket aufmachen müssen.


    Ob die QXG-5G1T-111C 5G Karte ein Fehlkauf war, muss ich noch prüfen. Vom QNA-UC5G1T 5G USB 3.0 Adapter bin ich überzeugt. Der arbeitet wunderbar auch an meiner DS-918+ und ermöglicht mehr Durchsatz. Falls die 10G QNAP Karte im TS-453D wenigsten 5G ermöglichen würde, wäre dies wunderbar.


    Da ich von meiner DS-918+ das IronWolf Health Management kenne, war ich erfreut, dass auch QNAP dies anbietet. Leider musste ich feststellen, dass wohl seit über einem Jahr QNAP immer noch nicht die Seagate-Firmware SC61 unterstützt, sondern nur die "alte" SC60.


    Hoffentlich wird QNAP zeitnah eine Lösung zur Verfügung stellen.



    Ich wünsche Euch allen einen guten Rutsch und bleibt gesund.

    nas4data

    Einmal editiert, zuletzt von nas4data ()

  • [OT]

    meistens hat zu der Zeit alles gut funktioniert

    Hängt immer stark davon ab, was man unter "gut" versteht.

    Ist wohl eine Charaktersache, aber der Mensch neigt typischerweise nicht nur dazu, sich rückwirkend Dinge schön(er)zudenken, sondern sich mit der Zeit mit minderen Dingen zufrieden zugeben.

    In diesem Sinne: never settle


    [/OT]


    nas4data

    "Freut" mich, dass ich nicht alleine bin mit dem Problem.

    Wie war der zeitliche Ablauf zwischen Firmware update und dem Netzwerkkarteneinbau? Bei mir lief 1495 ja ein paar Wochen unauffällig.

    Ich habe mit der FW 1381, das ich länger laufen gehabt habe, nachwievor keine Probleme. Viellicht versuchst du auch mal eine ältere FW.