RAID 1 herabgestuft - SSDs mit Lese- u. Schreibfehler / SMART ohne Auffälligkeiten

  • Moin allerseits!


    Ich komme direkt zu Sache: meine TS-253Be hat ein Problem - und somit ich auch :D


    Kurz zur Hardware:

    • TS-253Be (QTS 5.1.4.2596)
    • 16GB RAM
    • Erweiterungskarte QM2-2S-220A
    • 2x Crucial CT1000MX500SSD4 auf der QM2-2S-220 (RAID 1 als "System")
    • 1x Seagate Exos X18 18TB (Komplettbackup vom TS-673A)


    Gestern wollte ich von extern auf meine TS-253Be zugreifen. Der Anmeldebildschirm baute sich nicht komplett auf und reagierte auch auf kein Kommando. Zu Hause stellte ich dann fest, dass sich das NAS aufgehangen hatte. Power-Button lange gedrückt, hart ausgeschaltet, kurz gewartet, eingeschaltet.


    Via PC konnte ich nach dem Boot auf die GUI zugreifen und musste feststellen, dass SSD1 ein Problem hat: sie hat eine Lese- und Rechtschreibstörung (kurz RLS ;) ). Laut den Logs besteht das Problem seit gestern Früh um 00:39 Uhr.

    Neustart - keine Besserung. Auch der schnelle und auch ausführliche SMART-Test bescheinigen der SSD einen guten Zustand. Das NAS selbst empfiehlt weiterhin die SSD zu tauschen.


    Soeben wollte ich das Dateisystem prüfen lassen, aber es gibt ein Problem: RLS scheint ansteckend zu sein und betrifft nun auch SSD2 - gute 25 Stunden nachdem SSD1 Fehler ausgab.


    Blöd ist nun, dass nach wie vor alles SSDs erkannt werden (Ressourcenmanager, Systemstauts), ich aber keinen Zugriff mehr auf die Datenträger über Speicher & Snapshots habe. Somit kann ich keine SMART-Test etc. durchführen.


    Mir stellen sich nun mehrere Fragen:

    1. Was ist das Problem? (Ich tippe auf einen Defekt der Erweiterungskarte, denn dass binnen 25 Stunden die zweite SSD ausgefallen ist, ist kein Zufall).
    2. Wie seht ihr mein Problem? Möglicherweise übersehe ich etwas.
    3. Wie würdet ihr nun vorgehen?
    4. Wie stelle ich sicher, dass das Komplettbackup erhalten bleibt?


    Um etwas Eigeninitiative zu zeigen fallen mir zu Frage drei zwei Möglichkeiten ein:

    1. Die Exos vom System sauber trennen und das NAS neu initialisieren und alles neu aufsetzen. Anschließend die Exos einsetzen und das Beste hoffen.
    2. den zuvor genannten Punkt umsetzen, aber die Erweiterungskarte ersetzen
    3. einen ganz anderen Weg wählen, angesichts der Tatsache, dass das NAS "nur" das hausinterne Fullbackup darstellt :D Hier müsste auf lange Sicht nochmal eine große HDD rein, Es sei angemerkt, dass ich die TS-673A in Zukunft mit QTS anstatt QuTs hero verwende. Die Gründe liegen in der miesen Performance von QuTS hero und ich mit QTS Snapshot Replicas auf der TS-253Be erstellen könnte. In den zuvor genannten Thread habe ich mich eingeklinkt und kann die Probleme des TE nachstellen.

    So, erst einmal vielen Dank fürs Lesen. Ich freue mich von euch zu hören.


    Schöne Grüße


    Sebastian

  • Hallo,


    das TS-253Be ist auch ein Kandidat für den Intel Clock Bug. Würde ich als erstes versuchen. ;)


    Der "Intel Clock Bug" - Massensterben bei QNAP mit Intel Prozessoren - NAS Hilfe und Support Forum (qnapclub.de)


    Könnte natürlich auch ein anderer Hardwarefehler sein. :/

    Ich würde als nächstes auf defekte SSD tippen. ;)

    Hinweis: Ich hatte vor einigen Wochen auch ein Problem mit einer SSD (PC). Alle Tools wiesen den Zustand als "gut" aus. ES gab aber verschiedene Probleme die ich aber nicht richtig zuordnen konnte. Erst nach dem endgültigen "Versterbens" des SSD war der Fehler eindeutig.


    - Alles Ausbauen und die 220A mit einer neuen SSD versehen, dann NAS starten.

    - Wenn das NAS läuft, war es die SSD

    - Dann würde ich es mit einer neuen SSD und einer der alten (SSD1-1) erneut versuchen. Evtl kannst Du das Raid neu aufbauen.

  • das TS-253Be ist auch ein Kandidat für den Intel Clock Bug.

    Prinzipiell schon, tatsächlich habe ich aber noch kein x53Be bzw Modell mit Apollo Lake CPU gesehen, die tatsächlich betroffen war. Auszuschließen ist es aber nicht.

  • das TS-253Be ist auch ein Kandidat für den Intel Clock Bug. Würde ich als erstes versuchen. ;)

    Den Artikel hatte ich tatsächlich schon gelesen, da mir die Thematik vom Hörensagen bekannt war. In der Ausführung von Tiermutter sehe ich bis dato noch nicht so den Zusammenhang (muss aber nichts heißen.



    Könnte natürlich auch ein anderer Hardwarefehler sein. :/

    Ich würde als nächstes auf defekte SSD tippen. ;)

    Jo, der Gedanke kann einem kommen. In meinen Augen ist es allerdings ein zu großer Zufall, dass binnen 25 Stunden beide SSDs über den Jordan gehen. Natürlich kommen beide von einem und dem selben Händler :D Wenn ich in diese Richtung tippen müsse schiebe ich die Schuld der QM2-2S-220A zu.



    Hinweis: Ich hatte vor einigen Wochen auch ein Problem mit einer SSD (PC). Alle Tools wiesen den Zustand als "gut" aus. ES gab aber verschiedene Probleme die ich aber nicht richtig zuordnen konnte.

    Ist mir in meinem TS-673A Ende Oktober auch untergekommen. SSD top, IOPS bei 10% der beworbenen Leistung.



    - Alles Ausbauen und die 220A mit einer neuen SSD versehen, dann NAS starten.

    Blöd ist, dass die 220A nur M.2 SATA nimmt, sprich mal eben tauschen ist da nicht, weil keine hier rumfliegt. Auf Verdacht eine kaufen wollte ich vorerst nicht. Im späteren Verlauf jedoch eine Option bzw. gleich drauf verzichten und lieber eine 10GbE-Karte für ein schnelleres Backup einbauen.


    Derzeit tendiere ich auf eine Neuinitialisierung des NAS, in der Hoffnung darüber Erkenntnisse zu gewinnen (z.B. durch eine erneute Legasthenie).



    €DIT:

    Nach einem Neustart habe ich die SSDs nochmal getestet, da ich wieder Zugriff drauf bekam. Ergebnisse siehe Anhang, aber vorab: es wurden Fehler gefunden.

  • Dann scheint hoffentlich nur die SSD1-2 defekt zu sein. Würde ich schnellstmöglich tauschen. ;)


    Die Preise auch für die M2-SATA sind auch stark gefallen.


    Ich habe in meiner 220A 2 WD Red SA500 im Einsatz. :)

  • Dann scheint hoffentlich nur die SSD1-2 defekt zu sein. Würde ich schnellstmöglich tauschen. ;)

    Mich wundert halt, dass erst SSD 1 und dann SSD 2 ausgestiegen ist, letztere mit detektieren Fehlern.



    Die Preise auch für die M2-SATA sind auch stark gefallen.

    Blöd nur, dass es die Crucial nicht mehr gibt, ich in Transcend kein Vertrauen habe (unbegründet) und Western Digital auf meiner No-Buy-Liste steht :D


    Nicht missverstehen, ich will mich gegen Vorschläge nicht wehren. Ich bin mir nur nicht sicher in welche Richtung ich das NAS nun aufziehen will. Neue SSDs ja nein. 10GbE ja nein. Und so weiter. Neue Wärmeleitpads würde ich für die 220A auch benötigen :D