TS-231p wirft jeden Mittwoch Festplatte raus

  • Moin, moin,


    ich habe hier ein kurioses Problem und zwar wirft seit dem 01.01.2020 mein TS-231p (FW 4.1.1146 ) meine zweite Festplatte raus und das jeden Mittwoch um ca. 03:00. Das sieht in den Logs dann wie folgt aus:


    Code
    Fehler	2020/01/01	03:38:27	System	127.0.0.1	Hardware Status	Drives	[Hardware Status] "Host: Disk 2": Disconnected.
    Fehler	2020/01/01	03:38:16	System	127.0.0.1	Storage & Snapshots	Disk	[Storage & Snapshots] Disk "Host: Disk 2" failed. Volume: RAID1.
    Warnung	2020/01/01	03:38:15	System	127.0.0.1	Storage & Snapshots	RAID Group	[Storage & Snapshots] RAID group "1" is degraded. Volume: RAID1.
    Informationen	2020/01/01	03:38:14	System	127.0.0.1	Storage & Snapshots	Volume	[Storage & Snapshots] Finished hot-removing disk "Host: Disk 2".
    Fehler	2020/01/01	03:37:46	System	127.0.0.1	Hardware Status	I/O Ports	[Hardware Status] Failed to access the installed drive. Check the drive for errors.

    Nach einem Neustart ist alles in Ordnung bzw. das RAID fängt an sich neu zu rebuilden.

    Bei den Festplatten handelt es sich um WD RED 4TB, die ca. 2,5 Jahre alt sind. Die Smartwerte sind alle gut, sprich ich denke es liegt nicht an den Festplatten.


    Ich habe in den Cronjobs nur einen passenden Eintrag gefunden


    Code
    /etc/init.d/backup_conf.sh

    welcher jeden Mittwoch um 03:04 ausgeführt wird, jedoch konnte ich das Problem damit nicht reproduzieren. Das merkwürdige ist halt wirklich das es nun dreimal hintereinander, am selben Wochentag und zur selben Uhrzeit (+- 20 Minuten) passiert ist.

    Hat jemand eventuell einen Lösungsansatz oder ein ähnliches Problem schon einemal gehabt? Besten Dank im voraus.

  • Da halte ich für einen Zufall.

    Das backup_conf.sh wirft keine Platten aus, das sichert die NAS Konfiguration.


    Das Platten als "removed" angezeigt werden, kommt in letzter Zeit öfter vor :(.

    Wenn es kein SW Bug ist, bleibt leider nur noch ein HW Fehler.


    Gruss

  • Das kann jetzt viele Ursachen haben und lässt sich aus der Ferne gar nicht beurteilen.


    Ich würde da, wenn so was bei mir auftritt, das genau beobachten und mir auch Gedanken machen, WAS den jeden Mittwoch um diese Uhrzeit vorfällt. Aber wirklich alles, nicht nur auf der NAS!


    Als Erstmaßnahme könntest du den/die besagten Jobs auf der NAS einfach deaktivieren, oder um ein Stunde vor oder zurückschieben, ist der Fehler dann noch immer um 3:00 ist es mal nicht dieser Job ...

    Es gibt auch Jobs, die nicht IMMER in der Crontab stehen (z.B. zeitgesteuertes Ein-/Ausschalten), diese Tasks tragen sich selber zur richtigen Zeit in die Cron ein und werden danach wieder von einem anderem Task überschrieben ...

    • Was läuft sonst noch um diese Zeit, ein Backupjob von einem anderem NAS, den du nicht auf diesem siehst?
    • Was sagen die Systemlogs sonst noch aus, was passiert kurz vorher?
    • Wie schaut es mit dem Strom aus? Ist der um diese Uhrzeit stabil? läuft da vielleicht irgendwas an, was viel Strom zieht?
    • Wie schaut es mit der Temperatur aus, wird es um diese Zeit in der Nähe des NAS wärmer?
    • Sind um diese Uhrzeit Erschütterungen (Straßenbahn, Eisenbahn, was weiß ich, wo du wohnst, ...)
    • ...

    Und (!) natürlich immer ein guter Kandidat, was war vor dem 1.1.? Hast du da eine neue FW upgedated? Schon mal mit der vorherigen versucht?

  • Danke für die Antworten.


    Das offensichtlichste ist mir natürlich entgangen, nämlich das ich am 28.12. die Firmware von 4.4.1.1117 auf 4.4.1.1146 durchgeführt habe. Habe nun erstmal wieder ein Downgrade auf 4.4.1.1117 durchgeführt und werde das ganze beobachten und berichten ob sich etwas geändert hat.

  • Kurze Info, mit der alten Firmware gab es keine Probleme heute Nacht. Mag eventuell Zufall sein, aber ich denke das sich ein Bug in der aktuellen Firmware befindet, die für diese Problematik gesorgt hat.