SMART Warnungen häufen sich

  • Moin,

    ich betreibe hier eine TVS-863 mit acht 10TB Iron Wolf Platten in einem großen Raid 5 Verbund. Die Platten sind unterschiedlich alt. Die Älteste hat inzw. 900 Tage geschafft, die drei Jüngsten 730 Tage.


    Vor einer Woche hat eine der jüngsten Platten gemeldet, daß 16 Blöcke defekt sind.

    Code
    1. "Host: Disk 8": Medium Error. Run a bad block scan on the drive. Replace the drive if the error persists."

    Also habe ich eine neue 10TB Iron Wolf gekauft, einen Rebuild des RAID durchgeführt und danach die alte Platte auf Garantie eingeschickt. Am Mittwoch kam eine Ersatzplatte von Seagate zurück.


    Gestern hat sich eine weitere der jüngsten Platten gemeldet, Platte 6. Diesmal sind 8 Blöcke defekt. So habe ich dann die soeben als Ersatz zugeschickte Platte genommen, um sie als Ersatz für Platte 6 zu nutzen. Das Rebuild läuft gerade (dauert immer so 22 Stunden) mit höchster Priorität.


    Was meint ihr? Sollte ich vorsorgllich gleich alle Platten durchtauschen? Gab es da irgendwo mal eine schlechte Produktionscharge?


    Und bevor jemand kommt mit "Wofür braucht der ein Raid 5 aus acht 10TB Platten mit insg. 63TB Nutzdaten?" Von den 63TB sind 61TB voll.

  • Von den 63TB sind 61TB voll.

    Dann hast Du sicherlich auch eine gute Backup-Strategie ^^, sonst würde ich an Deiner Stelle unruhig schlafen.

    Wenn jetzt schon 2 der Platten mit SMART Fehlern rum zackern hätte ich zumindest 1 oder 2 in Reserve.

    Alle ist evtl. übertrieben, ich habe 4 NAS in Betrieb und mir sind in den letzten 4 Jahren in Summe 4 HDDs gestorben, eine davon mit sofortigem "Error", die anderen wurden "proaktiv" nach SMART Meldungen ausgetauscht.

    Dennoch halte ich es persönlich für sicherer bei solchen Plattenkapazitäten mit Raid 6 zu arbeiten, aber das ist jedem selbst überlassen.


    Gruss

    Einmal editiert, zuletzt von FSC830 ()

  • Moin,


    ich bin kürzlich über diesen Artikel gestolpert. Es wird dort betrachtet, in wieweit Raid5/6 - Systeme bei steigendem Speicherbedarf und größeren Festplattengrößen überhaupt noch ihre vormals angedachte Eigenschaften erfüllen. Hinzugezogen werden statistische Fehlerraten, z.B. für nicht korrigierbare Lesefehler (URE), die auch bei "intakten" Platten möglich sind. Fällt in einem Raid5 System eine Platte aus und muss ein Rebuild Prozess gestartet werden, ist die Wahrscheinlichkeit für einen nicht behebbaren Bitfehler der verbleibenden Platten umso größer, je größer die Kapazität der Platten ist und natürlich auch größer durch die Anzahl der Platten im Raidverbund.


    Die aktuelle statistische Fehlerrate URE liegt bei 1 Bit auf 10^14 Bits. Im Artikel wird dies auf 12TBytes umgerechnet. Statistisch gesehen schlummern also in deinem Raid-Verbund mit 61TB fünf unlesbare Bits.


    Soweit die Therorie ...

    Einmal editiert, zuletzt von phoneo ()

  • Ab der 6TB HD ist das verbessert worden auf 10^15, also rechen noch mal nach. Kannst im Datenblatt gern nachlesen, wenn das nicht glaubst.

    https://www.seagate.com/www-co…DS1904-9-1707DE-de_DE.pdf


    Aber bei der Menge und bei 8HDs hätte ich auch lieber ein Raid 6 gebaut, da kannst du einen Lesefehler korrigieren, da immer 3 Infos bereit stehen. 1: Daten, 2 Paritiy1 und 3 Pariry2, damit kann man schon wieder viel retten.


    Sehr gute Rebuild Zeit, für die Größe!

    Wo das Teil eh voll ist, brauchst du doch bestimmt eh in kürze was größeres, das alte kannst dann ja immer noch fürs Backup verwenden;)

  • Da gibt es nicht viel zu rechen, das wäre dann eine Zehnerpotenz mehr. Allerdings muss man sich doch fragen, warum ab einer "magischen" Grenze von 6TB, sich die Fehlerrate verbessert? Warum gilt eine URE von 10^15 nicht auch bei kleineren Platten? Technologisch hat sich aus meiner Sicht nicht viel getan und rein von Grundsatz her würde ich sagen, dass Platten mit einer größeren Kapazität eine größere statistische Fehlerrate haben müssten als kleine. Bedingt dadurch, dass die Informationen "auf gleichem Raum" immer dichter gepackt werden müssen. Vielleicht kann der seagate_surfer mal was dazu schreiben. Bestimmt auch zu dem grundsätzlichen Problem des Threadstarters.

  • Wo das Teil eh voll ist, brauchst du doch bestimmt eh in kürze was größeres

    Ich hoffe mich ja immer noch mit dem jetzigen NAS soweit zu kommen, daß ich dann auf 16TB HDDs umsatteln kann.

  • WD macht bei den red 10^14 und Seagate macht bei seinen Festplatten 10^15.

    Auch ein Grund warum ich Seagate kaufe. :D


    ich frag mich eher mit was du die 60 TB gefüllt hast. *Hust* 8o