SMART Warnungen häufen sich

cbk · 16. März 2019

Moin,

ich betreibe hier eine TVS-863 mit acht 10TB Iron Wolf Platten in einem großen Raid 5 Verbund. Die Platten sind unterschiedlich alt. Die Älteste hat inzw. 900 Tage geschafft, die drei Jüngsten 730 Tage.

Vor einer Woche hat eine der jüngsten Platten gemeldet, daß 16 Blöcke defekt sind.

Code

"Host: Disk 8": Medium Error. Run a bad block scan on the drive. Replace the drive if the error persists."

Also habe ich eine neue 10TB Iron Wolf gekauft, einen Rebuild des RAID durchgeführt und danach die alte Platte auf Garantie eingeschickt. Am Mittwoch kam eine Ersatzplatte von Seagate zurück.

Gestern hat sich eine weitere der jüngsten Platten gemeldet, Platte 6. Diesmal sind 8 Blöcke defekt. So habe ich dann die soeben als Ersatz zugeschickte Platte genommen, um sie als Ersatz für Platte 6 zu nutzen. Das Rebuild läuft gerade (dauert immer so 22 Stunden) mit höchster Priorität.

Was meint ihr? Sollte ich vorsorgllich gleich alle Platten durchtauschen? Gab es da irgendwo mal eine schlechte Produktionscharge?

Und bevor jemand kommt mit "Wofür braucht der ein Raid 5 aus acht 10TB Platten mit insg. 63TB Nutzdaten?" Von den 63TB sind 61TB voll.

FSC830 · 16. März 2019

Zitat von cbk

Von den 63TB sind 61TB voll.

Dann hast Du sicherlich auch eine gute Backup-Strategie , sonst würde ich an Deiner Stelle unruhig schlafen.

Wenn jetzt schon 2 der Platten mit SMART Fehlern rum zackern hätte ich zumindest 1 oder 2 in Reserve.

Alle ist evtl. übertrieben, ich habe 4 NAS in Betrieb und mir sind in den letzten 4 Jahren in Summe 4 HDDs gestorben, eine davon mit sofortigem "Error", die anderen wurden "proaktiv" nach SMART Meldungen ausgetauscht.

Dennoch halte ich es persönlich für sicherer bei solchen Plattenkapazitäten mit Raid 6 zu arbeiten, aber das ist jedem selbst überlassen.

Gruss

phoneo · 16. März 2019

Moin,

ich bin kürzlich über diesen Artikel gestolpert. Es wird dort betrachtet, in wieweit Raid5/6 - Systeme bei steigendem Speicherbedarf und größeren Festplattengrößen überhaupt noch ihre vormals angedachte Eigenschaften erfüllen. Hinzugezogen werden statistische Fehlerraten, z.B. für nicht korrigierbare Lesefehler (URE), die auch bei "intakten" Platten möglich sind. Fällt in einem Raid5 System eine Platte aus und muss ein Rebuild Prozess gestartet werden, ist die Wahrscheinlichkeit für einen nicht behebbaren Bitfehler der verbleibenden Platten umso größer, je größer die Kapazität der Platten ist und natürlich auch größer durch die Anzahl der Platten im Raidverbund.

Die aktuelle statistische Fehlerrate URE liegt bei 1 Bit auf 10^14 Bits. Im Artikel wird dies auf 12TBytes umgerechnet. Statistisch gesehen schlummern also in deinem Raid-Verbund mit 61TB fünf unlesbare Bits.

Soweit die Therorie ...

Crazyhorse · 16. März 2019

Ab der 6TB HD ist das verbessert worden auf 10^15, also rechen noch mal nach. Kannst im Datenblatt gern nachlesen, wenn das nicht glaubst.

https://www.seagate.com/www-co…DS1904-9-1707DE-de_DE.pdf

Aber bei der Menge und bei 8HDs hätte ich auch lieber ein Raid 6 gebaut, da kannst du einen Lesefehler korrigieren, da immer 3 Infos bereit stehen. 1: Daten, 2 Paritiy1 und 3 Pariry2, damit kann man schon wieder viel retten.

Sehr gute Rebuild Zeit, für die Größe!

Wo das Teil eh voll ist, brauchst du doch bestimmt eh in kürze was größeres, das alte kannst dann ja immer noch fürs Backup verwenden

phoneo · 16. März 2019

Da gibt es nicht viel zu rechen, das wäre dann eine Zehnerpotenz mehr. Allerdings muss man sich doch fragen, warum ab einer "magischen" Grenze von 6TB, sich die Fehlerrate verbessert? Warum gilt eine URE von 10^15 nicht auch bei kleineren Platten? Technologisch hat sich aus meiner Sicht nicht viel getan und rein von Grundsatz her würde ich sagen, dass Platten mit einer größeren Kapazität eine größere statistische Fehlerrate haben müssten als kleine. Bedingt dadurch, dass die Informationen "auf gleichem Raum" immer dichter gepackt werden müssen. Vielleicht kann der seagate_surfer mal was dazu schreiben. Bestimmt auch zu dem grundsätzlichen Problem des Threadstarters.

cbk · 16. März 2019

Zitat von Crazyhorse

Wo das Teil eh voll ist, brauchst du doch bestimmt eh in kürze was größeres

Ich hoffe mich ja immer noch mit dem jetzigen NAS soweit zu kommen, daß ich dann auf 16TB HDDs umsatteln kann.

Jagnix · 16. März 2019

Darf man fragen wofür du das NAS einsetzt ?

Ich meine 8 x 10 TB ist ja mal eine Hausnummer.

phoneo · 16. März 2019

Demnächst 8 x 16TB.... unendliche Weiten!

Ceiber3 · 16. März 2019

WD macht bei den red 10^14 und Seagate macht bei seinen Festplatten 10^15.

Auch ein Grund warum ich Seagate kaufe.

ich frag mich eher mit was du die 60 TB gefüllt hast. *Hust*

SMART Warnungen häufen sich

Vulnerability in Download Station

Vulnerability in QuLog Center

Vulnerability in Helpdesk

Vulnerability in curl

Bios TS-x73

Welche 6TB HDDS in QNAP TS 459

Eine meiner 4 TB NAS hat heute das klackern angefangen (LAUFZEIT nicht einmal 25 Tage!!!!)

TS433 - Seltsames Geräusch bei Festplatten

Seagate Ironwolf klickert metallisch

Tschüss QTS --- Ich werde künftig die Firmware von QNAP verweigern

(Betriebs)- System vs. Systemvolume - Hinweise zum Verständnis

Backup vom Smartphone (Android) mit FolderSync

QuDedup: Backup Job neu verlinken - Ein Ritt ins Verderben

Qnap & Syno – USV im Master-Slave-Mode

Kodi-Headless Server als Docker-Container

Hardware Praxis – „Hör mal wer da surrt“: Ein Erfahrungsbericht aus dem IT-Alltag

Hardware Praxis – Tipps zum Einbau einer neuen Festplatte: Ergänzung

Foren Update im Juli / August geplant

IT-Geschichten – Die verrückte Tastatur