Festplatte kaputt? Was nun?

  • Hallo zusammen,


    vielen Dank für die angeregte und detaillierte Diskussion!

    Im Prinzip wurde ja schon alles gesagt was wir auch nicht besser hätten ausführen können.. ;)


    Vielleicht noch ein Beispiel, um es dem "Normalsterblichen" ohne detailliertes technisches Hintergrundwissen etwas einfacher zu machen: na klar gab es vor einigen Jahren die einfache Festplatte für alle Zwecke und das wars. Die Ansprüche, Datenmengen, Workloads etc. sind aber dermaßen gestiegen, so dass auch die HDDs immer spezifischer wurden.

    Die Desktop-Platten sind natürlich die günstigste Variante und stark kostenoptimiert. Das macht sie zu keiner "schlechteren" Platte, solange die dafür vorgesehenen Werte nicht überschritten werden. Hier mal der Vergleich BarraCuda vs. Ironwolf:


    BarraCuda (Desktop)

    Betriebsstunden/Jahr: 2400h/Jahr

    Workload-Rate/Jahr: 55TB/Jahr


    IronWolf (NAS)

    Betriebsstunden/Jahr: 8760h/Jahr

    Workload-Rate/Jahr: 180TB/Jahr


    Den den meisten Usern reicht eine Desktop-HDD absolut aus. Man sollte sich vor Augen halten, dass selbst die im Vergleich gering aussehenden Werte bei den Desktop-HDDs immer noch ca. 150GB/Tag bzw. 8h/Tag bedeuten. Insbesondere der Datendurchsatz wird von dem Durchschnitts-User oft stark überschätzt und meist deutlich unterschritten...


    Bei den "höherwertigen" Platten deren Vorteile ja hier bereits diskutiert wurden, geht es eher ums Finetuning der Firmware. So kann man z.B. hinsichtlich Workload und Betriebsstunden auch eine SkyHawk im NAS verwenden - das volle Potenzial der Platte wird allerdings in einem Setup mit 80-90% Schreibvorgängen (z.B. im Zusammenspiel mit Überwachungskameras) erreicht! Die IronWolf ist bezüglich der Lese-/Schreiboptimierung etwas balanzierter.


    Zum Thema Backblaze wurden eigentlich auch die wichtigsten (objektiven) Punkte genannt. Wir halten uns da lieber etwas zurück - verweisen aber eben gerne mal auf Quellen, die sich neben den fett gedruckten Überschriften auch mal die Details und die Vorgehensweise anschauen, die zu den teilweise doch sehr fragwürdigen Statistiken führen..

  • Zum Thema Backblaze wurden eigentlich auch die wichtigsten (objektiven) Punkte genannt.

    Meine Wissensfrage drehte sich ja um die besondere Festplatten-Firmware für Raid-Systemen im Vergleich zu Desktop Platten. Ich wiederhole das aber gerne noch einmal: Wenn also Desktop-Platten in Raidsystemen ohne die Fehlerkorrektur-Routinen so anfällig gegen Ausfälle sind, wieso werden sie dann trotzdem zu zehntausenden von Blackblaze und vermutlich auch anderen Serverzentren eingesetzt? Das Kosten-Nutzenverhältnis muss ja trotz alledem stimmen, sonst würden Sie es ja nicht tun. (bzw. die letzten Jahre getan haben.)

  • Wenn also Desktop-Platten in Raidsystemen ohne die Fehlerkorrektur-Routinen so anfällig gegen Ausfälle sind, wieso werden sie dann trotzdem zu zehntausenden von Blackblaze und vermutlich auch anderen Serverzentren eingesetzt?

    Also die ursprüngliche Idee von Backblaze war eigentlich, immer die billigsten Platten ohne Rücksicht auf Verluste zu nehmen. Man hat auch eigene Server Gehäuse gebaut ( die "Pods" ) und außerdem die Daten erheblich redundanter gespeichert, um bei zu erwartenden Ausfällen gewappnet zu sein. Zum Teil kann man das glaube ich auch auf deren Webseite nachlesen. Als sie angefangen haben war allerdings der Preisunterschied zwischen Server und Desktop-Platten erheblich größer, so dass diese Mischkalkulation durchaus sinnvoll war. Nebenbei haben sie dann ihre Ausfallstatistiken auf der Basis generiert. Mittlerweile ist es aber wohl so, dass auch Backblaze normale "NAS" Platten verwendet, weil die einfach nicht mehr so viel teurer als Desktop-Platten sind. Jedenfalls nicht die hohen Kapazitäten. Das war/ist halt ihr Alleinstellungsmerkmal, weil man für einen festen Betrag monatlich "unbegrenzt" Speicher bekommt, allerdings pro Computer, den man sichert. Andere Serverzentren machen das eher nicht so. Vermutlich benutzen sie auch kein normales RAID, so dass die Firmware Limitierungen da nicht zum tragen kommen. Im Gegensatz zu "normalen" RAID Szenarien, wo Desktop-Platten bei Lesehängern dieses eben schnell in den "Degraded" Zustand überführen, weil sie halt "ewig" versuchen einen Sektor zu lesen. Die "Anfälligkeit" muss nicht unbedingt höher sein, aber mechanisch sind 24/7 sicherlich robuster gebaut.

  • Danke dir, das wäre eine Erklärung. Wenn man aber "mit erheblicher Redundanz" gearbeitet hätte, dann würde die Kosten-Nutzen-Rechnung nicht mehr stimmen. Im Grunde genommen, muss sich doch alles daran ausrichten.

    Bezüglich der Raid-Fähigkeit der Desktop-Platten könnte ich mir allerdings auch vorstellen, dass sie von Seagate eine angepasste Firmware bekommen haben. Wenn sich der Seagate Kollege zu dem Thema in Schweigen hüllt, kann ich auch mal spekulieren. ;) Beenden wir ruhig die Diskussion an dieser Stelle.

  • Danke dir, das wäre eine Erklärung. Wenn man aber "mit erheblicher Redundanz" gearbeitet hätte, dann würde die Kosten-Nutzen-Rechnung nicht mehr stimmen. Im Grunde genommen, muss sich doch alles daran ausrichten.

    Naja, die haben sich das damals schon gut überlegt.

    Siehe auch : Detailed Backblaze Storage Pod Parts and Vendor List


    Der Post ist von 2009, also schon ein Weilchen her. Damals waren echte Serverplatten sicherlich 3x oder mehrmals so teuer wie große Desktop Platten. Wenn man dann stumpf rechnet dass man im Großeinkauf Restposten etc. noch günstiger kriegt, dann kann sich das schon rechnen. Und wenn ich dann einfach mit einem simplem Mechanismus die Daten verdopple oder verdreifache ohne den RAID Schnickschnack dann kann auch mal eine Platte ausfallen. Dann habe ich Spare Pods, die dann automatisch wieder Redundanz aufbauen usw. Also die sind solange im Geschäft, dass das wohl funktioniert.


    Bezüglich der Raid-Fähigkeit der Desktop-Platten könnte ich mir allerdings auch vorstellen, dass sie von Seagate eine angepasste Firmware bekommen haben

    Das glaube ich eher nicht, dass wäre bei einer sehr simplen Redundanz Strategie auch gar nicht nötig. Wenn eine Platte ausfällt wird einfach aus dem Sparepool eine neue mit den übrigen Daten befüllt. Da die Typen und Chargen breit gestreut sind dürfte sich das Ausfallrisiko auch verteilen. Und wenn ich es ganz schlau anstelle, würde ich per SMART in meinem Storagemanager dafür sorgen, dass der die Daten immer automatisch über möglichst viele Typen / Hersteller redundant verteilt.

  • Nun habe ich inspiriert durch deinen Link mal ausführlich kreuz und quer gelesen. Früher hat Blackblaze tatsächlich auf Basis von Linux Raid-6 Systemen gearbeitet. Heute schaffen Sie wohl Redundanz (17+3) durch eigene Algorithmen. Möglich, dass sie dadurch die Firmware Nachteile der Desktop-Festplatten berücksichtigen können.
    Interessant ihre Maxime:

    • Don't make hardware redundant
    • use commodity part
    • use consumer harddrives

    Ist schon ein bemerkenswerter Ansatz den Blackblaze da verfolgt und offensichtlich auch erfolgreich umsetzt. Ich weiß nicht, ob du das hier kennst.

  • Ist schon ein bemerkenswerter Ansatz den Blackblaze da verfolgt und offensichtlich auch erfolgreich umsetzt. Ich weiß nicht, ob du das hier kennst.

    Neee, den kannte ich nicht. Bin eigentlich auch kein Blackblaze Kenner, aber sie tauchen durch ihre Statistik halt immer mal wieder auf und ihr Konzept ist schon rel. einmalig.


    Möglich, dass sie dadurch die Firmware Nachteile der Desktop-Festplatten berücksichtigen können.

    Nun, es hat ja immer Vorteile sich nicht von den Mechanismen einer Blackbox Firmware abhängig zu machen. Gerade bei dem Konzept, wo man wild irgendwelche Platten kauft und sich schlichtweg nicht auf bestimmte Randbedingungen verlassen kann.

  • Hallo Leute, ich habe jetzt nochmal die gleiche Festplatte bestellt und gestern eingebaut. Rebuild hat wunderbar geklappt und jetzt läuft alles! Danke für eure Hilfe!!

  • Wenn sich der Seagate Kollege zu dem Thema in Schweigen hüllt, kann ich auch mal spekulieren. ;) Beenden wir ruhig die Diskussion an dieser Stelle.

    Der hat auch keine 24/7/365-Schicht und manchmal Wochenende... ;)


    Wenn also Desktop-Platten in Raidsystemen ohne die Fehlerkorrektur-Routinen so anfällig gegen Ausfälle sind, wieso werden sie dann trotzdem zu zehntausenden von Blackblaze und vermutlich auch anderen Serverzentren eingesetzt? Das Kosten-Nutzenverhältnis muss ja trotz alledem stimmen, sonst würden Sie es ja nicht tun. (bzw. die letzten Jahre getan haben.)


    Ihr habe es ja in der Folge ausgiebig diskutiert - übrigens danke an dieser Stelle für die interessanten Links, die wir auch mal intern weitergeleitet haben!

    Die Frage können wir schlichtweg nicht beantworten, sondern die müsstest Du wirklich mal an Backblaze direkt richten. Wir raten ja wie oben bereites erläutert dringend von solchen Praktiken ab. Aber das alles war Teil einer insgesamt etwas unglücklichen Historie mit teilweise wirklich unglücklichen Veröffentlichungen. Dass so etwas dann eine gewisse Eigendynamik im Internet bekommen kann ist ja auch klar..


    Was aber wirklich von Interesse ist: die Sinne der User und auch der Firmen für einsatzspezifische Platten sind in letzter Zeit deutlich geschärft und den Herstellern (allen Herstellern!) ist es auch wichtig, dies entsprechend effektiv zu kommunizieren. So haben dann in der Folge hoffentlich alle etwas davon und daran arbeiten wir weiter!


    Vielen Dank Euch allen für die angeregte Diskussion und auf bald! ;)