Extrem schnell steigender Load_Cycle_Count SS839 pro

  • Hallo zusammen,


    ich habe ein gravierendes Problem mit meinem SS839 pro, bzw. den Festplatten darin.


    Nachdem mir grade eine meiner Platten (nach nur 6 Monaten Betrieb) ausgefallen ist habe ich festgestellt dass alle eingebauten Platten einen Load_Cycle_Count von über 3 Millionen (!!!!!) haben! Ein Wunder, dass sie überhaupt so lange gehalten haben!
    Ich habe das etwas beobachtet und festgestellt, der Load_Cycle_Count wächst je nach Aktivität auf den Platten um 100 bis zu fast 1000 cycles pro Stunde (auch bei abgeschaltetem PowerManagement des NAS)! Scheinbar fährt der Schreib-/Lesekopf nach fast jeder Operation sofort wieder in die Parkposition. Da die Platten nur bis 600.000 load cycles spezifiziert sind, ist der Plattentod in kürzester Zeit vorprogrammiert.


    Ein bisschen Recherche im Internet hat mich zu der Überzeugung gebracht, dass das wohl ein generelles Problem von Notebook Festplatten (mit per default recht aggressiv eingestelltem eigenem Powermanagement) und dem ext3/ext4 Dateisystem ist. Es sind auch normale Linux Distributionen betroffen. Siehe z.B. hier:


    http://ubuntuforums.org/showth…hlight=information+laptop


    Für Ubuntu und ähnliche gibt es scheinbar ein paar mehr oder weniger saubere fixes, aber die sind auf das Linux im NAS natürlich alle nicht anwendbar (jedenfalls wüsste ich nicht wie)...


    Hat irgendjemand eine Idee, wie hier am besten vorzugehen ist? Kann man das platteneigene Powermanagement irgendwie deaktivieren? Gibt's von Seiten QNAP irgendeinen Fix? Ist das Problem hier überhaupt schon in der Form aufgetreten?


    Ich trau mich das Ding gar nicht mehr einzuschalten, weil ich befürchte, dass mir plötzlich mehr als eine Platte gleichzeitig über den Jordan geht...

  • Hi!


    Irgendwie sehe ich in Deinem Post nicht, um welche Platten es sich handelt (Hersteller, Type, etc.)


    Das wäre hilfreich zu wissen, damit man Dir evtl. hier Tipps geben kann...


    Cheers,
    Zap

  • Hallo,


    danke für Deine Antwort. Ich habe den Plattentyp nicht dazugeschrieben, weil es anscheinend unabhängig vom Plattentyp auftritt.


    Ich hatte erst die Samsung HM500JI drin, habe nach dem Ausfall der ersten Platte dann aber auf Seagate ST9500420ASG gewechselt und jetzt wieder das selbe Phänomen...

  • Hi!


    Hmm... da kann ich Dir leider bei beiden Plattentypen nicht weiterhelfen.


    Wären es Platten von WD, z.B. EARS oder EADS, gewesen, hätte ich Dir ein Tool nennen können, mit dem man das schnelle Ansteigen des LCC hätte verhindern können.


    Vielleicht hat ja ein Anderer hier im Forum einen Tipp für Dich...


    Cheers,
    Zap

  • Hi,


    ich glaube Dir wird nichts anderes übrig bleiben als beim Offiziellen Support ein Ticket auf zu machen. Was die HM500JI angeht.


    Die ST9500420ASG steht nicht in der Kompatibilitätsliste... (wer weiss warum - entweder nicht getestet oder nicht Durch die QM gelaufen).
    Wenn man danach googelt findet man einen Haufen berichte, dass Diese Platte eigentlich ohne ein FW Update unbrauchbar ist.


    Zitat

    Diese Platte kann man ohne Firmware-Update sofort in die Tonne werfen.
    Ich höre ein ständiges Klick-Geräusch, worauf ich festgestellt habe, dass der Schreib-/Lesekopf ständig in die Parkposition gefahren wird. Natürlich ist der S.M.A.R.T. Wert "Load Cycle Count" auch innerhalb kürzester Zeit enorm angestiegen. Außerdem steigen auch die "Raw Read Error Rate" und die "Seek Error Rate" kontinuierlich an.


    Quelle:
    http://www.heise.de/preisvergleich/?sr=388980,-1


    Ich denke dass dürfte es erklären. ;)


    Grüsse, David

  • Hi zusammen,


    leider muss ich mich anschließen, ich finde die Load Cycle-Zahl auch beunruhigend. Bei mir läuft seit ca. 3 Wochen ein SS-839 Pro mit 8x WDC WD5000BEVT-00A0R01.0, davon ist eine als Spare eingerichtet, die anderen als RAID6 mit EXT3-Filesystem (hätte ich mal EXT4 genommen...)
    Nun habe ich bereits folgende Counter:


    Disk 1: 8585
    Disk 2: 8574
    Disk 3: 8603
    Disk 4: 8589
    Disk 5: 8504
    Disk 6: 8542
    Disk 7: 8594
    Disk 8: 5159 (Spare!)


    Rein rechnerisch bedeutet das, dass die Platten ~400mal täglich geparkt werden. WTF?
    Mir ist leider bisher immer noch nicht klar, ob jetzt das QNAP selbst für das häufige Parken und Hochfahren der Disks zuständig ist, oder ob diese aus Stromspargründen selbständig nach einer recht kurzen Idle-Zeit herunterfahren. Aber zumindest der Spare sollte doch eigentlich erst zum Einsatz kommen, wenn eine andere Platte ausfällt, da würde ich erwarten, dass der normalerweise gar nicht läuft bzw. höchstens mal gelegentlich geprüft wird. Wenn das Spare-Laufwerk aber jetzt schon so offensichtlich "verschlissen" wird, dann ist es ja schon total vernudelt, wenn es zum Einsatz kommt. Das System wird damit vermutlich dann auch nicht sehr lange stabil laufen. Wo ist dann der Gewinn, wenn man ein Spare-Laufwerk vorsieht? Dann kann ich es ja besser in die Schublade legen.
    Aus meiner DV-lastigen Ausbildung weiß ich, dass es Platten besser geht, wenn sie die ganze Zeit laufen, als wenn sie ständig hoch- und runterfahren. Gibt es irgendein Tool, um alle Platten in, sagen wir, Abständen von je einer Minute zu "pingen", damit sie nicht herunterfahren?
    Gibt es ansonsten speziell für die WD-Platten ein Tool, um deren Power Management-Einstellungen mal anzuschauen und ggf. zu ändern? Und zwar eines, das möglichst auf dem Qnap anwendbar ist, so dass man die Platten nicht ausbauen und am PC andocken muss? Unwahrscheinlich...


    Danke schonmal und viele Grüße
    Joe

  • Keine Meinung dazu?
    Ich habe gerade noch mal nachgeschaut, QNAP listet die WD5000BEVT durchaus in der Kompatibilitätsliste für den SS-839 Pro, und zwar ohne Einschränkung.
    Aber das Verhalten der Hardware ist ein Alptraum. Wenn man genau darauf achtet, hört man tatsächlich dauernd irgendeine Platte hoch- und runterfahren, scheinbar sogar bei hoher Last, z.B. wenn ich über's LAN ein Backup vom PC zum QNAP mache. Das kann's doch nun wirklich nicht sein...
    Die Counter sind mittlerweile hier:


    Disk 1: 10117
    Disk 2: 10132
    Disk 3: 10173
    Disk 4: 10166
    Disk 5: 10066
    Disk 6: 10104
    Disk 7: 10160
    Disk 8: habe ich vorsichtshalber entfernt. Hot Spare ist schön und gut, aber wenn die Platte in dem Moment des Notfalls schon kaputt vom vielen Parken ist, wo sie eigentlich hätte idle sein sollen, nehm ich sie lieber erst her, wenn's so weit ist. Dann bleibt wenigstens die eine heil.


    Von WD gibt's inzwischen eine Support-Antwort, leider nicht befriedigend. Die Platte sei nicht für den RAID-Betrieb ausgelegt, weil ihr das TLER-Feature fehle, und man empfiehlt mir, die RAID-Editions RE3/RE4 von WD zu kaufen... die es natürlich nicht im 2,5"-Format gibt! :-/
    Das TLER- oder bei anderen Herstellern auch CCTL-Feature ist leider selbst in den Herstellerspezifikationen nicht zu finden. Woher weiß ich also jetzt, dass die Nächste Charge Laufwerke besser funktioniert?
    Was ist das nur für ein Mist...

  • Hallo,


    ich bin mittlerweile zumindest sicher, dass es nichts mit dem Plattentyp zu tun hat, sondern dass es ein Problem der Linux Firmware auf dem NAS im Zusammenhang mit Notebook Festplatten im Allgemeinen ist.
    Zum einen habe ich inzwischen alle meine 8 Platten gegen andere Modelle getauscht und das Problem besteht weiterhin. Dass Du mit den WD Platten nun ebenfalls das selbe Problem hast bestätigt meine Einschätzung weiter.


    Außerdem habe ich noch ein zweites 2,5" NAS von Synology (auch auf Linux Basis), das ebenfalls das selbe Problem an den Tag legt.


    M.E. ist da QNAP in der Pflicht nachzubessern. Mich wundert nur, dass sich ausser uns keiner deswegen meldet... :-/ :(:?:

  • Master68: danke für die Antwort, dann fühle ich mich zumindest nicht mehr ganz alleine mit dem Problem. Dass es mit anderen Platten (bzw. anderen Herstellern) nicht gegessen ist, habe ich mir auch schon gedacht. Selbst wenn ich jetzt die blattvergoldete RAID-Edition von irgendeinem 2,5"-Modell kaufen würde, könnte das Qnap vielleicht ein paar mehr Features nutzen, würde die Platten aber dennoch mit ständigen Load Cycles quälen. Scheint wirklich eine tieferliegende Ursache zu haben.
    Ich werde es jetzt noch mal beim englischen Forum versuchen und hoffe, dass vielleicht was Brauchbares dabei rauskommt. Wie auch immer, ich werde es hier dann zum Besten geben.
    Inzwischen sind die Zählerstände schön weiter gewachsen, ich dokumentiere das jetzt mal in dieser Form weiter:

    Code
    Date        Disk 1   Disk 2   Disk 3   Disk 4   Disk 5   Disk 6   Disk 7   Disk 8
    
    
    2010-08-18   8585     8574     8603     8589     8504     8542     8594     5159
    2010-08-23  10117    10132    10173    10166    10066    10104    10160      --
    2010-08-25  13849    13864    13945    13852    13427    13482    13571      --
  • Zur Abwechslung mal was Erfreuliches: ich habe die Load Cycles offenbar drücken können:


    Code
    Date        Disk 1   Disk 2   Disk 3   Disk 4   Disk 5   Disk 6   Disk 7   Disk 8
    
    
    2010-08-18   8585     8574     8603     8589     8504     8542     8594     5159
    2010-08-23  10117    10132    10173    10166    10066    10104    10160      --
    2010-08-25  13849    13864    13945    13852    13427    13482    13571      --
    2010-08-27  13901    13918    14002    13906    13479    13533    13625      --


    Und zwar wurde mir gestern auf der Seite "Disk Management --> HDD SMART --> Summary" für jede der Platten angezeigt, sie werde gerade getestet und stehe bei 90%. Das konnte kaum sein, denn gemäß Terminplan sollte jede der Platten einmal wöchentlich (sonntags nachts) einen "Complete Test" machen und täglich (früh morgens) einen "Rapid Test". Offenbar sind aber alle Platten beim Testen "hängengeblieben". Das erklärt zwar nicht direkt, wieso sie dann trotzdem so viele Load Cycles hatten, aber seitdem ich diese Zeitpläne gestern Abend alle abgeschaltet habe, wachsen die Load Cycles bei weitem nicht mehr so rapide an!
    Außerdem habe ich gestern unter "System Administration --> Hardware" den Schalter "Enable Hard Disk Standby Mode" mit einer Vorgabe von einer Stunde eingeschaltet, zuvor war diese Option komplett aus. Auch das ist keine Erklärung für die Besserung des Verhaltens, denn bei abgeschalteter Standby-Funktion würde man ja eigentlich auch erwarten, dass die Platten einen Dauerlauf machen.
    Naja, eins von beiden - oder beides zusammen - scheint mein Problem gelöst zu haben. Ich hoffe, dass vielleicht auch andere diesen Erfolg haben.


    Grüße
    Joe

  • Ich habe das hier beschriebene Problem glücklicherweise noch nicht, da ich mit gerade ein SS-839 Pro zusammenkonfiguriere und nach geeigneten Laufwerken suche - weil ich genau solche Probleme mit den gängigen Notebook-Platten befürchtet habe. Nun sind die meisten Platten von der Kompatibilitätsliste [1] kaum bis gar nicht zu beschaffen und/oder sehr klein und teuer. Geliebäugelt hatte ich mit Samsung HM500LI (500 GB), Samsung HM500JI (500 GB) und Samsung HM641JI (640 GB), wobei die letztere mein Favorit wäre, aber nicht auf der Liste aufgeführt wird. Wenn aber selbst gelistete Platten die hier beschriebene Probleme machen, würde mich doch mal ganz brennend interessieren, ob es überhaupt irgendwelche uneingeschränkt empfehlenswerten 2,5-Laufwerke für das SS-839 Pro gibt - oder sollte ich doch lieber bei 3,5"-Technik bleiben??


    Ich freue mich über jegliche Erfahrungsberichte und Ideen!


    [1] http://www.qnap.com/de/pro_compatibility_HDD_Q.asp

  • Das Problem (wenn es denn überhaupt eines ist !!) mit dem hohen "Load Cycle Count" (LCC) gibt es schon seit mehreren NAS-Generationen sowohl bei QNAP als auch bei anderen Herstellern in Verbindung mit WD-Festplatten vornehmlich aus der "Green"-Serie und nun scheinbar auch bei Notebook-Festplatten, bei denen ja auch Energieeinsparung ein wesentliches Feature darstellt.
    Siehe dazu auch http://forum.qnapclub.de/viewtopic.php?f=25&t=4318


    Hierbei schiebt einer die Schuld auf den anderen und der Kunde hat das NAchsehen: Der WD-Support windet sich mit fadenscheinigen Begründungen, wie

    Zitat

    "...diese Festplatte ist ausschließlich mit Windows- und MAC-Betriebssystemen kompatibel..."

    aus der Affäre (was allein schon deswegen Schwachsinn ist, da aktuelle MAC-OS auf einem Linus-Kernel basieren). Und QNAPschiebt das Problem auch von sich, da es ja soo viele andere Nutzer (überwiegend mit Festplatten anderer Hersteller) gibt, bei denen dieses Problem nicht auftritt. Und zu guter Letzt wird unisono darauf verwiesen, daß ja bisher noch keine auffällig hohen Ausfallraten von WD-Festplatten-bestückten NAS erkennbar waren, bei denen ein zu hoher LCC-Wert Ausfallursache gewesen ist.


    Kurzum: Du wirst (leider) weder hier noch in den Foren der Konkurrenz oder beim WD-Support selbst eine befriedigende Antwort erhalten. :roll:

  • Hier gibt es auch noch ein wenig wissen:
    Der grüne Festplattentod - Load Cycle Count - Liste anfälliger Festplatten


    Nebenbei:
    Verbaut hab ich derzeit eine FUJITSU MJA2320BH G2. (2,5")
    Die erste, eine Hitachi(2,5"), lief wunderbar. Die zweite, ebenfalls Hitachi mit 2,5" (5K500 B 320), hatte leider schon einen LCC von 100 in der ersten Stunde. :roll:
    Hab dann einfach mit der Fujitsu getauscht. 9 LLC/Std. .Rechnerisch 5 LCC.


    Ich denke ich lass da die Finger von.

  • Hi zusammen,


    tja, und leider geht es weiter, ich bin doch nicht sorgenfrei:




    Und dabei habe ich an den Einstellungen nix mehr geändert!! Vielleicht war's doch eine Schnapsidee mit den 2,5"-Platten. Nach aktuellem Stand kann ich von diesem System (SS-839 Pro sowie von 2,5"-Platten im Allgemeinen) eigentlich nur abraten. Vielleicht würde es mit SSDs anders laufen, aber wer kann sich das schon leisten?
    Das ständige "Cyceln" müsste sich aber doch verhindern lassen, wenn man die Platten beschäftigt hält. Selbst wenn sie noch so viel Strom sparen wollen, wenn man alle paar Sekunden was von jeder Platte anfragt, können die doch nicht trotzdem zum Stromsparen runterfahren. So etwas muss sich doch auf Linux-Ebene machen lassen.
    Zumindest, wenn nicht das QNAP-Gerät selbst für das schnelle Herunterfahren sorgt - was das angeht, bin ich genau so schlau wie am Anfang, weil niemand zu wissen scheint, ob die QNAP-NAS-Gehäuse selbständig Platten zum Parken auffordern oder nicht.


    Viele Grüße
    Joe

  • Das Diagramm sieht ja gar nicht gut aus, und schön ist die Haltung von Qnap auch auch nicht. Hat eigentlich mal jemand von den Betroffenen eine wirklich *offizielle* Stellungnahme erbeten? Immerhin decken sich die Praxiserfahrungen ja anscheinend nicht wirklich mit den Qnap-Festplatten-"Empfehlungen"!


    Ich denke, das Thema SS-839 Pro hat sich für mich erledigt (Danke auch an Salzstein für den informativen Link!) - 2,5"-Platten und 24/7-Betrieb passen wohl einfach noch nicht zueinander. Jetzt lautet die Frage für mich wohl eher, ob überhaupt Qnap, oder irgendeiner der Mitbewerber oder doch besser Eigenbau... Perfekt auf die Hardware abgestimmtes Power Management war ja eigentlich das entscheidende Kriterium für eine Qnap-Black-Box...

  • Ich habe (ausnahmsweise) auch mal gute News: QNAP ist unschuldig! Habe es mit diesem Artikel rausgefunden: http://webdiary.com/i/?tag=wdidle3
    WD hat bei den Scorpio Blue Platten einen Timer eingebaut, der nach spätestens acht Sekunden ohne Zugriffe die Platte parkt. Sie nennen es "IntelliPark"... bäh! Sehr intelligent ist das nicht. Übrigens ist WD nicht der einzige Hersteller. Diese Mogelei ermöglicht natürlich einen geringeren durchschnittlichen Stromverbrauch, auch wenn es massiv auf Kosten der Gesamtlebenszeit geht, und da Stromverbrauch ja auch ein Kaufargument sein kann, sind die anderen Hersteller gezwungen, es ähnlich zu machen. Ich will jetzt also WD nicht die Alleinschuld daran geben. SS-839-Besitzer mit Platten anderer Hersteller haben ja auch Ähnliches beobachtet, es handelt sich also eher um ein Problem, das marketingtechnischer Natur ist.
    Immerhin gibt es von WD ein Tool, das man sogar offiziell dort herunterladen kann, mit dem dieser Timer deaktivierbar ist, oder wahlhweise auf 1-255 Sekunden geändert werden kann. WD gibt natürlich ganz andere Plattenserien für das Tool an, und vermutlich gefährdet man die Garantie für die Platten, die man mit dem Tool bearbeitet, aber ich habe es gewagt und war erfolgreich.
    Man braucht zwar DOS, um das Tool laufen zu lassen, aber zu meiner großen Faszination war nicht einmal ein Neustart des Rechners fällig, wenn man die nächste Platte anschließen wollte. Ich konnte den PC einfach laufen lassen und die Platten eine nach der anderen anstecken, Tool drüberlaufen lassen, Platte wieder ab und nächste dran. Da das Tool auch die Seriennummer der Platte ausgibt, konnte ich jeweils korrigieren, dass der Wechsel tatsächlich auch erkannt wurde. Dennoch würde ich das jetzt nicht pauschal empfehlen. Kann gut sein, dass mein Mainboard das mitmacht, das nächste aber nicht, und wer weiß schon, was dann passiert...


    Kurzum: Ich will ja jetzt nicht wieder zu früh jubeln, aber seit dem Eingriff gestern vormittag ist der load_cycle_count von jeder der Platten nur um genau 6 Zähler gestiegen!! :D


    Dabei ist der Standby-Mode der Platten im QNAP noch auf 1 Stunde konfiguriert, d.h. das QNAP schaltet sie ab, wenn sie eine Stunde lang nicht benutzt wurden, und das ist wohl auch der einzige Bereich, in dem das QNAP selbst beim Power Management mitmischt, alles andere tun die Platten selbst. Diesen Modus habe ich jetzt auch noch abgeschaltet und rechne damit, dass damit die Load Cycles noch langsamer zunehmen werden. Ich werde weiter berichten.


    Wer an dem Tool interessiert ist: http://support.wdc.com/product…oupid=609&sid=113&lang=en

  • Dass QNAP hier nicht "schuld" ist möchte ich jetzt so nicht unterschreiben - wenn QNAP ein NAS auf Basis von Festplatten konstruiert und verkauft, von denen bekannt ist, dass sie ein derartiges Verhalten an den Tag legen (und das tun ja offenbar alle Notebook Platten in ähnlicher Weise und auch die, die in der Kompatibilitätsliste stehen), dann erwarte ich von QNAP auch, dass sie eine Mechanismus implementieren, der dieses Problem in den Griff bekommt und dass sie das nicht einfach auf die Käufer abwälzen und sich mit Hinweis auf die Festplattenhersteller distanzieren. :x


    Und wenn sie das in ihrer eigenen Firmware nicht hinbekommen, dann erwarte ich zumindest, dass sie in Zusammenarbeit mit den Festplattenherstellern für alle Plattentypen ein Tool wie deines Zur Verfügung stellen, mit dem man dieses Verhalten in der Plattenfirmware deaktivieren kann. QNAP hat hier wesentlich bessere Karten an diese Tools der Festplattenhersteller heranzukommen als ein einzelner Endanwender, der sich mit den inkompetenten Hotlines der Festplattenhersteller herumschlagen muss!


    Diesen Kundensupport kann man meiner Meinung nach bei einem offensichtlichen und bekannten Problem erwarten - erst recht, wenn QNAP dieses Problem vor dem Verkauf ja nicht punbliziert!


    Schließlich gebe ich das Geld aus, damit meine Daten sicher sind, nicht damit sie möglichst schnell ins Nirvana gehen! :cursing:

  • Das WD Tool hilft mir leider rein gar nichts, weil ich keine WD Platten drin habe. Ich habe das selbe Problem mit Samsung und Seagate Platten (habe jeweils einen 8er Satz gekauft und mit beiden Herstellern das selbe Problem). :x


    Und ich meckere, weil ich mich von QNAP hängen gelassen fühle!


    Falls es jetzt hier im Forum einen freundlichen Mituser gibt, der mir bei meinen Platten auch helfen kann, dann freue ich mich natürlich sehr, das ändert aber nichts daran, dass ich der Meinung bin, dass hier von QNAP Support kommen sollte - schließlich verdienen die ja auch daran!