Festplatte mit Bad Blocks

  • Moin,


    vorhin hat sich mein TS 412 spontan aufgehangen. Das hat sich so geäußert, dass die CPU Last auf dauerhaft 100% war. Herunterfahren übers WebGui führte zu keiner Reaktion des NAS, da half nur die harte Tour: Ausschalt Knopf lange drücken.


    Nach dem Neustart hat das NAS einen Check des Dateisystems empfohlen, dieser läuft bereits. Außerdem wird der Festplattenstatus als Abnormal bezeichnet. In der Datenträgerverwaltung steht bei Status "Disk- Lese-/Schreibfehler". Laut Systemprotokoll ist es ratsam einen Bad Block Scan durchzuführen. Das werde ich tun, sobald die Dateisystemprüfung fertig ist.


    Ich habe aber mal eine allgemeine Frage zu den Bad Blocks. Laut Wiki sind das defekte Sektoren der Festplatte, die unter Umstände durch Reservesektoren ausgeglichen werden können. Wie genau muss ich mir das vorstellen? Das System will eine Datei auf die Platte schreiben, der Sektor reagiert eigenartig und die Festplatte wählt automatisch einen Reservesektor und hinterlässt einen Eintrag in den S.M.A.R.T. Werten?


    Ich frage deshalb so genau, weil das NAS jede Nacht automatisch auf ein zweites NAS per RTRR gesichert wird. Meine Befürchtung ist jetzt, dass einige Dateien auf dem Quell NAS aufgrund der Bad Blocks beschädigt sein könnten und die kaputten Dateien womöglich, mein im Moment noch heiles Backup, versauen würden. Liege ich damit richtig? Oder sind die Dateien prinzipiell alle noch heil, weil Bad Blocks sofort gegen neue Sektoren getauscht werden und gar nicht erst beschrieben werden?


    Vielen Dank schon mal für eure Hilfe. ich hoffe ich habe mein Problem ist einigermaßen verständlich dargestellt.


    Grüße
    Jonny



    EDIT: Bei den S.M.A.R.T. Werten steht noch überall "Ok"


    EDIT 2: Ich war mir sicher, neben dem S.M.A.R.T Test schon mal irgendwo einen Button für Bad Block Scan gesehen zu haben (das war noch in v3.8.3). Kann mir jemand verraten, wo ich das in FW 4.0.7 finde?

  • Beim Schreiben und Lesen sind automatische Fehlerkorrekturverfahren mit Prüfsummen im Spiel.


    Vereinfacht:
    Beim Auslesen der Daten von der Platte wird simultan gegen die mitgespeicherte Prüfsumme gecheckt, ob die Datei fehlerfrei gelesen werden konnte. Falls nicht, wird erneut versucht, die Daten zu lesen. Ist damit alles in Ordnung, passiert weiter nichts, der Read-Error wird aber möglicherweise bereits im SMART dokumentiert. Muss mehrmals gelesen werden und ist der Fehler damit korrigierbar, geht die Steuerung von schlechten Blocks aus und remappt diese an andere Stellen der Festplatte. Auch dieser Vorgang wird im SMART dokumentiert. War auch mehrfaches Lesen oder andere Korrekturmassnahmen nicht erfolgreich, kommt die Meldung zurück, dass der Datensatz nicht gelesen werden konnte.


    Beim Backuppen wird also ein möglicher Lesefehler der Quelle nicht einfach blind auch auf das Backup übernommen, sondern wenn das Lesen der Daten nicht erfolgreich war, wird die Datei erst gar nicht weiter übertragen, sondern das Backupprogramm überspringt die betreffende Datei mit einer Fehlermeldung oder stoppt gleich den ganzen Backupvorgang.


    Zum Thema Button für BadBlockScan: --> http://forum.qnapclub.de/viewtopic.php?f=46&t=30735


    GLG GBD

  • Ok, also kann ich das automatische BackUp erstmal ganz normal weiterlaufen lassen. Dankeschön.


    Der Bad Blocks Scan ist jetzt fertig und hat 241 Stück gefunden. Irgendwelche Ideen oder Vorschläge, was jetzt zu tun ist?

  • Bei mir geht bei einer solchen defekten oder verdächtigen Platte immer der erste Blick auf die Herstellerseite, ob auf die Platte noch die Herstellergarantie besteht, was man durch Eingeben der Seriennummer dort leicht feststellen kann. Falls ja, RMA beantragen, Versandlabel ausdrucken und ab die Post. Bei Seagate, WD und Hitachi kommt die Ersatzplatte üblicherweise binnen 5-10 Arbeitstagen.


    Ansonsten stimme ich Sascha zu. Einmal vorhandene BadBlocks sind meist eine (schnell) fortschreitende Erkrankung, die immer wieder für Störungen in der NAS sorgen kann, eine solch "toxische" Platte würde ich daher sofort ausser Betrieb nehmen.


    GLG GBD

  • Die Garantie ist am 28.05 abgelaufen. War ja klar.... -.-


    Ich habe hier im Forum noch ein anderes Thema dazu gefunden: http://forum.qnapclub.de/viewtopic.php?f=166&t=14145


    Da waren auch 2 Leute mit Bad Blocks auf den Festplatten. Und auch da hat die Qnap in beiden Fällen 241(!) Blöcke gemeldet. Für Zufall ist mir das schon bisschen arg unwahrscheinlich oder?! Kann es sein, dass die Qnap beim Bad Blocks Scan irgendeinen Bug hat? Wenn die Festplatte tatsächlich den Geist aufgibt, wird die natürlich sofort ausgetauscht....aber eventuell eine heile Festplatte auszubauen und in den Müll zu schmeißen widerstrebt mir dann doch :p ist da irgendwas bekannt?

  • Wenn ich Zweifel an dem Scanergebnis hätte, würde ich den Scan am PC wiederholen. Du kannst Ja auch mal die SMART-Einzelwertetabelle der HDD hier posten, dann schauen wir uns die mal an.


    GLG GBD

  • 36 Reallocated sectors und 92 uncorrectable Errors, bei letzterem Kriterium ist sogar der Skalenwert von 100 auf 008 abgesoffen.
    Current pending sectors mit 8 Auffälligkeiten, Offline uncorrectable ebenfalls mit 8 Auffälligkeiten.


    Die Platte hat definitiv einen Schatten, der vermutlich weiter fortschreiten wird. Ich würde sie nicht mehr weiter verwenden.


    GLG GBD

  • Hmmm....ok. Dann bin ich ein bisschen verwundert, warum bei Status überall "Ok" steht. Seagate hat es wohl nicht so mit kritischer Festplattenbewertung?! :shock:

  • Die "OK" - Beurteilungen kannste knicken. Die basieren auf Toleranzwerten. Wie das Beispiel hier zeigt, kann die Platte aber bereits Auffälligkkeiten zeigen, obwohl die Fehlerwerte noch innerhalb von Toleranzschwellen liegen.


    Diese Platte hier wird Seagate anstandslos umtauschen.


    GLG GBD

  • Platte sofort raus und ersetzen. Habe schon oft WD RE Platten und Seagate ES Platten gehabt die im Nas und Server nicht mehr funktionierten aber in z.B. Usb Gehaeusen ihren Dienst TESTWEISE ohne Murren noch verrichtet haben. Egal wie lange diese Platten noch testweise liefen, gute NAS und richtige Raidcontroller in Servern gehen anders vor, lest mal bitte folgende Hilfestellung: http://wdc.custhelp.com/app/answers/detail/a_id/1397
    Bitte beachtet den Hinweis des "deep recovery cycle", das sollte eigentlich schon mehr als genug erklaeren in Bezug auf fehlerhafte oder schwebende Sektoren.


    Frank

  • Zitat von "GorillaBD"

    Diese Platte hier wird Seagate anstandslos umtauschen.


    Die Garantie ist vor 5 Tagen abgelaufen. Mal schauen, wie kulant Seagate ist...

    Einmal editiert, zuletzt von GorillaBD () aus folgendem Grund: Zitat gekürzt!

  • Versuchen würde ich es auf jeden Fall, mehr wie Ablehnen können sie es nicht!

    Einmal editiert, zuletzt von GorillaBD () aus folgendem Grund: Unnötiges Zitat entfernt!

  • Während ich immer noch auf eine Antwort zwecks Garantie warte, habe ich noch einen zweiten Bad Block Scan durchgeführt. Jetzt sind es nur noch 182 (zuvor 241)....woher kommt das? Werden Bad Blocks, die aussortiert wurden und durch Reservesektoren ausgetauscht werden nicht mehr mitgezählt?

  • Hat der "reallocated sector count" - Rohwert sich denn verändert ?


    Wenn Du während der Wartezeit vielleicht noch weiter "forschen" möchtest, kannst du auch mit einem geeigneten Tool die Platte mal "Nullen", heisst also jeden Sektor mit Nullen oder Zufallszahlen überschreiben. In manchen Tools heisst die Funktion auch "Löschen", "Erase" oder ähnlich, kann man dann teils auch mit sofort anschliessender Validierung machen. Falls Du diese Funktion beim Seagate-Tool verwendest, führt dieses dabei automatisch ein Remapping schlechter Sektoren durch.


    Was alles nichts daran ändert, dass ich diese Platte aus dem Verkehr ziehen würde.


    GLG GBD

  • Der Rohwert steht nach wie vor auf 0. Lediglich der Schwellenwert hat sich von 36 auf 10 verändert.


    Ich werde mir das Tool von Seagate mal anschauen. Danke.


    Edit: Die Festplatte lief ja vor dem Harten Ausschalten perfekt. Ohne irgendwelche Bad Blocks usw....kann es sein, dass die Festplatte eigentlich ok ist und nur das harte Ausschalten dem NAS nicht gut tat und die FW jetzt einen Knacks weg hat? Ich kann mir irgendwie nicht vorstellen, dass beim Ausschalten durch langes drücken des On Knopfes die HDD kaputt gehen kann...

  • Auf die Gefahr, dass ich mich wiederhole:
    Wenn ich den Analyseergebnissen der NAS nicht trauen würde, würde ich eine Gegenprüfung mit einem anderen Tool auf einem anderen System durchführen.
    Möglicherweise kommen dann nur 137 BadBlocks, möglicherweise 7396 hoch.


    All das wird nichts daran ändern, dass die Platte in ihrem internen Reporting (SMART) bereits Fehler meldet, die nicht wegzudiskutieren sind. Damit ist "toxisch", also nicht mehr als unbedenklich einzustufen. Sie kann dann zwar möglicherweise noch eine Weile einwandfrei laufen, sie kann aber auch kurzfristig wieder zu "seltsamen Effekten" im System führen. Das Risiko ist nunmal da und höher als bei einer HDD, deren internes Reporting keinerlei Auffälligkeiten aufweist.


    Entscheiden, wie damit umgegangen werden wird, musst Du. Wir können Dich nur wohlmeinend warnen und Dich wissen lassen, was wir an Deiner Stelle tun würden.


    Der Zustand der Platte kann etwas mit dem harten Ausschalten zu tun haben, aber nur, weil imho nichts auszuschliessen ist. Üblich ist eine solche Reaktion eher nicht, meist entstehen beim harten Ausschalten eher nur logische Fehler, weil Daten nicht mehr vor dem Herunterfahren aus dem Cache noch zurückgeschrieben werden konnten, Prozesse nicht ordentlich abgeschlossen werden konnten usw.


    Wahrscheinlicher ist imho daher, dass das eine mit dem anderen nichts zu tun hat. Festplatten fallen nun mal aus, wann sie wollen und wie sie wollen. Das liegt in ihrer Natur. ;)


    GLG GBD

  • Von Seagate kam die Rückmeldung, dass sie die Festplatte nicht tauschen, da die Garantie abgelaufen ist....hey, das ist mal Service... :-/