Hat die Box der Teufel geritten?

  • also. kurz zur vorgeschichte.
    meine box mit 4xSeagate ST31000520AS CC32 1TB im raid5 (die stehen auch auf der liste. es sind lowpower platten) ist bis vor einer stunde brav gelaufen. keine problem.
    dann wollt ich eine großere datei draufkopieren. plötzlich fängt die box an zu piepsen und am display erschein "HDD3 ejeceted". hm. könnt mich nicht erinnern, dass ich sie rausgenommen hab. gleich darauf ist auch schon das mail gekommen. der kopiervorgang hat abgebrochen, weil angeblich auch die erste platte rausgenommen wurde. natürlich waren alle platten drinnen, liefen und hatten strom. also wackelkontakt fällt aus.
    da auch die weoberfläche abgeschmiert ist, hab ich die box mit dem power-knopf abgeschaltet. natürlich sind auch sämtliche dienste beendet worden, da das raid-volume nicht mehr vorhanden war.
    ich hab dann die box neu gestartet. das raid war degraded. alle platten aktiv. alle daten da. alle freigaben. die dritte platte war aber offensichtlich nicht im raidverbund. also hab ich sie dann tatsächlich rausgenommen, etwas gewartet und wieder reingesteckt. seither läuft der rebuildprozess.
    das raid ist mit ext4 formartiert. auch das bitmap hab ich enabeld.
    gibts da eine logische erklärung dafür? ich hab keine. oder auch eine unlogische. aber irgend eine. ich hab dann natürlich gleich mal mein backup auf den aktuellen stand gebracht. man weiß ja nie.

  • Hallo skorpion,


    das klingt, als ob eine der Platte einen Fehler nicht schnell genug korrigiert hat und die Platte aus dem RAID-Verbund gedroppt wurde.
    Dies kann passieren bei HDDs die eigentlich für den Desktop-Betrieb gedacht sind, da in Einzel-Platten Systemen die Festplatte durchaus auch mal länger brauchen kann um einen Fehler zu korrigieren. In einem RAID-Verbund kann diese lange Zeit nicht gewährt werden.


    Neuere Platten haben TLER (Time Limited Error Rcovery) (Western Digital) welches man im RAID aktivieren kann und so ein frühzeitiges auswerfen und damit verbundenen Zeit intensiven Raid-Rebuild vermeiden kann: http://de.wikipedia.org/wiki/Time_Limited_Error_Recovery


    Wenn du Pech hast kann dir das mit deinen Festplatten immer wieder passieren je mehr Fehler mit der Zeit auftauchen und somit korrigiert werden müssen. Bei Seagate wird dies wohl ERC (Error Recovery Control) genannt. Samsung und Hitachi nennen das CCTL (Command Completion Time Limit).


    Gruß Complicated


    Edit: habe das hier grade hier im Forum gefunden:http://forum.qnapclub.de/viewtopic.php?f=12&t=1026&
    Hier scheint jemand ebenfalls mit dem 409 Pro die selben Erfahrungen gemacht zu haben - scheint bei ihm mit dem automatischen SMART-Check zusammen zu hängen.

    Einmal editiert, zuletzt von Complicated ()

  • Der RAID-Controller schmeisst sie raus aus Performance Gründen. Aus diesem Grund soll man HDs die für Servereinsatz gedacht sind verwenden. Diese haben die Fähigkeit dem Controller mitzuteilen dass sie noch beschäftigt sind und werden dann nicht ausgestossen.


    Habe das hier grade hier im Forum gefunden: http://forum.qnapclub.de/viewtopic.php?f=12&t=1026&
    Hier scheint jemand ebenfalls mit dem 409 Pro die selben Erfahrungen gemacht zu haben - scheint bei ihm mit dem automatischen SMART-Check zusammen zu hängen.

  • naaaaaaaa ja. dann liegt der fehler wohl bei mir, respektive meiner plattenwahl.
    das mit dem smarttest ist mir bei den vorigen 500er platten schon mal aufgefallen. beim test ist immer die gleiche platte regelmäßig durchgefallen und hat mein raid a bissal beleidigt. ok. ich werde das beobachten.
    aber danke für die aufklärung. bin ich etwas ruhiger, wenn da mal kein datenverlust passiert. hoffentlich ;)
    edit: ich hab, wie ich diese platten in die 409er eingebaut hab, auch mal den kompletten smarttest einige male durchführen lassen. da ist mir nie ein fehler aufgefallen.

  • Ich habe im Seagate Forum diesen Thread gefunden wo einige Links zu Dokumentationen vorhanden sind: http://stx.lithium.com/stx/boa…s&message.id=10695#M10695

    Zitat

    I've checked with hdparm and can confirm that this feature is available on the Barracuda 7200.11, 7200.12 and LP series drives.


    Dort wird wohl auch dokumentiert auf welche Weise diese Funktion bei Platten geprüft werden kann und wenn nötig aktiviert werden kann.
    Es gibt mittlerweile einige HDs die als Desktop Platten verkauft werden und wo dieses Feature einfach deaktiviert wurde - im Desktopbetrieb ist es nämlich eher Schädlich :)


    Klasse erklärt wird es übrigens bei Samsung:
    http://www.samsung.com/global/…earningResource_CCTL.html
    Ist einen Blick wert wenn man das etwas genauer wissen will :)

  • so. ich hab heute mit meinem betreuer bei ****** ;) gesprochen und ihm das alles erklärt. er versteht es und er versucht, dass ich für die vier platten eine gutschrift bekomme. leider muß ich natürlich alle vier ausbauen und zurückschicken. ist aber nicht soooooo tragisch. hab ja noch die 409er fix fertig konfiguriert und einsatzbereit. kommen da wieder alle daten drauf. sind halt "nur" 1,5tb aber das reicht eh noch ein randerl (<- eine zeitlang).
    ich werde mir, wenn alles gut geht, 4 seagate 24x7 platten (ES2) besorgen. kosten zwar das doppelte aber ich hoffe ich hab dann ruhe. mehr will ich dann dafür nicht ausgeben.