[TS 409 PRO] Plattenausfall in RAID5 Verband

  • Hi,


    ich habe gestern meinen 409 PRO zum Leben erweckt und musste heute morgen folgende Info dem Protokoll entnehmen.
    Das Erstellen des RAID 5 ( mit 4 Platten des Typs: "Seagate ST31000340AS 1 TB
    Barracuda 7200.11)
    hat über Nacht gut funktioniert. Nach Erstellen des Raids ist wohl die HD1 ausgefallen und somit war der Raid-Verband defekt. Der QNAP hat daraufhin mit dem Wiederherstellen des RAID begonnen und nudelt nun wahrscheinlich immer noch. Werde heute Abend schauen können ob allen funktioniert hat.


    Könnte der Fehler die Folge eines Hardwaredefekts sein?
    Liegt es daran, das die Platten nach einer gewissen Zeit in den Ruhezustand gehen? (sollte beim erstellen des RIAD ja nicht der Fall sein denke ich.

  • Zitat von "HS_Goldberg"

    Könnte der Fehler die Folge eines Hardwaredefekts sein?


    Ja könnte durchaus möglich sein. Zur Not musst du mal die HDD am PC testen.

    Zitat von "HS_Goldberg"

    Liegt es daran, das die Platten nach einer gewissen Zeit in den Ruhezustand gehen? (sollte beim erstellen des RIAD ja nicht der Fall sein denke ich.


    Nein das passiert nicht.


    Christian

  • Das Testen der Platte am PC wird wohl bei einem erneuten Fehler unvermeidlich sein. Problem dabei ist, dass in meinem PC kein SATA Anschluss mehr frei ist und ich auch keinen frei machen kann, da ebenfalls ein RAID5 Verband am Laufen ist.


    Ich habe bereits einen Testlauf im QNAP versucht doch ist dieser bereits nach wenigen Sekunden abgebrochen worden. Lag aber vermutlich daran, dass ich erst später gemerkt habe, das im Hintergrund die Rekunstruktion des RAIDs am laufen war. :oops:


    Wenn ich vorm heimischen PC sitze werde ich mal schauen was der aktuelle Stand ist und bei bedarf nochmal posten.


    Vielen Dank erstmal!

  • Zitat von "HS_Goldberg"

    Das Problem hat sich behoben, die Ursache ist mir allerdings verborgen geblieben.


    Hi !
    Habe soeben ähnliches Problem mit TS-509 - siehe mein Thread.
    WIE hat sich denn Dein Problem gelöst??
    Würde mich mal interessieren.


    DANKE + Gruß aus München
    studti

  • Ich kann Dir leider nicht sagen was ich falsch gemacht habe oder was letztendlich der Fehler war.


    Das erstellen des Raids hatte beim ersten Vrsuch wohl nicht richtig funktioniert, daraufhin hat die TS selbstständig den Fehler behoben und nun ist das Raid existent und auch eine im Anschluß durchgeführte Fehlerprüfung der Platten und des Rais-Verbandes hat keinen Fehler ergeben.


    Ich hake das Thema für mich ab, da das Ergebnis stimmt und so lange ich keine Probleme bekomme ist das für mich OK.
    Wäre natürlich ärgerlich wenn die TS in wenigen Wochen auf Grund eines "versteckten" Fehler alle Daten verliert. :cursing:

  • Hallo Leute,


    habe mir heute die neueste Ausgabe der c`t gekauft Heft 22. Dort wird auf Seite 178 beginnend über Raid philosophiert. Ich erlaube mir eine kleine Auswahl an Zitaten, wer mehr wissen möchte kann sich das Magazin kaufen.


    Zitat

    ... Allen gemein ist ihre (Firmware-)Optimierung auf das Zusammenspiel mit Raid Adaptern. Die Platten arbeiten mit einer reduzierten Fehlerkorrektur, die je nach Hersteller als Time Limit Error Recovery (TLER), Command Completion Time Limit (CCTL) oder als Error Recovery Control vermarktet wird. Der Hintergrund: Tritt bei normalen Festplatten ein Lesefehler auf, versuchen sie im schlimmsten Fall bis zu zwei Minuten lang den Fehler zu korrigieren. Betreibt man die Festplatte an einem Raid-Adapter, sieht sich dieser möglicherweise veranlasst, das Laufwerk als defekt aus dem Array auszublenden.
    ...


    Ich empfinde diese Erkenntnis die nunmal nicht von irgend jemand kommt als sehr wichtig. Gerade weil in euren beiden Fällen keine als Serverfestplatte deklarierte HDD eingesetzt wurd. Ja ich weiss die HDD´s stehen auf der Kompatibilitätsliste aber ich wollte euch diese Informationen nicht vorenthalten.



    Mfg
    Christian

  • Hallo,


    auch ich hatte (und habe immer noch) ähnliche Probleme. Zu meiner Konfiguration: TS-409 (nicht Pro) und 4x ST31000340NS (Barracuda ES2 1TB 3x Firmware SN05, 1x SN04) im RAID5, Firmware Version 2.1.0 build 0904T . Gekauft Anfang September (2008). Auch ich hatte die Option quick SMART Test auf allen Platten aktiviert (Periode wöchentlich). Nun kam es vor, daß bei ca. jedem 2-3 Mal sich eine Platte aus dem Array verabschiedet. Bisher hat es 2x Platte 2 erwischt. Und das IMMER während des SMART-Tests. Meldung war dann immer: Drive Temeperature 255 (!!!). War natürlich völliger Blödsinn, die gefühlte Temperatur war in Ordnung da ich keine Kernschmelze hatte (auch die Temperaturen der anderen 3 Platten waren gefühlt OK). Normale Temeperatur liegt bei mir bei 34-38°C, also OK denke ich mal.


    Gestern wurde dann zum ersten Mal Platte 4 aus dem Array geworfen, diesmal aber ein anderer Fehler, welcher allerdings wieder während des SMART Checks auftrat: "HDD SMART: HDD 3 Quick Test result: Interrupted (host reset). The current temperature is 37 ºC."


    Gefolgt vom Rauswurf von Platte 4: [RAID5 Disk Volume: Drive 1 2 3 4] Hot-remove drive 4 failed. [RAID5 Disk Volume: Drive 1 2 3 4] Drive 4 has been removed.[RAID5 Disk Volume: Drive 1 2 3 4] Volume is in degraded mode.


    Es sei dazu gesagt: ich konnte nach den Fehlern jedes Mal die Platten problemlos wieder ins Array integrieren (Rebuild).


    Alles in allem recht merkwürdig wie ich finde. Ich bin mir sicher KEINE Platte rausgezogen zu haben, also nichts unternommen zu haben, was das Hot Remove failed erklären könnte. Vielmehr war ich zu besagter Uhrzeit schon längst im Bett und habe also am Array nicht rumgefummelt oder so.


    Was mir zu schaffen macht ist, das der Fehler bisher immer während des SMART Checks auftrat. Wenn ich diesen manuell (sozusagen 'mal zwischendurch' anstoße), auch mehrmals hintereinander, passiert gar nix, egal bei welchen Platten. Es trat bisher immer nur bei den scheduled Checks auf.


    Ich habe nun einmal ausprobiert den scheduled Check zu deaktivieren, mal sehen was dann passiert...berichten kann ich erst in einer Weile vom Ergebnis. Obwohl mich das nicht glücklich macht, da ich die Funktion doch gern nutzen würde.


    Die Platten an sich scheinen mir auch in Ordnung zu sein, Temperatur ist OK (sowohl ausgelesen - mit Ausnahme der Fehlermeldung, als auch gefühlt); Laufgeräusche ebenso nicht auffällig. SMART-Werte normal.


    Frage an die Experten: während der Checks laufen ja die Tasks auf dem Array weiter, kann sich da beim Zugriffsversuch während der Test gerade läuft im ungünstigen Fall vielleicht eine Art "Race condition" ergeben oder handled so etwas die Firmware vom TS-409? Sollte meiner Meinung nach nicht zu Problemen führen, das sollte die Firmware behandeln können, aber ich frage trotzdem lieber mal nach.


    Hat vielleicht sonst jemand etwas änhliches erlebt und kennt DIE LÖSUNG für das Problem (außer meinem unschönen Workaroundversuch?). So nach dem Motto: "Klar, da musste einfach *insert ultimate solution here* machen". Bin für Unterstützung dankbar!



    Viele Grüße,


    Sebastian