TS-459+ PRO; HDD-Ausfall im gleichen SLOT

  • Hallo Miteinander!
    Ich glaube, das Problem ist nicht neu - ich habe zumindest für das TS-509 einen ähnlichen Thread gefunden ...
    Allerdings hoffe ich auf aktuelle Entwicklungen zum Problem.


    Das Problem:
    Das QNAP wurde zunächst mit 4 HDD WD15EADS-00S2B0 im RAID5 in Betrieb genommen. Ich bin mir relativ sicher, dass diese Platten Anfang des Jahres in der Kompatibilitätsliste als einsetzbar ab einem bestimmten FW-Stand geführt wurden.
    Nun viel das Gerät aus: im Display "Booting System"; eine Platte (SLOT 2) blinkt ständig grün, alle anderen Dauerlicht grün; kein Zugriff auf Daten möglich.
    Erstmal Unglauben, da ein HDD-Ausfall ja eigentlich abgefangen werden sollte. Alle Platten ausgebaut und mit dd auf Tape gesichert. In der aktuellen Kompatibilitätsliste sind die Platten nun als "instabil und langsam" gekennzeichnet und von einer Verwendung wird abgeraten. Alles klar - Userproblem.
    Also 4 neue Festplatten gekauft (ST32000644NS) - ohne Einschränkung einsetzbar und während der Lieferzeit mal die "alten" Platten angeschaut. Die Platte aus SLOT 2 meldet beim BOOT-SMART-Status zwar o.k., zeigt aber in der Details eine HOHE Anzahl defekter Sektoren und bricht einen erweiterten SMART-Test ab. Ohne Platte in SLOT 2 bootete das System (RAID5 degradet) und ich konnte die Daten ersteinmal sichern.
    Nach Erhalt der neuen Platten und Firmware-Update auf "3.3.3 Build 0928T" wurde das System mit den ST32000644NS-Platten wieder in Betrieb genommen. RAID neu aufgebaut, Write-Cache deaktiviert, alle nicht benötigten Dienste abgeschaltet (bis auf NFS und iSCSI), Daten wieder drauf und ... am nächsten Tag genau das Selbe. Daten unerreichbar, SLOT 2 blinkt (weiter siehe oben ...).
    Die Platte meldet in den SMART-Details einige fehlerhafte Sektoren, lehnt aber einen erweiterten Test wieder ab.


    Die Fragen:
    1. Hätte ich Lotto spielen sollen? War das der Zufall auf den wir sonst warten: 2 x eine defekte HDD unterschiedlichen Typs im gleichen SLOT?
    2. Warum verhält sich das RAID nicht so wie in meinen Servern: sage Bescheid das ich degradet bin, aber liefere noch Daten?
    3. Kann ein fehlerhaftes QNAP des SMART-Status einer HDD beeinflussen? Mir ist nicht wirklich ein Szenario eingefallen. Habt Ihr einen Tip?
    4. Kennt jemand die Effekte und kann mir sagen, ob es Zweck hat, die reklamierte Platte wieder einzubauen oder sollte ich ersteinmal das QNAP einschicken?


    Vielen Dank und schönes WE!
    Micha

  • Zitat von "michatietz"


    Ich glaube, das Problem ist nicht neu -


    Wenn man so hier mitliest .... nein.
    Ich persönlich kann auch nicht mehr so recht an echte Plattendefekte glauben. Ob hier das NAS, die FW, das raid, der controler, der Hersteller oder kleine grüne Männchen die Ursache sind, wird wohl niemand mit Sicherheit sagen können.
    Ich würde mal vorschlagen, die bemängelte Platte in einem externen Gehäuse an den PC zu hängen, Partitionen löschen, formatieren, Partitionen anlegen und dann mit Daten vollzupumpen. dann smart drüber ....
    Würde mich gar nicht wundern, wenn dann alles wieder ok ist. Wenn - dann gut, aber eine Lösung ist das natürlich nicht :cry:


    Gruss
    Michael

  • Habe gerade mal das neue FW-Update angesehen:


    [Major Bug Fixes]
    - [Multimedia Station] The player buttons do not work for playing the next video if the user uses the seek-forward function when playing an MP4 file.
    - [Backup-Amazon S3] Incorrect status display/log/alert after completing a download task by Amazon S3.
    - [Backup-Amazon S3] Incorrect testing status display when performing quick test for an upload task of Amazon S3.
    - [Hardware] The rotation speed of the smart fan is switched to low after firmware upgrade.

    [Known Issues]
    - [Surveillance Station] Y-CAM Generic V2 will be disconnected when selecting the channel in Live View page.


    Da steht nichts in Richtung: "wir arbeiten daran, ein RAID-System auch mit RAID-Funktionalität auszustatten"
    Was soll ein Gerät für ca. 700 Euro (ohne Platten!), welches bei einem - wie auch immer initiierten Plattenausfall - die Arbeit einstellt und sich in einem endlosen Systeminit verheddert? Aus meiner Sicht ist das einfach Schrott. Natürlich ersetzt RAID5 keine Datensicherung, aber die Verfügbarkeit der Daten muss gegeben sein. Mal wieder ein Beispiel für gutes, aber irreführendes Marketing?


    Hat schon mal jemand versucht, einfach ein beliebiges Linux auf dem Teil zu installieren und NFS und/oder iSCSI damit bereitzustellen? Ich konnte zumindest Debian von DVD booten. Es gibt ja zum Glück nur drei Möglichkeiten: entweder ist die eingesetzte Hardware ungeeignet oder matschig. Oder die Software bring es nicht. Wenn die Probleme mit neuer Linuxinstallation verschwinden, liegt's zumindest nicht an der Hardware. Gib es dahingehend Erfahrungen?


    Sagt mal Bescheid - danke und schönen guten Morgen!
    Micha

  • Hallo Micha,


    ich kann deinen Frust nachvollziehen! Ich verstehe jedoch nicht warum du dir das selbst antust, entweder wendest dich an den offiziellen Support oder du tauscht das NAS beim Händler um. Vorausgesetzt natürlich das es nicht den Festplatten selbst liegt!
    Jetzt damit anzufangen an dem System rum zubasteln kann keine Lösung sein!


    Christian

  • Zitat von "michatietz"


    entweder ist die eingesetzte Hardware ungeeignet oder matschig. Oder die Software bring es nicht.


    Wenn es die Software wäre, dann müsste der Fehler "massenhaft" auftreten.
    Ich tippe da eher auf die hardware. Probleme mit dem slot 2 liest man hier ja nicht zum ersten Mal.


    Das ist wie mit Autos. "10.000 Golf laufen vom Band .... und 100 haben gleich Probleme mit der Wasserpumpe".
    Jetzt ist aber dadurch nicht gleich VW schlecht, oder der Golf oder der Zulieferer taugt nichts.
    Dafür gibt es die Garantie -


    Gruss
    Michael

    Einmal editiert, zuletzt von muck ()

  • Hi,


    ich tippe wenn ich das so lese auf ext4. Da gibt's immer noch unvorhersehbare Probleme. Zumindest ist es oftmals so....
    Falls ich damit richtig lag. Ruhig das ganze einmal mit ext3 probieren ;)


    Grüsse, David

  • Zitat von "Terz"


    ich tippe wenn ich das so lese auf ext4. Da gibt's immer noch unvorhersehbare Probleme.


    Wenn dem so wäre!! und QNAP auch nur im entferntesten evtl. Probleme mit ext4 in Verbindung mit raid vermuten würde/könnte, dann wäre aber noch heute Nacht ein Bugfixrelease angesagt, in der ext4 an keiner Ecke mehr als Option angeboten werden darf -
    Ne ne, ext4 ist stable und wird auch von vielen in ihrem Rechner mit raid genutzt.
    Das Problem wird sich wohl auf die hardware beziehen.


    Gruss
    Michael

  • Jipp,


    ext4 ist als stable von der Kernel.org eingestuft. In der KernelTrap hatte man damals darüber diskutiert.
    Erfahrungsgemäss scheint es da noch ein paar Probleme zu geben viele Ubuntuuser sind sich derzeit da auch noch nicht wirklich im Klaren. Man liest so 50:50 von Usern die damit Probleme hatten und ext4 dropped haben / wieder zurück auf ext3/XFS / whatever zurückgegangen sind. Andere dagegen sind rundum glücklich.


    Der Benutzer Medikit hatte letztens erst auch Probleme damit. Es kommt wohl immer darauf an, was man damit macht.
    Write Cache ist z.B. immer noch was "ganz böses". Kommt aber auch nicht bei jedem vor. :-/
    Ich selbst skippe ext4 und warte auf Btrfs / das hoffentlich in ein paar Jahren für das NAS kommen wird - letztendlich ist's mir lieber so. Weil das NAS muss ja nur laufen ;)


    Grüsse, David

  • Hallo Euch allen!


    Zunächst vielen Dank für den Austausch zu dem Problem.
    Richtig ist, dass ich bisher ext4 einsetzte, allerdings ohne WriteCache.
    Die reklamierte Platte ist bereits wieder unterwegs zu mir, ich bin mir nur unsicher, ob ich die weiteren Tests wirklich an einem produktiven System vornehmen sollte.


    Es muss doch mal rauszufinden sein, was da eigentlich die (aus meiner Sicht zu häufig im Forum diskutierten) Probleme macht.


    Als oberstes Problem sehe ich, dass die Systeme nicht sauber "degraden", wenn sie einen Festplattenausfall vermuten. Aus irgendeinem Grund führen sie ein Reboot aus, anders ist die vorgefundene Display-Meldung "Booting System" nicht zu erklären (das QNAP hängt mit an der USV).
    Hier vermute ich sehr stark ein Softwareproblem bei der Implementierung; ich kann mir unter SATA-Bedingungen kein Szenario vorstellen, bei dem 3 von 4 Platten in einem RAID5 sauber erkannt werden, aber das System nicht booten will. Am Montor sah es so aus, als ob die defekte Platte nicht aussortiert wurde, sondern die FW versucht, endlos ein Volumen zu reparieren.


    Ein möglicherweise ganz anderes Problem ist, warum es - ich will mal ganz vorsichtig sagen "scheinbar" - gehäuft zu Plattenausfällen in QNAP-Systemen kommt. Hier könnte ein Ansatzpunkt die Stromversorgung sein, da die die einzige Verbindung zwischen den über SATA entkoppelten Laufwerken darstellt. Nach meinem Kenntnissstand könnte auch ein defekter SATA-kanal der HDD nicht einen SMART-Fehler unterschieben. Ist der SATA-Block o.k. werden die Daten geschrieben; meint der Hostcontroller danach möglicherweise, die wären falsch, soll er halt neue schicken. Ist mir als HDD doch egal und erzeugt keinen fehlerhaften Sektor im Sinne des SMART. Ist es so, dass wirklich der SLOT 2 signifikant häufiger betroffen ist?
    Eventuell könnte ja mal ein Dauerbetroffener sein System übergangsweise mit einem externem Standardnetzteil betreiben.


    Ich tendiere im Augenblick dazu, zunächst ein Notsystem in die Produktivumgebung zu stellen und mir das QNAP in der Werkstatt mal länger anzusehen. Zumal das mit dem "QNAP-Service" ja auch eher ein Problemfall ist. Kein Vorabaustausch; so 2,3 Wochen kann es dauern und ob wir überhaupt den Fehler finden ...
    Wenn jemand Ideen hat, was man machen könnte um belastbare Aussagen zu bekommen - immer her damit.


    Ansonsten sorgenfreie Tage!
    Micha

  • Kann bestätigt werden. Habe ein TS-459 pro, was HDD 4 verliert. Anfänglich habe ich die Opferrolle, Besitzer einer neuen aber dennoch defekten Platte zu sein, akzeptiert. Nun ist genau dieser Slot mit einer neuen Platte wieder abgestorben...an diese Art von Zufällen glaube ich nicht mehr.