TS-669pro und WD 8TB Platten -> Bad Blocks auf neuen Platten?

  • Moin!

    Ich habe hier ein Problem, das ich nicht ganz verstehe. "Meine" TS-669Pro bekommt alle 3 Jahre neue Platten um zu verhindern, dass alte Platten unbemerkt aussteigen und dann Daten verloren gehen, weil ein rebuild nicht mehr möglich ist.


    Die Konfiguration is ein RAID5+1Spare. Firmware 4.3.4


    Die "alten" Platten waren 6TB WD60EFAX. Die neuen sollen nun WD80EFPX werden. (Ein gleicher Tauschvorgang lief an einer TS-659pro ohne Probleme durch)

    Wenn ich nun eine Platte austausche, startet der Rebuild, bricht aber nach einiger Zeit (nach einigen Stunden) ab und in den Benachrichtigungen stehen (als Beispiel) dann 30 oder mehr Zeilen mit:

    Code
    Warnung    2025/03/12    02:43:51    System    127.0.0.1    localhost    [Bad Block Log]: Invalid data found on Host: Disk 3 at sector (1319351168, 112, 512).
    Warnung    2025/03/12    02:44:05    System    127.0.0.1    localhost    [Bad Block Log]: Invalid data found on Host: Disk 3 at sector (1319351168, 128, 512).
    ...

    jeweils im Abstand von ein paar Sekunden. Der Rebuild bricht natürlich ab. Und die Platten_LED wird rot.


    Zunächst dachte ich an einen Transportschaden. Aber bei der dritten Platte glaubte ich daran nicht mehr so recht.

    Nun habe ich bei der dritten Platte in der qnap einen bad sector scan gemacht und angegeben, dass der Status zurückgesetzt werden soll, falls der Scan ohne Fehler durchläuft.

    Parallel habe ich eine der beiden anderen Platten, die angeblich beschädigte Sektoren haben sollen, an meinem Windows PC per diskpart und clean gelöscht und mit chkdsk /r scannen lassen.

    Bei beiden Platten lief der scan ohne Fehler durch. Qnap hat auch den Status der letzten "defekten" Platte auf "gut" zurückgesetzt. Der Smart der Platten ist auch nicht der Meinung, dass da defekte Blöcke waren. (Retired_Block_Count steht auf 0 )

    Nun ist die Platte, die ich unter Windows gewiped und geprüft hatte wieder eingesetzt und der rebuild ist wieder am laufen (23% aktuell)

    Ich vermute allerdings, dass es wieder abbrechen wird.


    Was tun?


    Grüße

    Matthias

  • Was tun?

    Moin,


    im Moment sind alte gefälschte und gebrauchte Platten im Umlauf (als neu deklariert). Betrifft erstmal wohl nur Seagates Pro und Exos, aber das heißt ja nicht, dass von irgendeiner Serverfarm auch WD's dabei sind

    Anhand der Seriennummer kannst Du bei WD prüfen, ob es Diskrepanzen bei der Garantie gibt. Auch äußerlich kann man die Dinger ja mal prüfen auf Gebrauchsspuren oder zusätzliche Aufkleber, oder...


    Nur mal für den Fall, dass Du das alles noch nicht in Erwägung gezogen hast


    Gruß Zacharias

  • Die "alten" Platten waren 6TB WD60EFAX

    Das sind SMR Platten, bei denen ein Problem während des Rebuild nicht ungewöhnlich ist.

    alle 3 Jahre neue Platten um zu verhindern, dass alte Platten unbemerkt aussteigen und dann Daten verloren gehen

    Unnötig, für sowas hat man ein Backup...

  • Das sind SMR Platten, bei denen ein Problem während des Rebuild nicht ungewöhnlich ist.

    Die "Seuche" mit den SMR von WD wird uns wohl noch einige Zeit begleiten. Bin damals auch drauf reingefallen, deshalb ist WD gestorben für meine NAS. Aber die neuen 8 TB-Platten des TE sind CMR

    für sowas hat man ein Backup

    Joo, ich käme auch nie auf die Idee prophylaktisch Platten alle 3 Jahre zu tauschen. Dafür hab ich ja das RAID5. Und unbemerkt steigen die sowieso nicht aus. Da krieg ich eine Mail. Dann wird eine neue bestellt, tauscht, und fertig ist die Laube


    Heißt aber nicht, dass mindestens ein zusätzliches Backup nicht nötig wäre. Also für die, die ihre Daten "liebhaben" :)

  • Die Konfiguration is ein RAID5+1Spare

    Das halte ich auch für sinnlos, denn die Hot-Spare läuft auch ständig mit und altert.

    Lieber in die Schublade legen als "cold standby".


    Besser wäre m.E. ein Raid6, das hat den Vorteil daß bei gleicher Kapazität wie Raid5 + Spare 2 Platten ausfallen dürfen.


    Gruss

  • Danke für eure Kommentare, leider helfen sie mir nicht wirklich weiter.

    Wie befürchtet ist der Rebuild übers Wochenende nicht durchgelaufen, stattdessen hat die Nas wieder defekte Sektoren "gefunden".


    Ich habe jetzt testhalber eine der ausgemusterten Platten gewiped und mit der den Rebuild gestartet. Bin gespannt, ob das durchläuft.



    OT: Um einige der Kommentare zu beantworten: Ich hab vor ein paar Jahren 15 Tausend Euro bezahlt, damit ein Datenwiederherstellunsunternehmen die Daten eines gefailten Raid6 von einer Qnap wieder hergestellt hat. Was war passiert? Es ist eine Festplatte ausgefallen (lief nicht mahr an). Nach dem Tausch schlug der Rebuild fehl, weil 2 weitere Festplatten unbemerkt von der Qnap-firmware defekte Sektoren entwickelt hatten. Das führte dann dazu, das das Raid nicht mehr mit Bordmitteln repariert werden konnte. Das Backup war eine Woche alt. Die Daten (Massenspektrometrie) , die in dieser Woche produziert wurden waren mehr als 15k Euro wert. Deswegen tausche ich jetzt turnusmässig die Platten alle 3 Jahre. Ausserdem werden alle paar Wochen die Festplatten im Betrieb getestet. Wichtige Daten werden mittlerweile täglich innerhalb der entsprechenden Box kopiert, von einer zur nächsten Partition. Dann Wöchentlich zu einer anderen Box in einem anderen Raum.

    Eine Enclosure Spare im Standby altert imho nicht so sehr wie eine Platte im laufendenden Betrieb. Mir ist es lieber, der Rebuild startet sofort. Aber ich gebe zu, es gibt zu Raid 6 keine großen Unterschiede.


    Die Qnap, um die es hier geht ist das Backupsystem. Ich verhandle mit dem Chef gerade, eine neue Box zu kaufen. Wäre aber trotzdem wichtig herauszufinden, was hier schief läuft, also warum die Qnap defekte Sektoren findet, wo keine sind.

  • Also wenn innerhalb einer Woche Daten anfallen die so viel Wert haben, dann muss die Backupstrategie dringend überdacht werden!

  • Wie ich in #4 schon geschrieben habe, sind die WD60EFAX SMR Platten und NICHT für Dein NAS freigegeben. Auch ist hier das alte QTS nicht hilfreich. Beim Rebuild mit SMR Platten gibt es immer Probleme, kann ich ein Lied von Singen. Ich hatte die WD40EFAX - andauernd Fehler.

    Wenn Du ein Backup hast, baue Dein System komplett neu auf. Mit neuem NAS, da muss Dein Chef mal in tief die Tasche greifen

  • Ist bei so einem Anwendungsfall ein NAS überhaupt die richtige Lösung?

    Ich habe damals alle Daten im Intranet gespeichert, die IT des Unternehmens hat für die Redundanz gesorgt. Mir ist noch nicht mal 1 Byte abhanden gekommen in ein paar Jahrzehnten. Nunja, das war eine Firma mit >100.000 MA. Aber zwischen ganz klein und ganz groß muss es doch auch etwas praktikables geben.

    Oder man beauftragt jemand externes. Nur mal so ein Gedanke :)

  • Aber ich habe doch ein Problem mit den neuen WD80EFPX?

    Also die 60EFAX werden (sollen) raus, obwohl sie keine Probleme gemacht haben, nur wegen Alter.


    Oder verursachen die noch nicht getauschten 60EFAX das Problem während des rebuild?


    Und nochmal zur Situation: Die Box um die es hier geht ist nicht die, bei der 15k Euro Daten pro Woche anfallen. Da arbeite ich inzwischen mit einer sehr viel grösseren Box. in der Grössenordnung von 60x 20 TB Platten. Das mit dem Datenverlust ist bestimmt schon 15 Jahre her. Die Qnap hier hat "nur" Daten aus den Bürobetrieb. Und ist wie gesagt das Backup. Trotzdem muss ich die komplette Kiste kopieren, bevor ich sie ausphasen könnte. Mal sehen.

  • [Bad Block Log]: Invalid data found on Host: Disk 3 at sector (1319351168, 112, 512).

    Ist das denn die getauschte Disk?


    Generell würde ich aber auch dazu tendieren, das gesamte NAS auszutauschen, Deine Disk-Tauschaktion halte ich auch eher für überflüssig, vor allem in so einem uralt Gerät... Neues NAS mit den neuen Disks aufsetzen, Daten aus Backup (das ab sofort aktuell gehalten werden sollte) wiederherstellen und dann kannst Du das alte NAS samt alten Disks als erstes/zweites Backup verwenden.

  • Ja, die Fehler kommen immer auf den neu eingesetzten Platten. In dem Fall abwechselnd Disk 3 oder 4. Mit jeweils 3 neuen Fastplatten vom gleichen Typ (WD80EFPX) probiert.

  • dolbyman Ja. Aber ich kann nicht das aktuelle Backup "abschiessen", bevor ich nicht ein anderes Backup bereits gemacht habe. Auch beinhaltet das aktuelle Backup eventuell Dateiversionen von vor einigen Monaten/Jahren, die ich nicht aus dem Produktivsystem wiederherstellen kann. Das sind Daten vom Typ "Oh, ich hab gerade gemerkt, dass ich vor 6 Monaten die Hälfte der Word-Datei gelöscht und dann abgespeichert habe."

  • Dann braucht dein "Backup" (Wenn die Daten ausserhalb des NAS NICHT mehr existieren, dann ist das NAS KEIN Backup) ein Backup.

    Ne 22TB USB Backupplatte drann und schnell ein Backup ziehen..ist ja net schwer.

  • In anderen Worten: Ihr habt momentan kein brauchbares Backup!

    Deshalb wie schon gesagt: schnell zusehen, dass ein aktuelles, echtes Backup (auf einem anderen Gerät) erstellt wird bevor weiter rumprobiert wird.