Festplatten untereinander tauschen

  • Hallo zusammen,


    Ich habe in meinem QNAP vier Festplatten in einem RAID6-Verbund laufen. In den Log-Files habe ich etliche Fehler entdeckt, welcher entweder auf eine defekte/beeinträchtigte Disk oder aber auf ein defektes Backplane schliessen lassen. Abgesehen von unerwarteten Neustarts, gibt es ansonsten keine Hinweise auf ein Problem. Leider habe ich gerade keine Ersatz-Festplatte hier herumliegen, um unter Umständen zumindest eine der möglichen Fehlerquellen zu eliminieren.


    Lange Rede kurzer Sinn: zum Prüfen wo der Defekt nun effektiv liegt, würde ich gerne zwei eingebaute Festplatten untereinander tauschen. Ist dies ohne Datenverlust möglich bzw. sind die Festplatten markiert, damit diese wieder korrekt erkannt werden und das RAID anschliessend keinen Resync startet? Ich würde den Wechsel natürlich im ausgeschalteten Zustand vornehmen.


    Besten Dank für Eure Erfahrungen und Anmerkungen zu dem Thema.

  • Vorne weg, bevor Du große Experimente machst und da Du Dir nicht sicher bist, ob min. eine Festplatte nicht ohnehin beschädigt ist würde ich dringend empfehlen eine Sicherung der Daten und der Einstellungen, bzw. der Apps und wenn vorhanden des DC vornehmen.


    Was steht den genau im Log-File? Kannst Du dies mal posten?

    Was sagen den die SMART-Werte der Festplatten?

    Die Festplatten schon prüfen lassen?

    Systemprüfung?

    Mit dem "QNAP Diagnostic Tool" gibt es im App Center ein zusätzliches Prüfttool.

  • Hallo,


    um welches NAS handelt es sich?

    Welche FW-Version ist installiert?

    Welche HDDs werden verwendet?


    Die HDDs solltest du dann auch mit dem Diagnose-Tool des Herstellers testen. Wenn du die HDDs genannt hast, können wir dir den Link dazu nennen,


    Das Tauschen der HDDs untereinander ist keine gute Idee.

  • Ich habe auch Probleme mit dem TA 251A Firmware 4.3.4 er System

    Es sind 2 x 3 TB verbaut und HD 1 ist die Led Rot an dem QNAP.

    Die HDs sind WD die für NAS geeigneten.

    Was kann ich tun?

    Die WD Garantie ist abgelaufen.

    Kann ich die defekte ausbauen und am PC formatieren und dann wieder einbauen und HD 2 auf HD 1 spiegeln?

    Oder geht das nicht?

    LG

  • Mit den Tools von WD die HDD prüfen. Wenn sie defekt ist -> ersetzen.

    Wenn Du ein Raid1 hast wird der Spiegel von selbst wieder aufgebaut.


    Der allgemeingültige Hinweis: ein aktuelles Backup sollte vor Änderunger vorhanden sein/erstellt werden.


    Gruss

  • Hallo zusammen,


    Vielen Dank für eure Ratschläge. Um das gerade vorneweg zu nehmen, ein aktuelles Backup ist natürlich vorhanden. Ich weiss, ist leider nicht immer selbstverständlich, daher ist die Nachfrage durchaus berechtigt.


    Zum NAS kann ich folgende Infos geben: Es handelt sich um ein TS-453A, in welchem vier WD RED 6TB Festplatten in einem RAID6-Verbund verbaut sind. Installiert ist die momentan aktuellste Firmware 4.3.4.0569.


    Im Kernel-Log wird nach jedem Neustart die folgende Fehlermeldung geloggt:

    Code
    SError: { UnrecovData 10B8B BadCRC }

    Wie gesagt, ansonsten kann ich keine weiteren besonderen Auffälligkeiten feststellen, die SMART-Werte sind in Ordnung und auch die anderen Tests im "QNAP Diagnostic Tools" laufen ohne Fehler erfolgreich durch. Die Prüfung der Festplatten mit dem Data Lifeguard Tool von WD habe ich noch nicht durchgeführt, dies werde ich noch nachholen. Wenn allerdings dieser Test auch keine weiteren Fehler hervorbringt, muss ich wohl davon ausgehen, dass die Festplatten in Ordnung sind und der Fehler auf das NAS selber zurückzuführen ist oder gibt es noch weitere Massnahmen zur definitiven Feststellung der Fehlerursache?


    Danke vielmals für eure Unterstützung.

  • SMART-Wert zeigen keine Auffälligkeiten. Ein schnelles Überfliegen des Kernel Logs konnte ich auch nichts entnehmen. Interessanter wären hier das Systemprotokoll.


    SError: { UnrecovData 10B8B BadCRC }

    Sind die Volumen verschlüsselt? Klingt für mich nach einem Verschlüsselungsproblem.


    Abgesehen von unerwarteten Neustarts, gibt es ansonsten keine Hinweise auf ein Problem.

    Das könnte auch an der Firmware 4.3.4.0569 liegen. Habe gelesen, dass das Problem mit den unerwarteten Neustarts immer noch auftreten kann, gerade bei verschlüsselten Volumen.


    Delmenhorster2017

    Mehr Angaben wären sehr hilfreich. Siehe Post2

  • Selbstverständlich kann ich an dieser Stelle auch noch das Systemprotokoll nachliefern. Abgesehen von den unvorhergesehenen Neustarts kann ich da aber auch nichts feststellen.


    Die Volumes sind nicht verschlüsselt. Den Gedanken bezüglich Firmware, insbesondere mit den vorherigen Versionen, hatte ich auch schon. Kommt hinzu, dass seit dem Update auf die aktuellste Version vor ca. zwei Wochen, kein einziger unerwarteter Neustart mehr auftrat, davor war dies mehrmals pro Woche der Fall. Allerdings wird dieser BadCRC-Fehler dennoch nach jedem Neustart ins Kernel-Log geschrieben. Normal ist dies ja sicher nicht.

  • Auch im Syslog nichts auffälliges. Was die Fehlermeldung aus dem Kernellog genau bedeutet weiss ich leider auch nicht. Wenn ansonsten keine Probleme da sind und auch die Neustarts nicht mehr sind würde ich mal abwarten und beobachten. Ich wüsste mal nachsehen, ob bei mehr eine vergleichbare Meldung steht. Könnte auch einfach ein Überbleibsel oder eine beschädigte Datei sein. Funktionieren alle Apps und benötigten Dienste?

  • Wenn man sich den gesamten Fehlerblock anschaut, dann sieht das nach Hardwarefehler oder unsauberer Steckverbindung der 2. Platte aus.

  • Hallo dr_mike


    Du würdest demnach auf einen Hardwarefehler des NAS schliessen und nicht auf einen Defekt der Festplatten? Diese habe ich bereits aus und wieder eingebaut, um zu prüfen, ob da alles richtig sitzt, konnte dabei auch nichts Verdächtiges feststellen.


    Habe jetzt einmal einen Case beim QNAP-Support eröffnet, bin gespannt was die meinen.

  • Danke für die Klarstellung, dann habe ich dich missverstanden. Wie kommst du zu dem Schluss, dass es an der Festplatte liegt und nicht am NAS? Sorry für die viele Fragerei, aber würde es gerne verstehen. Leider habe ich hier keine Ersatzplatte zur Hand und müsste zuerst die betroffene Platte als Garantiefall einschicken, ansonsten würde ich diese einfach mal tauschen und schauen ob der Fehler weg ist.

  • Ja, stimmt. Entschuldige, diese Ergebnisse wollte ich noch nachliefern. SMART-Werte sind in Ordnung, wie auch bereits über den Storage Manager des NAS ausgegeben wurde. Der Quick-Test übers Data Lifeguard Tool von WD ist ebenfalls ohne Befund. Ich lasse jetzt noch über das Tool mit dem Extended-Test die einzelnen Sektoren prüfen. Dauert aber bei der Festplattengrösse einige Stunden, melde mich wieder sobald dieser abgeschlossen ist.


    WD_SMART.PNG WD_QuickTest.PNG


    dr_mike: Gibt es sonst noch etwas, was ich prüfen kann?

  • simonhess

    Durch meinen vor kurzem erfolgten Festplattenausfall habe ich gelernt das es immer ratsam ist ein Reserve HDD parat zu haben. Würde an deiner Stelle eine neue HDD bestellen (identisch oder mit mehr Kapazität) und damit testen. Sind die Fehler nach RAID Rebuild weg kannst du in Ruhe schauen wie du das mit dem WD Support klärst. Bleibt der Fehler muss Qnap tätig werden. So oder so hast du danach für alle fälle immer eine reserve HDD da ;)

  • Damit wäre ich vorsichtig!

    So habe ich mir mal ein Raid geschrottet.

    Eine neue HDD eingebaut um sie zu testen, Rebuild lief an, Raid war ok.

    Nach dem Rebuild die HDD gezogen und wieder eine andere HDD eingesetzt, rebuild lief an, alles war gut, Raid nach Stunden wieder in Ordnung.

    Nach ca. 2 Monaten fiel tatsächlich eine HDD aus, die "Ersatzplatte" aus dem o.a. Test wurde gesteckt, und was passierte?


    Kein Rebuild! Stattdessen ein degraded Raid und eine Single Disk. Dieser Zustand war nicht mehr weg zu kriegen ausser durch ein komplettes Neuaufsetzen und initialisieren des Raids.

    Ursache alle Wahrscheinlichkeit nach: das Raid merkt sich leider die Seriennummer der HDDs und wo diese mal gesteckt waren. Deshalb hat es die "Ersatzplatte" nicht richtig eingeordnet.

    Wenn man HDDs testen will, dann am besten in einem anderen Raid System.


    Gruss

    Einmal editiert, zuletzt von FSC830 ()

  • So, der Extended Test des WD Data Lifeguard Tool hat zwölf Stunden lang jeden einzelnen Sektor der Festplatte auf Herz und Nieren geprüft, jedoch auch kein Problem festgestellt.


    WD_ExtendedTest.PNG


    Natürlich wäre die Ursache des Problems mit der Anschaffung einer zusätzlichen Festplatte rasch identifiziert. Dies ist aber eine Investition, welche ich lieber umgehen würde und in der momentanen Situation, bezüglich Ersatzplatte vor Ort, auch nicht unbedingt von Nöten ist. Ich habe keine 24/7 Verfügbarkeitsansprüche an das NAS und habe immer ein aktuelles Backup, auf welches ich im Fall der Fälle zugreifen kann.


    Mir gehen langsam die Ideen aus...

  • FSC830

    Hast du bevor du nach dem Ausfall die Platte wieder ins System gesteckt hast per PC die Partitionstabelle der HDD zurückgesetzt?

    Es gibt immer wieder Probleme wenn eine bereits partitionierte HDD in ein laufendes System gesteckt wird.


    simonhess

    Wenn du da so "schmerzfrei" bist kannst du es ja ausprobieren. Vorher noch die Konfig des NAS Sichern.

    Würde die 2 Platten (die eine mit vermutetem defekt und eine ohne probleme) ziehen und dann am PC die Partitionen löschen.

    Dann die Platten wieder ins NAS einsetzen (in die jeweils andere Bay aber versuche dir zu merken wo diese original mal gesteckt waren).

    Damit simulierst du einen Ausfall von 2 Platten den das RAID 6 aber verkraftet. Danach beten das der Rebuild sauber durchläuft (denn den Ausfall einer weitern HDD überlebt das RAID nicht bevor der Rebuild durch ist).


    WorstCase: NAS Neuinitialisieren und Backup einspielen.

  • Silent_GSG9: Danke für deinen Vorschlag, das ist gar kein schlechter Ansatz. Sofern die Platten nach erfolgter Zurücksetzung der Partition wieder korrekt als neue Festplatte vom NAS erkannt werden, müsste das ja wirklich wie beschrieben klappen. Frage mich gerade noch, ob ich beide Platten im laufenden Betrieb ziehen soll oder ob ich doch lieber das NAS vorher herunterfahre. Aber spielt vermutlich keine grosse Rolle. Werde dies heute Abend einmal versuchen, über Nacht den Rebuild laufen lassen und anschliessend kontrollieren auf welchem SATA-Anschluss nun die Fehler geloggt werden.


    Der QNAP-Support hat sich übrigens mittlerweile in einem ersten Statement zu dem Fall gemeldet. Als Ursache für den Fehler wird direkt auf eine defekte Backplane geschlossen und ich solle über den Händler das RMA-Verfahren auslösen. Leider ohne die Nennung von stichhaltigen Gründen, warum nicht doch vielleicht die Festplatte der Auslöser der Fehler ist.


    Ich möchte daher dennoch auf Nummer sicher gehen, indem ich einmal die Festplatten untereinander tausche, um so das NAS eventuell nicht zur Reparatur einschicken zu müssen.