Rebuild startet nicht?

  • Hallo,


    ich habe eine defekte HDD durch eine baugleiche ersetzt, also einfach im laufenden Betrieb ausgebaut und die neue eingebaut. Aber irgendwie passiert jetzt nichts weiter. Alle LED's am Gerät sind grün, in der Ereignisbenachrichtigung ist zu lesen, dass die Festplatte erkannt wurde und im "Speicher & Snapshots" unter "Datenträger" sehe ich die neue HDD mit einem lila Punkt (alle anderen blau), wobei Lila laut Legende für "Frei" steht.


    Wo kann ich denn sehen, ob ein Rebuild läuft, oder diesen anstoßen? Ich hatte gehofft, dass das alles automatisch passieren wird :/

  • Moin,

    für jeden der Dir helfen kann wäre es wahrscheinlich wichtig was für ein QNAP, welches QTS und welches RAID Du hast...

  • Ja, natürlich. Es handelt sich um ein TS-1635AX und es ist ein RAID 6.


    Ich habe eine Idee:

    Eventuell war in dem System eine Hot-Spare konfiguriert und diese hat bereits einen Rebuild gemacht. Was ich nicht finde, ist ein Hinweis, dass das RAID jetzt (oder früher mal) im Fehlerzustand ist. Also hat eine eventuell vorhandene Spare-HDD bereits den Fehler im Raid behoben und als ich die defekte HDD ausgetauscht habe, hat das keinen Rebuild angestoßen, weil die Hot-Spare bereits alles erledigt hat.

    Ich habe die HDD, die ich heute eingesteckt habe jetzt als Hot-Spare konfiguriert.


    Ich denke, dass alles ok ist, aber sicher bin ich mir nicht.

  • :/ mit nem hotspare habe ich noch nie gearbeitet, aber ich würde erwarten und darauf wetten, dass es im log entsprechend vermerkt ist... Sowas darf nicht einfach ohne log passieren...

  • Ja, im Log sollte bestimmt etwas stehen, ich finde nur nichts. Ich laufe an der Kiste vorbei und sehe eine rote LED. Dann tausche ich die Festplatte aus und das RAID interessiert sich dem Log nach überhaupt nicht dafür, seltsam.

  • Eine QTS Version sehe ich immer noch nicht.

    Wenn Du per SSH auf das NAS kommst, dann gib mal md_checker ein und danach mdadm -detail /dev/mdX, wobei das X eine 0 oder eine 1 sein kann, das sollte aber aus md_checker ersichtlich sein.

    Poste bitte die Ausgabe der Befehle.


    Im Log muss definitv ein Rebuild sichtbar sein, wenn er denn gelaufen ist.

    Ansonsten müsste das Raid auf "herabgestuft/degraded" stehen.


    Gruss

  • Hallo FSC830,


    der zweite Befehl mag mich nicht, aber laut dem ersten sieht es meiner Meinung nach gut aus. QTS ist vermutlich die Firmware? Das wäre dann: 4.4.3.1354. Ich habe noch eine wilde Theorie -> es gab eine Hot-Spare und diese ist ausgefallen, deshalb hat das RAID nichts gemeldet. Wobei ich auch dann etwas mehr im Log finden müsste... ...meine ich. Hier die Ausgabe:



  • Das ist ein - verloren gegangen, der Befehl heißt mdadm --detail /dev/md1, also -- vor detail.

    Sieht aber gut aus, ein Raid mit 11 HDD und alle sind online.


    Gruss

  • Hallo FSC830,


    dank deines Befehls sehe ich zum ersten mal was auf dem RAID los ist, top! Für mich sieht das gut aus, es läuft gerade ein resync und der ist schon bei 98%. Ich finde es nur seltsam, dass mir die Tatsache, dass gerade ein Resync läuft nicht von der GUI groß und rot-blinkend entgegenkommt.


    EDIT: Ne Quatsch, ein Resync, ist ja kein Rebuild. Also ich verstehe es immer noch nicht ganz, was da passiert ist, außer eben wenn die SPARE-HDD ausgefallen wäre und das für das System keine große Meldung wert ist. Das fände ich aber auch komisch.


  • Seltsam ist das schon, das nichts im Log stehen soll. Bist Du Dir da sicher?

    Mein letzter Plattendefekt war Anfang August, so sieht das bei mir im Log aus:



    Diese Meldungen solten auch bei Dir irgendwo auftauchen.


    Gruss

  • Jetzt habe ich was gefunden! Disk 12 war wohl eine HotSpare-HDD, das System hat Fehler auf Disk 1 festgestellt und die Daten auf Disk 12 verschoben. Das Ganze ist mir 11 Tage später aufgefallen, weil an der Hardware eine LED rot war. Also HDD raus und neue HDD rein, leider wurde diese Disk dann nicht automatisch dem RAID zugeordnet bzw. zu einer neuen HotSpare, das habe ich inzwischen manuell nachgeholt.


    Das Einzige was jetzt etwas seltsam ist ist, dass ich keinerlei Mailbenachrichtigungen bekommen habe, obwohl ich sogar Mails bekomme, wenn sich jemand vergebens Anmeldet usw... naja, da muss ich mir wohl die Einstellungen der Benachrichtigungen nochmal genauer ansehen. Ein fader Beigeschmack bleibt allerdings. Das das Tacho rechtsoben im Webinterface hat nie etwas angezeigt und der Systemzustand war zu jeder Zeit "Gut", obwohl die HotSpare "verbraucht" war.


    Wie hast du denn dieses schöne Log da oben erzeugt, welches du gerade gepostet hast? Wenn ich das Log über die GUI herunterlade (als .csv) und hier reinkopiere, sieht das -zumindest in der Vorschau- gruslig aus.


    Code
    Assigned RAID spare disk to RAID group "1". Storage pool: 1, Disk: Host: Disk 1.
    
    Host: Disk 1": Connected.    
    Host: Disk 1": Disconnected.   
     
    Finished migrating data between disks. Source: Host: Disk 1, Destination: Host: Disk 12, RAID Group 1.
    Started migrating data between disks. Source: Host: Disk 1, Destination: Host: Disk 12, RAID Group 1.
    Host: Disk 1": Medium error. Run a bad block scan on the drive. Replace the drive if the error persists.    
  • Wie hast du denn dieses schöne Log da oben erzeugt,

    Ganz einfach: Zeilen markieren, dann den Guttenberg spielen (Ctrl C, Ctrl V) ;).


    Gruss

  • Das Einzige was jetzt etwas seltsam ist ist, dass ich keinerlei Mailbenachrichtigungen bekommen habe, obwohl ich sogar Mails bekomme, wenn sich jemand vergebens Anmeldet usw...

    jaja, das gute Notification Center... das macht gerne mal das was es nicht soll :S

    Je nachdem wie es konfiguriert ist kann es sein dass es gar keinen Grund zur Meldung hat, wenn das Ereignis nichtmal im Log auftaucht...

  • Ich habe ja noch das gute, alte QTS 4.3.4 auf meiner Büchse, aber ich habe dafür eine Mail erhalten :).


    Code
    Date/Time: 2020/08/03 12:21:23
    Level: Warning
    
    Host: Disk 2 Read I/O error, UNRECOVERED READ ERROR sense_key=0x3, asc=0x11, ascq=0x4, CDB=88 00 00 00 00 01 5c 59 83 b8 00 00 00 08 00 00 .

    "Früher war alles besser" stimmt mal wieder :S.


    Gruss

  • Ich bin jetzt erstmal erleichtert, dass mit den Daten alles in Ordnung ist und nochmal herzlichen Dank für eure Hilfe hier im Forum. Ich habe ein Paar neue Befehle kennengelernt, wunderbar!


    PS:

    Ich bekomme alle Warnungen und Fehler als Mail geschickt, nur Informationen nicht... ...dabei belasse ich es aber.

  • Im Notification Center gibt es einen Verlauf, hier sollten die Meldungen entsprechend auftauchen wenn Du Ereignisbenachrichtigungen erstellt hast.

    Dann würde das NC wenigstens schonmal den Auftrag haben Dich zu informieren. Wenn da nichts auftaucht und Ereignisbenachrichtigungen konfiguriert sind, dann funktioniert (mal wieder) was nicht. Bei mir hat bis jetzt immer das Löschen und Neuerstellen aller Regeln geholfen.

    Nochmal prüfen müsste doch gehen wenn man die Hotspare zieht, oder?

    Ist auf jeden Fall traurig, dass das Ding so unzuverlässig läuft, vor allem wenn dann nur manche Meldungen ausbleiben und man sonst alles bekommt und daher glaubt dass alles funktioniert...

  • Ich bekomme alle Warnungen und Fehler als Mail geschickt, nur Informationen nicht...

    Die Mail kam bei mir aber definitiv als "Warning" an, daher sollte die bei Dir auch ankommen...?


    Gruss