QNAP bleibt beim Booting in "Starting System" stecken

  • Hi,


    ich habe stinknormales Reboot initiiert und nun bleibt er (TVS-H1688X mit QuTS Hero) beim Booten stecken.


    Auf der Display steht: Booting... Starting System


    Anpingen und SSH funktionieren leider nicht. Idee? Monitor anschließen kann ich auf die Schnelle leider noch nicht (müsste dann mein Arbeitsplatz halb zerlegen um den QNAP überhaupt in der HDMI-Reichweite von großen Monitor kommt... (hätt ich bloß den alten kleinen HDMI-Monitor nicht entsorgt...).


    Welche Firmware drauf ist, kann ich nicht sagen da ich nicht darauf zugreifen kann, aber es sollte die aktuellste Version sein (Läuft erst seit einer Woche, ist also nagelneu).


    Viele Grüße

    Floh

  • Booting... Starting System

    Das ist der default Wert des Displays beim Boot, bedeutet also nur das noch kein Signal ans LCD gesendet wurde, bringt also nicht viel zur Fehlerdiagnose.


    Mal runter fahren(Strom weg), alle Platten nen Zentimeter rausziehen (so das kein Kontakt mehr besteht) und neu-starten , dann sollte das Setup booten.

    Wenn das klappt ist irgendwas auf den Platten faul, Wenn auch nicht dann ist entweder das DOM oder was anderes im Argen

  • Hi, habe mit ausgeschaltete Netzschalter probiert. Leider half das nicht.


    Also werde ich als nächstes einen Pool rausholen und starten (d.h. nur ein Pool mit Systemvolume ist drin). Hoffe ich kann dann die große Volumen nachher wieder reinstecken, wenn ja wie am besten vorgehen?


    NVMe auch ausbauen? (Ist "nur" SSD Cache)


    Grüße

    Floh

  • Also werde ich als nächstes einen Pool rausholen und starten (d.h. nur ein Pool mit Systemvolume ist drin).

    Bitte alle HDD raus, NVMe auch. Es geht ja darum, dass das System (QTS auf den HDD/NVMe) nicht gestartet wird um Probleme daran auszuschließen.

    wenn ja wie am besten vorgehen?

    NAS abschalten, alle HDD/NVMe raus (Steckplätze merken) und NAS einschalten. Dann schauen ob bootet. Die Platten können später einfach wieder im abgeschalteten Zustand eingesetzt werden, aber so weit sind wir ja noch lange nicht :)


    Bereite Dich sicherheitshalber schonmal darauf vor das Gerät an einen Monitor zu hängen.

  • Ich habe mich schon innerlich darauf eingestellt, daß ich einen großen Beamer holen werde... (Muß nur noch den "Leinwandproblem" lösen da kein Wand frei ist...).


    Aktueller Stand, NAS startete nicht mit nur großen Pool ausgehängt. Jetzt ist er gestartet als ich die SSDs mit Systempool auch ausgebaut habe, d.h. aktuell ist nur NVMe drin. D.h. schon mal gut daß das Ding funktioniert.


    Wie ist die Prozedur, die Festplatten im Laufenden Betrieb reinzustecken? Gibts einen Wizard hierfür?


    Ich bin jetzt eingeloggt.


    UPDATE (11:00Uhr):

    Ich habe 4 SSDs reingeschoben (= Pool1 mit Systemvolume). Dann auf "Raid Gruppe Wiederherstellen" angeklickt. Nun kam nach einer Weile mit "Änderungen werden übernommen - Bitte warten" erscheint dann eine Meldung "Der Server ist zur Zeit ausgelastet. Bitte wiederholen Sie den Vorgang später.". Wenn ich nichts weiter mache kommt ein weitere Dialog "Der Server ist ausgelastet oder das Netzwerk ist getrennt" Vergewissern Sie sich, dass das NAS erreichbar ist und laden Sie dann die Seite neu.", aber da läuft aktuell nix. CPU ist idling (laut top wenn ich per SSH darauf zugreife) und Festplatten sind ruhig (keine Geblinke an der Gehäusenfront).


    Ich habe den Prozedur wiederholt (also ausgeschaltet, Festplatten alle raus) dann gestartet und dieses Mal alle Festplatten (4x SSD für Pool1 und 5x HDD für Pool2). Mit selben Ergebnis beim Versuchen Pool1 wieder zum Laufen zu bringen.


    dmesg spukt folgendes aus:

    Code
    [ 1967.344921] INFO: task l2arc_feed_thre:3189 blocked for more than 120 seconds.
    [ 1967.352139]       Tainted: P     U     O    4.14.24-qnap #1
    [ 1967.357714] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
    [ 1967.365524] l2arc_feed_thre D    0  3189      2 0x80000000


    Und nun? :( Wenn ich in SSH schaue gäbe da 2 möglicherweise sinnvolle Optionen:

    • Reboot in Rescue mode (w/o configured disk))
    • Reboot in Maintenance mode


    Info für Euch: Pool1 ist aktuell bis auf System nix drin also mir egal ob das plattgemacht wird. Pool2 sind mit Daten gefüllt, die ich gern behalten hätte. Erschwerend kommt: Pool2 hat Volumen mit aktivierte SSD-Cache (2x NVMe) und die homes sind auf Pool2 festgelegt.

    3 Mal editiert, zuletzt von floh79 ()

  • Ist vorhanden nur dauert es dann 3 Tage sie wieder aufzuspielen, das hätt ich gern erspart. 😉

  • Hi, bin wieder zurück und mache hier weiter.

    Bereite Dich sicherheitshalber schonmal darauf vor das Gerät an einen Monitor zu hängen.

    Inzwischen habe ich Monitor von Büro mitgebracht und angeschlossen. Da ist eine Meldung, daß ich mit Alt+F2 in Konsole komme was ich gleich gemacht habe. Allerdings ist der Bildschirm dann schwarz. :/


    Außerdem habe ich mit Festplatten eingebaut gebootet, und an der Stelle wo es hängenbleibt ist das Bild ebenso schwarz (leer), vorher war Cursor-Geblinke zu sehen und nix passiert. Ich habe ebenso festgestellt, daß nix konstruktives angezeigt wird wenn ich kein Festplatte angeschlossen habe. Muß ich beim Booten an einer Stelle auf ESC drücken, damit ich diese leere "Splash screen" beim Starten von Betriebssystem wegmache?


    Was anderes, sobald ich auf "Raid-Gruppe Wiederherstellen" anklicke, ist der CPU idling und kein LED-Geblinke auf der Front. Allerdings habe ich hohe Load festgestellt, über 60 was auf I/O deutet... (Bin über SSH drin). Wenn ich hier zfs list eingebe, bleibt es ohne Rückmeldung stecken (d.h. weder irgendein Ausgabe noch Eingabe-Prompt kommt).


    Nur mal um sicher zu sein: QuTS Hero arbeitet nicht mit mdraid, sondern ausschließlich ZFF, ist das korrekt? Was soll ich in ZFS eingeben um zu schauen, wo er eigentlich steckenbleibt? Gibts Logdaten für ZFS?


    So schaut's aus, wenn ich RAID-Gruppe noch nicht wiederherstelle aber die Festplatten nach dem Booten reinschiebe:

    Bash
    [~] # zfs list
    NAME       USED  AVAIL  REFER  MOUNTPOINT
    zpool256  1.04M   383M   144K  /zpool256

    Sollte nicht eigentlich noch andere zpools auftauchen sobald ich die Festplatten reingeschoben habe? Zumindest mit "OFFLINE"-Vermerk oder sowas?


    UPDATE:

    Mit Pool2 startet QNAP ohne Probleme, d.h. mit Pool1 (mit Systemvolumen) funktioniert leider nicht.


    Viele Grüße
    Floh

    3 Mal editiert, zuletzt von floh79 ()

  • Ich habe vor über einer Woche Ticket aufgemacht. Nach erneuter Nachfrage wies aussieht habe ich eine Rückmeldung erhalten:

    Zitat von QNAP Support

    vielen Dank für Ihre Nachricht. Antwort aus TW:

    This issue will be solved on QTS Hero 4.5.3 v3

    Leider gibt es noch kein Release-Datum für diese Version. Ich bitte noch um ein wenig Geduld.

    Scheint so, daß ein Bug gefixt wurde der mein Problem lösen sollte... nur frage ich mich, wie lange dauert üblicherweise bis der nächste Release raus ist? Gibts Erfahrungswert bzgl. QuTS Hero Firmware z.B. wie häufig ein Update kommt?


    Grüße

    Floh

  • Schau dazu doch einfach mal in die release notes, da stehen Daten dabei. Grundsätzlich ist es sehr unterschiedlich, je nachdem wie gut oder schlecht die Vorgängerversion lief :P

    Für QTS steht wohl das nächste Update kurz bevor, keine Ahnung ob sich das bei hero widerspiegelt.

  • Für QTS steht wohl das nächste Update kurz bevor

    Woran machst Du das fest?

    Oder ist das nur eine wilde Spekulation?

    Aber ja, im Prinzip so jeden Monat ein neues Release.

    Dauert paar Tage, dann ist es wieder verschwunden.

    QNAP legt halt auch eine gewisse Beständigkeit an den Tag. :beer:

  • Ich hab letzte Woche erst 4.5.3.1652 installiert.

    Die Kiste ist nur intern, bzw. über VPN erreichbar.

    Ich kann durchaus mit neuer Firmware warten.

  • Schau dazu doch einfach mal in die release notes, da stehen Daten dabei.

    Hi, ich habe dort nachgeschaut:

    https://www.qnap.com/de-de/rel…hero/h4.5.3.1670/20210515


    Aber ich finde kein Release Note zum 4.5.3 V2. Wie gesagt ich möchte wissen wie groß da die "Intervalle" ist zwischen V1, V2, V3... und daher habe ich nach Erfahrungen gefragt. Und überhaupt, auf Download-Seite sehe ich nur 4.5.1, 4.5.2 4.5.3, ... aber V3 wie von Support geschrieben:?:

  • Aber ich finde kein Release Note zum 4.5.3 V2.

    Das habe ich auch nicht ganz geblickt, was damit gemeint ist. Die Deklaration mit V2 oder V3 ist auch unüblich, der Supporter hat diese wahrscheinlich genutzt der er die zukünftige Build nicht kennt... Vielleicht wurde die "V1" ja zurückgezogen und deshalb gibt es nur noch eine Build, die "V2".

    Wenn man sich die Release Notes mal so anschaut bekommt hero deutlich seltener Updates als QTS. So alle 2-3 Monate, bei QTS ist es momentan monatlich. Das ist aber sicherlich auch von vielen Faktoren abhängig.

  • Soeben habe ich Firmwareaktualisierung durchgeführt: 4.5.3 Build 1670 => 4.5.3 Build 1698.

    Nun konnte ich den RAID-Gruppe wiederherstellen, yay!


    In Changelog kann ich nur dieses Punkt vermuten:

    Mod: Zitat ohne Quellenangabe ... korrigiert! :handbuch::arrow: Forenregeln und Die Zitat Funktion des Forums richtig nutzen

    - Users could not bring a storage pool online if QSAL (QNAP SSD Antiwear Leveling) was enabled on this storage pool.

    Bei mir ist QSAL aktiviert, ich frage mich allerdings ob ich der einzige bin der das nutzt. So speziell ist meine Konfiguration eigentlich nicht und ich nutze 4x Samsung 870 EVO 1TB (also die betroffene Pool).


    Viele Grüße

    Floh

  • Ich glaube hero selbst ist (hier) schon nicht sehr verbreitet. Dann noch jemand mit der Konstellation und Option... Schwierig ?(

  • Hier gut möglich ja... aber nicht bei der Unternehmen QNAP daher wundert mich, daß solche Bug nicht früher aufgefallen ist (außer es ist eine spezielle Konstellation was ich mir nicht vorstellen kann).