[4. Sammelthema] Probleme mit Festplatten-Standby

  • Mit mdadm -D /dev/md9 die vorhandenen Platten anzeigen lassen. Gleiches dann auch für md13

    Ich bin da recht unbedarft und hätte daher gern eine kurze Bestätigung, dass ich nichts falsch mache :saint:


    Hier die Auswertung:



    Passen die Größen (~500 und ~450MB)?

    Sind die md9 und md13 immer so bennant oder könnte es da unterschiede geben?


    Meine Konstellation ist:

    2xSSD RAIS 1 für System (Schacht 1+2)

    2xHDD RAID1 für Daten (Schacht 3+4)


    md_checker zeigt das:


    D.h.:

    /dev/sda + /dev/sdb sind die beiden SSDs (Port 1+2),

    /dev/sdc + /dev/sdd die beiden HDDs (Port 3+4)

    Soweit korrekt?


    Zusammen bräuchte ich dann diese Befehle zum Trennen des System-Raid für die HDDs:


    Code
    mdadm /dev/md9 --fail /dev/sdc1
    mdadm /dev/md9 --fail /dev/sdd1
    
    mdadm /dev/md13 --fail /dev/sdc4
    mdadm /dev/md13 --fail /dev/sdd4


    Ist das so korrekt?

    Vielen Dank fürs Prüfen :)

  • Sieht ok so aus denke ich es reicht allerdings auch wirklich nur eine Platte im md9+md13 zu lassen. Beim erneuten synchronisieren erfolgt das über alle Platten. Lässt sich dann nach dem resync wieder mit mdadm -D /dev/md9 prüfen


    Code
        Number   Major   Minor   RaidDevice State
           0       8        1        0      active sync   /dev/sda1
          34       8       17        1      spare rebuilding   /dev/sdb1
          32       8       33        2      spare rebuilding   /dev/sdc1
          33       8       49        3      spare rebuilding   /dev/sdd1
  • Sieht ok so aus denke ich es reicht allerdings auch wirklich nur eine Platte im md9+md13 zu lassen.

    Ich werden das RAID für md9 und md13 auf den ersten beiden SSDs lassen. So sind zumindest die System-Raids sowie das System-Volume gegen den Ausfall einer SSD abgesichert.


    Ich hatte das Skript nicht zum Laufen gebracht. Kann man das nicht einfach über die Konsole ausführen?

    Daher habe ich die 4 Befehle direkt ausgeführt.

    Bis jetzt zeige die HDDs keine Aktivität mehr im Ressourcenmonitor. Scheint also funktioniert zu haben.

    Danke nochmal für die Hilfe.


    Ergänzung:

    Die Anpassung hatte Erfolg. Die HDDs gehen nun in den Ruhemodus. Gut zu sehen an der Temperatur (angezeigt in HomeAssistant) - gleich 10° kühler.

    Einmal editiert, zuletzt von rws ()

  • Hallo zusammen.


    irgendwas scheine ich falsch zu machen...


    In meinem TS 451+ sind 3 HDDs (Raid 5) und eine SSD verbaut.


    Wenn ich das Gerät einschalte laufen alle Platten an und prima. Wenn ich es aber lange nicht benutze, dann laufen die Platten weiter. Immer, ohne jemals in den Ruheszustand zu gehen.

    Auch wenn ich die Netzwerkverbindung treene, dann laufen die Platten weiter.


    Eigentlich wäre es doch gut, wenn sie bei längerer Inaktivität in den Ruhemodus gehen, oder?


    Wer hat da eine Idee für mich?


    Danke

    H.

  • Eigentlich wäre es doch gut, wenn sie bei längerer Inaktivität in den Ruhemodus gehen, oder?

    Ist Ansichtssache... mir persönlich ist es egal, die Platten sind ja für Dauerbetrieb gemacht. Ich mag aber grundsätzlich wissen, was die Platten ständig beschäftigt, denn ich bin der Boss über mein System ;)


    Für Ideen fehlen zu viele Infos, insbesondere welche Dienste / Apps auf dem Gerät aktiv sind!

    Es gibt dafür auch einen eigenen Sammelthread, den Du Dir mal anschauen könntest: [4. Sammelthema] Probleme mit Festplatten-Standby (1.Beitrag beachten)

  • Bei mir dient das NAS nur zum Backup und Abends als Medienserver.

    D.h. rund 12-16 Stunden am Tag läuft es nicht.

    Da wären ein Ruhemodus aus Energiegesichtspunkten eigentlich nicht schlecht.


    Bzgl des Zugriffs hast Du Recht

  • Hallo Forum,


    ich nutze ein TS-231P2 in (hoffentlich) Minimalkonfiguration als reines Familien-NAS, d.h. Rechner der Bewohner im Haushalt sollen auf ihre jeweiligen Ordner zugreifen dürfen und können. Die übrige Zeit soll das NAS mit HDDs im StandBy vor sich hindümpeln. Zugriffe erfolgen manchmal täglich, manchmal aber nur sporadisch wöchentlich - aber immer nur aus dem LAN. Keinen anderen Dienst oder kein anderes Feature will ich nutzen.


    WOL und StandBy funktionieren einwandfrei. Was aber stört: Das NAS fährt bei Nichtnutzung die HDDs in regelmäßigen Abständen bzw. täglich zu gleichen Zeiten (meist alle 2 Stunden, immer um halb) einmal kurz hoch. Dann rattern die HDDs kurz und nach ein paar Minuten legen sie sich wieder schlafen. Dies macht das NAS auch, wenn es gar nicht mit dem Netzwerk verbunden ist, daher - denke ich - kommt der Aufweckbefehl aus dem System, nicht von extern. Ich habe in einem anderen Beitrag etwas von Cronjobs gelesen, die die HDDs wecken - kann das der Grund sein, wozu brauche ich diese - und kann ich die deaktivieren? Wie geschrieben: Ich verlange von dem TS-231P2 nichts anderes, als ein stupides NAS-Dasein (mit Raid, falls eine HDD mal aussteigt). Welche klickibunti-Häkchen und Knöpchen muss ich dafür in der Bedienoberfläche noch drücken, damit dieses Gerät funktioniert wie zuvor 7 Jahre lang eine billige DLink-Dose, die leider nur im Netzzugriff quälend lahm war, daher der Umstieg aufs Qnap.


    Gruß

    Christoph

  • Hallo zusammen,


    ich habe jetzt einmal (hoffe ich) alle nicht-benötigten Funktionen abgeschaltet.


    Anhängend das Log aus dem HDD Standby Test.


    blk_tmp6.txt


    Hat jemand eine Idee, warum meine Platten nicht in den Standby gehen?

  • Randanmerkung: Gestern ist mir Platte1 abgeraucht (Hardwaredefekt), auf der natürlich Apps und Co installiert sind. In diesem NAS ist kein Raid im Einsatz, sondern alles (4) Single Disks. Wie auch immer: seitdem Platte 1 defekt und raus ist, ist das NAS komplett leise und macht keinen Mucks mehr ;)


    Also entweder war die Platte von sich aus der Meinung ständig irgendwas rattern zu müssen, oder eben ein permanenter Zugriff durch eine App o.ä. Wobei für meine Tests wie viele hier in der Runde, immer sämtliche Apps deaktiviert hatten.


    Bin mal gespannt was es nach der Neuinitialisierung aussieht.

  • Die Anpassung hatte Erfolg. Die HDDs gehen nun in den Ruhemodus. Gut zu sehen an der Temperatur (angezeigt in HomeAssistant) - gleich 10° kühler.

    Ich wollte nochmal eine Rückmeldung dazu geben...

    QNAP setzt die Einstellungen von selbst wieder zurück.

    Nach dem Firmwareupdate war das System-RAID für md9 und md13 wieder über alle 4 Platten aktiv.

    Ob das nur beim Firmwareupdate passiert (evtl. beim Punkt "Dateisystem-Aktualisierung" nach dem eigentlichen Update) oder beim Neustart kann ich nicht sagen. Ich würde tippen, dass nach dem Firmware-Update die "Dateisystem-Aktualisierung" im Prinzip nur das RAID-Rebuild ist, um die aktualisierte Version der ersten HDD über das System-RAID zu synchronisieren und dabei das RAID wiederhergestellt wird.

  • Was die Fehleranalyse betrifft bin ich noch unbedarft, weil mein NAS TS-128A bisher ohne Murren funktioniert hat.


    Da die Festplatte in meinem NAS seit dem Update von Version 4.4.3.1439 auf die Version 4.5.1.1480 nicht mehr in den Ruhezustand geht (zuvor hat das immer funktioniert) und auch das folgende Update auf die Version 4.5.1.1495 keine Besserung gebracht hat, habe ich mir das Script "blkdevMonitor_20151225.sh" herunter geladen und wie beschrieben laufen lassen.

    Das Ergebnis sieht so aus:


    blkdevMonitor_v2.log


    Ich habe versucht, darin die Ursache meines Problems zu finden.

    Es gibt nur 4 Prozesse, die aufgeführt sind.

    Davon sind laut Ressource-Monitor 3 Kernel-Prozesse:

    Code
    md9_raid1 -> WRITE block ... on sda1
    kjournald  -> WRITE block on md9
    kworker/u8:1 -> WRITE block ... on md9

    und 1 Prozess scheint zu einem Syslog Server zu gehören:

    Code
    rsyslogd -> WRITE block ... on md9
    rsyslogd -> dirtied inode 20310 (kmsg) on md9


    Die Prozess-IDs im Log für die Kernel-Prozesse stimmen mit den im Ressource-Monnitor aufgezeigten IDs überein, die ID des rsyslogd weicht jedoch ab (im Log ist es die ID 8315 und im Ressource-Monitor ist es die 16220).


    Leider kann ich mit dem Ergebnis meiner Analyse nichts anfangen.

    Einzig die Tatsache, dass kjournald, kworker/u8:1 und rsyslogd auf md9 zugreifen und dieser wiederum auf die Festplatte (sda1) legt mir nahe, dass ich verstehen muss, was kjournald, kworker/u8:1 und rsyslogd veranlasst, etwas schreiben zu wollen.

    Und die Zeile

    Code
    rsyslogd(8315): dirtied inode 20310 (kmsg) on md9

    sagt mir überhaupt nichts.


    Kann mir jemand helfen, den Log zu verstehen?


    Vielen Dank im Voraus und viele Grüße

    Andreas

  • Nach dem Firmwareupdate war das System-RAID für md9 und md13 wieder über alle 4 Platten aktiv.

    Ob das nur beim Firmwareupdate passiert (evtl. beim Punkt "Dateisystem-Aktualisierung" nach dem eigentlichen Update) oder beim Neustart kann ich nicht sagen.

    Klar nach einem reboot ist wieder alles beim alten wenn Du es nur temporär deaktiviert hast. Daher mache ich das auch per script und lasse den Verbund generell täglich einmal wieder synchronisieren. Nach einem Reboot / Firmware Update muss das Script zum internen "Raid entknüpfen" erneut ausgeführt werden.

  • Zumindest letzteres ist ausschlaggebend. Was da zuletzt geschrieben wurde kannst du mit dmesg sehen.

    Hallo,


    ich habe die Anmerkung so verstanden, dass ich zu dem Eintrag mit rsyslogd mit Hilfe von dmesg heraus finden kann, was diesen Prozess getriggert hat.


    Hier sind der Log von blkdevMonitor blkdevMonitor_v2_2020_12_02_2.log und die Ausgabe von dmesg blkdev_dmesg_2020_12_02_2.log.


    Zu dem Eintrag

    Code
    <7>[11494.280981] rsyslogd(23592): WRITE block 968200 on md9

    finde ich in der Ausgabe von dmesg nur

    Ich vermute, dass pidof den rsyslogd getriggert hat, aber dummerweise finde ich pidof nicht im Ressource-Monitor.


    Desweiteren fällt mir auf, dass in der Ausgabe von dmesg öfter Eintrage mit hal_enc_temp zu finden sind. Aber auch dieser Prozess ist nicht im Ressource-Manager zu finden.


    Ich komme irgendwie immer noch nicht weiter.


    Viele Grüße

    Andreas

    Einmal editiert, zuletzt von Wimmelbach ()

  • Hallo zusammen,


    Dr. Mike hat mich auf diesen Beitrag verwiesen, also stelle ich hier meine Fragen und hoffe, Ihr könnt mir mit eurer Erfahrung helfen! :)


    Meine Festplatten in mein Qnap 453D gehen anscheinend auch nie in den Standby. Habe schon alle Apps abgeschaltet bis auf Microsoft-Netzwerk und HBS3. Heute Nacht habe ich den Festplattenbereitschafts Test nochmals durchlaufen lassen, siehe Anhang.


    blk_tmp (4).txt


    Das komische ist, selbst wenn hier in dieser Datei nicht protokolliert wird wie z.B. zwischen 00:26 und 00:56, gehen die Platten(ich habe 5 min eingestellt, bei nicht Aktivität) trotzdem nicht schlafen! Mein Qnap steht im Büro also nicht zuhause und habe extra unsere Überwachungskamera auf das NAS gerichtet, damit ich sehen kann ob das Lämpchen mal ausgeht, aber nichts da!????? Bei meinen anderen Qnap TS219PII gehen die Platten brav schlafen ohne Probleme.


    Könnt jemand aus dieser Datei was rauslesen, woran das liegt?


    Vielen lieben Dank im Voraus

    LG

    cybersufer11

  • Schalte mal HBS3 aus, die hatte in der Vergangenheit irgendwas und hat die HDs wach gehalten.