[4. Sammelthema] Probleme mit Festplatten-Standby

  • Unter Festplatte wird seither nicht nur die Datenträger, meistens auch die Lese- und Schreibköpfe verstanden, sondern auch Cache, Controller u.a.m.

    Klar... wenn jemand von HDD/ Festplatte spricht ist meist die Gesamtheit gemeint.

    In dem Kontext "HDD Standby" ist es mMn durchaus sinnvoll zwischen Platte und Controller zu unterscheiden, denn wenn die SMART Werte aus dem Controller kommen, dann muss die HDD nicht anlaufen und kann ergo weiterschlafen, sofern darunter die Aktivität der Platten verstanden wird, wie ich es zumindest verstehe.


    Also für mich schläft eine HDD solange die Platten nicht drehen und die Köppe stillstehen, egal was der Controller noch kommuniziert oder verarbeitet...

  • dann muss die HDD nicht anlaufen

    O-Ton chef1: Wie definierst du in diesem Zusammenhang HDD?:evil::D


    Verstehe die Unterscheidung zwischen Platte und Controller nicht.

    Das heißt, bei deinen Festplatten dreht der Controller auch auf der Spindel mit?;)


    Lieber chef1 , wenn man etwas nicht verstehen will, kann man zu jedem Satz klugsch...en.:P

  • Also ich habe da ja auch schon so einige Untersuchungen gemacht und bei mir ist es defintiv so, dass es laut System/OS keinerlei Zugriff auf die HDD durch irgeneinen Dienst gibt, das System schläft eigentlich (IO = 0) aber die Platten rattern.


    Ich glaube inzwischen das ist ein spezielles Thema der Platten selbst, ich erklär mir das so, dass die osich irgendwie selbst optimieren. Vielleicht ist es ja auch ein Firmware Thema ... ich habe Seagate Ironwolfs verbaut.

  • Das heißt, bei deinen Festplatten dreht der Controller auch auf der Spindel mit? ;)

    Also ich habe noch Festplatten, die ihren Controller auf der Hauptplatine benötigten und auch haben. Musste schon einmal meine MFM-Festplatte zur Reparatur abgeben, ohne den Controller von der Hauptplatine. Habe auch noch nachfolgende Festplattengeneration mit Mäuseklavier für die Busanbindung. Bei denen war m.W. der Controller ebenfalls weder auf der Spindel und bestenfalls ein Teil in der Festplatte. Und ich habe auch schon einmal eine Jugendgruppenstunde eines CVJM besucht, bei der gab es auch den Punkt Festplattenweitwurf. Die Festplatten waren solche MFM-Laufwerke. Das ist eine andere Gewichtsklasse als heutige Festplatten. Zugegeben, dieser CVJM hatte eine besondere Affinität zu Computern und Modems, die auch ohne Internet damals verbreitet waren. Datenaustausch funktionierte mit echten Disketten oder über BBS. Damals benötigten BBS noch kein Internet. In Deutschland war hierzu Fido statt dessen verbreitet.

  • Bei meinen MFM-Festplatten auf jeden Fall. Und bei meinen Festplatten der folgenden Generation müsste mindestens noch ein Teil der Controller-Logik auf der Hauptplatine stecken. Angesichts von Mäuseklavier sollte ein Teil der Logik aber bereits in der Festplatte eingebaut sein, mutmaßlich der hardwarenähere Teil.


    Und bei aktuellen Festplatten wollte ich diese nicht auseinander nehmen, solange sie noch funktionstüchtig sind, um nachzusehen, wo der Controller steckt. Würde ihn jedenfalls in der Festplatte und nicht auf dem rotierenden Datenträger erwarten.

  • o Bei aktuellen HDs wir dem System nur noch die Sektor Zahl mitgeteilt und das teilweise auch mit 512Byte obwohl die HD intern schon mit 4k Sektoren arbeitet.

    Das Betriebssystem legt dann in den ersten 1k die Partitionstabelle an usw.


    Alle aktuellen Consumer HDs arbeiten so, das der Controller komplett auf der HD montiert ist.

    Ins Gehäuse gehen dann 4 Kontakte zum Motor und ein paar zum Aktor, hängt dann wiederum von der Platter Anzahl und damit den einzelnen aktiven RW Köpfen.

    Sobald 2 Arm System beim Kunden ankommen, kommen noch 2 Kontakte dazu, da hier dann 2 Spulen an zu steuern sind.


    Mir sind jedenfalls keine aktuellen HDs bekannt, die Host based arbeiten, auch bei den SMR HDs kenne ich nur Host unabhängiges SMR, also alles wird vom Controller selber verwaltet und dem Host wird ggf. nur durch einen extrem lange Antwortzeit und geringe IO Leistung das direkte SMR schreiben bekannt.

    So lange also so eine HD entweder rein sequenzielle (Raidaufbau, Raid Resync ohne random Zugriffe) arbeiten kann, ist die nicht langsamer als ein CMR System, eher sogar schneller durch die höhere Datendichte.

    Kommt jetzt aber Random IO hinzu, oder werden so viele Daten erneuert, die schon auf dem SMR Teil liegen, das hier der CMR Cache voll läuft, geht es etwa 20 Jahre rückwärts mit der HD Performance.

    10-20MB/s sind dann völlig normal.


    Und wenn HDs im Idel rattern wie doof, ohne das die LEDs am NAS Zugriffe anzeigen und auch IO TOP nix liefert, liegt der Verdacht im Raum, das hier SMR HDs arbeiten die gerade neu organisieren und SMR Spuren aus dem CMR Cache neu schreiben.

  • So nun muss auch ich mal wieder mit dem Thema standby nerven.


    Mein System:

    TS-253D-4G mit 1x Seagate 16TB ST16000NE000


    Output von /root/blkdevMonitor_20151225.sh (auch stundenlanges laufen lassen liefert da keine weiteren Erkenntnisse):


    Hier meine crontab ("# 0-59/15 * * * * /etc/init.d/nss2_dusg.sh" breits erledigt):


    Das Sonderbare ist, das immer im Abstand von 6 Sekunden ein HDD Zugriff erfolgt (gut hörbat als "tacken") und im Ressorcenmonitor ist auch alle 6 Sekunden ein Schreibzugriff mit 2/s (max. 3/s, min. 1/s) zu sehen.


    Das Netzwerkkabel habe ich auch schon gezogen - alles ohne Erfolg.


    Der Prozess "ext4lazyinit" ist übrigens auch nicht in der Prozessliste zu sehen.


    Gibt es weitere Ideen?


    Vielen Dank schon mal!


    Gruß ausm Keller

  • Ich habe bei weiterem Recherchieren noch Hinweise gesehen, dass das auch rein aus der HDD Firmware heraus getriggert werden könnte.

    Also dieses alle 6 - 8 Sekunden erfolgende "Klacken" könnte auch das permanente Anfahren der Parkposition des Festplattenkopfes sein.


    Allerdings müsste doch die HDD auch in den Sleepmode gehen, wenn das NAS das ansteuert!?


    Kennt jemand hier so sein Verhalten?


    Vielen Dank!

  • Hallo Kellerknabe,


    im Crontab wird jede Minute ein Logrotate für dir MariaDB angetriggered. Das würde ich mal auskommentieren oder nur 1x täglich ausführen.


    Code
    * 4 * * * /usr/sbin/logrotate /etc/config/mariadb_mc.logr
  • Hallo Variag,


    vielen Dank! für den Tipp!


    Aber ist es nicht so, dass "* 4 * * * cmd" das Kommando nur um 4 Uhr jede Minute ausführt?

    Wäre dann nicht "einmal täglich" z.B.:

    Code
    0 4 * * * /usr/sbin/logrotate /etc/config/mariadb_mc.logr

    ?


    Danke und Gruß ausm Keller

  • Ah, stimmt ja. Das wird es dann nicht sein. Was ist denn noch installiert? (wobei jede Minute um 04:00 auch nicht so prickelnd ist)

  • Hallo,


    Anbei das Testergebnis von meinem Server:

    (habe nur bis 10 Einträge laufen lassen, sind aber 3 verschiedene Ansätze gesehen)


    Bitte um einen Tipp (oder 3), was bei mir das Problem ist.


  • Ah, stimmt ja. Das wird es dann nicht sein. Was ist denn noch installiert? (wobei jede Minute um 04:00 auch nicht so prickelnd ist)

    Ja, komisch. Gibt ja noch nen 2. Eintrag mit diesen Angaben in meiner crontab.


    Aktuell läuft gerade wieder mal blkdevMonitor_v2*.sh, das ich vom Helpdesk aus gestartet habe.

    Hier der aktuelle Output (letzte Zeilen gelöscht, da sonst über 10.000 Zeichen):

  • Das Update der Multimedia Console auf Version 1.1.5 könnte vielleicht auch ein bestehendes Problem mit dem Standby lösen:

    Mod: Nicht deklariertes Zitat ohne Quellenangabe ... korrigiert! :handbuch::arrow: Die Zitat Funktion des Forums richtig nutzen

    - If there were no activity after some time, Multimedia Console would occasionally read database files, and the NAS could not enter standby mode.

  • Ich hatte auch ein Ticket beim QNAP Support geöffnet und die haben geraten Qsync zu beenden.

    Anfangs ging der NAS nicht wirklich in Standby, aber nun klappt es sehr häufig.

    Time steht auf 5 Minuten.

    Bin mal gespannt wie die nächsten Tage laufen.

  • Hallo Zusammen,

    da mich das Thema Festplatten-Standby auch immer wieder ungewollt beschäftigt (in diesem Jahr bereits 3 Mal) klinke mich mal in diesen Beitrag ein, um meine Erfahrungen zu teilen.


    Ende Januar 2020 stellte ich (wieder einmal) fest, dass bei meiner QNAP TS251+ die Festplatten nicht mehr in den Standby gingen.

    Kurze Zeit vorher kam ein Update von HBS3 Hybrid Backup Sync. Nach deaktivieren der App war das Problem behoben, für mich aber nicht die Lösung, da die App benötigt wird. Also Ticket beim QNAP-Support aufgemacht, Standby-Test an den Support weiter geleitet und nach einigem Hin und Her kam relativ kurze Zeit später ein weiters Update von HBS3 und alles war wieder ok.

    Mitte Juli ging es dann wieder los: kein Festplatten-Standby mehr. Auch hier war ein zeitlicher Zusammenhang mit einem Update der Multimedia-Konsole festzustellen und auch hier war erst einmal die Lösung die Multimedia-Konsole auszuschalten. Also wieder ein Ticket aufgemacht. Über ca. 2 Wochen fast tägliche Kommunikation mit einer sehr engagierten Support Mitarbeiterin von QNAP. Es wurde sogar eine Fernwartung für die Entwickler in Taiwan angefordert und von mir freigegeben (mit gemischten Gefühlen auf meiner Seite). Kurz: eine neu veröffentliche Version der Multimedia-Konsole hat dann das Standby-Problem behoben.

    Nächstes und derzeit noch ungelöstes Problem mit dem HD-Standby trat dann Anfang Oktober auf. Die Eingrenzung diesmal war um einiges schwieriger, da zu dem Zeitpunkt mehrere Apps Updates bekamen, sowie das QTS innerhalb einer Woche drei Mal(!) upgedatet wurde (vermutlich aufgrund der aktuellen Angriffe auf QNAP-NAS). Alle installierten APP's, die sich stoppen lassen, habe ich Stück für Stück deaktiviert, diesmal aber ohne Erfolg: weiterhin kein Festplatten-Standby.

    Also wieder Ticket beim Support aufgemacht, die üblichen vom Support angeforderten Tests durchgeführt und dann war erst einmal Funkstille. Auf meine Rückfrage mit der Vermutung, dass diesmal das QTS selbst einen Bug hat, der den Standby verhindert, kam die Antwort vom QNAP-Support: ja, die Entwicklung hat das 'confirmed'. Wann aber ein erneutes Update ohne den Fehler kommt, könne man mir nicht sagen.

    Das ist der Stand bis heute.


    Für alle, die also ebenfalls seit Anfang Oktober Probleme mit dem Festplatten-Standby haben, bleibt also nur abzuwarten.:(

    Ich habe inzwischen bei den vielen Updates, die QNAP veröffentlicht, ein ungutes Gefühl.=O

    Vielleicht hilft es ja weiter...


    Grüße aus Hamburg

    Stefan

  • sowie das QTS innerhalb einer Woche drei Mal(!) upgedatet wurde (vermutlich aufgrund der aktuellen Angriffe auf QNAP-NAS)

    der Grund sind nicht etwaige Angriffe/ Sicherheitslücken, sondern dass die 4.5.1 komplett fürn Eimer ist... daher:

    Das ist der Stand bis heute.

    dennoch sehr schade zu hören, dass noch keine Aussage über Fixes der 4.5.1 getroffen werden kann...

    Für alle, die also ebenfalls seit Anfang Oktober Probleme mit dem Festplatten-Standby haben, bleibt also nur abzuwarten.

    ... oder Downgrade versuchen...

    Ich habe inzwischen bei den vielen Updates, die QNAP veröffentlicht, ein ungutes Gefühl.

    Nachvollziehbar, aber das ist ja zum Glück nicht die Regel... zumindest in letzter Zeit wenn es nicht gerade Major-Updates sind wie es bei 4.5.1 war.

    Aber schön dass Du mit Deinem ersten Beitrag Deine Beobachtungen geteilt hast :thumbup:

  • Hallo,


    ich hoffe auf Infos und möglichst eine Lösung, etwas Ruhe in die HDDs zu bekommen.

    Aktuelle Situation:

    TS-453A, aktuelle Firmware

    2xSSD als RAID1 für System+Apps (u.a. ContainerStatio). Diese HDDs sollen extra einen lautlosen Betrieb beim deuernden Schreiben durch die Container sicherstellen.

    2xHDD als RAID1 für Daten. Diese Platten sind recht laut im NAS-Gehäuse. Daher sollten diese idealerweise nur laufen, wenn Zugriffe erfolgen.


    Die Volume-Aktivität der HDDs:

    Volume.JPG

    Also keine Aktivität.


    RAID-Aktivität der HDDS (auch keine Aktivität):

    RAID.JPG


    HDD-Aktivität:

    HDD.JPG


    Diese Aktivität findet dauernd statt in einem Abstand von 1 bis 10min. Der Abstand ist nicht immer fest, Die Datenmenge aber immer ähnlich.

    HDD1: 60MB/s lesen, 23MB/s schreiben
    HDD2: 4MB/s lesen, 80MB/s schreiben


    Woher kommen diese Zugriffe, wenn keine Zugruffe auf die Freigaben bzw. das Volume erfolgen?

    Es ist keine Aktivität des Volume-RAID, aber evtl. von dem System-RAID, das über alle HDDs verteilt ist?
    Oder ist das eine normale RAID-Sychronisation?


    Ich würde das gern abstellen, damit die Daten-HDDs in den Ruhezustand gehen ohne Zugriffe.



    Wenn ich den Festplattenbereitschaftstest ausführe, dann sind die HDD-Schreibzugriffe dauerhaft bei ~10-20 kB/s.

    Danach bleiben die Zugriffe dauerhaft.

    HDD2.JPG


    Kann man nachvollziehen, woher die Zugriffe kommen?

    Wenn ein verstecktes System-RAID hier auf den RAID-Verbund schreibt, kann ich das über die Konsole nachvollziehen (Dateiänderungen, ggf. über den Änderungszeitpunkt)?

    Schreibvorgänge auf dem System-Volume des SSD-RAID können doch keine Schreibvorgänge auf den beiden HDDS verursachen, oder? Das ist doch ein unabhängiger Speicherpool/RAID.


    Für Tipps zum Hintergrund (System-RAIDs?) wäre ich dankbar. Noch besser wären Tipps, wie man das abstellen kann. Danke vorab :)

  • Schreibvorgänge auf dem System-Volume des SSD-RAID können doch keine Schreibvorgänge auf den beiden HDDS verursachen, oder? Das ist doch ein unabhängiger Speicherpool/RAID.

    Das ist soweit richtig. Aber Du kennst die Antwort schon, was Du an dieser Stelle übersehen hast:

    von dem System-RAID, das über alle HDDs verteilt ist

    Das System-RAID ist standardmäßig nicht nur auf alle internen HDDs verteilt, sondern auch auf alle internen Speicher-SSDs.


    Über die Kommandozeile kannst Du für Deine Zwecke die internen HDDs aus dem System-RAID entfernen, wenn Dir das System-RAID beschränkt auf Deine internen SSDs reicht.