mdadm-Frage

  • Ich habe diese Frage so aehnlich auch schon im Englischen Forum gestellt, aber noch keine Antwort bekommen, daher erlaube ich mir mal, sie hier nochmal zu stellen.


    Habe Folgendes in der Man-Page von mdadm gelesen:
    Once in a while, server administrators can initiate a "CHECK" sync_action on their array. This can be accomplished with the following command:
    echo check >> /sys/block/mdX/md/sync_action
    This will have mdadm immediately start a "check" process on the array to verify that all parity is correct. It is a good way to ensure the array is healthy, and that there are no underlying errors on any of the drives affecting your data.


    Das scheint mir sehr vernuenftig zu sein.
    Daher habe ich das mal ausprobiert.
    Nun steht im Log-File aber "rebuild" , und nichts von "check".


    Kann mir jemand genau sagen, was mdadm bei "check" tut?
    Oder kann mir jemand sagen, wo ich diese Info bekomme? (ausser im Source-Code)


    Ich habe ein RAID-5 (TS-412 mit 4x2 TB).


    Vielen Dank im voraus.

  • Hi,


    niemals steht das in der Manpage von mdadm :D
    Es gibt:

    Code
    cat /proc/mdstat


    und

    Code
    mdadm --detail /dev/mdX


    um den Status vom Raid zurück zu bekommen.


    Mit

    Code
    echo check >> /sys/block/mdX/md/sync_action


    erzwingst Du einen "check" oder auch resync.
    Dieses kommando sollte man nie nutzten, da man den resync auch mittels mdadm anhauen kann. Das wiederrum müsste in der manpage stehen ;)
    Das was Du da machst wirst Du auch nicht im "Quellcode" finden, weil es ein einfaches Blockdevice ist. Tue nur das vom dem Du auch weisst was es macht.


    Grüsse, David

  • Zitat von "Terz"

    niemals steht das in der Manpage von mdadm :D
    Mit

    Code
    echo check >> /sys/block/mdX/md/sync_action


    erzwingst Du einen "check" oder auch resync.
    Dieses kommando sollte man nie nutzten, da man den resync auch mittels mdadm anhauen kann. Das wiederrum müsste in der manpage stehen ;)



    Hmja, anscheinend steht das nicht in der man page; hatte das von unserem Sysadmin bekommen, und ihn so verstanden, dass es da drinsteht.
    Es steht wohl nur in diesem anderen Forum: http://www.linuxforums.org/for…se-check-sync_action.html


    Allerdings steht in der man page ( http://man-wiki.net/index.php/8:mdadm ) auch nichts drin, wie man einen "check" mittels mdadm durchfuehrt.
    Das muss doch irgendwie gehen, oder?


    Zitat von "Terz"


    Tue nur das vom dem Du auch weisst was es macht.


    Eben drum frage ich ja hier nach ...


    G.

  • Was ich gerne haette waere ein Check, ob die Parity-Bloecke noch gut sind.
    Ich will also nicht wissen, ob die Festplatte insgesamt defekt ist, sondern ob einzelne Parity-Bloecke noch zu den Nutzdaten "passen", also konsistent damit sind.


    Ob ein "Check" genau das tut, versuche ich z.Z. herauszufinden ...


    G.

  • Dann sollte das was ich schriebe doch reichen oder nicht. ?
    Gut, man könnte noch ein examine machen und die checksums prüfen... Allerdings ist das ja halb bei den anderen beiden kommandos sichtbar ;)


    Wenn se nicht gerade degraded sind oder einen resync machen sind se doch gesynct oder nicht ^^


    Grüsse, David

  • Zitat von "Terz"

    Dann sollte das was ich schriebe doch reichen oder nicht. ?


    Tut mir leid, finde ich nicht.


    Zum einen schreibst Du: "Dieses kommando sollte man nie nutzten",
    aber in der man page von mdadm habe ich nicht gefunden, wie man einen "check" initiiert.
    Ich will keinen "resync".


    Zitat von "Terz"


    Wenn se nicht gerade degraded sind oder einen resync machen sind se doch gesynct oder nicht ^^


    Nein, das ist nicht garantiert.
    es gibt auch "silent data corruption" (einfach mal googeln, oder hier lesen: http://ieeexplore.ieee.org/xpl…_all.jsp?arnumber=4630077 ).
    Das ist u.a. einer der wichtigsten Gruende, warum man z.B. eigtl lieber ZFS nehmen wuerde ...


    G.

  • Hi,


    etwas weiter oben, hier:
    http://forum.qnapclub.de/viewtopic.php?f=25&t=17526#p97133


    Es gibt keinen "check" so wie Du das ausführen möchtest, geschweigedem ist "dein check ein rsync".


    Silent Data Corruption, das hat sich wahrscheinlich ein Foto Laden einfallen lassen und brennt deshalb auf Kodak DVD's, weil anonsten die Bytes verschwinden :mrgreen: Oder sich das Laufwerk einfach besser fühlt :mrgreen: :mrgreen: :mrgreen:


    ZFS iss 'ne ganz andere schiene. Wenn es ein Unternehmen gibt, denen ich es zutraue ein performantes, sicheres Filesystem zu entwickeln, dann ist es Oracle.
    Aus Lizenztechnischen grüden hatte sich Oracle von ZFS getrennt und BTRFS ins Leben gerufen.
    Beides gibt es für das NAS nicht. Wenn dann BTRFS (keine BSD Klausel) ;)
    Das sind aber auch alles Firmen im Enterprise bereich, die Petabytes an Daten haben/verarbeiten und die über Jahre hinweg speichern ^^ Wie CERN oder sonst was ^^


    Wir können nix anderes machen, als die Datenintegrität & anhand von mdadm gucken, ob der "RAID so noch fuppt oder nicht."
    ZFS & BTRFS arbeiten vollkommen anders google mal nach Copy-on-Write und die Filesysteme haben keine ahnung wieviele Checksums ;)
    Wenn das so einfach wäre, hätten alle Firmen wie MS, Apfel & Co so etwas auch schon implementiert ^^ Ich würde mir über so etwas auch keinen Kopf machen, wir sind hier im SoHo bereich ;)


    Grüsse, David

  • Zitat von "Terz"


    Es gibt keinen "check" so wie Du das ausführen möchtest,


    Dann sag' das doch gleich ...


    Zitat von "Terz"


    Silent Data Corruption, das hat sich wahrscheinlich ein Foto Laden einfallen lassen


    Verstehe nicht, was Du damit sagen willst.


    Zitat von "Terz"


    ZFS iss 'ne ganz andere schiene.


    Schon klar ...


    Zitat von "Terz"


    ZFS & BTRFS arbeiten vollkommen anders


    Schon klar ... ich wollte ja auch gar keine grosse Diskussion bzgl. ZFS anfangen.


    Zitat von "Terz"


    google mal nach Copy-on-Write und die Filesysteme haben keine ahnung wieviele Checksums ;)


    So schlimm ist es auch wieder nicht - es ist einfach ein hierarchisches Schema von Checksums.


    Zitat von "Terz"


    Wenn das so einfach wäre, hätten alle Firmen wie MS, Apfel & Co so etwas auch schon implementiert


    Apple hatte ZFS schon mal fuer Snow Leopard angekuendigt. Ich nehme an, die hatten auch Probleme wegen der Lizenz.
    Ich hoffe langfristig auf diese Firma: http://tenscomplement.com/z-410-storage-main-features


    Herzliche Grüße,
    Gabriel.

  • Hi,


    dann probiere mal

    Code
    mdadm --examine /dev/sda3


    (sda, sdb,sdc (anzahl der Platten)...


    Ja, die BSD Klausel. Da gab es streitigkeiten zwischen Oracle & Apple & Solaris. Solaris hatte irgendann einfach die Lizenz auf BSD geändert oder so...
    http://de.wikipedia.org/wiki/Btrfs


    Wird kommen, ist ein sehr interessantes Thema :)