Beiträge von macric

    den hyper data protector habe ich gelöscht (hat nicht so funktioniert wie ich es mir vorstellte, bzw. war mir nicht verlässlich genug) und mir Archiware Pure auf QNAP, Synology sowie als VM auf einen ESXi7 installiert. Laufen lassen will ich jetzt nur noch den auf einen NAS. die VM möchte ich für den Notfall behalten falls der QNAP wieder abraucht ;)

    Allerdings muss ich noch die Restoreprozedur für den Notfall testen ob es auch wirklich verlässlich funktioniert.

    in Archiware Pure kann man ja die Repositories selbst definieren


    mein Plan für den worst case, falls ein ESXi7 abraucht: auf neuer HW den ESXi7 installieren, geht ja eh schnell mit USB-Stick...danach die Archiware Pure VM aus irgendeinen share von irgendeinen NAS (habe da sicherheitshalber mehrere Clones auf mehreren NAS verteilt) auf dem ESXi7 registrieren und starten. in Archiware Pure das Repo des letzten Backups adden und RESTOREN....fertich.. so der Plan ;)

    Alternativ kann ich auf den noch funktionierenden NAS Archiware Pure auch noch starten und das entsprechende Repo einhängen.... viele Wege führen nach Rom..


    hatte übrigens auf meinen ts653pro einen kaputten RAM-Riegel (erst heute festgestellt), da war dann alles im Ar***, ich bekam die - wahrscheinlich - noch intakten Daten von vorher auch nicht mehr vom QNAP runter weil jeglicher rsync-Job mit I/O-Error abbrach - Super GAU, alle 20TB weg :(


    VEEAM Backup kenne ich auch noch von früher, war super, aber man braucht dazu einen Windows-Server (der frisst natürlich Ressourcen und zusätzliche Lizenzen)....ich habe jetzt nur noch Linux-Kisten als VM, und will mir kein Windows mehr installieren um ein Backup machen zu können ;)


    btw: nebenbei ist auf allen Linuxkisten rsnapshot installiert welches per cronjob via nfs sichert...brachte aber in meinen Fall nichts beim defekten RAM-Riegel(siehe oben).....


    Ergo: ein Backup alleine reicht nicht, die Daten sollten zumindest gespiegelt sein bzw. zwei Sicherungsjobs auf zwei verschiedenen NAS

    meine ESX bzw. die darauf laufenden VM`s mussten bis jetzt nicht restored werden - da habe ich noch Glück gehabt

    ich muss mich jetzt bei allen entschuldigen.


    Ich denke, ich habe den Fehler bei der TS-653 gefunden.


    habe über USB-Stick Memtest gebootet und das RAM getestet, und siehe da, bei einen der zwei eingebauten 8GB Riegel waren über 4000 Errors!


    Das hätte ich schon vorher machen sollen, hätte mir einige Arbeit erspart.


    Vor allem habe ich mich auch bei TrueNAS gewundert wieso ich da unregelmäßige Reboots sowie Checksum-Errors auf den Disks habe.


    Werde nun wieder von TrueNAS auf QTS wechseln und sehen wie es läuft.


    Jagnix: download truenas : https://www.truenas.com/download-truenas-core/

    Doku dazu https://www.truenas.com/docs/core/gettingstarted/install/

    TrueNAS geht super easy auf QNAP zu installieren

    okay dank, die ssdcache.conf habe ich gefunden - allerdings etwas zu spät


    warum?


    wie gesagt, hatte ich über die Weboberfläche versucht den Cache zu deaktivieren, aber die GUI blieb bei 0% für Stunden...

    Wollte dann ein Reboot über die GUI initieren - auch weil die Console hing - aber das NAS fuhr nicht "runter".

    Also habe ich nachgeholfen und den Stecker gezogen.

    Das war aber nicht so gut, denn das NAS war nach Restart nicht übers Netzwerk erreichbar.

    Auch die HDMI-Console blieb bei "starting..." .


    Also, wieder das alte Spiel, alle Platten raus und eine HDD von einen anderen alten NAS rein und gebootet.

    Das hat funktioniert und ich konnte mich in der WebGUII anmelden.

    Hatte dann natürlich keine Volumes, aber egal.


    Dann kam ich auf die glorreiche Idee die Einzelplatte im laufenden Betrieb zu entfernen und stückchenweise die originalen Platten reinzuschieben, zuallererst natürlich die 1TB SSD.

    Im Display zeigte das NAS auch brav an dass die Platten "geadded" wurden.... ich wollte dann in der GUI noch in den Storagemanager gucken, aber das NAS hat automatisch rebootet.

    Nach Reboot konnte ich mich nicht mehr mit meinen Passwort anmelden....

    mmmhhh

    habe dann als Passwort die MAC vom Interface des NAS genommen, das hat funktioniert.


    Konnte dann zwar die ssdcache.conf angucken, aber das war zu spät.

    in der ssdcache.conf war der Cache disabled....

    Ebenso war in der GUI kein SSD-Cache vorhanden.

    Also gut, dann legen wir halt einen an, dachte ich mir.

    Leider kann ich die SSD aber nicht selektieren als SSD-Cache, ist genauso grau wie die anderen Festplatten.

    Jetzt wirds lustig :(


    btw: anscheinend ist die Config vom NAS auch weg, es werden nur die Standardverzeichnisse im "Finder" angezeigt.....

    Eigentlich müsste ich jetzt die Config wieder restoren um alle Einstellungen zu haben.

    Das werde ich jetzt machen... mal sehen was passiert.....


    btwbtw: wenn ich im /share/CACHEDEV1_DATA/ in einen Verzeichnis ein du -hs mache, bekomme ich

    Code
    cannot access  F I L E N A M E    Structure needs cleaning

    habe mir das CACHEDEV mal übers debugfs gemountet... das schaut aus als ob ein fsck dringend nötig wäre....aber das mache ich erst wenn die Sache mit dem SSD-Cache geklärt ist


    mmmh, nach ein paar Stunden "Arbeit" bin ich zur Überzeugung gekommen dass das Storagevolume kaputt und nicht mehr zu retten ist.

    Filesystemchecks auf Volume brachen alle ab.


    Ich initialisiere die Disks jetzt neu und mache ein frisches NAS daraus.....


    Ein technischer Defekt dürfte nach jetztigen Erkenntnisstand auszuschließen sein.



    Der Thread kann somit gesschlossen werden


    Ergo:

    1.) ich hatte beim Update wirklich nicht nachgesehen wann das 1630 herauskam, noch habe ich mich in den Foren erkundigt wie es mit dieser FW für mein NAS aussieht.

    2.) Ich war diesmal mutig und habe ohne Backups ein Update gemacht

    zu 1+2: (normalwerweise mache ich das immer -diesmal aber nicht)

    3.) froh dass kein HW-Defekt vorliegt

    Hintergrundaufgaben:


    App Center Video Station Download steh seit ca einer Stunde bei 94% ....


    #########################################################


    auf der direkten Console (USB/HDMI) geht anmelden geht


    habe ein bisschen top geguckt..so weit so gut



    und wollte dann per cd /share/CACHEDEV1_DATA Verzeichnis wechseln und blieb dort hängen..Console hängt wieder


    laut snmp-abfragen von checkmk ist die cpu vom NAS auf 100% (war aber bei top nicht so ersichtlich)



    Ich befürchte auch dass der 1TB SSD Cache etwas abbekommen hat, wenn das der Fall ist, na dann gute Nacht.



    jetzt wäre interessant zu wissen welche Kommandos mir auf der Console zur Verfügung stehen um mit den Einstellungen für den Cache "herumzuspielen".


    Es müsste doch so etwas geben? Kann mir nicht vorstellen dass nur auf der Weboberfläche diese Einstellungen zu machen sind.

    mmmh


    bin nicht zufrieden.


    nach Reboot komme ich zwar auf die Weboberfläche, aber ein SSH-Login bleibt nach der Passwortabfrage hängen (habe es von verschiedenen Rechner auf mehrere IP-Adressen des NAS versucht)

    Die Weboberfläche bleibt manchmal hängen ("Server ist ausgelastet ...")


    zB Multimediaconsole: "Daten werden geladen, bitte warten", gefühlt schon ca eine Stunde...


    Eigentlich stehe ich im Moment da wo ich vorher war....


    muss weiter forschen

    hallo tiermutter ;)


    habe das 653 nun mit einer anderen HDD gestartet.

    auf der Weboberfläche eingeloggt und ein Firmwareupdate auf 1594 gemacht.

    diesmal lief das update scheinbar korrekt durch bis zum ende

    nas bootet gerade neu


    Backups?

    Nein, ich war mutig ;) ich habe nur die wichtigsten Daten gespiegelt auf einer Synology liegen.

    Ich hätte die Möglichkeit gehabt alles auf ein anderes NAS zu sichern, war mir aber zu aufwendig - was soll schon schief gehen? ** grins**

    ausserdem liegen auf dem 653 nur TimeMachine-Backups, sowie rsnapshots von meinen virtuellen Linuxsystemen, kann man vernachlässigen.

    Das vCenter habe ich mir neu aufgesetzt, geht ja schnell, und alle Daten liegen im Moment auf meiner Synology rs815+ (ein Mirror vom 653)


    So, mal sehen wie das System jetzt reagiert...



    so, Start war geglückt.

    Das NAS meldet nun FW 1594.


    ich werde ein paar Tests machen bevor ich meine richtigen HDDs reinschiebe

    hallo zusammen,


    ich habe blöderweise meine TS653pro auf 1630 upgedatet, danach war das system nicht mehr brauchbar.


    Ein Downgrade auf 1566 wurde danach durchgeführt.

    Leider war das NAS auch mit der alten FW 1566 nicht mehr brauchbar (Console freez, rsync mit i/o error, Weboberfläche vom NAS freeze, keine Backups mehr möglich(i/o error / freeze) ......)


    Ich habe dann versucht andere FW raufzuspielen, 1594, 1540...... hat alles nicht gefunzzt, d.h. in der Systemsteuerung/Firmwareaktualisierung andere images uploaded, beim Firmwareinstallieren blieb der Prozess bei 30% hängen, habe nach 24 Stunden den Stecker gezogen und neu gebootet.

    Es blieb bei der 1566 Version, aber das NAS war noch immer nicht mehr brauchbar (Freezes auf der Console, ein Neuanmelden funktionierte zwar, aber ein rsync war immer mit i/o-error befruchtet,....)


    ALSO: ich habe dann alle Festplatten aus dem NAS gezogen und ohne diese gebootet.

    Das System fährt hoch und die Firmware 1566 meldet sich mit der Möglichkeit die Firmware auf die neuste Version upzudaten oder eine andere einzuspielen....

    Ich habe dann versucht die 1594er Firmware zu installieren.

    Der Upload geht 100% durch, beim Firmwareupdate bleibt es kurz bei 9% stehen um dann plötzlich auf 100% zu springen und neu zu booten.

    Dabei ist es egal welche Version (1594, 1540, 1566,.) ich angebe, das Spiel ist immer das gleiche (bei 9% springt er auf auf 100% und bootet, nach dem Reboot zeigt mir das NAS IMMER die Firmware 1566 an)


    d.h. ich komme von der 1566 nicht mehr weg, bzw. kann keine andere Firmware mehr raufspielen.....


    Hat jemand einen Tip wie ich nun eine andere Firmware drauf bekomme oder hat jemand ähnliches erfahren?

    jetzt hänge ich bei der installation vom 1594er Image.


    bin von 1630 von meiner TS653pro auf 1566 gewechselt da 1630 irgendwie kaputt.

    das NAS scheint danach nicht mehr zu funktionieren.


    jetzt habe ich alle festplatten rausgenommen und ohne hdd gebootet.


    NAS startet auch und man kann sich auf die weboberfläche zum konfigurieren anmelden .


    jetzt wollte ich die firmnware 1594 raufspielen, der upload scheint zu funktionieren, die installation geht dann auch ziemlich flott(zu flott) - springt von 9% gleich auf 100%.

    aber nach dem reboot wird noch immer die 1566 angezeigt. habe zweimal rebootet!


    ich forsche weiter


    mmmh, ich kann keine Firmware mehr raufspielen, egal welche Version ich uploade, es bleibt immer bei der 1566 nach reboot :(

    downgraded von 1630 auf 1566 wegen unzufriedenheit.

    nun spinnt das qnap ts 653 pro total.


    das zurücksetzen der mtu von 9000 auf 1500 brachte nicht den gewünschten Effekt.


    wenn ich nun das NAS über die Weboberfläche beenden will passiert genau nix, auch über die console mit /sbin/halt passiert nix, hilft nur manuel auschalten.

    beim start danach wartet man ewig bis qboost gestartet ist, vorher kann man nix im speichermanager machen (Filesystemcheck!)


    jetzt wollte ich auf 1540 downgraden, aber der prozess meint, ich müsste zuerst den ssd-cache deaktivieren und löschen.

    ich kann zwar den hebel auf OFF stellen, es passiert aber genau nix -> Anzeige bei "Cacheinhalt wird gelöscht" bleibt bei 0% (warte schon 45 Minuten)


    ???


    die Gacke ist jetzt schön langsam am Dampfen.

    Ich kann mein vCenter auf einen ESX nicht starten weil die vm-discs auf den 653pro als nfs eingebunden sind und der NFS&iSCSi-Zugriff nach dem Upgrade auf 1630 nicht mehr korrekt funktioniert :(


    Also: Downgrade geht nicht weil SSD-Cache geleert werden muss -> geht aber nicht - > 0%

    Sichern der Dateien auf ein anderes NAS geht nicht -> rsync error

    Console ist jetzt gerade nach der Eingabe von ls -la im /share Verzeichnis eingefrohren


    Ich forsche weiter

    downgraded auf 1566, MTU auf 1500, reboot


    rsync auf anderes NAS, nach ein paar GB kommt diese Meldung:

    Code
    client_loop: send disconnect: Broken pipe
    rsync: writefd_unbuffered failed to write 4092 bytes to socket [sender]: Broken pipe (32)
    rsync: connection unexpectedly closed (168 bytes received so far) [sender]
    rsync error: error in rsync protocol data stream (code 12) at io.c(601) [sender=3.0.7]


    ???


    stelle nun auf allen Systemen (auch Switche) die MTU auf 1500 und versuche es nochmals

    QTS 4.5.2.1630 Build 20210406 installiert (Anfang April) auf TS653pro

    Ergebnis: alle NFS- mounts sowie iSCSi-Verbindungen meiner DebianServer sowie ESXi-Hosts kaputt

    rsync von QNAP zu anderen NAS bricht mit IOerror nach einiger Zeit ab

    zum Teil friert auch die Console sporadisch ein wenn ich Commands absetze


    DAHER: downgrade auf 4.5.2.1566 (die 1594er machte auch Probleme)

    Aber das Phänomen besteht noch immer - kein produktiver Einsatz möglich


    Versuche zur Zeit noch immer verzweifelt meine Daten auf einen anderen NAS zu schaufeln, aber die rsyncs brechen immer mit io-error ab


    ist eine MTU von 9000 angebracht? Netzwerkanschlüsse sind gebondet 2 x 2 bond0/1


    Wie weit soll ich noch downgraden?

    Könnte auch ein Hardwaredefekt vorliegen?