Beiträge von darth_max

    Update: Nachdem um Mitternacht die tägliche Speicher Rückgewinnung gestartet ist - welche nach 8 Stunden Laufzeit mit einem Fehler abgebrochen ist, war das Volume plötzlich "leer" - sprich sind keine Dateien mehr sichtbar gewesen. Im Speicher Manager ist der berüchtigte Fehler "Volume Entladen" zu sehen gewesen.


    Nach einem Rechtsklick auf das Volume hat das QTS automatisch eine Prüfung angeboten, welche dann auch rund 4 Tage gelaufen ist, den gesamten RAM aufgefüllt hat (rund 31 GB) das Storage insgesamt damit so gut wie unbrauchbar gewesen ist. Darüber hinaus ist die Prüfung ergebnislos automatisch gekillt worden.

    Gelaufen ist diese über die WebGUI initierte Prüfung als /bin/e2fsck_64 -C 0 -fy -N /dev/mapper/ce_cachedev1 /dev/mapper/ce_cachedev1


    Grundsätzlich sind die Daten ohnehin online redundant verfügbar gewesen und ich wollte das Volume schon löschen, da habe ich noch einen Versuch über die Bash gestartet. Mit e2fsck_64 -pfv -C 0 /dev/mapper/ce_cachedev1. Da die Daten eine redundante Kopie gewesen sind, war das Risiko überschaubar.


    Das lief sehr viel schneller ab (rund 3 Stunden) und am Ende meinte er viele Dinge bereinigt zu haben (u.a. "corrupt group Descriptor" und die berüchtigten "Inode XXX has INDEX_FL flag set on filesystem without htree support.). Ersichtlich war aber zuerst natürlich noch keine Änderung, erst nach einem Neustart konnte das Volume wieder normal entsperrt werden und der darin enthaltene Freigabe Ordner ist sichtbar gewesen.


    FAZIT: Anscheinend hat die entweder die "alte" 5.0.0.1891(20211221) einen mehr als heftigen Bug in Bezug auf verschlüsselte Volumes (die auch noch größer sind), oder aber aus irgendeinem nicht ermittelbaren anderen Grund ist das Volume seit Erstellung (ca. 8 Monate vor dem Incident) bereits korrupt gewesen und der Fehler ist nun mit der neuen Firmware kulminiert.

    Auf jeden Fall sollte man anscheinend von größeren Volumes und der built-in Verschlüsselung die Finger lassen!

    Sehr stranges Verhalten auf einer TS-1680U-R2.


    Gestern Abend das Online Firmware Upgrade von der angestaubten 5.0.0.1891 build 20211221 auf die aktuelle 5.0.0.1986 build 20220324 durchgeführt. Soweit so gut.

    Alles lief laut Logs erfolgreich ab - es gab keine Auffälligkeiten, Warnungen oder Fehler im Log.


    Abgeschlossen wurde es laut Log mit:

    Code
    Informationen	2022-04-09	18:52:11	admin	127.0.0.1	Firmware Update	Firmware Update	[Firmwareaktualisierung] System von Version 5.0.0.1891(20211221) auf 5.0.0.1986(20220324) aktualisiert.


    Seit dem Neustart danach stimmen aber die Freigabegrößen nicht mehr via SMB - über NFS werden die korrekten Größen angezeigt und die Shares scheinen normal zu funktionieren... :rolleyes: Und damit es noch "besser" wird, so gilt dies anscheinend nicht für alle Shared Folder. Gemeinsamkeiten lassen sich keine finden - so sind manche betroffenen Shares verschlüsselt, andere wieder nicht. Bei manchen ist das Volume verschlüsselt, bei anderen wieder nicht.


    z.B. ist ein 25 TB Share über NFS korrekt 25 TB groß, während der gleiche Share auf dem gleichen Rechner nur 6.68 TB groß ist und als propenvoll ausgewiesen wird (während in Wahrheit rund 3 TB frei sind). :S


    Hat jemand schon einmal derartige Merkwürdigkeiten mit dieser (oder einer anderen) Firmware erlebt?

    Keiner ist also einen Deut besser. Und ob die anderen mit nicht zertifizierten Festplatten besser laufen? Hmm...

    Sag, was läuft mit Dir eigentlich falsch? Die Leier mit den nicht zertifizierten Platten ist jetzt dann auch schön langsam gut durch, oder? 1 (!!!) von Dutzenden Storages, noch dazu ein nicht produktives, Ausfallgesichertes und ins Backup gesicherte Storage läuft mit NICHT zertifizierten Platten. Nämlich das aus meiner Anfrage hier.


    Wenn Du auf der Leier weiter reiten willst mir dauernd unterstellen möchtest ich hätte IRGENDWO behauptet dass es keine Rolle spielt, ich nicht verstehen würde das man keinen Hersteller Support bekommt wenn etwas außerhalb der Specs betreibt etc., dann hast Du wirklich ein sehr ernsthaftes Problem mit sinnerfassendem Lesen.

    Text von einem Moderator zensiert


    Wenn Du gelesen (und entsprechend auch verstanden) hättest, was ich geschrieben habe, vielleicht würdest Du dann nicht solch einen zusammenhanglosen Mist schreiben - der mit meiner ursprünglichen Anfrage nicht das Geringste zu tun hat, nebenbei...

    Die Pro-Platten hätten es gar nicht erst soweit kommen lassen und durch geeignete Drehzahlveränderung einen derartigen Resonanzfall verhindert.

    Das ist mir durchaus klar - aber darum ist es mir nicht gegangen. Durch meine persönlichen, leider sehr negativen, Erfahrungen wollte ich ausschließen können dass es nicht die QNAP an sich ist. Daher hätte es mich interessiert ob es irgendwo zumindest im Ansatz nachvollziehbare wäre, was eigentlich passiert ist. Aber ich habe halt mittlerweile schon verstanden dass dies anscheinend nicht möglich ist - was auch ok ist. Ich habe heute Vormittag zwei Disken aus den betroffenen Storage Pools bei einem langjährigen Freund in einem renomierten DR Unternehmen mitgehabt und eine von den 11 anderen Disken die Online geblieben sind. Die Platten selbst sind absolut in Ordnung, es lässt sich nicht nachvollziehen dass es irgendwelche abnormen Einflüsse gegeben hätte. Da die Platten dies aber gar nicht (außer extreme Veränderungen der Betriebsvariablen) dauerhaft protokollieren, ist das auch zu erwarten gewesen...


    ...nichts desto trotz hätte die Disk, wenn die Elektronik eine Art Sicherheits Shutdown durch Resonanzschwingungen durchgeführt hätte, dieses mit einem Fehlercode an den Controller zurück gegeben. Und mich hätte einfach nur interresiert wo man dieses Controller Log einsehen kann. Nichts anderes habe ich wissen wollen. Aber anscheinend es dies nicht möglich - was, wie Eingangs erwähnt, uns jetzt zu dem Schluß bewogen hat, diese Systeme umgehend außer Betrieb zu nehmen. Ich habe zwei Mal das leidige Thema mit der Backplane Thematik bei QNAP gehabt (einmal bei mir selbst mit einer 1079 und einmal Kundenseitig mit einer 1279), dass ich überhaupt keine Lust auf weitere Erfahrungen dieser Art habe. Und dadurch dass wir aufgrund der komplett fehlenden Infos keine Exklusions Diagnose machen können ist es mir einfach zu riskant mich darauf zu "verlassen" dass sich 5 Disken völlig wahllos weggeschaltet haben, weil es mitten in der Nacht omminöse Resonanz Schwingungen gegeben hätte. Welche mit Pro Platten aufgrund der Drehzahl Reduktion in solchen Situationen möglicherweise nicht aufgetreten wären. Aber natürlich nicht auszuschließen - was ich auch niemals behauptet habe dass sich dies anders verhalten würde. Ich wollte nur eine simple Verifikation. Die mir jeder bessere Hardware RAID Controller mit seinen Standard Tools bietet...


    Deswegen, wie bereits gesagt, habe ich heute Mittag zwei weitere 2080er MSA bestellt und damit ist das Thema QNAP ziemlich durch bei uns. Zumal die Gruppen Diskussion über zertifzierte Platten oder nicht hier ziemlich ausgeartet ist - ins komplett Sinn befreite.

    Reine Spekulation! Ich war schon oft im QNAP Lab und kann bestätigen, dass dort Berge an Festplatten liegen, die getestet werden.

    Wunderbar - und?

    Falschaussage.

    Du könntest beim Kontext bleiben. Und nein, keine Falschausage. Du kannst gerne die TT Nummern haben, samt zugehörigen Mail Verkehr wie der QNAP Support arbeitet. Bei einer 879 bei einem Kunden wurde empfohlen, nachdem sie es nicht auf die Reihe bekommen haben das die Ordner via AFP oder SMB konsistent auf diversen Mac Clients angezeigt zu werden, rein und dauerhaft auf NFS zu switchen. WTF? Klar, die Box ging auch wieder zurück...

    Meine Aussage auf das Vertrauen, auch aus dem Kontext meiner Aussage ganz klar zu erkennen, meine ich, hat sich auf das gesamte Gebahren bezogen. Natürlich wäre es möglich das die hier besprochene 1680 in der besagten Nacht mysteriöse Ressonanzschwingungen im Rack erfahren hat, die sie all die Jahre mit haargenau den gleichen Disken, Geräten, klimatisierung, Standort etc. nicht hatte, dass die Vibrationssensoren der Platten einen Disconnect ausgelöst haben. Möglich. Mich hätte nur interessiert ob es sich nachvollziehen lässt, was passiert ist. Also ob es weiterführende Logs gibt, als das recht witzige Sys Log in der Web GUI. Und aufgrund meiner eigenen Erfahrungen (am eigenen Leib, wie auch bei Kunden) mit diversen Modellen dieses Herstellers, habe ich keinerlei Vertrauen mehr. Und ja, ich halte einen Verarbeitungsfehler an der Backplane mittlerweile für weitaus plausibler als Resonanzschwingungen. Wäre bei kaum einen anderem Hersteller so, aber bei QNAP bin ich mittlerweile soweit. Auch durch die Eigenerfahrung im Reparatur Gebahren mit meiner, damals nicht einmal 2 Jahre alten 2000€ 1079Pro. Wo ich dann Monate diskutieren musste, damit ich sie von QNAP repariert bekommen habe (und nein, damals sind keine nicht zertifizierten Platten darin gelaufen. Auch keine nicht zertifizierte CPU, Speicher oder anderweitige Erweiterungen)...

    Auf einer Kunden 1270 werden Snapshots, welche während einer Sicherung einer VM in der Virtualization Box angelegt werden, nicht mehr aufgelöst. Sprich, irgendwann läuft das Volume voll, weil man bei täglicher Sicherung jedes Mal die volle Kopie der VM im Snapshot Ordner liegen hat. Und sich gefühlte 3 Dutzend Snapshots auch nicht gerade positiv auf Verhalten und Performance der VMs auswirken... und das sind jetzt nur Dinge, die mir spontan einfallen. Ich möchte nicht das unendliche schwarze Loch im entsprechenden "QNAP Support" Subordner in meiner Inbox dazu befragen...

    Die Sensoren zur Vibriationserkennung sind btw in den Festplatten verbaut.

    Und wo genau hätte ich behauptet dass dem nicht so ist?

    Diese Dinge sind mir alle klar - nicht weil ich der Storage Experte auf Rocket Science Niveau bin - wie es dieser "Doc" in den Raum gestellt hat - was ich auch mit keiner Silbe behauptet habe. Sondern weil ich dies weder angezweifelt noch irgendwo behauptet hätte es wäre nicht so. Ich wollte lediglich wissen ob jemand schon einmal ein ähnlich gelagertes Problem gehabt hat und ob es sich irgendwo nachvollziehen lässt. Aber anscheinend beides nicht.

    Es bleibt (wieder einmal bei QNAP) bei dem Fazit: Keine Ahnung. Dieses Mal nur noch garniert mit: "Sicherlich" sind es die inkompatiblen Platten gewesen... Ja, klar, möglich. Oder eben ein anderer Schaden, der mit den Platten rein gar nichts zu tun hat. Etwas das, zeitnah vielleicht auch noch, auf den 3 anderen, (bis auf die Platten) baugleichen Boxen auftreten könnte.

    Abschließend die Frage was du hier nun weiter erfahren möchtest?

    Recht einfach: Bei passender Gelegenheit kommen hier 4 weitere HP MSA (2 bei mir im Haus und noch 2 ins RZ) hin und gut ist es. Der HP Enterprise Support ist nämlich auch grottig - aber nicht derartig...

    ...und selbst die WebGUI spukt mehr im Eventlog aus außer "Platten disconnect". Die 1680er werden alle rausfliegen und die letzte, meine reparierte 1079er werde ich auch noch durch irgendetwas ablösen. Und Kunden werden zu anderen Lösungen greifen. Also zu einem Hersteller mit zumindest einem halbwegs vernüftig funktionierendem Support (natürlich nur, wenn der Dolm von einem Kunden nicht auf die lächerliche Idee kommt eine NAS Platte in ein NAS zu verbauen).


    ...wie weiter vorhin schon gesagt, nachdem ist es auch Community seitig keinen "Support" gibt, weil es sich um nicht zertifizierte Platten handelt, dann lassen wir die Diskussion und schließen die Thematik. Mir ist nicht bewusst gewesen, als ich diesen Thread erstellt habe, welch heiliges Sakrileg ich begangen habe. Aber hey, wer ("NAS") Platten, die nur für 8 Bay NAS empfohlen werden in ein 16 Bay NAS einbaut, hat auch sicher kein Backup und ist deswegen mutig und was war das andere nochmal gleich, ach - selbstverachtend. Was für ein Ritt, Hölle! Wie konnte ich unwissender Blinder nur eine Disk verbauen, die nicht auf der Kompatiblitätsliste zu finden ist, sondern nur das beinahe baugleiche "Pro" Modell... Wie soll das Storage nur damit klarkommen, dass die Platte keine 7,2k fährt und keine Resonanzsensorik hat, die sie vor weiterführenden Schäden bewahren würde?


    Etwas das ich ja bereits Eingangs in meinem ersten Post in aller Deutlichkeit festgestellt habe, ist es mir nicht darum gegangen ein produktives Problem zu lösen. Und das ich, aufgrund der fehlenden "Kompatiblität" keinen Support erfahren würde, also von QNAP, ist mir klar - würde ich als Hersteller auch nicht. Aber auch darum ist mir nicht gegangen. Ich wollte ja bloß wissen ob sich das Thema eingrenzen lässt. Mittels verlässlicher Logs. Ich wollte keinen Bürgerkrieg anzetteln: die guten, allwissenden, Kompatitbliätslisten Gläubigen vs. die bösen, unwissenden, Rebellen, die einfach "irgendwelche" NAS Platten mal eben verbauen... Es ist auch kein Kunden NAS, kein hochproduktives NAS, eines ohne Backup oder Ausfallsicherung gewesen... Ich habe auch mit keinem Wort gesagt, ganz im Gegenteil, es wäre nicht sinnvoll sich an solche Vorgaben zu halten.

    Ich bin nur "fasziniert" gewesen, dass sich von dem Disconnect keine weiteren Spuren haben finden lassen. Auch nicht mit den WD Diagnose Tools an den betroffenen Platten selbst. Aber ich werde mich morgen mit einem befreundenten Techniker in einem DR Unternehmen unterhalten, ob diese Disken dass nicht irgendwo rückmelden (vielleicht auch nur für sich, ähnlich der SMART Entrys), wenn dem so wäre. Mich mehrere Male darauf hinzuweisen, dass dieses eine Storage außerhalb der Specs läuft, ist mehr als überflüssig gewesen.


    Das Fazit ist nur unter dem Strich, dass nach knapp 10 Jahren QNAP Erfahrung ein schaler Beigeschmack bleibt: KEIN einziges (der an Thematik und Anzahl vielschichtigen) Problemen, konnte vom Support in irgendeiner Weise gelöst werden. Die meisten Anfragen haben sich in einer Schleife von sich wiederholender FAQ Antworten bewegt, manchmal hatte man auch eine engagierteren Supportler aus Taiwan mittels Remote Session am Rohr der aber dann auch kapituliert hat... Die Zweite (TS-EC1680R2), hier im Haus bei mir, hat noch immer das ewige "MM DB funktioniert nicht" Problem - auch dazu gibt es ein TT, dessen Lösung es sein soll: Machen sie die Box platt und installieren sie diese neu. Ja, klar, die universelle Antwort 42 auf alle QNAP Support Probleme. Ich habe mittlerweile eine Linux VM aufgesetzt, läuft auf dem Blade Center daneben auf via Fibre angebundener MSA mit einem Plex Server, als Ablöse. Das Ding transkodiert darüber hinaus flotter und stabiler...

    ...beinahe so gut wie der Lenovo Support, der diese Woche einem Kunden bei einer nagelneuen DS4200 rät, dass er entweder einen DHCP in den Serverbereich stellt oder aber die fixe IP nur mittels SSH Shell setzen kann. Denn wenn er es über das Webinterface tut, resetten sich beide Storage Controller auf Factory Default. :thumbup:Also QNAP sind nicht die einzigen, die unausgegorenen Schrott auf den Markt bringen...


    ...und sollte ich vielleicht ein wenig Desillusioniert, angefressen und frustriert ankommen - dem ist sicherlich auch so.

    Plus der Tatsache geschuldet, dass mein Sprachfilter durch Hitze und Grad der Frustration, aufgrund der Menge an ungelösten Problemen, nicht mehr einwandfrei arbeitet. Das ist nicht schön, aber rücksetzen, frisch installieren und Backup Rückspielen kann ich zur Zeit nicht... :cup:

    darth_max diese Frage kann unter anderen seagate_surfer oder Seagate Support beantworten. Es handelt sich zwar um WD aber die Problematik haben beide Hersteller. Ich habe dazu u.a. das hier gefunden https://www.seagate.com/files/…lletin-mb632-1-1305de.pdf

    Aber danke für weiterführende Hinweise zu dem Thema! :thumbup:Ich werde mal sehen was die Gurus morgen sprechen, ob sie eher die Disk oder das Storage vermuten - denn im Endeffekt geht es mir genau um diese Differenzierung.

    Das ist mir ja vollkommen klar - ich habe dies ja auch initial selbst eingeräumt. Nur darum geht es mir überhaupt nicht. Ich würde meine hochproduktiven Storages auch niemals außerhalb der Specs betreiben - davon abgesehen habe ich für solche Fälle Support Verträge mit dem entsprechenden Hersteller habe, in welchem die Spielregeln vollkommen klar definiert werden...


    ...nur als die WD Red (ohne Pro) auf den Markt gekommen sind, hat sich ein solcher Zusatz (nicht für mehr als 8 Bay Storages geeignet) nicht gefunden. Sie sind "nur" nicht auf der Komp. Liste zu finden gewesen. Was auch, sind wir uns ehrlich, sehr oft natürlich passiert weil der Storage Hersteller keine Lust hat, gerade bei einem Modell das vielleicht in Ablöse steht, neue Disken zu testen. Aber wie auch immer, mich würde interessieren, was der Grund ist? Vibrationen? Ok, die Platten lassen sich in all der Zeit nicht aus dem Takt bringen, auch nicht durch den wöchtenlichen Stresstest - kippen aber dann zu fünft, nicht nebeneinander, nicht im Cluster, nicht übereinander, einfach in der Nacht weg? Als hätte ich sie einfach vorne abgezogen? Keine Surface Beschädigung in den WD Tools festzustellen, alle Smart Parameter im Rahmen, überhaupt keine Auffälligkeiten und man rebooted die Kiste und alles ist wieder da wie gehabt? Keine Beschädigung am Soft RAID, keine fehlerhaften Nodes etc.


    Ich habe einen Kunden, der hat gedacht es wäre ein ultimativ guter Plan ohne Rücksprache seine alte 859 Pro einfach mit 6 TB Platten (WD Red Pro) sukzessive zu bestücken (also mittels Rebuild und Extension zu erweitern). Hat zu Beginn anscheinend gut geklappt, bis nach ca. 3 Monaten die Kiste angefangen hat sich unmotiviert neu zu starten... Ich konnte dann zwar mittels USB Stick (für die Auslagerung wegen der mageren 512 MB RAM) den Filecheck erfolgreich ablaufen lassen, das RAID wieder manuel mounten und alle Daten weg zu sichern, aber gut, das ist nachvollziehbar. Irgendwo.


    Nur das weckt nicht gerade Vertrauen in diese Boxen - ob nun zertifizierte Disken drinnen stecken oder nicht. Zumindest nicht, wenn ich nicht einmal im Ansatz nachvollziehen kann was die Kiste gemacht hat. Aber möglicherweise hat QNAP nicht nur in der 1079 günstige Kondensatoren verbaut... das ist für mich ehrlich gesagt als Schnellschuß aus der Hüfte eher plausibel, als dass sich im klimatisierten Rack plötzlich in der Nacht mysteriöse Vibrationen aufgetan haben haben, die 5 Platten quer durch die Bank aus dem Tritt gebracht haben. Aber wenn "niemand" eine Ahnung hat, wo man auf der Box entsprechende Logs finden kann, was sie gemacht hat, ist es natürlich mühseelig darüber zu spekulieren.


    ...was mich eher zu dem Schluß führt, diese Kisten mittelfristig auszusortieren und durch einen anderen Hersteller zu ersetzen. Zertifizierte Platten hin oder her, bei diesem speziellen Thema, aber der allgemeine, vom Hersteller angebotene Support, die Reife der Firmwares und auch die oftmaligen Hardware Probleme, lassen schwer zu wünschen übrig.

    Alles klar - canceln wir den Thread. Es kennt sich mit den Boxen anscheinend kaum einer tiefer gehend aus...


    ...und entschuldige bitte, aber der QNAP "Support" ist schlicht lächerlich. Das die einen, nicht einmal bei legitimen Tickets, großartig weiterhelfen (können oder wollen?), habe ich schon bei Kunden erfahren dürfen. Das sie mir nicht bei einem Problem weiterhelfen, wo man sich auf "Firmware veraltet", "Platten nicht auf der Komp. Liste" etc. bequem ausreden kann, ist mir auch klar. Sonst hätte ich ein Ticket erstellt und nicht hier einfach unverbindlich einmal nachgefragt ob jemand das Problem bereits hatte (vielleicht auch mit anderen Platten ?!)...

    Bei meiner zweiten, baugleichen Onsite (allerdings mit Seagate IronWolf Pro Platten befüllt) 1680 geht seit einem Jahr die MM Bibliothek nicht, weil er sie aus irgendwelchen obskuren Gründen nicht idexieren kann. Das Fazit des Ticket beim Support hat, mal wieder, gelautet: Formatieren sie die Box und installieren sie diese neu, sorry. Und nein, die Box hat zertifizierte Disken, war innerhalb der Garantie, aber der Support... Lächerlich. Also bitte keine Hymen darüber, dass mir der QNAP Support helfen könne, wenn es denn zertifizierte Platten wären... in zwei Jahren bei 6 Boxen 8 Tickets und KEINES konnte vom Support in irgendeiner zufriedenstellenden Weise gelöst werden. Und nein, bei einem einem Fehler in einer eigentlich Micky Maus Funktion TB an Daten zu sichern, oder aus dem Backup Wiederherzustellen weil man die Box plattmachen musste, ist keine Option...


    ...bei meiner kleineren TS-1079 hieß auch zuerst (es wurden auf einmal im Betrieb alle Platten abgemeldet - und die standen auf der Komp. Liste), das wäre ein unbekanntes Problem im Support. Und ich müsse, sofern ich die Daten gerettet bräuchte, ein prof. DR Unternehmen beauftragen. Und im Endeffekt waren es billige Kondensatoren auf der Backplane und ein relativ häufig auftretendes Problem bei diesem Modell... bei einer 1270 hatte ein Kunde ein verschlüsseltes Volume eingerichtet und LUKS Key (der damals zumindest in der 4.2 nicht über das Web Frontend zu sichern gewesen ist) nicht gesichert. Nach einem problemlosen FW Update konnte er das Volume nicht mehr mounten, weil der LUKS Key beschädigt gewesen ist. Was ja kein Thema ist, wenn man sich mit LUKS beschäftigt und dem KD im Webinterface die Option gibt es zu sichern. Aber der KD weiß nicht, weil es auch nirgends im Manual angegeben ist, dass er den zweiten relevanten Part, zur Zeit, nur über die bash sichern kann...

    Die normale WD Red ist nur für Gehäuse bis max. 8 Platten freigegeben.

    Alle diese dort aufgeführten HDDs vertragen auch die starken Vibrationen von so vielen HDDs.

    Du denkst dass sich die Disken abgeschaltet hätten, weil sich die Vibrationen überlagert haben? Hm. Ein Ansatz. Der mich zwar jetzt nicht wirklich befriedigt, also aus Perspektive der Neugierde, aber ich werde mal die Jungs von der Datenrettung konsultieren ob die beide Modelle schon einmal offen gehabt haben und entsprechende Unterschiede gesehen haben (bessere Lagerung, Dämpfung etc.).


    Wie mutig kann man sein. Oder wie selbstverachtend. Deine Backup-Strategie würde mich interessieren.

    Entschuldige bitte, aber was soll das für eine lächerliche Aussage sein? Schlecht geschlafen?

    Abgesehen von zwei LTO 8 Tapes auf meinen vsphere Center Servern (mit der klassischen wöchentlichen vollen und 2 x täglichen Inkrementellen) ist es eines von 4 Storages die sich mittels rsync abgleichen und seit 2,5 Jahren absolut problemlos laufen. Und ich habe in meiner Anfrage wohl nicht thematisisert dass ich ein produktives Problem hätte. Es ging mir nicht dass darum ich Daten gerettet bräuchte (da habe ich meinen Ansprechpartner bei der Hand) oder einen Ausfall gehabt hätte, oder ein Problem mit meiner Backup Strategie hätte...

    nur würde es mich interessieren warum die Platten sich disconnectet haben. Wäre dies irgendwann in den ersten Monaten nach in Betriebnahme der Konfig schon mal in irgendeiner Form passiert, wäre gforce Argument durchaus brauchbar. Aber sorry, 2,5 Jahre läuft die Box nicht stabil und poppt dann ab weil sie meint, ach da stecken mehr Platten als 8 drinnen, dann stelle ich mal meinen Dienst ein. Also kannst Du mir erklären, wo der Mut liegen soll? Wenn es zu Beginn irgendwelche Probs gegeben hätte, dann hätte ich die Red ins Regal für andere Projekte gelegt und mir 16 Red Pro abgeholt...

    ...und wer betreibt eine produktive Umgebung (zertifizierte Platten oder nicht) ohne Ausfall Absicherung? Der Lastenausgleich hat sofort dafür gesorgt das die Anfragen auf die zweite Box gegangen sind, und wenn die auch ausgefallen wäre, hätte ich noch 2 baugleiche im RZ offsite stehen... und wenn die abgeraucht wären, zeitgleich, dann hätte ich die Bänder einlegen müssen... Wobei VMs keine betroffen gewesen wären, weil ich dafür meine MSA habe... Auf den QNAPs liegen nur cold Memory und einige direkte Fileshares.


    Wenn es eine Limitation geben soll, also dass es wirklich daran gelegen haben soll dass sich die Platten nicht mögen, obwohl in kleineren RAID Gruppen, dann würde ich es spannend finden, was das Problem ist. Ich dachte, vielleicht ist schon jemand auf das Problem gestoßen und hat eine Ahnung warum. Also ein warum abseits der Produktfolie.

    EDIT ist in dem SSD-Cache auch ein Schreibcache?

    Ja, die Module haben jeweils 256 MB DDR3 Cache on Board, der sich leider nicht deaktivieren lässt. Aber ich verwende das Caching nicht für die zwei Speicherpools gesamt, sondern für ein paar Volumes. Gibt es mit dem Modul Cache ein Problem? Lässt er sich dann QNAP seitig deaktivieren? Wenn ja, weißt Du wie? Bisher gab es mit den Modulen keine Probleme - ich muss sagen dass mir auch der Zusammenhang jetzt nicht erschließt warum das QTS denkt ein paar, offensichtlich, wahllose Platten wären ausgeworfen worden, weil die SSD Module ihren Cache verwenden.

    Ich habe heute Nacht ein recht spannendes Erlebnis gehabt:


    Auf meiner produktiven TS-EC1680R2 haben sich zuerst 5 Platten mit der Fehlermeldung gemeldet, dass sie das Native Command Queuing wegen eines Time Outs beenden müssten. Was für das Logging der QNAP offensichtlich eine reine Information darstellt...


    ...und eine Sekunde später ging es auch schon los:

    Eine Platte nach der anderen, von den besagten 5, wurde getrennt! Schön über beide RAID Gruppen verteilt sind diese dann natürlich hübsch offline gewesen. Soweit wäre es ja noch nicht wirklich spektakulär - vielleicht das gleich 5 Disken von 16 über den Jordan gehen, die knapp 2 Jahre gelaufen sind.


    ...heute Morgen haben ich nach Kontrolle des Eventlog und dem ersten Schock die Kiste herunter gefahren, Lüfter kontrolliert, Kabelverbindungen etc. Nichts auffälliges. Platten habe ich keine abgezogen. Nach dem Neustart waren alle Disken wieder da und das Ding hat sich verhalten als wäre niemals was passiert - außer natürlich den entsprechenden LOG Einträgen.

    File System Checks, sowie Platten Checks absolut ergebnislos. Alle Disken weisen nicht die geringsten Auffälligkeiten mit dem Western Digital Diagnose Tool auf. Zwar stehen meine WD80EFZX-68UW8N0 (die "normalen RED) nicht auf der Kompatibiliätsliste, aber sie werden auch nicht unter Produkten aufgeführt, die man explizit nicht verwenden soll. Hatte jemand schon einmal ein derartiges Verhalten? Eine Idee wo ich mit der Fehlersuche noch beginnen kann?


    Firmware: 4.3.4.0644, 32 GB RAM, 2 Plextor Caching SSDs auf den zugehörigen mSATA Schnittstellen.

    Ich erlaube mir den alten Thread auszugraben

    Konntest Du das Systemvolume dann verschieben?

    Kein Problem - nein, leider. Ich habe das Sys Volume im laufenden Betrieb gekillt und danach ein neues angelegt. Hat soweit wunderbar funktioniert, nur leider waren natürlich alle Apps, die bereits installieren waren, weg. In wie weit man diese noch hätte migrieren können, z.B. via SSH Zugriff, kann ich nicht sagen. Damit habe ich mich nicht beschäftigt.

    Also bei mir handelt es sich nicht nur um eine gefühlt längere Zeit - sie wird auch durch das Log bestätigt. Wobei die Kiste ca. 3 Minuten vor dem Eintrag dass sie "startet" jetzt weg gewesen ist und erst gute 5 Minuten nach dem Eintrag dass sie angeblich fertig hochgefahren ist wieder da war. Also zumindest per SSH und HTTPS.


    Ah - und ja, ich mache immer den Reboot vor den Updates. Die Kisten laufen bei mir meist zwischen 60 bis 90 Tage, bis ich ein Update Fenster habe (außer es ist gerade Luft, so wie jetzt). Also auch vor diesem Update. Daran kann es nicht gelegen haben.


    Zur Zeit scheint aber alles wie gewohnt zu laufen. Nur auf den anderen, produktiven Boxen dann das Update erst heute Abend / Nacht in Ruhe...

    Also ich kann auf einer TS-EC1680 R2 selbiges Verhalten bestätigen. Nach dem Firmware Upgrade von der 4.3.4.0435 :arrow: 4.3.4.0483 hat der anschließende Reboot 20 Minuten gedauert.

    Code
    Informationen    2018/02/16    10:09:12    System    127.0.0.1    localhost    [Firmware Update] System updated successfully from 4.3.4.0435(20171230) to 4.3.4.0483(20180213).


    Code
    Informationen	2018/02/16	10:12:01	System	127.0.0.1	localhost	System was shut down on Fri Feb 16 10:12:01 CET 2018.	
    
    
    Informationen	2018/02/16	10:28:40	System	127.0.0.1	localhost	System started.

    Vorher hat die Box knapp 7 Minuten gebraucht. Nach einigen Minuten hat sie angefangen munter alle Lüfter auf die maximale Drehzahl anzufahren und verblieb in der Haltung knapp 12 Minuten, bevor sie die Lüfter langsam wieder runter gefahren hat.
    Mal sehen wie sie sich nun weiter verhält...


    Und hättest du sie mit find gesucht, ach ich lass das ist mir zu blöd.

    Da hast du schon recht - nur unter dem Share war nichts zu finden. Ich habe nach zwei Lizenzdateien gesucht... Eigentlich nur durch Zufall, weil ich auf dem Share ein

    Code
    ls -R

    ausgeführt hatte, habe ich dann in dem betreffenden anderem Share die Dateien gefunden.


    Frohe Weihnachten

    Da stimme ich dir vorbehaltlos zu - besten Dank auf jeden Fall für die prompten Bemühungen. Ich habe ein Backup gezogen und nehme die Kiste über Weihnachten einmal außer Betrieb.

    Ich nehme an, dass die Datei bzw. der Ordner in einem versteckten Verzeichnis liegen.
    Deshalb der Hinweis zu find.

    Aber sollte ich auf der Shell unter dem Build-in "admin" User nicht alle Folder, also auch versteckte, sehen?


    Und würde der Ordner im selben Share abgelegt werden? Also würde cp -r den vorhandenen einfach umbenennen und verstecken?


    Wobei das für mich spannende ist (im Vergleich zur Windows Welt), dass er mir den besagten Ordner anzeigt, als wäre er nicht heute "bearbeitet" worden. Was genau stellt der "cp" Befehl dann auf FS Ebene an? Laut meinen vorher eingelesenen Verständnis hätte der Parameter "-r" ja nur bewirken sollen, dass eben auch Verzeichnisse und Subverzeichnisse mitkopiert werden sollten.
    Aber es scheint, als hätte er das leere Verzeichniss über das "alte" geschoben...


    Bash
    [/share] # ls CACHEDEV2_DATA/ -lttotal 120drwxrwxrwx    6 admin    administ      4096 Dec 24 10:35 Download/-rw-------    1 admin    administ     10240 Dec 24 09:35 aquota.userdrwxrwxrwx    3 admin    administ      4096 Dec 23 14:50 Web/drwxrwxrwx    3 admin    administ     32768 Dec 20 21:51 Recordings/drwxrwxrwx   42 admin    administ      4096 Nov  8 19:21 Programme/drwxrwxrwx    5 admin    administ      4096 Aug 11 09:48 Multimedia/drwxrwxrwx    3 admin    administ      4096 Aug 11 09:00 Software/drwxrwxrwx    6 admin    administ      4096 Apr 10  2016 homes/drwxrwxrwx    3 admin    administ      4096 Apr 10  2016 Public/drwx------    3 admin    administ     16384 Mar 30  2016 lost+found/


    Ok, ich schiebe es mal auf die Weihnachtsstress der letzten Wochen:


    Aus irgendeinem Grund hat der Befehl die Daten aus dem alten "Software" Ordner in einen älteren Ordner namens "Programme" verschoben... Dieses alte Share hatte ich vor Wochen für Datenkonsultation angelegt.

    Also alle Daten da - nur im "falschen" Ordner. Allerdings beunruhigt mich das Ganze noch ein wenig. Also so ganz ohne Erklärung...

    Zitat von Eraser-EMC2-


    Ist CACHEDEV2_DATA dein neuer oder alter Ort der Freigabe ?

    Also /share/CACHEDEV2_DATA/Software war der originale Ordner, den ich weg kopieren wollte. (eben extra nicht mit mv verschoben)
    /share/CACHEDEV7_DATA/Software war der neu angelegte und leere Ordner.


    Das Debakel habe ich mit folgendem Befehl veranstaltet:

    Code
    cp -r /share/CACHEDEV7_DATA/Software/ /share/CACHEDEV2_DATA


    Ich habe eben extra nicht mit mv gearbeitet, weil bei den letzten beiden Shares ohne Netz operierte. Im ersten Moment dachte ich mir noch, nachdem natürlich die Operation umgehend beendet war, dass ich nichts angerichtet hatte, weil die Folder sozusagen zusammengefügt hätten sollen. Aber dann war der Schock im ersten Moment doch groß, als beide Folder leer waren...

    Nun ja, der Folder "Software" im Volume "System" ist leer. Sprich außer dem Papierkorb befindet sich dort nichts mehr.


    Code
    [~] # find /share/CACHEDEV2_DATA/Software/
    /share/CACHEDEV2_DATA/Software/
    /share/CACHEDEV2_DATA/Software/@Recycle
    /share/CACHEDEV2_DATA/Software/@Recycle/desktop.ini

    Ursprünglich wollte ich auf dem Volume "System" den share "Software" verlagern ohne ihn übers Netz zu kopieren. Dazu habe ich auf meinem zweiten Speicherpool ein Volume "Medien" erstellt und per GUI (Freigabeordner) den Pfad für den Share umgelegt. Da ich die Shell gerade ohnehin offen hatte, habe ich anschließend cp -r benutzt um den Folder zu kopieren. Allerdings habe ich eben Quell- und Zielordner vertauscht und damit den Folder mit Infos mit dem neuen, und leeren "überschrieben". Nun sind beide Folder leer. Allerdings zeigt mir die Speicherverwaltung nach wie vor an, dass die über 800 GB Daten vorhanden wären (siehe Screenshot).
    Software Delete 001.JPG


    Habe ich eine Möglichkeit dieses Volume auf eine separate Disk zu klonen (z.B. mit "dd") und dann auf der geklonten Kopie mit Tools wie Testdisk nachzusehen?
    Vom Verständnis her müsste das Filesystem ja die Dateien und Folder nur ausgeklammert haben. Oder irre ich mich hier?

    Ich wollte heute auf meiner TS-EC1680 R2 (unter 4.3.2) ein share verschieben. Zuerst habe ich mittels WebGUI den Ordner auf ein neues Volume verlegt und dann wollte ich mit der Shell (cp -r) den alten Share Ordner auf den neuen kopieren.


    Leider habe ich dabei nicht aufgepasst und die Reihenfolge der beiden Ordner verkehrt angegeben (neuer (leerer) Folder > alter Folder anstatt alter Folder > neuer (leerer) Folder). :cursing::cursing::cursing: Nach dem Enter war es dann auch schon zu spät: Ich habe nun zwei leere Folder... Allerdings scheinen die Daten noch angezeigt zu werden, also zumindest in der Volume Verwaltung belegen sie noch genauso viel Platz wie vorher. Ich habe umgehend mit dem services.sh alle Dienste gestoppt und habe nun die gelinde Hoffnung, dass sie noch irgendwo auf der Disk schlummern und wiederherstellbar sind. Denn nachdem ich das Raid samt Volume auflösen und neu konfigurieren wollte, habe ich "natürlich" Snapshots und Backup deaktiviert...

    Hallo Thommy,


    Hast du es schon einmal versucht mit dem QNAP Support Kontakt aufzunehmen? Vielleicht können die dir einen autorisierten Reparaturpartner in deiner Nähe nennen. Wobei das wahrscheinlich in dieser Gegend eher darauf hinauslaufen wird, dass du das Gerät einschicken wirst müssen. Oder du kennst jemanden, der die Anzahl an verbauten Platten in seiner QNAP unterbringen kann, damit du an die Daten kommst.


    Ebenso einen schönen Abend, viel Glück und liebe Grüße!

    Wenn es das Problem meiner 1079er ist, dann ist die Backplane defekt. Also die rückwertige Platine, auf der die Steckverbindungen für die Platten sitzen. Dort sind einige Treiber Bausteine und einer hatte sich verabschiedet... Die Reparatur war nicht gerade günstig, aber zum wegwerfen war ein 2.000 € Gerät dann doch zu schade.

    Hallo zusammen,


    Ich habe vor kurzem ein Upgrade meiner schon betagten und aufgerüsteten TS-1270 auf ein neues TS-EC1680U R2 Modell getätigt. Soweit hat der Umzug wunderbar geklappt, alle Daten etc. waren vorhanden. Allerdings habe ich massive Probleme mit den Netzwerkeinstellungen. Und zwar genauer gesagt mit dem VLAN Tagging. Auf der 1270er habe ich das tagging Interfaceseitig auf der QNAP aktiviert und meinen HP entsprechend natürlich auf "tagged" auf dem entsprechenden Port aktiviert.
    Nun kann ich aber das tagging nicht mehr verwenden. Sobald ich es verwende, fliegt die QNAP aus dem Netz und ist nicht mehr erreichbar. Wenn ich aber das VLAN "untagged" vom Switch für dieses Port vergeben lasse, passt natürlich alles, wenn ich das VLAN wieder deaktiviere für das entsprechende Port. Weiter ist mir aufgefallen, dass die fixe IP verschwindet, sobald ich das "tagging" auf der QNAP aktiviere. ?( Ist mir etwas entgangen? :handbuch: Hat jemand eine Idee, wo mein Denkfehler sein könnte?