Hallo!
Ich bekomme bei meinem neuen TS-877 beim erstellen eines neuen Speicherpools mit den bays 3-6 (und nur bei diesen bays) hard resetting link errors.
Ich habe die Platten getestet, es liegt definitv nicht an den Platten.
Hier eine Übersicht der BAYS, damit ihr euch auskennt:
Um den Fehler einzugrenzen bin ich so vorgegangen:
1.) Nas neu initialisert mit nur 2 m.2 SSDs drinn. Mit diesen Speicherpool 1 (Raid1) erstellt und System-Volume angelegt. Kernel-Log-Analysator ausgeführt. keine Fehler.
2.) Nas heruntergefahren. 2 SSDs in ssd-bay 1 und 2 eingelegt, 2 SSDs in disk bay 1 und 2 eingelegt, 4 wd red in disk bay 3-6 eingelegt.
3.) NAS gebootet. Kernel-Log-Analysator ausgeführt. keine Fehler.
4.) SSD-Cache (Raid1) mit den 2 SSds in den ssd-bays angelegt. Kernel-Log-Analysator ausgeführt. keine Fehler.
5.) Storagepool 2 (RAID1) mit den 2 SSds in disk-bay 1 und 2 erstellt. Kernel-Log-Analysator ausgeführt. keine Fehler.
6.) Storagepool 3 (Raid5) mit den 4 wd red in disk-bay 3-6 erstellt. Kernel-Log-Analysator ausgeführt. Fehler:
In Systemprotokolle sieht man das:
Habe dann über putty nochmal überprüft, welche devices ata1 und ata2 sind. Ergebnis:
Ata1 ist sda
Ata2 ist sdb
Dann in putty die Seriennummer von sda und sdb abgegriffen und und es handelt sich definitv um die 2 wd red in bay 3 und 4.
(Diese Platten sind komplett neu und fehlerfrei). Da ich es auch mit anderen Platten getestet habe, kann ich einen Plattenfehler ausschließen.
dmesg gibt folgendes aus: siehe Anhang: (konnte es nicht als Code-Block einfügen, weil zu lange.)
Es ist auch so, dass die Fehler erst auftreten, wenn ich den Storagepool mit den wd red anlege (egal ob RAID5, RAID6 oder RAID10, es gibt immer hard resetting link Fehler). Wenn die Platten einfach frisch im NAS stecken, ohne dass darauf ein Storagepool bzw. RAID angelgt wird/ist, gibt es keine Fehlermeldungen. Beim Erstellen der anderen Storagepools gab es keine Fehler.
Im QTS Speichermanager sind auch keine Fehler angezeigt. Nur (wie oben geschrieben) gibt es unter Systemprotokolle" diese NCQ Meldungen.
Kann mir hier jemand weiterhelfen bzw. was dazu sagen? Hardwarefehler (schon wieder)?
Interessant zu erwähne ist vielleicht noch, dass ich bei dem vorherigen TS-877 (das ausgetauscht wurde), neben anderen problemen auch ata1 und ata2 hard resetting Fehler hatte. Damals habe ich leider nicht überprüft, welche devices in welchen bays das waren, aber da die Platten gleich gesteckt waren, soweit ich mich erinnere, dürfte es auch damals bay 3 und 4 gewesen sein.
Danke vielmals,
lg Robertson23
PS: Ticket bei Qnap ist gemacht.
update:
zusammengefasst:
ata1 = sda =disk 4
ata2 = sbd = disk 3
habe NCQ bei beiden disks mittels:
manuell über putty aktiviert.
Das ist auch in Systemprotokolle ersichtlich (habe testweise auch disable probiert und ein schneller smart test disk 4 habe ich auch gemacht, deswegen steht das auch drinn):
Bei beiden Disks ist es wieder auf diasabled (timeout error) gesprungen nach ein paar Minuten (disk 3 hat etwas länger mit Status enabled durchgehalten). Auch der Kernel Log hat bei ata1 (also disk 4) und ata2 (disk 3) den hard resetting link error um 1 raufgezählt:
Nach dem hard reset ist ncq scheinbar wieder aktiviert auf den Platten, bis zum nächsten timeout.
laut dem kernel log kommt zuerst der NCQ disable, daraus resultiert später der hard resetting link.
Mir ist aber nicht klar, was die Ursache für das NCQ Problem ist. Vor allem, da in bay 5 und 6 die selben wd red stecken, die keine NCQ Probleme verursachen! Gefühlsmäßig würde ich ja wieder auf einen hardware Fehler des Qnap (backplane, Speichercontroller) tippen. Ich hoffe sehr stark, dass nicht.
update:
habe jetzt den storage pool gelöscht, und die platten umgesteckt. disk 3 und 4 auf 5 und 6 und umgekehrt, dann neuen storagepool raid5 angestoßen. synchronisiert gerade. sollte es am Qnap liegen, müssten die NCQ errors jetzt trotz der anderen Platten auf bay 3 und 4 auftreten und die ata errors sollten auch bei ata1 und ata2 bleiben.
ata1 (disk 4) ist jetzt sdm
ata2 (disk3) ist jetzt sdl
sollte es an den Platten liegen, dann müssten die NCQ errors bei bay 5 und 6 kommen, und ata13 und ata 14 betreffen (ata14 = sda, ata13 = sdb).
mir wird langsam schwindelig.
update:
verdammt. Eben ist bei disk 3 (ata2) wieder ein nrq error aufgetreten, obwohl da ja jetzt eine andere Platte drinn ist. disk 4 wird auch nicht lange auf sich warten lassen wahrscheinlich.
Damit ist klar, dass es nicht die Platten sind, endgültig.
Mann, was ist da los? Backplane defekt?
HALLO? Niemand eine Idee, was da los ist?
Könnte es am zusätzlichen RAM liegen? (denke ich eigentlich nicht.)
Hat die ganze Serie TS-877 eine Macke?
Gibt es hier noch andere TS-877-Besitzer, die berichten können, was bei ihnen los ist?
Mit keinem Gerät in meiner Vergangenheit hatte ich dermassen viele Probleme wie mit dem neuen Qnap.
Kann vielleicht jemand generell was zu der ncq-Problematik sagen? Wer hatte bei diesem oder einem anderen Qnap-Gerät auch einen ncq-disable auf Grund von timeout? Wie konnte das Problem behoben werden? bios-update vielleicht? (bei Windows ist doch ncq automatisch aktiviert, wenn AHCI im bios eingestellt ist, oder?)
Bin auch nicht der einizige hier, der ncq-Probleme hat.