:tongue: TS-269 Pro, Firmware 3.8.1 Build 20121205 mit 2x WD60EFRX (Red 6TB) vom Juli 2015 (vermutlich sogar gleiches Fertigungslos) als Raid1
Folgendes Szenario:
Es laufen Dateitransfers (Videos vom Laptop per Mediathekview runterladen und auf public am NAS speichern) und gleichzeitig läuft eine zeitgesteuerte Datensicherung (Sync auf externe Festplatte am eSata). Alles wird langsamer und langsamer, plötzlich wird das NAS im LAN unansprechbar (weder Freigaben noch Admin-Oberfläche) gefühlt also abgestürzt oder eingefroren.
NAS per Powerbutton formgerecht runtergefahren, neu gestartet.. Lüfter bleibt auf Vollgas stehen, System fährt nicht hoch, beide HDD-LEDs bleiben aus. :shock:
Testhalber: Beide HDDs raus und die im Juli ausgebauten fast vollen WD Red 3TB eingebaut: Kiste fährt hoch, alles bestens, alles da, alles läuft (halt Stand Juli...).
Panik, beide 6TB-HDDs mit externem USB-Gehäuse und Diskinternals Linuxreader vom PC aus angesehen, Festplatten laufen beide soweit erkennbar einwandfrei, und alle Daten da - Uff. (Dreifach Hoch auf die 3.8.1 ohne Speicherpool...) Frei Auge der Verlust zum letzten ca. 1 Woche alten Backup per Sync auf externe Platte verschmerzbar, also weitermachen.
Einzelne HDD1 reingesteckt, NAS startet, alles da, RAID degraded (klar, zweite Festplatte ist ja "weg"). SMART-Daten unauffällig.
Uff, bevor ich IRGENDWAS mache, Datensicherung vom degradierten RAID aus vervollständigen und prüfen.... (ist mir ja abgebrochen zuvor)....
NAS aus, zweite HDD dazu, NAS an: startet nicht, Lüfter Vollgas, wie zuvor.
OK, also RAID-Rebuild erzwingen: NAS aus, zweite HDD wieder raus, NAS an, startet mit RAID degraded. HDD2 "hot" einschieben und schauen, was passiert: OK, erkennt die HDD2 und beginnt selbständig das RAID zu syncronisieren. Rebuild vom RAID läuft fast 20h, aber erfolgreich. Die HDD2 ist ABNORMAL, (siehe unten, Raw_Read_Error_Rate) und verweigert den Schnell- und Normaltest "Severe or unknown errors".
Nach einem Neustart des NAS sind die SMART-Werte für die zweite HDD auf einmal wieder schön, Schnelltest etc. laufen durch, alles bestens. :shock: :shock: :shock: Hä? Alles wieder gut, war was?
Frage: Was kann da passieren, daß a) die zweite Festplatte schlagartig erst mal dieses Fehlerbild zeigt (alle anderen SMART-Werte schauen so unverdächtig aus wie bei der ersten). Was ist da jeweils Ursache und was Wirkung (Datentransfers und gleichzeitig Sync?) <> Systemeinfrieren <> Probleme die die NAS-Hardware hat und evtl. meine zweite HDD angeschossen hat? <> Probleme, die die HDD2 selber entwickelt hatte und die zum Absturz geführt haben... b) warum heilt sich das alles wieder?
Ich trau momentan der HDD2 immer noch nicht so über den Weg und dem ganzen NAS auch nicht.
Meint Ihr, ich sollte trotzdem die Festplatte tauschen und fertig? Da das ganze im Rahmen von einem "Absturz" lief, bin ich da etwas ratlos, wo ansetzen und wo die Ursache finden....
DAs ist die gute HDD1, und so sah die zweite vorher auch aus.
ID Description Value Worst Value Threshold Raw Value Status1 Raw_Read_Error_Rate 200 200 051 0 OK3 Spin_Up_Time 231 198 021 7425 OK4 Start_Stop_Count 100 100 000 37 OK5 Reallocated_Sector_Ct 200 200 140 0 OK7 Seek_Error_Rate 100 253 000 0 OK9 Power_On_Hours 098 098 000 1918 OK10 Spin_Retry_Count 100 253 000 0 OK11 Calibration_Retry_Count 100 253 000 0 OK12 Power_Cycle_Count 100 100 000 37 OK192 Power-Off_Retract_Count 200 200 000 31 OK193 Load_Cycle_Count 198 198 000 6648 OK194 Temperature_Celsius 116 112 000 36 OK196 Reallocated_Event_Count 200 200 000 0 OK197 Current_Pending_Sector 200 200 000 0 OK198 Offline_Uncorrectable 100 253 000 0 OK199 UDMA_CRC_Error_Count 200 200 000 0 OK200 Multi_Zone_Error_Rate 200 200 000 0 OK
Das ist die merkwürdige HDD2 während und nach RAID-Rebuild etc. wie oben beschrieben, SMART ABNORMAL
ID Description Value Worst Value Threshold Raw Value Status1 Raw_Read_Error_Rate 001 001 051 12488 ABNORMAL3 Spin_Up_Time 226 199 021 7700 OK4 Start_Stop_Count 100 100 000 28 OK5 Reallocated_Sector_Ct 200 200 140 0 OK7 Seek_Error_Rate 200 200 000 0 OK9 Power_On_Hours 098 098 000 1904 OK10 Spin_Retry_Count 100 253 000 0 OK11 Calibration_Retry_Count 100 253 000 0 OK12 Power_Cycle_Count 100 100 000 28 OK192 Power-Off_Retract_Count 200 200 000 19 OK193 Load_Cycle_Count 198 198 000 6607 OK194 Temperature_Celsius 117 112 000 35 OK196 Reallocated_Event_Count 200 200 000 0 OK197 Current_Pending_Sector 200 200 000 0 OK198 Offline_Uncorrectable 100 253 000 0 OK199 UDMA_CRC_Error_Count 200 200 000 0 OK200 Multi_Zone_Error_Rate 179 179 000 10265 OKK
Nach Restart des Systems ist die HDD2 auf einmal wieder "gut". :roll:
ID Description Value Worst Value Threshold Raw Value Status
1 Raw_Read_Error_Rate 194 001 051 227 OK
3 Spin_Up_Time 226 199 021 7700 OK
4 Start_Stop_Count 100 100 000 28 OK
5 Reallocated_Sector_Ct 200 200 140 0 OK
7 Seek_Error_Rate 200 200 000 0 OK
9 Power_On_Hours 098 098 000 1905 OK
10 Spin_Retry_Count 100 253 000 0 OK
11 Calibration_Retry_Count 100 253 000 0 OK
12 Power_Cycle_Count 100 100 000 28 OK
192 Power-Off_Retract_Count 200 200 000 19 OK
193 Load_Cycle_Count 198 198 000 6607 OK
194 Temperature_Celsius 117 112 000 35 OK
196 Reallocated_Event_Count 200 200 000 0 OK
197 Current_Pending_Sector 200 200 000 0 OK
198 Offline_Uncorrectable 100 253 000 0 OK
199 UDMA_CRC_Error_Count 200 200 000 0 OK
200 Multi_Zone_Error_Rate 179 179 000 10265 OK
Alles anzeigen
lG Matthias
PS.: Kann mir jemand einen Tipp geben für ein gutes HDD-Testtool, das die ext4-formatierten Platten am externen USB- oder eSata-Adapter am PC gründlich aber völlig zerstörungsfrei (so, daß ich sie einzeln aus dem heruntergefahrenen NAS rausholen und testen kann und sie nachher auch wieder dort laufen) testet (wenn möglich gerne unter Windows 7)? Tools von WD? Kann mir jemand einen Tipp geben oder auf einen guten Thread dazu verlinken, wie und womit ich eine eventuelle leere, neue Austauschplatte vor Einsatz im NAS gründlich testen sollte - dann sicher auch schreibend/lesend (empfohlene SW, HDtune fand ich erwähnt.. Muß es die Pro sein?).