Raid Sicherheit - Frage

  • Hallo an alle,


    das Qnap SS-839 sagt mir schon sehr zu! Jetzt bin ich nur verunsichert durch einen Artikel welchen ich kürzlich las: http://blogs.zdnet.com/storage/?p=162


    Dieser behauptet, dass Raid5/6 Systeme prinzipbedingt bei großen Festplatten versagen werden. Wenn zum Beispiel eine Festplatte ausfällt, man sie austauscht und dann rebuilded, steigt mit großen Festplatten die Wahrscheinlichkeit eines URE (Unrecoverable Read Error). Wenn so ein URE auftritt, sei dann das Rebuild fehlgeschlagen und die Daten von dannen.


    Nun die Frage an die Spezialisten. Ist dieses Szenario zutreffend? Ich vermute das liegt auch an der Implementation des Raid Rebuild Prozesses.



    Vielen Dank,
    Sebastian


    Frage am Rande: Verwendet der SS 839 Software Raid?

  • hi


    zdnet übertreibt imho (und der artikel ist auch bereits 2 jahre alt) aber grundsätzlich haben sie nicht unrecht. zumindest theoretisch.


    so oder so: raid dient generell nicht der datensicherung (sprich ist kein backup)! es ist lediglich eine ausfallsicherheit (sprich man kann weiterarbeiten ohne unterbruch) und bietet je nachdem eine erhöhte geschwindigkeit. du findest ansonsten auch ausführlichere beiträge zu diesem thema von mir oder anderen in diesem forum ;)


    das gilt für alle raids, egal welcher hersteller. raid wurde nie zwecks datensicherung entwickelt, leider wird das heute aber oft missverstanden. das was ein raid tun soll, tut es einwandfrei.


    qnap verwendet bei allen TS ein linux mdadm software raid.

  • Zitat von "IamQ"


    so oder so: raid dient generell nicht der datensicherung (sprich ist kein backup)! es ist lediglich eine ausfallsicherheit (sprich man kann weiterarbeiten ohne unterbruch) und bietet je nachdem eine erhöhte geschwindigkeit. du findest ansonsten auch ausführlichere beiträge zu diesem thema von mir oder anderen in diesem forum ;)


    Ich muss Dir leider widersprechen. Natürlich ist Raid kein Backup, sondern dient primär der höheren Datenverfügbarkeit. Falls es aber tatsächlich so wäre, das ein Rebuild allein durch ein URE unterbrochen wird, dann sehe ich darin ein großes Problem. Das würde diese Form von Raid für große Festplatten in der Tat ad absurbum führen, da die Wahrscheinlichkeit eines erfolgreichen rebuilds immer geringer wird. Alle 10^14bit tritt so ein URE (Nonrecoverable Read Error) laut Seagate bsp. auf.


    Ich brauche jetzt einfach eine Aussage wie sich der Qnap im Falle so eines Fehler während des Rebuilds verhält. Rebuild bricht ab - oder läuft weiter und nimmt einen korrupten Sektor in kauf.


    Gruss,
    Sebastian

  • wie gesagt halte ich die aussage von zdnet für übetrieben und sie ist nicht aktuell (von 2007!), sie ist vermutlich nicht falsch aber basiert auf theoretischen und alten annahmen. im artikel steht aber auch dass es mit enterprise (24/7) platten, welche eine geringere fehlerrate haben, rein rechnerisch auch weniger probleme gibt.


    wobei spezifisch die aussage "But even today a 7 drive RAID 5 with 1 TB disks has a 50% chance of a rebuild failure" im artikel einfach nur völliger quatsch und panikmache ist! weder damals noch heute war das risiko eines fehlers beim rebuild jemals auch nur ansatzweise in der nähe von 50%, das würde ja heissen jeder zweite rebuild ist fehlerhaft. das ist definitiv und nachweisbar nicht der fall.


    wie auch immer... ich schätze die hdd hersteller und auch einige linux entwickler werden sich bestimmt in den 2 jahren gedanken gemacht und auch tests durchgeführt haben. es ist jetzt 2009 und bisher gibt es meines erachtens kein anzeichen dafür dass dies in der praxis ein nennenswertes problem wäre.


    es ist eine standard linux raid implementation. wie sich diese verhält, kann ich dir nicht sagen.


    mal ganz abgesehen davon gibt es keine 2.5" laufwerke mit 2TB...

  • Zitat von "IamQ"

    mal ganz abgesehen davon gibt es keine 2.5" laufwerke mit 2TB...


    Noch nicht ;) Es gibt aber schon 2,5" 1TB und 2TB sind demnach in 2 Jahren da. Auch SSD in den Größenordnungen werden bald nichts ungewöhnliches sein.


    Und ich verstehe nicht, wieso du diese Thematik so abwiegelst. Wieso soll eine theoretische Abhandlung schlecht sein, nur weil sie 2 Jahre alt ist? Es ist doch ganz klar das man sich vor dem Kauf gedanken macht, ob die Funktionalität die ich mir erhoffe durch das Produkt gewährleistet ist. Und je nach Implementation (Rebuild Algorithmus) kann sich jedes Produkt anders verhalten. Raid wird von manchen Benutzern in der Tat als allheilmittel gegen Datenverlust gesehen bzw. genutzt.


    Also wenn jemand etwas technischen Hintergrund über den QNAP Rebuild Prozess geben kann, oder bereits Erfahrungen mit Rebuilds (inkl. fehlgeschlagenen) hat, würde ich mich sehr über einen kleinen Beitrag freuen.



    Gruss,
    Sebastian

  • Das wäre ja auch was.


    Dann könnte man Raid5 auch gleich ganz sein lassen.


    Ich nutze mein NAS eigentlich sehr selten, die meiste Zeit ist aus.


    Da könnte ich mir auch Raid sparen und hätte somit 1,5TB mehr Speicher zur Verfügung.

  • togg: ähm ich versuche dir nur zu helfen... wenn du es besser weisst, wieso fragst du dann? ich sage dir nur - nach meinem besten wissen - wie die realität aussieht.


    rein rechnerisch - ich bin kein mathematiker sondern praktiker - mag der mann recht haben aber die realität zeigt uns ganz klar dass der artikel sich in der praxis nicht bewahrheitet hat. und die welt ist auch nicht stehengeblieben seit dann (schon mal überprüft ob vielleicht die URE inzwischen niedriger ist bei grösseren HDDs?). er hat damals eine vorhersage gewagt aber inzwischen IST es 2009 und nichts deutet darauf hin dass die prognostizierten probleme tatsächlich eingetroffen sind. möglicherweise ist die fehlerrate tatsächlich höher, aber nicht massiv. und wie gesagt ist mindestens eine aussage in dem artikel erwiesenermassen einfach nur falsch.


    ich verstehe dass du dir gedanken machst und auch deine ursprüngliche frage wie auch dein zweites post ist 100% berechtigt! aber wenn ich dann dir etwas erkläre, musst du auch "zuhören". was du dann mit der information anfängst resp. wie du diese bewertest ist natürlich deine sache.


    mir erschliesst sich einfach nicht ganz wieso du über ein theoretisches problem diskutieren willst, das in der praxis schlichtweg nicht relevant ist wenn man die üblichen IT richtlinien (backup und so) befolgt. natürlich kann es beim rebuild zu einem fehler kommen, aber es sieht definitiv nicht so aus als ob dieses risiko auch nur annähernd so hoch wäre (oder massiv höher als früher) wie robin harris behauptet. es gibt wohl tausende firmen die ein raid5 mit mehr als 12tb betreiben als beweis dafür.


    meine erfahrung und das feedback der kunden zeigt dass es auch mit den QNAP TS in der regel sehr zuverlässig funktioniert. oder ist die aussage von harris nun "richtiger" als meine nur weil er seine persönliche meinung auf ner bekannten website kundtun darf? ;)


    Zitat

    QNAP Rebuild Prozess


    wie ich bereits sagte... es ist nichts qnap spezifisches. absolutes standard linux raid (wie auch bei vielen anderen herstellern), welches als sehr zuverlässig und stabil gilt. auch beim rebuild.


    nun gut, ich habe für dich mal kurz gegoogelt... http://linux.die.net/man/4/md


    und da steht dann u.a. folgendes:


    SS-839 verwendet kernel 2.6.24 womit auch md/mdadm auf dem neusten stand ist.


    frage zu deiner zufriedenheit beantwortet?


    und wenn man immer brav backups macht wie sich's gehört, wäre selbst ein fehlerhafter rebuild kein beinbruch! 8-)



    Mayday:

    Zitat

    Da könnte ich mir auch Raid sparen und hätte somit 1,5TB mehr Speicher zur Verfügung.


    ja und nein. in der regel wird dir ein raid5 einiges an aufwand ersparen falls mal ein laufwerk defekt sein sollte. denn wie gesagt funktioniert ein rebuild mehrheitlich problemlos. ohne raid5 wäre der zugriff auf die daten - also beispielsweise in einem pc - einfacher (was aber mit einem regelmässigen backup eher sekundär ist) und du hättest wie erwähnt mehr speicherplatz zur verfügung.


    in einer firma ist ein raid praktisch immer pflicht, weil jede ausfallzeit geld kostet (angestellte können evtl. gar nicht arbeiten wenn die daten auf dem server nicht zur verfügung stehen). im privaten bereich ist es sicher nicht zwingend, sondern hängt einfach von der persönlichen präferenz ab.


    wenn es sich um einen sehr schnellen NAS handelt (z.b. TS-809) würde dir raid5 wohl auch eine höhere leistung bringen als eine einzelne platte.