Unterschied RAID und Backup

  • Servus Leut,


    da ich von der Moderation so nett gebeten wurde: Hier mal grundlegende Gedanken (vereinfacht) zum Thema RAID vs. Backup:


    RAID (Ausfallsicherheit):


    Beim RAID (abgesehen von RAID0) geht es um eine gewisse Ausfallsicherheit bei Plattendefekten - wenn eine Platte ausfällt / defekt ist, dann sind nicht gleich die Daten verloren. (Bei RAID0 oder auch Stripeset oder Striping genannt werden nur mehrere Platten miteinander zusammengeführt ohne eine Parität oder Spiegelung zur Wiederherstellung zu haben.) Ein recht guter Artikel zum Verständnis über RAIDs ist bei Wikipedia zu finden: http://de.wikipedia.org/wiki/RAID


    Backup (Datensicherheit):


    Ein Backup bedeutet, dass man Daten zu einem Zeitpunkt sichert um sie bei Verlust aus der Sicherung wieder herstellen zu können. Der Aufwand hierzu ist wiederum eine Sache für sich und muss überlegt werden, wieviele Sicherungen man vorhalten will.
    Beispiel: Man hast eine Datenhaltung für seine Dokumente und macht regelmäßig (sagen wir täglich) ein Backup und hält nur eine Sicherung dieses Backups vor. Nun hat man aber vor drei Tagen eine Datei gelöscht, von der man erst dachtest dass man sie nicht mehr brauchst - merkt aber dann doch, dass sie wieder benötigt werden würde. Wenn man nun nur eine Sicherung vorhält, diese nur vom Vortag ist, so ist in dieser Sicherung auch die gewünschte Datei nicht mehr vorhanden.
    Somit ergibt sich, dass man eigentlich mehrere Backups vorhalten sollte. Mögliche Szenarien von Backup-Strategien gehen teilweise bis zu einem halben Jahr oder gar längeren Zeiträumen zurück. Dabei wird zumeist in der ersten Woche ein tägliches Backup vorgehalten und dann für einen Monat ein wöchentliches und danach wiederum min. ein monatliches. Dies dient der Wiederherstellung von Daten die versehentlich (oder aus was für einen Grund auch immer) gelöscht wurden.
    Ersichtlich sollte somit sein, was für Speicher-Kapazitäten irgend wann gar nur für eine Backup-Strategie von Nöten seien kann. Hierbei wird dann ein vielfaches von dem benötigt, was an (sog. Verkehrs-)Daten im eigentlichen Betrieb vorhanden ist.


    Es stellt sich somit nun die Frage, was willst man eigentlich (technisch gesehen):

    • Ausfallsicherheit? Dann sollte zumindest mal entsprechende RAID-Systeme / -Konfigurationen zum Einsatz kommen.
    • Datensicherheit (sprich Backup)? Hier ist dann vor allem auch die weitere Frage angedacht, in wie weit soll diese Datensicherheit zurück führbar sein. Entsprechend hoch ist dann auch der zusätzliche Aufwand an Speicherkapazitäten vorzuhalten.


    Beides lässt sich natürlich nochmals miteinander kombinieren - also einerseits eine gewisse Ausfallsicherheit für den laufenden Betrieb und die Datensicherheit (mit Backups) für fatale Datenverluste z.B. durch Verlust des eigentlichen Datenspeichers (durch Feuer oder andere zerstörende Katastrophen wie Kinder oder Besoffene ... :roll: )


    Fazit: Bei NAS-Systemen wie denen von QNAP, die hier im Forum behandelt werden, geht es in erster Linie um Ausfallsicherheit für die Datenhaltung (neben dem Aspekt von großen Datenpartitionen, die die Kapazität einzelner Platten übersteigt). Ein Backup oder entsprechende Strategien sind von einer einzelnen NAS nicht betroffen. Eine NAS kann aber für das Vorhalten von Speicherkapazitäten für Backups hergenommen werden. Somit ist eine NAS nur ein möglicher Teil innerhalb einer Backup-Strategie - aber nie das Backup alleine ... vor allem, wenn nur eine NAS für Datenhaltung und Backup eingesetzt werden sollte - es werden dann min. zwei benötigt (oder andere / weitere Speichermedien, die die Daten aufnehmen können).


    Ich hoffe mal, dass diese Gedanken zu RAID und Backup hier helfen können sich selbst mal Gedanken um benötigte Kapazitäten und Einsatzzwecke von NAS-Systemen zu machen und somit Fehlinvestitionen zu vermeiden.


    Mit freundlichem Gruß eines ehemaligen WAN-Administrators.

    Einmal editiert, zuletzt von GorillaBD () aus folgendem Grund: Toter Link entfernt.

  • Ergänzung:


    im Zusammenhang mit RAID-Systemen gibt es den Begriff der Wiederherstellwahrscheinlichkeit. Dieser beschreibt, wie hoch die Chance ist, dass ein degraded RAID (bei dem eine oder mehrere Festplatten ausgefallen sind) wieder erfolgreich wiederhergestellt werden kann.


    Diese Chance liegt IMMER unter 100%.


    Sie ist umso niedriger, je grösser die Platten sind, je mehr Platten im Verbund sind, je älter (Laufstunden, Belastung) die Platten sind und je "gleicher" die Platten sind (z.B. alle vom gleichen Hersteller/Typ und womöglich sogar noch aus der gleichen Produktionscharge).


    Das Risiko, welches diese Wahrscheinlichkeit unter 100% hält ist, dass während des sogenannten Rebuilds des RAID-Systems mit einer neuen Platte eine weitere des Verbundes Lesefehler zeigt bis hin zum Totalausfall einer weiteren Platte. Der RAID-Rebuild, die Wiederherstellung, scheitert dann. Eine milde Folge kann sein, dass nur der Rebuild scheitert und das RAID aber zugänglich bleibt. Der Worst Case ist, dass das RAID durch den weiteren Ausfall während des Rebuilds "abstürzt" und gar nicht mehr zugänglich ist - was einem Totalverlust der Daten gleichkommen kann, für jemanden der sich dann mit tieferen Kenntnissen in Linux und Datenrettung nicht mehr selbst helfen kann.


    RAID-Rebuilds sind für die Platten sehr "stressige", kritische Vorgänge und daher ist das Risiko, dass genau während eines solchen Vorgangs weitere Platten einen Fehler/Ausfall zeigen, hoch.


    Daher spricht man bei RAID-Systemen nur von einer erhöhten Datenverfügbarkeit durch solche Verbunde, nicht von Datensicherheit. Diese können RAID-Systeme nicht bieten, s.o.


    Wir raten daher hier auch immer, trotz RAID-Einsatzes ein aktuelles Backup vorzuhalten, insbesondere gerade vor solchen Rebuild-Vorgängen. Auch Online-RAID-Kapazitätserweiterungen oder -Levelmigrationen beinhalten solche Rebuild-Vorgänge, für solche gilt dieser Zusammenhang der Wiederherstellwahrscheinlichkeit und somit dieser Rat also genauso.


    Die Wiederherstellwahrscheinlichkeit eines RAID6 ist (bei Ausfall einer Platte) wesentlich höher als die eines RAID5. 100% ist sie aber auch hier nicht.


    Siehe dazu vertiefend z.B. auch Kap. 3.5 in diesem Wiki-Artikel: --> http://de.wikipedia.org/wiki/R…i_gro.C3.9Fen_Festplatten


    GLG GBD



    EDIT
    Wer sich für die Historie von RAID und weitere Details interessiert, findet hier einen imho spannenden und verständlich geschriebenen Artikel: --> http://www.gernoth.net/rdf/raid.pdf