ANFRAGE: Versionierte Sicherungen - das verwirrt uns etwas

  • Hallo zusammen,


    vor geraumer Zeit, als ich in ein neues Unternehmen eingetreten bin, haben wir dort die komplette Datensicherungsroutine geändert. Auf der Basis eigener Erfahrungen mit QNAP sind wir unternehmensweit auf QNAP umgestiegen.


    Lassen wir die Probleme mit Ransomware mal außer acht, bereue wir den Schritt auch nicht.


    Nun haben wir jedoch Probleme dass die Datensicherung Überhand an Platzbedarf nimmt. Wir kommen mit der Begrifflichkeit "versionierte Datensicherung" nicht so zurecht. Ich nutze das Tool schon länger auf der eigenen QNAP - im Unternehmen habe ich in der HBS3 folgende Dinge angewendet:


    Zeitplan: täglich 20:00

    Versionsverwaltung : ON

    --> Intelligente Versionierung

    --> Stunden behalten: 1

    --> Tage behalten: 7

    --> Wochen behalten: 4

    --> Monate behalten: 12


    Ich nahm also an, dass er einmal am Tag eine Datensicherung macht, dies 7mal die Woche und am Ende der Woche die Woche selbst speichert - am Ende des Monats den Monat selbst.

    Wenn ich in die Sicherungen reinschaue, stimmt das auch so - die Monatlichen Sicherungen enthalten nicht nochmals Wöchendliche bzw. Tägliche Sicherungen.


    Dennoch ist das ja keine Versionierte Sicherung. Bei einer Versionierten SIcherungm wie ich das eigentlich aus Windows Server 2016/2019 kenne, wird anfänglich alles gesichert und NUR die Veränderte Datei wird dann inkrementell gesichert. Irgendwie aber sichert der immer alles. So flutet das natürlich unsere Backupssicherungern zu.


    Jetzt wo ich gerade darüber sinniere - hat das was mit QuDedup zu tun? Eine Deduplizierung sollte ja eigentlich doppelte und identische Datensätze negieren und nur die Veränderungen behalten....also zumindest in Windows Server 2016. Die QuDedup wurde nämlich deaktiviert wie ich sehe.


    Hat das damit zu tun?

    Dann noch eines: Es werden komischerweise über Monate hin immer wieder Datenstände gesichert in den monatlichen Sicherungen, die es gar nicht mehr im normalen Netzlaufwerk gibt, d.h. wenn es einen Ornder "Juli2019" im Juli 2019 gab, dann ist das OK - ich finde ihn aber auch in der Monatlichen Sicherung von September 2020 wieder. Das will ich nicht so recht verstehen.


    Vielen Dank im Voraus

  • Moin,


    HBS3 sichert nicht immer alles, Du hast nur diese Vermutung, weil in den Versionen immer der entsprechende Gesamtdatenstand angezeigt wird. Dieser enthält auch Hardlinks zu Daten, die bereits (in der selben Version) in einer vorherigen Sicherung enthalten sind.


    QuDedup hat damit nichts zu tun, das könnte unter Umständen aber die Datenmenge durch deduplizierung verringern. Die Effektivität hängt aber von den Daten ab.


    Auch die Verwirrung um gelöschte Ordner ist nachvollziehbar, ist aber das gleiche Thema vom Beginn: Es handelt sich um einen Hardlink zu der Version, die zuletzt bestand. Es ist also auch nur eine Sache der Anzeige, die sich aber nicht ändern lässt.


    Fakt ist: Gleiche Daten liegen nicht in zigfacher Ausfertigung im Backup uns fressen demnach den Platz, sondern sie sind einmalig vorhanden und benötigen auch nur einmal Platz.

    Dass die Größe der Backups aus dem Ruder läuft könnte damit zusammenhängen, dass zB große Mengen verschoben oder gelöscht wurden, wenn die Option "gelöschte Daten behalten" aktiv ist.

    Wo genau die "zusätzliche Datenmasse" herkommt wird vermutlich nicht leicht ausfindig zu machen sein. Eventuell muss das Konzept bzgl dem Aufheben gelöschter Daten überdacht werden...


    Hier ist noch etwas Lesestoff zu HBS3, allerdings ohne explizit auf Versionierung und gelöschte Daten einzugehen:

    Datensicherung vom QNAP - "Hybrid Backup Sync 3" kurz vorgestellt

  • Ich nutze die versionierte Sicherung ohne QuDedup. Da werden bei jeder Sicherung alle Verzeichnisse neu angelegt. Die Dateien werden aber nur dann kopiert, wenn sie sich gegenüber dem Vortage geändert haben, ansonsten wird ein Hard Link auf die Version vom Vortage angelegt (das Besondere bei Hard Links: Link und Original sind gleichwertig). Das erste Backup ist also ein Vollbackup, alle folgenden sind Inkrementell.


    Das Besondere daran ist, jedes Verzeichnis für eine Sicherung ist vollwertig und enthält den ganzen Bestand. Man kann auch beliebig einzelne Sicherungen (=Verzeichnisse) löschen, ohne dass andere Sicherungen beeinträchtigt werden. Allerdings ist der Platzgewinn, wenn man eine einzelne Sicherung aus der Mitte löscht, relativ gering, da die meisten Dateien identisch auch in der Sicherung vorher oder nachher vorkommen und damit weiterhin auf der Platte bleiben. Am meisten Platz gewinnt man, wenn man die ältesten Sicherungen löscht. D. h., ob du nun 4, 8 oder 12 Wochen im Wochenrhythmus behältst, macht keine großen Unterschied, aber ob du monatlich 6 oder 12 Versionen aufhebst, macht einen deutlichen Unterschied.


    Noch ein Hinweis: Images laufender virtueller Maschinen sollten nicht so gesichert werden, da du sonst täglich eine geänderte riesige Datei hast.

    Es werden komischerweise über Monate hin immer wieder Datenstände gesichert in den monatlichen Sicherungen, die es gar nicht mehr im normalen Netzlaufwerk gibt, d.h. wenn es einen Ornder "Juli2019" im Juli 2019 gab, dann ist das OK - ich finde ihn aber auch in der Monatlichen Sicherung von September 2020 wieder.

    Es gibt die Option "Zusätzliche Dateien im Zielordner löschen". Ist die Option ausgewählt? Wenn nicht, kommt es zum von dir beschriebenen Effekt.

  • Hallo

    Vielen Dank für die konstruktiven Lösungen :)

    Ja ich habe einige Dinge hier wohl ZUVIEL gemacht.


    • Der Netzwerkpapierkorb wird 180Tage gehalten - das habe ich mal auf 30 reduziert.
    • Zusätzlich habe ich diese Einstellung editiert, dass ein MIRROR erzeugt wird. Irgendwas mit "Zusätzliche Daten löschen" war das - so haben wir Backupleichen immer weiter mitgeschleppt.

    Danke nochmals :D