Wie kann ich aufgeblasenes Backup nach Pfadänderung in der Quelle verhindern?

  • Hallo,


    ich benutze HBS 3 für einen täglichen Backuplauf. Version Management ist eingeschaltet und hebt 365 tägliche, 104 wöchentliche und 120 monatliche Versionen auf. Unterm Strich habe ich also ein Jahr lang Zugriff auf die täglichen Datenstände, dann noch 1 Jahr lang Zugriff auf die wöchentlichen Datenstände, und dann noch 8 Jahre lang Zugriff auf die monatlichen Datenstände. In der Quelle nicht mehr vorhandene Dateien werden im aktuellen Backuplauf entfernt, sodass ich zusätzlich zu den historischen Ständen immer auch eine akutelle Sicht habe. Da das NAS erkennt, wenn eine Datei unverändert schon in einem vorherigen Backup enthalten ist, ist der Speicherbedarf des Backups trotz der vielen verfügbaren Einzelversionen begrenzt, solange der Anteil der täglichen Änderungen ggü. der Gesamtzahl der Dateien der Quelle begrenzt ist.


    So weit, so gut, das System funktioniert problemlos und liefert die gewünschten Ergebnisse.


    Nun musste ich aber in der Quelle einen Ordner umbenennen. Innerhalb dieses Ordners liegen eine Menge sehr großer Dateien, die zusammen rund 90% des Datenvolumens der Quelle ausmachen. Das HBS hat diese Dateien nun aufgrund des geänderten Pfadnamens als "neue" Dateien identifiziert, diese in den nächsten Backup-Lauf eingeschlossen und das Backup belegt nun folglich auf der Zielseite 90% mehr Speicherplatz als zuvor. Meine Frage: Welche Möglichkeit gibt es, diesen Zustand wieder zu korrigieren und den Speicherbedarf des Backups zu reduzieren?


    Vielen Dank für eure Tipps!

  • aturdent314

    Hat den Titel des Themas von „Wie kann ich aufgeblasene Backups und Pfadänderung in der Quelle verhindern?“ zu „Wie kann ich aufgeblasenes Backup nach Pfadänderung in der Quelle verhindern?“ geändert.
  • Hallo,


    sieht glaube ich schlecht aus.


    Nutzt Du QuDedup :?:


    Wenn nicht, könntest Du versuchen den Ordner auch in der Sicherung manuell umzubenennen. Wären halt sehr viele Änderungen. :/

  • Hallo,


    nein, QuDeDup nutze ich nicht. Es sind leider schon rund 400 Sicherungsinstanzen vorhanden, da würde das manuelle Umbenennen eine Weile dauern. Und ich bin mir auch nicht sicher, ob das FileSystem des NAS dann rückwirkend erkennt, dass es sich um die gleiche Datei handelt und statt der doppelten Datei dann nur noch einen Link vorhält.....?

  • Wenn du kein QuDedup hast, dann lässt sich das in der Shell machen:


    Du musst für jede der verschobenen Dateien die neue Datei löschen und einen Hardlink (ln aber ohne die Option -s) auf dieselbe Datei im Verzeichnis vor der Umbenennung setzen.


    Dies geschieht idealerweise direkt nach dem ersten Lauf des Backups nach der Umbenennung. Denn wenn danach schon mehrere Läufe erfolgt sind, dann löschst du damit nicht die neue Kopie, sondern löst nur einen Hardlink raus. Erst wenn du das Prozedere (löschen und neuen Hardlink auf Datei vor der Umbenennung) für alle Versionen nach dem Verschieben gemacht hast, hast du wirklich alle Kopien derselben Datei zusammengefasst und Plattenspeicher freigegeben. Sind schon so einige Läufe nach dem Umbenennen erfolgt, empfiehlt es sich, das Prozedere durch ein awk-Skript zu automatisieren (geht als ein etwas länglicher Einzeiler in der Shell).


    Alternativ könntest du mogeln (ohne Gewähr, ich habe es nicht probiert, müsste aber machbar sein): Du löschst das umbenannte Verzeichnis im letzten Backup komplett und ersetzt das Verzeichnis durch einen symbolischen Link (ln -s) auf das entsprechende Verzeichnis im letzten Backup vor der Umbenennung. Dann lässt du einmal das Backup laufen, womit Hardlinks am Ort nach der Umbenennung auf Dateien vor der Umbennung angelegt werden. Wenn das funktioniert hast, löschst du alle Backups ab dem Zeitpunkt der Umbennung mit Ausnahme dessen, das du gerade eben neu gemacht hast und wo die Links schon stimmen. Das ist vermutlich deutlich weniger Aufwand, aber dir fehlen dann einige Tagesbackups in deiner Historie.


    Und ich bin mir auch nicht sicher, ob das FileSystem des NAS dann rückwirkend erkennt, dass es sich um die gleiche Datei handelt und statt der doppelten Datei dann nur noch einen Link vorhält.....?

    Nein, tut es nicht. Das Dateisystem erkennt nichts von selbst. Du musst die Hardlinks selbst setzen, siehe oben.

    (Mit ZFS sähe das anders aus, das würde durch die eingebaute Deduplizierung die gleichen Daten erkennen, aber nicht auf Datei- sondern auf Blockebene. Mir ist nicht bekannt, dass man ZFS für Backup-Laufwerke nehmen könnte, außer man nimmt ein NAS mit quts hero als Backup-Ziel.)