Hallo!
Ein TS 419P II steht seit kurzem als zentraler Speicher im Home Office. Ich beginne nun die Dateien aus diversen Quellen (mehrere Rechner und Notebooks, externe Festplatten, etc.) dort zusammen zu tragen. Dabei wird es sich quasi nicht vermeiden lassen, dass zahlreiche Dateien Doppelt auf das NAS gelangen (z.B. Fotos die auf Rechner A und B gespeichert sind).
Gibt es eine einfache Möglichkeit solche Duplikate zu finden und anzuzeigen? Von der Theorie her müsste ja ein Programm/Script "nur" die CRC jeder Datei erstellen, diese z.B. in einer Datenbank speichern und dann ausspucken welche CRC mehrfach vorkommt. Das die Berechnung der CRC gerade bei großen Dateien länger dauert und es hunderttausende Dateien auch nicht einfacher machen ist klar. Man könnte das ganze aber auch vereinfachen und nur die CRC der ersten, mittleren und letzten 100 Byte (oder so) erstellen. Damit würde man dann vielleicht auch falsch positive Ergebnisse erhalten aber die Suche wäre deutlich einfacher.
Wenn das Durchsuchen aller Dateien 3 Monate dauert wäre mir das auch egal. Hauptsache ich habe später eine möglichst aufgeräumten Datenbestand.
In der Theorie ist also ganz einfach. Aber gibt es hierfür auch fertige Lösungen? Ich bin Experte und wüsste daher nicht wie ich die Theorie ohne fertige Lösung in die Praxis umsetzte könnte.
Besten Dank