Doppelte Fotos/Dateien finden

  • Hallo!


    Ein TS 419P II steht seit kurzem als zentraler Speicher im Home Office. Ich beginne nun die Dateien aus diversen Quellen (mehrere Rechner und Notebooks, externe Festplatten, etc.) dort zusammen zu tragen. Dabei wird es sich quasi nicht vermeiden lassen, dass zahlreiche Dateien Doppelt auf das NAS gelangen (z.B. Fotos die auf Rechner A und B gespeichert sind).


    Gibt es eine einfache Möglichkeit solche Duplikate zu finden und anzuzeigen? Von der Theorie her müsste ja ein Programm/Script "nur" die CRC jeder Datei erstellen, diese z.B. in einer Datenbank speichern und dann ausspucken welche CRC mehrfach vorkommt. Das die Berechnung der CRC gerade bei großen Dateien länger dauert und es hunderttausende Dateien auch nicht einfacher machen ist klar. Man könnte das ganze aber auch vereinfachen und nur die CRC der ersten, mittleren und letzten 100 Byte (oder so) erstellen. Damit würde man dann vielleicht auch falsch positive Ergebnisse erhalten aber die Suche wäre deutlich einfacher.


    Wenn das Durchsuchen aller Dateien 3 Monate dauert wäre mir das auch egal. Hauptsache ich habe später eine möglichst aufgeräumten Datenbestand.


    In der Theorie ist also ganz einfach. Aber gibt es hierfür auch fertige Lösungen? Ich bin Experte und wüsste daher nicht wie ich die Theorie ohne fertige Lösung in die Praxis umsetzte könnte.


    Besten Dank

  • Wenn die Daten alle auf der NAS sind, würde ich die Fotos enthaltenden Freigaben auf der NAS als verbundene Netzlaufwerke in Windows verknüpfen.


    Dann gibt es Tausende von Windows-Tools, die Dateiduplikate finden und aufräumen können, die würde ich dann auf den Bestand in der NAS loslassen.
    --> http://www.google.de/search?q=windows+dateiduplikate+finden


    Wichtig: Vor der Aufräumaktion sollte ein vollständiges Datenbackup der NAS vorhanden sein. Fotos sind unersetzlich.



    GLG GBD

  • Richtig, die Möglichkeit hatte ich mir natürlich auch schon überlegt. Über das Netzwerk zu arbeiten machte die Sache aber auch nicht effizienter. Wenn das die einfachste Lösung ist, werde ich so vorgehen. Eine Tool das direkt auf dem NAS arbeit wäre mir aber lieber.

  • Mit der Effizienz mach ich das so:
    Ich recherchiere nicht 1 Woche im Internet, um hinterher beim Prozess von 3 Stunden eine einzusparen. 8-)


    Das ganze ist doch eine Einmalaktion, die kann zur Analyse doch mal über Nacht ablaufen, wenn einmal aufgeräumt ist, ist doch gut.


    Wenn Du dreimal die Woche aufräumen musst, wird Prozesseffizienz natürlich relevant.


    Ich habe eine sechsstellige Anzahl an Digitalfotos und keins ist ungewollt doppelt, ganz ohne NAS-Tool.


    GLG GBD