Duplikate systematisch aussortieren

Fotoduplikate aussortieren – mein Weg durch 160.000 Bilder

Wie viele Hobbyfotografen habe ich über die Zeit Unmengen an Fotos angesammelt – auf Speicherkarten, Festplatten und diversen Clouds. Im Zuge eines Umzugs von den großen amerikanischen Cloudanbietern auf regionale Lösungen, kopierten sich die Inhalte mehrerer Rechner (alleine Windows-Rechner liefen drei bis vier über die Zeit und alles sammelte sich kreuz und quer im One-Drive-Verzeichnis) zusammen.

Letztendlich müssten sich sehr viele Duplikate angesammelt haben. Aufgrund eines stabileren Workflows in der Be- und Verarbeitung von Fotografien, wollte ich ein System aufsetzen, mit dem ich in Zukunft sowohl den Überblick behalte und auf einer sauberen Datengrundlage arbeiten konnte. Die Windows 11-Problematik führte bei mir dazu, dass ein runderneuerter Mac mini die Aufgabe mehrerer Windows-PCs übernahm. Das M1-Modell ist erstaunlich leistungsfähig und konnte meine (teilweise 10 Jahre alten PC-Hardwaren) einfach ersetzen.

Was liegt also näher, als sich eine große Festplatte (10TB als Raid 1) an den Mini anzuschliessen und einfach mal (per File-Sync-App) alles aus den Clouds zentral auf diese Platte zu kopieren? Danach importiert man alles in iPhoto und schaut sich die Sache an. Hinweis: trotz M1 dauert das. Mehrere Tage. Also die Kiste einfach laufen lassen.

Im Ergebnis sah das dann so aus: über 160.000 Fotos in meiner Mediathek.


iPhoto – oder: Der erste große Rundumschlag

Der Vorteil von iPhoto ist die Verarbeitung der Bilder: es ist in der Lage Vorschaubilder zu erzeugen, Gesichter zu erkennen, Orte zuzuordnen, und auch: Duplikate zu finden.

Und das ist der erste wichtige Punkt, den man verstehen muss:

iPhoto arbeitet im Hintergrund.
Es passiert gar nichts, wenn man davor sitzt – öffnet man ein paar Stunden später dann die App erscheinen doppelte Fotos mit dem Hinweis „mögliche Duplikate gefunden“.

Ich habe den Rechner also einfach laufen lassen: über mehrere Tage hinweg. Über das Wochenende (!) hatte iPhoto dann endlich die ersten (40.000) Duplikate gefunden. Ein wichtiger Hinweis, den man leicht übersieht: iPhoto (oder Fotos) macht manche Dinge nur im Hintergrund, und nicht immer, wenn die App aktiv geöffnet ist.

Einfach ein paar Tage Geduld mitbringen, iPhoto zwischendurch „laufen“ lassen, und immer mal wieder kontrollieren.


Der nächste Schritt: Alles exportieren

Nachdem ich in iPhoto alles bereinigt hatte, was das Programm von selbst erkennen konnte, kam die nächste Etappe.
Offensichtlich gab es immer noch Duplikate die das Programm nicht gefunden hat. Und weil die App nicht wirklich kommuniziert, ob und was sie vielleicht gerade tut, bin ich davon ausgegangen, dass da auch nix mehr passiert. Also muss ein weiteres Tool zur Hilfe genommen werden.

Deshalb habe ich alle verbliebenen Fotos exportiert – also aus iPhoto heraus wieder auf eine externe Festplatte.
Das Programm legt die Fotos in Datums-Ordnern an. Sehr hilfreich.


DupeGuru

Jetzt kommt das Tool, das mir den letzten Rest Chaos genommen hat: DupeGuru.
Ein kleines, kostenloses Programm, das es für macOS, Windows und Linux gibt.

DupeGuru analysiert ganze Ordnerstrukturen und erkennt inhaltlich ähnliche oder identische Fotos – auch wenn die Dateinamen unterschiedlich sind.
Man kann einstellen, wie genau es vergleichen soll (Pixelgenau, Metadaten, oder sogar nur visuell ähnliche Inhalte).

Bevor ich mit DupeGuru angefangen habe, den ersten Scan zu machen, schaute ich interessehalber noch mal in iPhoto nach neuen Duplikaten. Und tatsächlich hatte es weitere 8000 Fotos ermittelt. Trotzdem habe ich den kompletten exportierten Ordner in DupeGuru geladen und einen ersten Scan gestartet.
Das dauerte bei meinen rund 120.000 verbliebenen Bildern mehrere Stunden.


Die Ergebnisse

Das Ergebnis war beeindruckend – und ehrlich gesagt auch ein bisschen erschreckend:
Noch einmal über 80.000 potenzielle Duplikate. Ich hatte statistisch jedes Bild doppelt. (Teilweise 10 fach!).

DupeGuru zeigt dabei immer zwei Versionen: die „Originale“ und die „Duplikate“.
Ich bin die Liste sorgfältig durchgegangen, habe Stichproben gemacht und mir ein Gefühl dafür verschafft, wie zuverlässig die Erkennung ist.

Ich habe mich entschieden, lieber konservativ zu löschen – also nur eindeutige Duplikate zu entfernen, nicht ähnliche.
Nach zwei oder drei Durchläufen war meine Sammlung endlich (?) sauber.
Am Ende blieben rund 40.000 Fotos übrig.


Ein paar Tipps, die ich beim nächsten Mal sofort beherzigen würde

Letztendlich hatte DupeGuru von Anfang an alle Duplikate ausgemacht. iPhoto hatte ich verwendet, um es mal auszuprobieren, aber auch, weil ich wollte, dass die Fotos durch das Programm vorher zeitlich strukturiert würden. Wahrscheinlich hätte man sich das sparen können. Ich glaube, DupeGuru findet Duplikate zuverlässiger als iPhoto. Wobei hier Ausnahmen auch die Regel sind. Beides im Tandem zu nutzen ist wohl die beste Idee.