Foto-analysetool exacte duplicaten / verschillende versies van dezelfde foto

  • mrt 2025
  • Joël Sander
  • 817
  • 2
Profielfoto van Joël Sander
Preservation Digitaal Erfgoed
  • Profielfoto van André Clement
  • Profielfoto van Marieke Klomp
  • Profielfoto van Jan Kruidhof
  • Profielfoto van Eva van den Hurk - van 't Klooster
  • Profielfoto van Nadia Favié-Slaar
  • Profielfoto van Eike den Hertog
  • Profielfoto van Ingmar Vroomen
  • Profielfoto van Francien
  • Profielfoto van Ad van Heijst

Hallo allemaal,

Mijn naam is Joël Sander en ik werk bij het Noord-Hollands Archief in Haarlem.

Om problemen met exacte duplicaten en verschillende versies van dezelfde afbeelding (denk aan andere bestandsformaten of resoluties) in onze beeldcollecties aan te pakken, heb ik een foto-analysetool in Python ontwikkeld. Deze tool is nu voor iedereen beschikbaar op GitHub. Het maakt gebruik van een combinatie van file hashing, image hashing en metadata-analyse om deze duplicaten en verschillende versies te vinden. De tool rangschikt de versies op basis van resolutie en het aantal unieke kleuren. Ook kun je de duplicaten en versies koppelen aan de record ID informatie zoals die in MaisFlexis staan.

Als je hierin geïnteresseerd bent, kun je de tool vinden via de GitHub link onder dit bericht!

Groeten,

Joël Sander

GitHub - noord-hollandsarchief/image-compare

https://github.com/noord-hollandsarchief/image-...

Contribute to noord-hollandsarchief/image-compare development by creating an account on GitHub.