Hallo allemaal,
Mijn naam is Joël Sander en ik werk bij het Noord-Hollands Archief in Haarlem.
Om problemen met exacte duplicaten en verschillende versies van dezelfde afbeelding (denk aan andere bestandsformaten of resoluties) in onze beeldcollecties aan te pakken, heb ik een foto-analysetool in Python ontwikkeld. Deze tool is nu voor iedereen beschikbaar op GitHub. Het maakt gebruik van een combinatie van file hashing, image hashing en metadata-analyse om deze duplicaten en verschillende versies te vinden. De tool rangschikt de versies op basis van resolutie en het aantal unieke kleuren. Ook kun je de duplicaten en versies koppelen aan de record ID informatie zoals die in MaisFlexis staan.
Als je hierin geïnteresseerd bent, kun je de tool vinden via de GitHub link onder dit bericht!
Groeten,
Joël Sander
GitHub - noord-hollandsarchief/image-compare
https://github.com/noord-hollandsarchief/image-...Contribute to noord-hollandsarchief/image-compare development by creating an account on GitHub.