Fotoarchieven moeten meer experimenteren met nieuwe ontsluitingstechnieken

  • dec 2011
  • Verwijderde gebruiker
  • ·
  • Aangepast 27 jun
  • 46
  • 95
Verwijderde gebruiker
KIA Community
  • Christian van der Ven
  • Yvonne Welings

Beste allemaal,

Ik heb me nog maar net aangemeld alhier maar ben erg benieuwd wat er hier besproken wordt.

Zelf ben ik erg benieuwd naar de reacties op een artikel dat ik onlangs geschreven heb voor het tijdschrift Fotografisch Geheugen. Hierin probeer ik uit te leggen hoe onderzoekers op zoek gaan naar foto's in een digitale collectie en betoog dat fotoarchieven actiever zouden moeten nadenken hoe de collectie op andere manieren doorzocht zou kunnen worden, bijvoorbeeld m.b.v. beeldherkenningstechnieken.

Dergelijke methoden klinken wellicht nog als toekomstmuziek maar bij allerlei projecten wordt er al actief mee geëxperimenteerd en in mijn optiek zouden juist fotoarchieven actiever moeten aanhaken bij dergelijke projecten om in de toekomst optimaal te kunnen profiteren van dergelijke projecten.

Het hele artikel kun je downloaden via http://repub.eur.nl/res/pub/30669/

Ik ben erg benieuwd naar jullie reacties op mijn betoog!

Reacties

46 reacties, meest recent: 4 oktober 2012
  • @Martijn, heb je al eens naar de nieuwe nog niet vastgestelde norm NEN2084 gekeken ?

    Yvonne Welings
  • Dag Yvonne,

    Dank voor je reactie. Ik ken die norm nog niet en zal er eens induiken.

    Bedankt!

    Yvonne Welings zei:

    @Martijn, heb je al eens naar de nieuwe nog niet vastgestelde norm NEN2084 gekeken ?

    Verwijderde gebruiker
  • Martijn, ik ben het artikel nu aan het printen - dank voor het delen - maar moet bij 'andere manieren' om een fotocollectie te doorzoeken meteen denken aan de opkomende trend van datavisualisatie. In het ab-c media weblab werd eens een mooi voorbeeld daarvan besproken. Niet echt van een fotoarchief, maar wel van plaatjes.

    Christian van der Ven
  • Martijn, een leuk artikel! Naast het zoeken van plaatjes met plaatjes, vind ik zelf vooral de ontwikkeling interessant hoe we gebruikers kunnen laten helpen bij het beschrijven van onze beeldcollecties. Ik denk aan diverse tagging projecten voor foto's, maar ook aan woordentikkertje voor video's. Vooral het aspect om collecties doorzoekbaar te krijgen door het gebruik van 'natuurlijk taalgebruik' en zoekwoorden waarmee een gebruiker zou zoeken, vind ik waardevol.

    Verder deed het artikel me denken aan collecties kaartmateriaal. Ook kaarten zijn doorgaans slechts via trefwoord doorzoekbaar, maar het is veel logischer om ze te laten doorzoeken op een geografische manier. Ik schreef ooit een blogpost over hoe ze dit in de New York Public Library aanpakken, maar ook bij ons Nationaal Archief is een pilot aan de gang.

    Christian van der Ven
  • Beste Joost,

    Hartelijk bedankt voor je reactie. Toen ik onlangs inderdaad las over Het project 'Gezichten van het Rijksmuseum' bekroop me het gevoel dat ik op mijn wenken bediend werd! Wat een prachtig project dat echt de potentie laat zien van beeldherkenning, hoewel het wel echt een eerste stap is. Dank voor het meedenken,

    Martijn

    Joost Geraets zei:

    Ik denk in dit kader ook aan de 'Gezichten...' artikelen van Ingmar, zie

    - Gezichten van het Rijksmuseum en - Gezichten in archieven.

    Die eerste blogpost verwijst naar dezelfde ab-c media viewer waar Chris naar verwijst. Zie voor meer toepassingen / apps de website Open Cultuur Data.

    Verwijderde gebruiker
  • Beste Christian,

    Hartelijk bedankt voor je bericht en compliment over het artikel.

    En je hebt gelijk hoor, het is zeker ook interessant om te zien hoe gebruikers ingezet worden om beeldcollecties te beschrijven. Bij het NA werken ze overigens al jaren met vrijwilligers die het op meer geinstitutionaliseerde manier doen. Doen meer archieven dat eigenlijk? Nogmaals dank!

    Martijn Christian van der Ven zei:

    Martijn, een leuk artikel! Naast het zoeken van plaatjes met plaatjes, vind ik zelf vooral de ontwikkeling interessant hoe we gebruikers kunnen laten helpen bij het beschrijven van onze beeldcollecties. Ik denk aan diverse tagging projecten voor foto's, maar ook aan woordentikkertje voor video's. Vooral het aspect om collecties doorzoekbaar te krijgen door het gebruik van 'natuurlijk taalgebruik' en zoekwoorden waarmee een gebruiker zou zoeken, vind ik waardevol.

    Verder deed het artikel me denken aan collecties kaartmateriaal. Ook kaarten zijn doorgaans slechts via trefwoord doorzoekbaar, maar het is veel logischer om ze te laten doorzoeken op een geografische manier. Ik schreef ooit een blogpost over hoe ze dit in de New York Public Library aanpakken, maar ook bij ons Nationaal Archief is een pilot aan de gang.

    Verwijderde gebruiker
  • @Martijn: Zoals het NA dat doet, werken eigenlijk alle archiefdiensten al jarenlang met vrijwilligersgroepen. En steeds meer wordt er ook op afstand gewerkt, ook via 'crowdsourcing'.

    Het interessantste vond ik overigens niet zozeer het feit dat gebruikers ingezet worden, maar dat de collecties langs de weg van 'natuurlijke taal' toegankelijk worden. Naast zoeken van plaatjes via plaatjes, lijkt me dat namelijk óók een waardevolle, nieuwe manier van toegankelijkheid. Dit in tegenstelling tot 'vroeger', toen dergelijke collecties enkel via formele beschrijvingen toegankelijk waren. Maar goed, dit ligt buiten de scope van je artikel.

    Christian van der Ven
  • @Christian Je hebt helemaal gelijk en is een minstens zo interessante invalshoek! Ik heb daar inderdaad nog niet eerder over nagedacht maar zal er eens induiken, bedankt! Christian van der Ven zei:

    @Martijn: Zoals het NA dat doet, werken eigenlijk alle archiefdiensten al jarenlang met vrijwilligersgroepen. En steeds meer wordt er ook op afstand gewerkt, ook via 'crowdsourcing'.

    Het interessantste vond ik overigens niet zozeer het feit dat gebruikers ingezet worden, maar dat de collecties langs de weg van 'natuurlijke taal' toegankelijk worden. Naast zoeken van plaatjes via plaatjes, lijkt me dat namelijk óók een waardevolle, nieuwe manier van toegankelijkheid. Dit in tegenstelling tot 'vroeger', toen dergelijke collecties enkel via formele beschrijvingen toegankelijk waren. Maar goed, dit ligt buiten de scope van je artikel.

    Verwijderde gebruiker
  • @Martijn @Christian & @Ingmar

    Heel hartelijke dank voor jullie informatie!!

    Later dit jaar wil ik een nu nog fysieke collectie (politiek historisch) digitaal gaan ontsluiten. De inzet van gebruikers waarbij de collectie langs de weg van 'natuurlijke taal' toegankelijk kan worden spreekt mij aan. Op dit moment heb ik nog geen idee hoe dat op te pakken. Jullie woorden zijn zeker inspirerend. Groeten, Sylvia Bakker 

    Verwijderde gebruiker
  • Bij de Politie gebruikt men voor het digitaal rechercheren van beeldmateriaal van kinder-pr0n (geometrische) hashing technieken (zie ook: http://en.wikipedia.org/wiki/Hash_function). Ofwel je rekent voor bekend beeldmateriaal een cijferreeks uit die (bijna) uniek is, stopt dat in een database en gebruikt die database om razendsnel bestanden van verdachte oorsprong (die ook zijn ge-hasht) te vergelijken met de database. Simpel en redelijk effectief. Redelijk want zodra een verdachte beeldmateriaal op de juiste manier digitaal gaat bewerken correspondeert de hash niet meer. Desondanks werkt deze techniek een stuk beter als het bepalen van de statistische overeenkomst tussen twee sets van metadata van identieke beelden. Laat staan dat voor metadata vergelijking meer menskracht nodig is in de interpretatiefase.

    Verwijderde gebruiker
  • Statistisch bekeken is "tagging" van descriptoren voor beeldmateriaal door vrijwilligers weliswaar goedkoop maar zeker geen ideale manier van toegankelijk maken. Kijk hiervoor ook eens naar bijgaand artikel van Eric Sieverts http://www.library.uu.nl/medew/it/eric/folksonomies.pdf Vooral voor onderlinge vergelijking van beeldmateriaal van verschillende archiefinstellingen is het praktisch ongeschikt.

    In essentie is het eerder door mij aangehaalde geometrisch hashen de kern technologie achter de beeldherkenningstechnieken van Google en consorten.

    Verwijderde gebruiker
  • @Sylvia Leuk te horen, veel succes! Sylvia Bakker - Kempen zei:

    @Martijn @Christian & @Ingmar

    Heel hartelijke dank voor jullie informatie!!

    Later dit jaar wil ik een nu nog fysieke collectie (politiek historisch) digitaal gaan ontsluiten. De inzet van gebruikers waarbij de collectie langs de weg van 'natuurlijke taal' toegankelijk kan worden spreekt mij aan. Op dit moment heb ik nog geen idee hoe dat op te pakken. Jullie woorden zijn zeker inspirerend. Groeten, Sylvia Bakker 

    Verwijderde gebruiker
  • @Erik Dank voor je interessante reactie Erik! Ik ben redelijk op de hoogte van de werkwijze van dergelijke technieken maar je legt het me nu nog beter uit, fijn! Het artikel van Eric Sievert is zeker ook interessant. Ik begrijp dat dit verschijnt in het 'Handboek Informatiewetenschap voor bibliotheek en archief' maar kan nog niet achterhalen of dit inmiddels verschenen is. Weet iemand dat alhier wellicht? Erik de Jong zei:

    Statistisch bekeken is "tagging" van descriptoren voor beeldmateriaal door vrijwilligers weliswaar goedkoop maar zeker geen ideale manier van toegankelijk maken. Kijk hiervoor ook eens naar bijgaand artikel van Eric Sieverts http://www.library.uu.nl/medew/it/eric/folksonomies.pdf Vooral voor onderlinge vergelijking van beeldmateriaal van verschillende archiefinstellingen is het praktisch ongeschikt.

    In essentie is het eerder door mij aangehaalde geometrisch hashen de kern technologie achter de beeldherkenningstechnieken van Google en consorten.

    Verwijderde gebruiker
  • Wellicht heeft één van jullie aanvullingen op de reactie die ik heb gegeven in de LinkedIn groep Ambtenaar 2.0 op de vraag : "Ik wil een interne beeldbank opzetten. Als ons mooie fotomateriaal staat nu versnipperd en is moeilijk te vinden. Dat moet beter kunnen ! Wie heeft daar ervaring mee ? Welke applicatie is geschikt om te delen ? Hoe deel je fotomateriaal in ? Hoe zorg je ervoor dat alles vindbaar is ? Graag jullie input !" ?

    Verwijderde gebruiker
  • @Joost: Een aantal jaren geleden is de wegwijzer Opzetten van beeldbanken uitgegeven; daar zullen vast goede tips in staan.

    De oplossing is volgens mij wel afhankelijk van een paar zaken. Hoe groot is bijvoorbeeld die collectie? Wat is het doel ervan? Welke eisen worden dientengevolge gesteld aan de toegankelijkheid? Hoe vaak wordt de collectie geraadpleegd (of zou die moeten worden geraadpleegd)? En hoe snel zou je vervolgens een foto moeten kunnen vinden? Dat soort dingen.

    Voorbeeldje: het BHIC heeft een fotodatabase voor het publiek, maar heeft natuurlijk ook een 'interne' collectie: reportages van afdelingsetentjes, open dagen enzovoort. Enkele duizenden foto's. Die staan gewoon op een gedeelde harde schijf in mapjes per evenement. En dat werkt prima. Maar goed, onze eisen zijn voor die interne 'beeldbank' ook erg laag. Voor de fotodatabase voor het publiek zijn de eisen veel hoger, dus is de oplossing een stuk geavanceerder.

    Christian van der Ven
  • Bedankt voor het delen van jouw / jullie overwegingen en de link naar die wegwijzer Christian. Top !

    Verwijderde gebruiker
  • Bij één van mijn werkgevers: historische vereniging Oud Hoorn hebben we zelf een beeldbank inclusief software ontwikkeld. De software bestaat uit twee delen (separate processen), ten eerste het beheer-deel inclusief database ten tweede een webinterface  voor de presentatie naar buiten toe. Als programmeer omgeving is Visual Basic gebruikt (de versie voor .NET) met als database Microsoft Access, de webinterface is in PHP geschreven. Het geheel draait stabiel sinds 2004 op één server (motief: kosten besparen) met een back-up server voor redundantie. In de database zijn momenteel circa 17.000 foto's gearchiveerd en met metadata verrijkt. We willen daaraan nog film en geluidsmateraal toevoegen als we daarvoor ooit capaciteit hebben. De webinterface communiceert niet direct met de database maar in een zogenaamde zandbak zodat het beheerdeel, wat geen connectie heeft met internet, ten allen tijde stabiel kan doordraaien, ook bij aanvallen van buiten af op de webinterface. Notabene, onze website is 1x ge-defaced de servers zijn nog nooit gehackt. Joost Geraets zei:

    Wellicht heeft één van jullie aanvullingen op de reactie die ik heb gegeven in de LinkedIn groep Ambtenaar 2.0 op de vraag : "Ik wil een interne beeldbank opzetten. Als ons mooie fotomateriaal staat nu versnipperd en is moeilijk te vinden. Dat moet beter kunnen ! Wie heeft daar ervaring mee ? Welke applicatie is geschikt om te delen ? Hoe deel je fotomateriaal in ? Hoe zorg je ervoor dat alles vindbaar is ? Graag jullie input !" ?

    Verwijderde gebruiker
  • @Martijn @Erik dank jullie wel! Heb de site van historische vereniging Oud Hoorn met belangstelling bekeken. Goed toegankelijk. Voorbeeld van weinig middelen, efficiënt resultaat!?

     

    Verwijderde gebruiker
  • Middelen zijn in oorspronkelijke zin: Land, Labour and Capital ofwel in het Nederlands: grondstoffen, arbeid en kapitaal later is hieraan nog 'informatie' toegevoegd. Een toevoeging die op de IDM-opleidingen uit en te na wordt geeerd.

    Vereniging Oud Hoorn heeft met uitzondering van de factor arbeid van alles meer dan genoeg beschikbaar. In essentie zijn er ook genoeg arbeiders (= vrijwilligers). Echter tekort gewalificeerde arbeiders voor de aan Informatie Technologie verwante werkzaamheden. Namelijk drie èènpitters op tweeduizend leden. Een Visual Basic ontwikkelaar en systeembeheerder (vuttende ict-professional), een (homemade) PHP-programmeur die de extern gehoste website bestiert en een overbodige bibliothecaris/ archivaris (WAO) die daarnaast serverbeheer (Jana en WHS 2011) en informatiebeveiliging doet en in Perl-script.

    En het resultaat, ach dat kan altijd beter. Doch is voor maximaal twee maal drie uur per week per persoon niet verkeerd.

    Verwijderde gebruiker
  • Wij (Pictura) zijn momenteel bezig met het opzetten van een pilot voor een van onze klanten die precies doet wat Martijn Kleppe beschrijft: het automatisch taggen van fotomateriaal. De techniek analyseert beelden zeer snel (erg belangrijk bij de hoeveelheden waar we het over hebben) en voorziet elk beeld van 1 of meer tags, tezamen met de waarschijnlijkheid dat deze tag op het beeld van toepassing is. Door deze tags en de waarschijnlijkheidsfactor te voeren aan onze zoektechnologie, ontstaat een nieuwe dimensie op onze beproefde beeldbanken.

    Naast het verbeteren en verrijken van zoekresultaten van reeds redelijk tot goed beschreven fotocollecties, biedt deze techniek ook uitkomst voor niet of zeer slecht ontsloten collecties.

    De pilot zal beelden gaan taggen op een aantal "concepten" (momenteel ruim 40), vallend onder de volgende hoofdcategorieën:

    • Dieren/Planten (w.o. algemene begrippen als vegetatie, maar ook heel concrete als schapen)

    • Stadsleven (bv. gebouwen, fietsen, maar ook water of sneeuw)

    • Door mensen gemaakte objecten (bv. zwembaden, vliegtuigen en snelwegen)

    • Mensen (w.o. menigten, sociale onrust, sport & spel)

    • Stijl (bv. nacht, interieur, geen zichtbare personen)

    Mocht de pilot succesvol zijn, dan zal ik hier de resultaten ervan delen.

    Verwijderde gebruiker
  • @mark Ben erg benieuwd!  Mark Lindeman zei:

    Wij (Pictura) zijn momenteel bezig met het opzetten van een pilot voor een van onze klanten die precies doet wat Martijn Kleppe beschrijft: het automatisch taggen van fotomateriaal. De techniek analyseert beelden zeer snel (erg belangrijk bij de hoeveelheden waar we het over hebben) en voorziet elk beeld van 1 of meer tags, tezamen met de waarschijnlijkheid dat deze tag op het beeld van toepassing is. Door deze tags en de waarschijnlijkheidsfactor te voeren aan onze zoektechnologie, ontstaat een nieuwe dimensie op onze beproefde beeldbanken.

    Naast het verbeteren en verrijken van zoekresultaten van reeds redelijk tot goed beschreven fotocollecties, biedt deze techniek ook uitkomst voor niet of zeer slecht ontsloten collecties.

    De pilot zal beelden gaan taggen op een aantal "concepten" (momenteel ruim 40), vallend onder de volgende hoofdcategorieën:

    • Dieren/Planten (w.o. algemene begrippen als vegetatie, maar ook heel concrete als schapen)

    • Stadsleven (bv. gebouwen, fietsen, maar ook water of sneeuw)

    • Door mensen gemaakte objecten (bv. zwembaden, vliegtuigen en snelwegen)

    • Mensen (w.o. menigten, sociale onrust, sport & spel)

    • Stijl (bv. nacht, interieur, geen zichtbare personen)

    Mocht de pilot succesvol zijn, dan zal ik hier de resultaten ervan delen.

    Verwijderde gebruiker
  • Dank je Joost! Ik had de aankondiging inderdaad ook gezien. Gaat weliswaar over ander materiaal (audio) maar is zeker dezelfde problematiek!

    Verwijderde gebruiker
  • Vanuit de abstractie, 'dezelfde' of toch in ieder geval vergelijkbare problematiek en met het idee dat archieven mogelijk ook audio materiaal hebben, al dan niet het geluidsspoor en de -sporen van video- en filmmateriaal dacht ik dat deze attendering wel zou passen Martijn. Vandaag schrijft de Automatiseringgids er over : Promovendus laat computer beter luisteren.

    Verwijderde gebruiker
  • Dag Joost, dank voor je berichtjes! Geweldig dat je me zo op de hoogte houdt.

    Groet,

    Martijn

    Verwijderde gebruiker
  • Het NIOD en het Meertens Instituut, beide onderdelen van de Koninklijke Nederlandse Akademie van Wetenschappen (KNAW), gaan ook binnenkort starten met een project om politieke karikaturen te ontsluiten. Hierbij gaat het niet om foto's, maar om beladen historische cartoons (getekend in zwart/wit). Er is nog geen data om detectoren te bouwen, en het gaat hier om hele speciale visueel bronnenmateriaal, dus we gaan crowdsourcen voor transcripties en annotaties. Het idee is dan om niet bijvoorbeeld plaatjes te vinden van voetbal wedstrijden (= groen), maar meer semantischer ontsluiting voor historici (Voorbeeld: "Gaat het om zelfbeeld of vijandbeeld?" of "Welke symbolen en stereotypen worden benut?"). Het project wordt o.a. door mij uitgevoerd, dus ik zal jullie op de hoogte houden, binnenkort komen we met een website en persberichtje, en wellicht gaan we jullie hulp vragen. :) 

    Verwijderde gebruiker
  • Beste Junte,

    Hartelijk bedankt voor je bericht. Wat een spannend project! Ik zou graag op de hoogte blijven. Kun je mij er tzt een berichtje over sturen? Alvast bedankt & veel succes!

    Martijn

    Verwijderde gebruiker
  • Dank Junte, mooi project! Ik weet nog wel een aantal historische cartoons!

    Sylvia

    Verwijderde gebruiker
  • @Junte: Klinkt als een boeiend project! En historische cartoons zijn er voldoende. :-)

    Leuk idee om Archief 2.0 daarbij te betrekken en fijn dat je ons op de hoogte wilt houden. Als je wilt, plaats ik daarover t.z.t. ook een bericht op mijn weblog.

    Christian van der Ven
  • Leuk stuk over zelfde onderwerp op Kennisland:

    Multimediazoekers voor professionals

    De overvloed aan video- en fotobestanden op harde schijven, servers en het internet is niet meer te doorgronden. Daarom is er vraag naar snelle en gerichte mediazoekmachines. Bij de Universiteit van Amsterdam zijn er twee gebouwd, ‘MeRDES’ en de ‘MediaMill Semantic Video Search Engine’, beiden met een eigen aanpak.

    http://www.kennislink.nl/publicaties/multimediazoekers-voor-professionals

    Verwijderde gebruiker
  • Mooi om te zien Martijn, dank voor je bijdrage hier.

      Martijn Kleppe zei:

    Leuk stuk over zelfde onderwerp op Kennisland:

    Multimediazoekers voor professionals

    De overvloed aan video- en fotobestanden op harde schijven, servers en het internet is niet meer te doorgronden. Daarom is er vraag naar snelle en gerichte mediazoekmachines. Bij de Universiteit van Amsterdam zijn er twee gebouwd, ‘MeRDES’ en de ‘MediaMill Semantic Video Search Engine’, beiden met een eigen aanpak.

    http://www.kennislink.nl/publicaties/multimediazoekers-voor-profess...

    Verwijderde gebruiker

Trefwoorden