Web 2.0 'neglecting good design'
Bij mijn eerste post wat input van een naamgenoot ;-)Hype about Web 2.0 is making web firms neglect th...
De afgelopen maanden ben ik me langzaamaan wat meer gaan oriënteren op het gebied van het e-depot, de heilige graal van archiefminnend Nederland. Binnen de groepen die zich daarmee bezighouden en er over praten is de term metadata tot een nieuwe godheid gepromoveerd. Metadata is de sleutel tot alles, vooral het terugvinden van informatie. Als je deze mensen tenminste moet geloven. Daarbij ontstaat al snel de illusie dat het daarbij gaat om data over informatie waarmee die beter terug te vinden is. Maar dat is niet zo! Metadata bestaat voor het allergrootste deel uit informatie over informatie waar een normaal mens niet blij van wordt en waarvan je je zelfs kunt afvragen of we dat wel nodig hebben.Een analogie zoeken binnen de papieren archiefwereld ligt voor de hand maar is meteen ook gevaarlijk. Het gevaar van de appelen en de peren ligt om de hoek. Goed, dat risico neem ik dan maar voor lief.Bij metadata moet de lezer vooral denken aan informatie over de ambtenaar die het document geschreven dan wel opgesteld dan wel geassembleerd heeft. De afdeling, de datum, de instelling. Tot zover kan er nog relevantie zijn met de inhoud van een document. Zorgerlijker wordt het als je geconfronteerd wordt met data die betrekking heeft op de gebruikte software, de versie daarvan, het lettertype, het operating system en wat dies meer zij.Daar gaat zich de vergelijking opdringen met een charter. Dat is gemaakt van perkament, voor het begrijpen van de informatie niet bepaald waardevolle informatie, maar om het document in een tijd te plaatsen kan het al weer relevanter zijn. Of het perkament is gemaakt van een schaap, een geit, een varken of nog een ander dier... Mogelijk bevat dat informatie over de plaats van vervaardiging. Maar dat wordt al erg troebel.Of er met een rietpen, een kroontjespen dan wel een ganzeveer of andere veer is geschreven... daarvan moeten we ons al af gaan vragen of dat nog werkelijk iets toevoegt. Als we dan ook nog vast zouden leggen wat voor gans het was en of het ene mannetje of een vrouwtje was en of hij de zoon was van een andere ganzenveerverstrekker... Ik denk dat we daarmee helemaal niets meer toevoegen aan de informatiewaarde van het perkamenten document.Maar nu, met de huidige metadatagoeroes, is dat allemaal informatie die bewaard dient te worden, reproduceerbaar moet zijn, want het zegt iets over de authenticiteit of weet ik wat. Veel ballast denk ik dan.Bovendien heerst de overtuiging dat met goede metadata alle informatie straks terug te vinden is door geautomatiseerde systemen. Dat zal voor een bepaalde categorie vragen ook zeker het geval zijn. Simpele vragen over de bouwtekening van een pand, dat kun je door goede metadatering best goed terug vinden. Prima oplossing. Maar wie wel eens achter de balie van een studiezaal heeft gezeten weet dat daar niet alleen maar eenduidige en enkelvoudige vragen gesteld worden. Daar komt het vaak neer op het (eenmalig) combineren van verschillende informatiebronnen.Bovendien bevat archiefinformatie niet zozeer antwoorden maar eerder de potentie van een antwoord of antwoorden. De hoop dat je dat met een goed metadateren kunt blijven bevragen en snappen tot in de volgende eeuw getuigt van pure naïviteit. Het grenst eigenlijk aan incompetentie. Onvermogen om te leren van je eigen verleden als archivaris en blind vertrouwen op een technologie die veel mogelijk heeft gemaakt, maar nog steeds niet alles heeft opgelost. En eigenlijk voortdurend nieuwe vragen creeert.Ik hoor al mensen zuchtend "linked open data" steunen, of semantisch web, of andere goden in opkomst. Ja. Zeker. Die gaan een aantal oplossingen bieden. Maar uiteindelijk, daar ben ik van overtuigd, blijft er een informatiespecialist nodig die vragen en informatie bij elkaar brengt. Niet achter een balie, God verhoede dat, maar ergens in cyberspace. Via de interface van de toekomst. Verbinden. Een woord dat aan kracht verloren heeft door de hype van de afgelopen jaren, maar uiteindelijk wel de kracht van de informatiespecialist van de toekomst prima verwoord.
Reacties
Luud,
Volgens mij is metadata helemaal niet zo nieuw: archiefbeschrijvingen en nadere toegangen zijn toch ook metadata?
Je kunt inderdaad ook technische metadata hebben, die had je in het papieren tijdperk niet echt nodig. Alhoewel, ik kan mij voorstellen dat als er was vastgelegd welke papier- en inktsoort was gebruikt je nu inventarissen zou kunnen selecteren voor digitaliseren op basis van risico van onleesbaar worden...
Maar, ik denk dat de technische metadata juist in het digitale tijdperk nodig zijn. Dat stuk perkament kunnen we straks nog wel lezen, maar dat digitale bestand met al die 1-en en 0-en? Veel succes :-) Juist over deze technische metadata zou ik me trouwens vanuit je archivaris- of gebruikersrol niet zo zorgen maken, dit setje is makkelijk, geautomatiseerd te verkrijgen, die hoef je niet zelf in te voeren.
Welke metadata je vastlegt (en dat is een keuze!) en hoe je deze presenteert zijn trouwens twee verschillende aspecten. Een deel van de data zal geïndexeerd worden voor zoekmachines, een deel zal aan een eindgebruiker getoond worden, een deel zal door software gebruikt worden om de juiste viewer te gebruiken voor de content, een deel zal door de beheerder van het e-depot gebruikt worden om bepaalde data te converteren als we bij PDF/Z aankomen, een deel zal voor linked data gebruikt kunnen worden, enz.
De metadata kan de informatiespecialist en eindgebruiker helpen bij het vinden, tonen en inzicht geven in de context. Maar goed zoeken blijft een vak. Het interpreteren van informatie ook. Weten wat er waar beschikbaar is en wat juist niet, blijft belangrijke kennis. Dus ja, ik denk dat informatiespecialisten ook in de toekomst een belangrijke rol blijven houden.
Metadata is voor de archivaris als het goed is gewoon business-as-usual. Wat het nieuwe aspect is, is het digitale karakter van de archiefbescheiden. Maar in het nadenken over digitale archieven moet je toch ook nadenken over een aspect als metadata?
Tenslotte (het is weekend :-), er zijn door de metadatagoeroes nog wel enkele hordes te nemen voordat metadata als een officiële godsdienst wordt erkend, zie Vliegend Spaghettimonster-geloof.
We schrijven 1802, ofwel het jaar XI van de Republikeinse Kalender:
"Vandaag kwam een heerschap genaamd Van Wijn bij ons langs. Hij meende 's Lands Archivarius der Bataafsche Republiek te zijn en begon meteen te zeuren over het niet beschreven zijn van onze archieven. Daarnaast had hij twijfels bij onze manier van fysiek beheer.
Hij maakte zelfs een inspectierapport waarin hij constateerde dat onze archieven niet geschikt waren voor onderzoek om cultuurhistorische of recht- en bewijszoekende redenen. Wat een onzin! Alsof beschrijvingen de heilige graal zijn voor het terugvinden. Laat staan dat moderne geneuzel over inventarissen!
Als iemand iets wil weten, dan komen ze maar gewoon langs! Wij weten echt wel wat er in onze archieven zit! En ze liggen gewoon hierachter in het hok, dan kunnen we er gemakkelijk bij.
Wat denkt die man wel niet? Dattie God is?"
In mijn column beweer ik niet dat metadata onnuttig is, of dat we die maar moeten vergeten vast te leggen. Mijn betoog is juist dat er ontzettend veel wordt vastgelegd "just in case". Bezien vanuit het standpunt van Big Data aanhangers een logische keuze. Maar ik probeer altijd met beide voeten op de digitale aardschijf (plat toch? ;) ) te blijven staan en vooral te kijken naar hoe we de gebruiker/onderzoeker bij de juiste informatie kunnen krijgen.
Het vastleggen van technische metadata om informatie "in de juiste vorm" te laten zien is mijns inziens zinloos. Het zal de grote groep onderzoekers worst zijn hoe ze de informatie tot zich nemen, als het maar eenvoudig kan. Hele bevolkingsgroepen maken nu dankbaar gebruik van de gescande archieven die online staan. Dat is een andere vorm van de informatie dan het (papieren) origineel, maar bijzonder goed bruikbaar. Dus waarom moet informatie in de toekomst ineens wel op de "originele" wijze getoond kunnen worden? Het gaat (uiteindelijk) om de content en niet om de vorm.
Door de fixatie op metadata ontstaat er meteen een sfeer waarbij het terugvinden van informatie door toepassing van technieken die we nu nog niet kennen zaligmakend wordt. Alles vastleggen dan kan informatie straks makkelijker worden teruggevonden.
Zoals ik betoog is dat voor een aantal zoekvragen zeker mogelijk. Maar nu alle aandacht, energie en geld steken in het ontzettend uitgebreid metadateren van de beschikbare informatie houdt het gevaar in zich dat er straks minder relevante informatie te vinden is. Het blijft/wordt zo een systeem voor archivarissen en andere informatiespecialisten. Niet per se een informatiesysteem waar de gebruiker/onderzoeker blijer van gaat worden.
Dat ik deze column schrijf betekent juist dat ik nadenk over metadata Bob!
Ik denk dat ook hele volksstammen die informatie graag 'in de juiste vorm' willen zien en niet met verschoven tabelcellen of verkeerde legendakleuren omdat de juiste interpretatie niet voorhanden was vanwege het gebrek aan technische metadata. (Dit zijn overigens geen academische kwesties, maar komen vrij veel voor.)
Daarnaast vind ik het vreemd dat je allerlei metadata bewaart omdat je het tijdens het werkproces nodig hebt voor de juiste weergave of interpretatie en dat je het daarna verwijdert, omdat het later niet meer zinvol zou zijn. Veel energie gestoken in allerlei registratie omdat dan daarna weg te gooien.
Minder relevante informatie door bewaren is een drogreden. Als je weggooit is er minder relevante informatie. Als je bewaart is al die informatie er wel. Het vereist alleen een andere manier van zoeken en vinden. Information overload = filter failure. Beter daar energie in steken dan in vernietigen.