Stadsarchief Amsterdam op de Transkribus User Conference 2024
Op 15 en 16 februari 2024 vond de Transkribus User Conference plaats. Tijdens dit terugkerende congre...
Tegenwoordig lijkt (of mag ik al zeggen 'is'?) wat niet digitaal is, niet bestaand. Echter slechts een fractie van onze archieven is digitaal beschikbaar en/of nader toegankelijk. De meeste van onze 'schatten' worden dus niet gevonden, zijn voor het moderne publiek niet bestaand. Het ene toegankelijk maken, is eigenlijk het andere relatief ontoegankelijker maken. Een tafelgesprek dus over slimme manieren van toegankelijk maken om alles toegankelijk te krijgen. Een verslag daarvan niet als doordacht artikel, maar als aantekening van gedachten.
Uit de doos
Want we moeten meters maken. En misschien benaderen we toegankelijk maken daarbij op dit moment nog altijd te veel op de vertrouwde, oude manier, maar dan met behulp van nieuwe technieken, in plaats van dat we toegankelijkheid echt op een nieuwe manier aanpakken. Out of the box, in to our database. Van gevangenisregisters indiceren naar gevangenen laten indiceren. "Dat soort gedachten", zou Rik Maes een dag later zeggen.
Toegankelijkheid, riep de eerste, zou al meteen vanaf de creatie van een document goed moeten worden aangepakt. Vraag is of dit al nadere toegankelijkheid zou betreffen, maar vooruit. Hoe dan ook geeft dit nog geen oplossing voor onze papieren erfenis. En toegankelijkheid, riep een tweede, is méér dan alleen een toegang, het is ook hulp bij het vinden, uitleg bij het begrijpen enzovoort. Klopt, echter het gesprek richtte zich daarna toch specifiek eerst op het vervaardigen van toegangen. Je moet je tijdens zo'n kort gesprek nu eenmaal weten te beperken (en dat geldt misschien ook bij het maken van toegangen).
Laaghangend fruit
Tip om eerst eens te beginnen met wat ik maar even het laaghangend fruit benoem. Zeg alles wat getypt en gedrukt is. Series raadsnotulen, correspondentie en zo verder die je eenvoudig kunt scannen en ocr'en, veel naoorlogs spul dus. Het meest recente materiaal is het meest omvangrijk en het snelst geautomatiseerd te verwerken. Hoe verder terug in de tijd, hoe meer tijd aan hoe minder meters je kwijt bent. Dus waarom bij charters beginnen?
Goed genoeg is ruim voldoende
Er is bovendien al zo ontzettend veel materiaal voorhanden. Denk aan allerlei nadere toegangen, vervaardigd door vroegere collega's en onderzoekers, opgenomen in onze bibliotheekcollecties. Maar denk ook aan de vele nadere toegangen die mensen online hebben gezet (denk aan particuliere websites, sites van heemkundekringen of initiatieven als Van Papier Naar Digitaal). Door het digitaliseren van bestaand papier, en acquireren van bestaand digitaal materiaal, kunnen we snel meters maken. Allemaal geen perfecte toegangen (en foto's!) misschien, en misschien niet zoals wij het zelf zouden hebben gedaan, maar het schiet wel op en is doorgaans goed genoeg voor onze onderzoekers. Verbeteren, aanvullen, verrijken, het kan later alsnog. Zie mijn artikel voor een voorbeeld
Je kunt dan wel te maken krijgen met weerstand vanuit je eigen organisatie. Maar hoeveel controle wil je houden? Hoeveel kwaliteit streef je na? Wanneer is goed ook goed genoeg? En spreken we dan vanuit ervaring, vanuit gevoel of vanuit reflexen? Hoe krijgen we collega's mee?
Ook al vaker genoemd: maak gebruik van eigentijdse indexen. Op het BHIC loopt op dit moment een VeleHanden-project om notarieel archief via de repertoria toegankelijk te maken. Enkele tienduizenden akten zijn zo al binnen een paar maanden toegankelijk gemaakt. Niet perfect als toegang, maar ruim voldoende, denken we, want de vorm van de inschrijvingen van akten in de repertoria sluit aan bij hoe we hebben gezien dat onderzoekers ook zelf akten toegankelijk maken voor eigen en andermans gebruik. Dat zouden meer archivarissen moeten doen!?
Succes stories
Om je collega's mee te krijgen in deze andere manier van denken en werken, hebben we misschien succes stories nodig, best practices. En ook andere archiefdiensten (onder andere Leiden en Amsterdam werden genoemd) hebben al projecten gehad op basis van bijvoorbeeld eigentijdse toegangen of ontsluiten puur op naam, niet op andere gegevens (want waarom maken we eerst niet alles alleen op 'een' naam toegankelijk, hetgeen waarop verreweg de meeste zoekacties zijn gericht?). We zouden die ervaringen moeten delen. Waarom dit gedaan, hoe aangepakt, met welk resultaat en met welke klanttevredenheid?
Aansluitend ook: gedraag je zelf eens vaker als klant. Hoe zoek je dan, wat gebruik je en wat niet, waar heb je wat aan en waaraan niet? Gebruik de log files van je zoeksystemen en kijk naar gebruikers. Stem daar je toegankelijk maken op af, focus op de grootste gemene delers en richt je niet op de 'long tail'. Als iedere toegang voor alles en iedereen goed genoeg moet zijn, dan duurt het zo lang voor die toegangen er zijn, dat er voorlopig toch niemand mee geholpen is.
Alle kaarten op handschriftherkenning
Ook een interessante - maar hoe te rijmen met de eerste tip? - is om al onze kaarten te zetten op handschriftherkenning. Veel budget naar de ontwikkeling van technieken die pas over een tijdje (wanneer?) goed genoeg zullen werken om je schepenprotocollen doorheen te jagen. Is het niet voor totale transcripties, dan misschien in eerste instantie voor het verkrijgen van bepaalde metadata - denk aan het type document, de datum etc. Die data zouden weer kunnen dienen om selecties te maken en/of de 'crowd' verder aan het werk te zetten. Mooie gedachte en mooie mix tussen mens en machine.
Gat in aandacht, gebrek aan kennis
Eigenlijk 'weten' we al heel veel manieren om versneld archieven toegankelijk te krijgen, maar we zetten ze lang niet altijd in. Naast factoren als tijd en geld en zo spelen ook interne weerstand mee en misschien kunnen dan succes stories helpen. Maar we weten ook heel veel manieren niet, we zijn bovendien slecht op de hoogte van elkaars slimme projecten. We zijn ook slecht op de hoogte van de voortgang van bepaalde technieken, zoals handschriftherkenning.
Zit hier in ieder geval niet een gat in onze aandacht en in onze (subsidie)programma's? Er is de laatste tijd veel aandacht voor e-depot, voor behouden en beheren, er is ook veel aandacht voor open data, open toegang en andere vormen van (laten) benutten. Maar voor het toegankelijk maken, voor het verkrijgen van al die data die open moet zijn of beheerd moeten worden, is eigenlijk weinig aandacht. Te weinig misschien wel?! En vragen klanten niet in de eerste plaats om méér dan om open data?
Gelukkig hoeven we niet te kiezen. Alleen slimme keuzes te maken. Slimme ideeën blijven daarbij welkom!
Dank iedereen die deelnam aan mijn beide tafelgesprekken. Het waren twee volle tafels, twee uiteenlopende gesprekken, maar wel twee met veel raakvlakken. En met veel actieve deelnemers. Fijn!