Het plaatje als bijproduct

  • dec 2023
  • Tessel Dekker
  • ·
  • Aangepast 27 jun
  • 31
Tessel Dekker
KIA Community
  • Verwijderde gebruiker

Samenvatting

Het Stadsarchief digitaliseert sinds begin van deze eeuw zijn archieven en collecties. Via scanning on demand en projectdigitalisering zijn inmiddels meer dan 50 miljoen scans geproduceerd.

Op dit moment staan we aan de vooravond van een volgende revolutie: de techniek om handschriften doorzoekbaar te maken is dusdanig ver gevorderd dat het doorzoekbaar maken van informatie in alle scans een realistisch scenario geworden is. Betekent dit ook dat we met een nieuwe blik naar scans, de plaatjes, kunnen kijken?

Een kleine geschiedenis van het digitaliseren van archieven

Het Stadsarchief is net als veel andere erfgoedinstellingen rond 2000 gestart met digitaliseren van de collectie. Digitaliseren betekent hier: een digitale foto maken van een analoog origineel. In de eerste jaren stond het fotografische aspect dan ook voorop. Het maken van een digitale reproductie moest eenmalig en van hoge kwaliteit zijn. Hierdoor was scanning duur en bleef het beperkt tot de topstukken in de collectie.

In de beginjaren veranderde de digitale wereld in razendsnel tempo. Het internet werd rijker, content werd digitaal en al snel ontstond de gedachte: ‘als het niet digitaal is dan bestaat het niet’. Dit heeft met name bij archiefinstellingen tot een kentering in het denken over het doel van digitalisering geleid. De kwaliteit van de reproductie werd afgestemd op het doel van het gebruik: lezen van de informatie. Hierdoor stond niet langer het fotografisch eindproduct, maar het werkproces centraal.

Nieuwe wegen, nieuwe doelen

Met een collectie van meer dan 50 miljoen scans heeft het Stadsarchief inmiddels ongeveer 20% van de collectie gedigitaliseerd. Door digitalisering is vooral de afstand tussen gebruiker en document verkleind. De gebruiker kan de informatie thuis vanuit de luie stoel raadplegen en hoeft niet meer naar de instelling te reizen. Ook heeft digitale beschikbaarheid het nader toegankelijk maken van bronnen makkelijker gemaakt doordat het indexeren van archieven door vrijwilligers ook vanuit huis gedaan kan worden. Dat is enorme winst, en heeft het doen van onderzoek fundamenteel veranderd. Maar we hebben nog altijd handmatig toegekende metadata (beschrijvingen) nodig om de informatie te vinden en vervolgens te kunnen begrijpen.

Met de ontwikkeling van Handwritten Text Recognition (HTR) wordt het mogelijk handschriften op woorden doorzoekbaar te maken. Waar de eerste jaren de modellen alleen toepasbaar waren op een enkel handschrift of een specifieke periode, kunnen nu modellen gecombineerd worden en kan één model een breed scala aan teksten ‘lezen’. Bij inzet van HTR-technologie is het niet meer de vraag óf, maar wannéér een bron doorzoekbaar wordt gemaakt. Het Stadarchief is daarom gestart met het opstellen van een HTR-masterplan om op grote schaal scans doorzoekbaar te gaan maken.

Het plaatje als bijproduct

Het gegeven dat de gedigitaliseerde documenten doorzoekbaar gemaakt kunnen worden stelt het doel van scannen opnieuw in een nieuw licht. Het doel wordt nu om de informatie doorzoekbaar te maken, waarbij de scans als referentie gebruikt kunnen worden. In hoeverre die referentie het origineel representeert is dan veel minder belangrijk. Dit gegeven maakt andere keuzes bij scanning mogelijk. Het is interessant om opnieuw te kijken naar de eisen die je stelt aan je scans en hoe je opnieuw schaalvergroting kunt toepassen. Hiervoor moeten werkprocessen, techniek en kosten onder de loep genomen worden. De scan wordt meer een bijproduct van digitalisering, want het hoofddoel is het produceren van digitale, doorzoekbare informatie.

Uitnodiging: innovatieve blik

Het scanproces bestaat uit een aantal stappen en handelingen die in meer of mindere mate vertragend werken in het proces. Hoe meer van deze elementen geëlimineerd of in tijd geoptimaliseerd kunnen worden, hoe sneller er gewerkt kan worden en hoe meer kosten bespaard kunnen worden. Het gegeven dat niet het plaatje zelf het doel is, maar de scan bruikbaar moet zijn voor handschriftherkenning, maakt het mogelijk anders te kijken naar kwaliteit. Een aspect waar bijvoorbeeld kritisch naar gekeken kan worden is het werken met een glasplaat om de documenten zo vlak mogelijk te krijgen. Het valt ook te onderzoeken of bijvoorbeeld inzet van AI niet kan helpen om beeldcorrectie achteraf te verzorgen.

Het Stadsarchief hoopt samen met leveranciers en collega-instellingen deze nieuwe kijk op scanning de komende jaren te omarmen. We hopen samen te onderzoeken hoe we, door het proces slim in te richten en gebruik te maken van moderne technologie, het scannen en doorzoekbaar maken van archieven naar een nieuw niveau kan worden getild.

Trefwoorden