Verslag Transkribusbijeenkomst Stadsarchief Amsterdam
In december 2019 rondde het Stadsarchief Amsterdam het crowd sourcing project “Crowd leert computer ...
4 februari was het zover. Met meer dan een half jaar vertraging hadden we eindelijk een bijeenkomst met de Regionaal Historische Centra over het project De ijsberg zichtbaar maken.
In dat project zetten we handgeschreven teksten om naar informatie die de computer kan lezen. We noemen dat transcriberen. We doen dit met kunstmatige intelligentie. We transcribeerden 1 miljoen scans van de VOC van het Nationaal Archief. Het Noord-Hollands Archief en de andere Regionaal Historische Centra doen mee met 1 miljoen scans van notariële archieven.
Het project draait al weer 2 jaar. Dus hoogste tijd om de collega’s in de provincie bij te praten. En dat daar behoefte aan was bleek wel uit het grote aantal aanmeldingen. Samen met de sprekers hadden we bijna 50 deelnemers in de vergadering. Wat technische problemen daargelaten was het een geslaagde en bruisende bijeenkomst.
Stand van zaken van het project
Ik vertelde over de totstandkoming van het project, de stand van zaken en wat ons nog te wachten staat. Mijn collega Yashvant Gadjradj ging dieper in op de ontwikkeling van de projectwebsite voor het zoeken in de transcripties. De website bestaat uit een viewer met filters en een zoekmachine. De achterkant heeft een pijplijn om de transcripties te beheren en te bewerken. Zo worden de automatische geproduceerde transcripties gecorrigeerd, gemoderniseerd en worden namen van personen en locaties gemarkeerd.
Prijsvraag
Nico Vriend van het Noord-Hollands Archief vroeg aandacht voor de prijsvraag voor studenten die we hebben uitgeschreven. We willen met de prijsvraag de transcripties onder de aandacht brengen. En van studenten leren welk innovatief onderzoek mogelijk is als handgeschreven archieven massaal getranscribeerd zijn. (Als jij nog studenten weet die €1000 willen winnen met onderzoek in transcripties, hoor ik het graag!)
Onderzoek
Als voorproefje liet Milo van de Pol zijn vondsten zien in de transcripties van de VOC. Hij wist een slavenopstand in Banda te reconstrueren en vergeten aardbevingen op te diepen uit de archieven.
Toekomst
Ik ben enthousiast over het automatisch transcriberen van archieven en wil hiermee door in de toekomst. Uit een rondvraag bleek dat ook veel Regionaal Historische Centra hiermee aan de slag willen. In de projectwebsite zullen de transcripties van onze collega’s doorzoekbaar zijn. Maar deze website is tijdelijk. Gelukkig is de gebruikte technologie herbruikbaar en staan leveranciers Clean Code en Picturae klaar om te helpen.
Workshop
Als bonus gaven Vincent Noppe en Filotas Liakos een beginnerscursus Transkribus. Transkribus is het platform dat we hebben gebruikt om met kunstmatige intelligentie de scans automatisch te trancriberen.