OCR-en met Transkribus: de resoluties van de Staten-Generaal
Vincent Noppe van het Nationaal Archief heeft een OCR-test gedaan op scans van de “Gedrukte registers...
Gerhard de Kok, universitair docent koloniale geschiedenis aan de universiteit Leiden, vertelt over de interessante vondsten in automatisch getranscribeerde archiefstukken.Het Nationaal Archief transcribeerde archieven zoals de Verenigde Oost-Indische compagnie (VOC), de West-Indische Compagnie (WIC), de Sociëteiten van Suriname en Berbice met automatische handschriftherkenning. In totaal gaat het om 3 miljoen transcripties, een resultaat van het project De IJsberg
zichtbaar maken.
Gerhard de Kok besloot een kijkje te nemen in de datasets van de WIC en de Sociëteit van Suriname die het Nationaal Archief online had gezet. “Ik heb eerder onderzoek gedaan naar een groep piraten die de West-Afrikaanse kust in de 18e eeuw onveilig maakte. Ik wilde graag weten of ik misschien dingen had gemist.” De uitkomst was verrassend!
Lees het hele artikel op Nationaalarchief.nl