OCR-en met Transkribus: de resoluties van de Staten-Generaal
Vincent Noppe van het Nationaal Archief heeft een OCR-test gedaan op scans van de “Gedrukte registers...
De Innovatie in Archiefonderzoek-prijs is een nieuwe onderzoekswedstrijd van het Nationaal Archief en het Noord-Hollands Archief. De prijs wordt toegekend aan het onderzoek dat op meest overtuigende wijze de meerwaarde aantoont van de beschikbaarheid van grote hoeveelheden transcripties van de archieven van de VOC en Haarlemse notarissen.
Inmiddels staat de oproep voor inzendingen open via https://www.nationaalarchief.nl/herschrijf-jij-de-geschiedenis. Helaas zijn medewerkers van het NA en NHA uitgesloten van deelname. Toch willen we aan jullie vragen deze oproep binnen jullie netwerk te verspreiden. Alvast veel dank!
Kan jij laten zien welke nieuwe onderzoeks- of visualisatiemogelijkheden er zijn als archieven zijn ontsloten met automatische handschriftherkenning? Dien dan je onderzoeksresultaten uiterlijk 1 april 2021 in en maak kans op een prijs. De prijsuitrei- king vindt plaats tijdens een hybride (deels online) symposium op 17 mei 2021 waar de winnaar haar of zijn onderzoek mag presenteren.
In het project De ijsberg zichtbaar maken van het Nationaal Archief, in samenwerking met het Noord-Hollands Archief en andere Regionaal Historische Centra, worden grote hoeveelheden historische documenten met behulp van kunstmatige intelligentie auto- matisch getranscribeerd, oftewel omgezet in machineleesbare tekst. We willen graag weten wat voor mogelijkheden dit biedt voor onderzoek in deze bronnen. Daarom dagen we studenten uit om onderzoek te doen.
Je bent een master- of bachelor student aan een Nederlandse hogeschool of univer- siteit of een Vlaams equivalent. Het onderzoek is geschreven in het Nederlands of Engels. Voor je onderzoek maak je gebruik van de transcripties van het archief van de VOC uit de 17e en 18e eeuw van het Nationaal Archief of van de Haarlemse notarissen uit de 19e eeuw van het Noord-Hollands Archief. De insteek kies je zelf. Wordt het een big data analyse, richt je je op digital humanities, is jouw focus taal of juist sociale geo- grafie, zie je verbanden die eerst niet mogelijk waren? De keuze is aan jou. Het onder- zoek hoeft geen scriptie te zijn maar moet vooral de meerwaarde aantonen van de be- schikbaarheid van grote hoeveelheden transcripties van archieven. Bekijk het reglement met de volledige eisen op https://www.nationaalarchief.nl/handschriftherkenning.
De transcripties (HTR results), op basis waarvan je jouw onderzoek doet, zijn te down- loaden van de website Zenodo (in Zenodo naar beneden scrollen). Van de Haarlemse notarissen zijn twee archieven ontsloten met handschriftherkenning (nummers 1617 en 1972). De VOC is één dataset. De transcripties zijn beschikbaar in het format PA- GE-XML of TXT. Kies zelf waarmee je aan de slag gaat.
Draag je onderzoek voor door uiterlijk 1 april 2021 een e-mail te sturen aan Nationaal Archief Prijsvraag onder vermelding van ‘Innovatie in Archiefonderzoek-prijs’.
Voeg aan je email het onderzoek toe, een samenvatting van maximaal duizend woor- den en een CV.
Er zijn twee prijzen te winnen:
• Een prijs van €1000, beschikbaar voor de onderzoeker met het beste onderzoek in de automatische transcripties van het archief van de VOC.
• Een prijs van €1000, beschikbaar voor de onderzoeker met het beste onderzoek in de automatische transcripties van het archief van de Haarlemse notarissen van het Noord-Hollands Archief.
De uitreiking vindt plaats tijdens een hybride symposium op
17 mei 2021. De winnaar presenteert daar haar of zijn onderzoek. De locatie wordt binnenkort bekend gemaakt.
Deze onderzoekswedstrijd is een initiatief van het Nationaal Archief en het Noord- Hollands Archief.
De jury wordt gevormd door professionals uit het werkveld van archivering, digital humanities en de media, te weten:
• Marens Engelhard, de algemene rijksarchivaris en algemeen directeur Nationaal Archief (voorzitter van de jury).
• Coen van Galen, onderzoeker en universitair docent, Radboud Universiteit Nijmegen.
• Günter Mühlberger, voorzitter van het Digital Humanities Research Centre van de Universiteit van Innsbruck en voorzitter van de Raad van Bestuur van de European Cooperative Society, READ COOP SCE, Innsbruck, Oostenrijk.
• Klaartje Pompe, afdelingsmanager Publiek en plaatsvervangend directeur Noord- Hollands Archief.
• Charles van den Heuvel, Hoofd onderzoek kennisgeschiedenis, Huygens ING. Hoogleraar digitale methoden en geschiedwetenschappen Universiteit van Amsterdam. P.I. Golden Agentsproject.
• Franciska de Jong, Executive Director van CLARIN ERIC, de European research infra- structure for language resources.