Trainen van modellen voor automatische handschriftherkenning
“De ijsberg zichtbaar maken”, het gezamenlijke digitaliseringsproject van het Nationaal Archief (NA)...
Vincent Noppe van het Nationaal Archief heeft een OCR-test gedaan op scans van de “Gedrukte registers van de ordinaris resoluties” uit het archief van de Staten-Generaal
met behulp van de Abbyy Finereader-module in Transkribus en de Transkribusmodellen “Dutch_Romantype_Print” en “IJsberg & Roman_type_print”.
Het doel van deze test is om na te gaan of het OCR-en loont om modellen te trainen die zowel handgeschreven als gedrukte teksten automatisch kan herkennen. Dit laatste is vooral interessant voor veel 20ste-eeuwse stukken die veelal getypte of geprinte stukken met handgeschreven aantekeningen bevatten.
Zie Voor Vincent's bevindingen de onderstaande bijlage: