Vragen en updates
Van enkele nieuwe leden kreeg ik de vraag hoe ze het beste updates kunnen delen of vragen kunnen stell...
Wij zijn bij HFA bezig met de dossiers van de Zuiderzeesteunwet. Het gescande deel van deze toegang willen we doorzoekbaar maken. De dossiers bestaan uit scans van gedrukte documenten en handgeschreven brieven.
Wij willen de scans van de handgeschreven documenten via Trankribus laten vertalen. Dat betekent dat in elk dossier de handgeschreven scans geselecteerd moeten worden.
De vraag: bestaat hier een programma voor, zodat we zelf niet scan voor scan hoeven te bekijken?
Met vriendelijke groet,
Lidy Kutschruiter
Het Flevolands Archief
Reacties
Beste Lidy,
My two cents:
Voor zover ik weet bestaat er geen kant-en-klare software die on the fly afbeeldingen met handschrift herkent en dan selecteert, hoewel Transkribus wel met iets dergelijks bezig was (zie: https://readcoop.eu/printed-vs-handwritten-text-lines-automatically-separated/).
Er zijn wel programma's waarmee je (handmatig) afbeeldingen kan selecteren en batchgewijs verwerken. Ik denk dan aan Tropy en Faststone Image.
Maar misschien weet iemand anders in deze groep een ander goed programma.
Groet!
Milo
Hoi Lidy,
Ik heb ook weleens getest met het maken van een Transkribus model met zowel gedrukte als handgeschreven trainingsdata. De resultaten waren verrassend goed, maar wel iets minder goed dan specifieke modellen voor de gedrukt en handgeschreven.
Wellicht is dit een mogelijkheid voor je project?
Succes met je project,
Vincent