Het herkennen van scans

  • okt 2021
  • Lidy Kutschruiter
  • ·
  • Aangepast 27 jun
  • 2
  • 95
Lidy Kutschruiter
Automatische Tekst Herkenning
  • Geert Leloup
  • Vincent Noppe
  • Milo van de Pol

Wij zijn bij HFA bezig met de dossiers van de Zuiderzeesteunwet. Het gescande deel van deze toegang willen we doorzoekbaar maken. De dossiers bestaan uit scans van gedrukte documenten en handgeschreven brieven.
Wij willen de scans van de handgeschreven documenten via Trankribus laten vertalen. Dat betekent dat in elk dossier de handgeschreven scans geselecteerd moeten worden.
De vraag: bestaat hier een programma voor, zodat we zelf niet scan voor scan hoeven te bekijken?

Met vriendelijke groet,
Lidy Kutschruiter
Het Flevolands Archief

Reacties

2 reacties, meest recent: 7 oktober 2021
  • Beste Lidy,

    My two cents:

    Voor zover ik weet bestaat er geen kant-en-klare software die on the fly afbeeldingen met handschrift herkent en dan selecteert, hoewel Transkribus wel met iets dergelijks bezig was (zie: https://readcoop.eu/printed-vs-handwritten-text-lines-automatically-separated/).

    Er zijn wel programma's waarmee je (handmatig) afbeeldingen kan selecteren en batchgewijs verwerken. Ik denk dan aan Tropy en Faststone Image.

    Maar misschien weet iemand anders in deze groep een ander goed programma.

    Groet!

    Milo

    Milo van de Pol
  • Hoi Lidy,

    Ik heb ook weleens getest met het maken van een Transkribus model met zowel gedrukte als handgeschreven trainingsdata. De resultaten waren verrassend goed, maar wel iets minder goed dan specifieke modellen voor de gedrukt en handgeschreven.

    Wellicht is dit een mogelijkheid voor je project?

    Succes met je project,
    Vincent

    Vincent Noppe

Trefwoorden