Nieuwe modellen en ground truths voor Transkribus

  • nov 2019
  • Milo van de Pol
  • ·
  • Aangepast 27 jun
  • 7
  • 27
Milo van de Pol
Automatische Tekst Herkenning
  • C. Annemieke Romein

Wij hebben grote behoefte aan nieuwe Ground Truths (GT's) en modellen. Als je die wilt delen, dan is dit platform de uitgelezen plek om dat te doen.
Gedeelde GT's en modellen kan je vervolgens op dit forum aankondigen.

Enkele grondregels bij het genereren van nieuwe modellen in Transkribus:
- Geef het model een begrijpelijke naam; gebruik geen cryptische acroniemen en/of cijfers.
- Verwijs in de omschrijving naar de herkomst van de gebruikte archivalia.
- Vermeld in de omschrijving op welke periode het model betrekking heeft.
- Geef aan welke talen in de transcripties voorkomen.
- Geef aan welke conventies zijn gehanteerd (bijvoorbeeld afkortingen wel/niet uitgeschreven).








Reacties

7 reacties, meest recent: 3 augustus 2020
  • Transkribus heeft het model NAN/NHA_GT_M3 van het Nationaal Archief en het Noord-Hollands archief model vrijgegeven. Dit model is gebaseerd op de Overgekomen Brieven en Papieren van de VOC, kamer Zeeland, uit de 17e en 18e eeuw en Notariële Akten uit de 19e eeuw. CER is 7.48%

    Milo van de Pol
  • Zojuist beschikbaar gemaakt:
    Dutch_Gothic_Print (16-17-18e eeuw)
    en
    French_18thc_Print

    C. Annemieke Romein
  • Sinds deze maand beschikbaar in Transkribus: het “Noscemus GM v1”-model.

    Dit model kan 16e-18e-eeuwse teksten aan die gebaseerd zijn op het lettertype Antiqua. Zowel teksten in het neolatijn, het Frans, Italiaans of Engels leveren goede resultaten op.

    Milo van de Pol
  • Het model model "Margaretha Turnor" (17e-eeuws Nederlands) van het Utrechts Archief is nu beschikbaar in Transkribus.

    Milo van de Pol

Trefwoorden