Testen van Google Lens en Apple's Live Text software voor handschrift, getypte en gedrukte tekst.

  • feb 2022
  • Filotas Liakos
  • ·
  • Aangepast 27 jun
  • 32
Filotas Liakos
Automatische Tekst Herkenning
  • Liesbeth Keijser
  • Job Nijssen
  • Bob Coret
  • Milo van de Pol

De recente ontwikkelingen op het gebied van OCR en HTR hebben mij ertoe gebracht te testen hoe Google 's en Apple 's software kan bijdragen aan de transcriptie-productie en hoe betrouwbaar deze kan zijn. Om die reden heb ik gekozen om te experimenteren met drie soorten documenten van handschrift - getypt en gedrukt materiaal. Deze drie categorieën zijn het belangrijkst als het gaat om de transcriptie productie. Dit experiment vond plaats in beperkte omvang, aangezien vier pagina's zijn getest.

Zoals uit onderstaande tabel blijkt, zijn er verschillende CER-niveaus voor elke pagina en software. De manuscriptpagina's zijn 17e-eeuws VOC-materiaal dat in de 19e eeuw is getranscribeerd, waardoor ze op die manier 1e-eeuws manuscript zijn, terwijl de andere twee uit de 19e eeuw zijn.

Hierbij kunt u de vergelijking zien tussen de GT en de geproduceerde transcriptie van elke software:

  • 1667 Dagregister - beelde pagina 150

  • 1737 Dagregister - beelde pagina 88

  • Getypt pagina 55

  • Gedrukt testset pagina 10

Geconcludeerd kan worden dat deze twee stukken software niet in staat zijn transcripties te produceren voor handgeschreven tekst, maar dat er wel potentieel is voor getypte tekst. Handschrift was zoals verwacht het meest uitdagend, wat tot uitdrukking komt in de CER-scores. Over het algemeen is Google Lens vooralsnog geavanceerder dan Live Text, maar beide software hebben moeite om de tekst volgorde goed te begrijpen, en ze hebben de neiging woorden of zelfs regels over te slaan als het gaat om automatische tekstherkenning. Het kopiëren en plakken van de tekst van beide programma's is een ander probleem, omdat de tekst wordt geplakt als een geheel en niet volgens de regelgrootte.

Trefwoorden