Data Provenance - modellen en data delen en hergebruiken

  • jan 2023
  • C. Annemieke Romein
  • ·
  • Aangepast 27 jun
  • 34
C. Annemieke Romein
Automatische Tekst Herkenning

Samenvatting

Op 30 november publiceerden een grote groep mensen (academici, archivarissen, bibliothecarissen) het volgende artikel: https://doi.org/10.5281/zenodo.7267245 over delen van data en het op adequate manier vermelden. Het artikel is bedoeld als startpunt voor een discussie.

De titel luidt: "Exploring Data Provenance in Handwritten Text Recognition Infrastructure: Sharing and Reusing Ground Truth Data, Referencing Models, and Acknowledging Contributions. Starting the Conversation on How We Could Get It Done."

Het artikel is als volgt opgebouwd:

  • Hoe en waar kan je GroundTruth exporteren en delen (HTR United) zodat anderen het ook kunnen hergebruiken.

  • Hoe zou je datasets (zoals de zojuist gedeelde dataseet op HTR United) kunnen citeren.

    • Wat zijn eventuele beperkingen aan het delen van data (data ethiek).

  • Het erkennen van bijdragen van 'de crowd'/ citizen scientists.

  • Het erkennen van het werk van instellingen in het digitalisatie proces.

Deze zaken hangen uiteraard met elkaar samen en ik ben dan ook benieuwd of er nog commentaar van jullie kant op dit artikel is; of nieuwe inzichten. Veel leesplezier!