iPRES2022: nieuws over Metadata

  • okt 2022
  • Marjolein Steeman
  • ·
  • Aangepast 27 jun
  • 91
Marjolein Steeman
Preservation Digitaal Erfgoed
  • Angela Puggioni

Samenvatting

Van 12 tot 16 september 2022 vond in Glasgow de jaarlijkse iPRES conferentie plaats. Het thema ‘Let digits flourish’ was uitgewerkt in een zeer breed programma. Verschillende communities presenteerden ook updates rond metadata-standaarden en modellen. Hierbij een paar highlights.

PREMIS & METS

Het metadata schema voor preserveringsmetadata (PREMIS) beet het spits af met een uitgebreide tutorial over PREMIS. Deze presentaties geven een goed overzicht van het PREMIS-model.

Op donderdag volgde een presentatie over voorgenomen wijzigingen in het model, die zich toespitsen op het documenteren van rechten. Rechten is één van de entiteiten van het model. Er werden enkele use-cases gepresenteerd die om een aanpassing vragen van deze entiteit en van de mogelijkheden om naar Rechten te verwijzen.

De oplossingen zoals gepresenteerd zullen in een eerstvolgende paper worden opgenomen en staan open voor feedback. Ook andere use-cases of vragen ter verduidelijking zijn welkom. De PREMIS Implementation Group wordt geïnformeerd via een emailgroep, de zogenaamde PIG-list; registratie staat open voor iedereen.

Overigens werd de PREMIS Editorial Committee vereerd met een bijzondere Award, uitgereikt ter gelegenheid van het 20 jarig bestaan van de Digital Preservation Community (DPC). De EC zelf poste er dit over !

De stap van PREMIS naar METS is niet groot. PREMIS metadata wordt vaak in het METS schema opgenomen. Tijdens iPRES werd in een korte lightning talk een vereenvoudiging van het METS schema aangekondigd. To be continued…

PRONOM & NARA

PRONOM is niet zozeer een metadataschema, als wel een register voor file-formats. Het register geeft signatures uit waarmee file-formats uniek identificeerbaar zijn. Tijdens iPRES werd een sneak preview gegeven van de update van PRONOM. Er komt een nieuwe versie van de tool, volledig gebaseerd op linked data. Dat maakt het mogelijk om connecties te maken met andere registers. Een belangrijke ontwikkeling uit metadata-perspectief. De ontwikkelaars nodigen de community uit om feedback te geven, te helpen met testen enz. Hierbij het mailadres: PRONOM@nationalarchives.gov.uk.

Ook de National Archive for Records Administration (NARA) kondigt een dergelijke update aan. NARA’s Digital Preservation Framework bevat onder andere een matrix van meer dan 650 file formats en versions. Deze zijn beschikbaar onder github. Daarnaast zijn er preservation plans voor 16 verschillende type files (email, digital still image, etc.). Deze zijn sinds augustus 2022 als linked open data beschikbaar opdat de actieplannen machine leesbaar zijn en kunnen worden geautomatiseerd. De formaten zijn per categorie te doorzoeken.

Metadata collections

Tenslotte een introductie tot een ander onderwerp: metadata collections. Zie ook Beginners Guide to Computational Acces (augustus 2022) die door de DPC is gepubliceerd. Hierin wordt de term computational access uitgelegd en de verschillende technieken die daarbij worden gebruikt. De gids richt zich vooral op archieven als aanbieders van data sets.

Tijdens iPRES werd er een paper gepresenteerd door de Library of Congres dat een framework voorstelt voor het beschrijven en classificeren van dergelijke datasets. Dit is bijvoorbeeld van belang in het licht van machine learning en artificial intelligence (ML/AI) uit oogpunt van transparantie en bias. En om een heldere afweging te kunnen maken tussen alternatieve projecten in ML/AI.

Tegelijk maakte de Europeana Tech Community overigens bekend dat zij zich gaan bezig houden met het ontwikkelen van een datasheet voor digitaal cultureel erfgoed. Een gestandaardiseerde, maar flexibele aanpak voor het documenteren van digitale erfgoeddatasets. Zij bouwen daarmee voort op een artikel van Timnit Gebru et al: Datasheets for Datasets.

Conclusie

Op uiteenlopende fronten bood iPRES inspiratie en inzichten in ontwikkelingen rond metadata. Ontwikkelingen waarvan het goed is te weten dat ze spelen, en waar we ons naar behoeven verder in kunnen verdiepen om er ons voordeel mee te doen in onze dagelijkse praktijk.

Trefwoorden