Linked Open Data bij de bron: het Regionaal Archief Nijmegen

  • nov 2021
  • Renier van de Giessen
  • ·
  • Aangepast 27 jun
  • 2
  • 47
Renier van de Giessen
Toegang tot Data
  • Annelot Vijn
  • Enno Meijers
  • Maarten Zeinstra
  • Harm Pieters
  • Marco Streefkerk

Het Regionaal Archief Nijmegen (RAN) heeft de beeldbank, met meer dan 120.000 foto’s en beschrijvingen, beschikbaar gesteld als linked open data (LOD). In dit blog een uitleg over hoe we dit hebben aangepakt.

In het project “LOD en PID bij de bron” van het Netwerk Digitaal Erfgoed (NDE) worden leveranciers van collectiebeheersystemen aangemoedigd en ondersteund bij het implementeren van persistent identifiers en LOD-functionaliteit. Bij het RAN maken we gebruik van de software Atlantis van leverancier DEVENTit. Zij hebben het afgelopen jaar werk gemaakt van het implementeren van LOD-functionaliteit in Atlantis, met name in samenwerking met het Literatuurmuseum en NDE. Zie ook dit NDE-bericht. Als RAN haakten wij daarna graag aan met een eigen project.

De doelstellingen van het RAN waren om de bruikbaarheid en vindbaarheid te vergroten van (allereerst) onze beeldbank en om te leren omgaan met de nieuwe LOD-functionaliteit in Atlantis en deze te integreren in onze werkprocessen. Met LOD-functionaliteit wordt bedoeld: (1) de mogelijkheid om termen vanuit het Termennetwerk (seriegewijs) te koppelen aan bepaalde velden en (2) de mogelijkheid om onze gegevens beschikbaar te stellen als linked open data.

Koppeling en mapping

In Atlantis is het mogelijk om velden aan te wijzen waaraan een thesaurus gekoppeld kan worden. Dit kan een interne thesaurus zijn of een externe thesaurus (denk: Termennetwerk). We hebben een aantal velden gekoppeld aan het Termennetwerk (onderwerp, locatie en vervaardiger) en een enkel veld aan een interne thesaurus (documenttype); de interne thesaurustermen hebben we op hun beurt weer gekoppeld aan termen uit het Termennetwerk. Dit zijn velden die al een uniformering kenden in de schrijfwijzen of waar we al stamlijsten gebruikten. Atlantis biedt voor gekoppelde velden de mogelijkheid om op grote schaal gegevens te matchen met het Termennetwerk. Relatief makkelijk kan dan een term uit het Termennetwerk, bijv. een bepaalde vervaardiger uit RKD Artists of een onderwerp uit de Art & Architecture Thesaurus, aan vele records tegelijk worden gekoppeld (zie ook de omslagafbeelding van dit blog). Het koppelen hebben we, verspreid over een paar weken, in klein teamverband aangepakt in een proces dat zowel automatisch als handmatig te noemen is: handmatig omdat we per gegeven beoordeelden welke externe term eraan moest worden gekoppeld en automatisch omdat we daarmee een externe term aan meerdere records tegelijk koppelden.

Met het koppelen van termen waren we er nog niet. We wilden onze gegevens natuurlijk ook als echte triples kunnen aanbieden, in RDF-vorm. De aanpak hiervoor is vergelijkbaar met de aanpak uit verleden jaren om gegevens via een OAI-PMH-koppeling aan te bieden: we maken een mapping. Deze mapping kan worden gemaakt binnen het collectiebeheersysteem met behulp van de XSLT-programmeertaal; dit kan in opdracht worden gegeven aan de softwareleverancier, maar hebben wij in dit project zelf ter hand genomen om flexibel te kunnen werken. We hebben ervoor gekozen om met de mapping aan te sluiten bij twee belangrijke ontologieën: Schema.org en het archiefspecifieke Records in Contexts.

Resultaat en conclusie

Onze doelstelling om de LOD-functionaliteit in ons collectiebeheersysteem te implementeren is behaald. We zijn nu bezig met de integratie ervan in onze werkprocessen en onze invoerformulieren. Wat betreft de doelstelling om de bruikbaarheid en vindbaarheid te vergroten van onze beeldbank: in theorie is dit nu bereikt, maar de betekenis hiervan moet nog blijken. Met LOD-functionaliteit in ons collectiebeheersysteem en de opgedane ervaring in de vingers kunnen en willen we, na de beeldbank, op termijn ook andere collecties als LOD beschikbaar stellen.

Onze LOD-set beelddocumenten is nu in zijn geheel (of deels, als zoekresultaat) te benaderen via onze open data-publiekspagina en is ook te bevragen met SPARQL via deze interface. De dataset is ook op de juiste wijze beschreven waardoor deze is opgenomen in het nieuwe NDE-datasetregister, wat de vindbaarheid van de dataset ten goede komt.

Reacties

2 reacties, meest recent: 4 februari 2022
  • Ik heb het idee dat de genoemde publiekspagina alleen beschrijvingen van de dataset in verschillende formaten geeft. Toegang tot de inhoud zelf, lukt me alleen via SPARQL.

    Marco Streefkerk
  • Dag Marco,

    Ik zie nu pas je reactie, excuus. De publiekspagina had enige tijd problemen met het downloaden van de dataset is verschillende serialisaties. Dat is nu verholpen. Let wel op, want het betreft een flink bestand (>400 MB).

    Renier van de Giessen

Trefwoorden