Archiefvormers en Open Data (Tafel 8 #kvan15)

  • jun 2015
  • Ernest Verhees
  • ·
  • Aangepast 27 jun
  • 46
Ernest Verhees
KIA Community

Zoals beloofd bij de tafelgesprekken die ik op de KVAN-dagen op dinsdag mocht leiden, hierbij een korte samenvatting en een oproep om alle beschikbare data over je archiefvormers beschikbaar te stellen. Eerst de aanleiding en achtergrond van het gespreksonderwerp.

Archiefvormers verbinden

In het eerste nummer van het Archievenblad van dit jaar schreven Petra Helwig en Roland Bisscheroux over een informatiearchitectuur voor archiefinstellingen. De drie lagen die zij hierin onderscheiden – datalaag, verbindingslaag en presentatielaag – sluiten, niet toevallig, naadloos aan bij de Nationale Strategie Digitaal Erfgoed.

De presentatielaag krijgt bij de meeste archiefinstellingen veel aandacht in de vorm van een fraaie website en online toepassingen en ook de datalaag heeft, mede door de komst van het E-depot, niet over belangstelling te klagen. Maar hoe zit dat met laag twee, het verbinden? Thesauri, open data, OAI-koppelingen en kernregistraties zijn nog weinig gemeengoed en buiten de eigen instelling verbinden van metadata op basis van standaarden is nog beperkt.

Bij het Regionaal Archief Nijmegen hebben we hier al diverse stappen in gezet en de kennis hierover willen we graag delen. Als concreet voorbeeld neem ik één gedeelde kernregistratie van archiefvormers, zoals ook genoemd door Helwig en Bisscheroux.

Op basis van ISAAR beschrijven we in Nijmegen de archiefvormers in het collectiebeheerssysteem en presenteren we deze in een digitale kennisbank, met links naar de archieven in de Digitale Studiezaal en met een eerst stap richting Linked Open Data. De in inleidingen van online toegangen verstopte gegevens zijn met terugwerkende kracht omgezet naar het ISAAR-model, voor zover de beschikbare gegevens aanwezig waren. Er ligt uiteraard nog een grote werkvoorraad. (zie ook mijn eerdere berichten) Tot nu toe zijn er weinig vergelijkbare initiatieven maar mogelijk biedt de aandacht voor de verbindingslaag in de architectuur en voor Open Data nieuwe kansen.

Waarom niet eerder?

Om te bespreken wat nodig is om al die rijke kennis over archiefvormers open, gestandaardiseerd en gezamenlijk beschikbaar te stellen, stelde ik aan iedereen de vraag of ik die data kon en mocht krijgen. Niemand wees dat onmiddellijk af, sommige konden dat niet toezeggen of wisten het niet maar de meeste waren daar toe bereid. Van die laatste groep had wel iedereen een voorbehoud: het was maar zeer beperkte informatie, van onvoldoende of onduidelijke kwaliteit of er was twijfel of dat technisch wel (makkelijk) uit het systeem kon.

Over het algemeen zag iedereen de meerwaarde, in die zin dat de huidige manier van aanbieden in een toegang inderdaad als verstoppen werd ervaren. Op een uitzondering na was echter niemand met de archiefvormers bezig. Bij het Nationaal Archief hebben ze TOCO (Taken en Organisatie Centrale Overheid) met institutionele basisinformatie vanaf 1975 voor de centrale overheid bijeengebracht. Na afloop van het project in 2012 is het beheer echter opgehouden en dat TOCO al een paar jaar online staat (https://ibro.nationaalarchief.nl/) zal bij weinig mensen bekend zijn.

Dat iedereen het nut inziet maar er tegelijkertijd niemand aan werkt, is een signaal dat niet genegeerd kan worden. Blijkbaar heeft het geen hoge prioriteit en zijn andere werkzaamheden, ook voor digitale dienstverlening, belangrijker. Er werd in een gesprek ook de vraag gesteld of gebruikers hier wel behoefte aan hebben, wordt er door bezoekers wel om gevraagd? Of zoeken die helemaal niet via de context van de archiefvormer? Niemand leest de inleidingen van toegangen, hoor je dan vaak.

Waarom maken we dan inleidingen met beschrijvingen van archief en archiefvormers of steek je er energie in om ze online te krijgen?, vraag ik dan op mijn beurt. Door verbeterde en andere beschikbaarstelling worden ze mogelijk wel gelezen, al is het misschien door mensen die geen besef van het bestaan van ‘archiefvormers’ hebben of nooit de stap naar archiefonderzoek zullen maken. Deze gegevens kunnen, al dan niet via koppelingen (Linked Open Data), bijvoorbeeld in veel gevallen de artikelen Wikipedia aanvullen en daarmee een veel groter publiek bereiken. Voor mij was dan ook de belangrijkste reden om hier mee aan de slag te gaan, dat het zonde is om de beschikbare waardevolle informatie – in veel gevallen de beste beschrijving van een organisatie online – te verstoppen.

De toegevoegde waarde in het gezamenlijk aanbieden, op basis van een beschrijvingsstandaard, zit hem in de (automatische) verrijking door koppelen van gerelateerde instellingen en overname/hergebruik van informatie van anderen. Dat kan met gegevens van andere archiefbeheerders maar bijvoorbeeld ook met data over instellingen en personen in andere portals (Biografisch Portaal werd genoemd). Mogelijk zijn er op andere, onverwachte plekken al gegevens van ‘jouw’ archiefvormers. Voor de archiefinstelling kunnen goede en beheerde beschrijvingen van de archiefvormers ook van dienst zijn bij acquisitie en bij de positie in het netwerk. Bij voorkeur houden archiefvormers (overheid en particulier) hun eigen organisatieveranderingen bij maar in de praktijk gebeurt dat zelden. Als archiefinstelling vooraan in het proces zitten, betekent niet na 20 jaar de geschiedenis van de organisatie beschrijven maar er bovenop zitten als het gebeurt..

Vervolg

De tweede vraag is of het veel werk is of een zogeheten ‘quick win’. Als je streeft naar perfecte beschrijvingen van al je archiefvormers, volgens de standaard ISAAR beschreven die op basis van EAC in een OAI-koppeling beschikbaar gesteld moeten worden, dan kun je beter iets anders gaan doen. Accepteer dat het onvolledig is, niet bijgehouden en niet volgens een standaard met velden maar alles in een plat tekstbestand maar onderschat daarmee niet meteen wat je allemaal wél hebt. Veel beschrijvingen zijn wel goed (goed genoeg voor het tonen in de online toegang in ieder geval ), er zit misschien wel meer in velden in je collectiebeheerssysteem dan je denkt en een export in csv of excel is ook prima.

Het is uiteraard ook niet nodig om het zelf allemaal uit te gaan vinden. Je kunt gebruik maken van de kennis en ervaring van anderen die er mogelijk wel tijd voor hebben (al dan niet via een project). Geef hen tegelijkertijd dan ook de kans om met zo veel mogelijk data te bepalen wat er gedaan moet worden en wat haalbare doelstellingen zijn. Dus bied alles online aan, in de best mogelijke vorm als je kunt/wilt. De voorkeur is een link naar een te downloaden bestand. Let op, denk wel aan mogelijk auteursrecht op beschrijvingen van de archiefvormers die via inhuur zijn gemaakt.

Of dit een project wordt in kader van archief2020 of een samenwerkingsverband vanuit archief2.0 kan ik niet zeggen. Mogelijk is het wachten op een beter moment of op bijdragen uit onverwachte hoek. Ik wil in ieder geval graag de ervaringen die we in Nijmegen hebben opgedaan delen en meedenken over wat er nodig is om te komen tot een landelijke (dat is meer dan voor NA en RHC’s) kernregistratie van archiefvormers.

Trefwoorden