Doel Archivematica Camp
Het zogenaamd Archivematica Camp is een laagdrempelige, informele driedaagse bijeenkomst die wordt georganiseerd door Artefactual – het bedrijf dat Archivematica heeft gemaakt en beheerd. Een Archivematica Camp bestaat normaliter uit een introductiedag en twee verdiepingsdagen. Doel van de Camps: “are intended to provide a space for anyone interested in or currently using Archivematica, to come together, learn about the platform and share their experiences.”
Dit keer vond het Camp plaats in het IISG te Amsterdam (en dat was de tweede keer in Europa). De opkomst bleek boven verwachting – het was het grootste Archivematica Camp tot nog toe. Deelnemers kwamen – als verwacht – met name uit Nederland en België (ongeveer 50%), de rest van deelnemers uit verschillende landen uit Europa als Zweden, Duitsland, Groot Brittannië, Italië, Zwitserland. Maar ook waren er, opvallend genoeg, twee deelnemers uit Canada.
Dag 1
Het Camp werd geopend door Afelonne Doek – hoofd collecties en adjunct directeur van het IISG – waarna de introductiedag begon. Evelyn McLellan, de directeur van Artefactual, schetste om te beginnen de bredere digital preservation context waarin Archivematica opereert. Daarbij werd een mooie definitie gegeven van wat een digitaal preserveringsysteem als Archivematica behelst: “A system built from tools that perform a variety of functions to ensure the integrity and authenticity of digital content”. Daarbij moet onder andere worden gedacht aan virus checks, file identificatie/karakterisering en validering, extractie (van file header informatie), fixity checking en normalisering van bestandsformaten. Ook werd de relatie van Archivematica tot het OAIS model uitgelegd en vervat in een onderstaande aardige sheet:
De bovenste zwarte balk komt letterlijk uit de webinterface van Archivematica. M.a.w. Archivematica ambieert een OAIS compliant preserveringssysteem te zijn. Archivematica probeert zoveel mogelijk gangbare (preserverings)standaarden te ondersteunen. Dit zijn onder andere Bagit, METS, PREMIS, Dublin Core en de PRONOM fileformatenlijst.
Uiteindelijk en in essentie is Archivematica een workflowapplicatie die met behulp van tal van microservices een AIP en een DIP produceert:
Belangrijk is daarbij dat de AIP en DIP’s die Archivematica produceert system agnostisch zijn – maw: “Archivematica creates system agnostic AIPs, meaning that you do not require a particular system to store and read AIPs in the future”.
Belangrijk onderdeel van deze sessie was ook het tonen van de mogelijkheden om Archivematica te integreren met opslag, toegangs- en repository systemen. Inmiddels zijn er tal van integraties met Archivamatica tot stand gebracht. Opslagsystemen:
Toegangs- en repositorysystemen:
In de volgende sessie behandelde Justin Simpson, technisch directeur van Artefactual, de technisch opzet van Archivematica. Interessant is dat Archivematica uiteindelijk een workflowtool is die een fiks aantal zogenaamde microservices (lees: externe tools) 1 voor 1 afhandelt in verwerking van het digitaal archief tot er uiteindelijk een AIP en DIP is gecreëerd. In de zogenaamde Archivematica processing configuration kan de workflow naar wens worden aangepast en kan voor sommige specifieke tools worden gekozen. Ook kan daar worden bepaald met welke mate van automatische verwerking de workflow wordt afgehandeld.
De preservation planning tab geeft de gebruiker veel mogelijkheden preserveringsstappen en de daarbij horende tools zelf in te richten:
De deelnemers mochten in de tweede helft van de dag zelf met Archivematica aan de slag door onder andere een SIP te creëren, metadata toe te voegen, een ingest procedure te starten, te normaliseren, een AIP te creëren en deze down te loaden.
Dag 2
In de volgende dagen werd dieper in gegaan op Archivematica en haar functioneren. Gedurende deze dagen waren er een drietal wat technischer ingestoken parallelsessies. Daar ondergetekende daar niet bij heeft gezeten, op deze plaats slechts een indruk van de minder technische sessies.
Gedurende de tweede dag werd er ingegaan op het zelf inrichten van workflows en werd er daarmee flink geoefend. De redenen voor het inrichten van dergelijke gespecialiseerde workflows zijn onder andere:
Ook mocht ondergetekende en collega Lucien van Wouw iets vertellen en over de Archivematica implementatie in het IISG. Kern van die presentatie is de boodschap dat de genoemde implementatie veel meer behelsde dan die implementatie alleen:
Ook vroeg ik in mijn lezing om enige aandacht voor de Nederlands-Vlaamse gebruikersgroep ( https://wiki.archivematica.org/Community/Regional_User_Groups#NETHERLANDS_and_FLANDERS) en het feit dat de eerst bijeenkomst daarvan plaatsvind op 16 juni.
Een ander belangrijk element van Archivematica – de zogenaamde automation tools – kwam ook aan de orde. Deze tools bieden de mogelijkheid pre- en post-ingest stappen te automatiseren:
Het IISG gebruikt deze scripts op het moment om de aanlevering van nieuw archief aan Archivematica zoveel mogelijk automatisch te laten verlopen.
Ook was er aandacht voor de Archivematica waardering en selectie functionaliteit binnen Archivematica. Op de zogenaamde Archivematica appraisal tab is het mogelijk om pre-SIP’s te schonen, samen te voegen en anders in te delen. Ook zijn koppelingen mogelijk (via een API) met de archiefbeschrijvingsapplicaties ATOM en Archivespace.
Marco Klindt van het Berlijnse Zuse Instituut sloot dag 2 af met het geven van een presentatie over Archivematica implementatie in zijn instituut. Ook uit zijn lezing bleek dat Archivematica een schakel is in een veel groter geheel van applicaties en hardware die allen het digitaal depot vormen van het Zuse Instituut:
Dag 3
De derde en laatste dag werd met name besteed aan uitleg over de AIP en de daarin opgenomen PREMIS metadata, een aantal voorbeelden van andere Archivematica implementaties en een discussie over de Archivematica community.
PREMIS, de standaard voor het opslaan van digital preservation metadata, is een onvervreemdbaar onderdeel van Archivematica. Het idee achter PREMIS:
Een belangrijk deel van de output van de preservation tools die in Archivematica actief zijn komt terecht in deze PREMIS velden. De PREMIS velden worden in een METS metadata wrapper opgenomen. Een voorbeeld:
Een van de problemen daarbij is – bij een archief dat bestaat uit veel files – dat de METS files nogal groot kan worden. Er wordt daarom gekeken naar een linked data oplossing voor de PREMIS metadata. Deze oplossing zou de ‘breedsprakigheid’ (verbosity) van de METS flink kunnen indammen.
De afsluitende discussie over de Archivematica community en de verdere ontwikkeling daarvan ging onder andere over de (on)wenselijkheid van de verdere integratie van systemen met Archivematica. Ook kwam de Archivematica “wensenlijst” (https://wiki.archivematica.org/Improvements) en de gewenste betrokkenheid van de community daarbij aan de orde.
De zonnige Archivematica community in Amsterdam:
Foto: Ross Spencer
Dank
De Archivematica Camp sheets uit deze lezing zijn met toestemming gebruikt van de firma Artefactual.