FREEZE! Red en behoud ons digitaal erfgoed | casestudy De Digitale Stad
Afgelopen vrijdag 17 november 2017 was ik aanwezig bij de finale van het 'webarcheologisch onderzoek' ...
Elke eerste donderdag van november is het Werelddag van de Digitale Duurzaamheid. Dit jaar met als thema ‘Breaking down barriers’. Het Netwerk Digitaal Erfgoed organiseerde, samen met LIMA en andere organisaties binnen het netwerk, een online symposium. Annelot Vijn (Het Utrechts Archief) vertelt over de vijf eyeopeners van die dag.
Lotte Wijsman en Remco van Veenendaal (beiden Nationaal Archief) behandelden errors, warnings and headaches bij preserveringstools. Een ‘hoofdpijndossier’ inderdaad. En dus hadden alle deelnemers een doosje ‘pilletjes’ (lees: pepermuntjes) toegestuurd gekregen.
Lotte presenteerde haar onderzoek naar het gebruik van de preserveringstool JHove. Bij het traject voor opname van digitale bestanden gebruikt het Nationaal Archief deze en andere tools om bestandsformaten in het e-depot te monitoren en te analyseren. Hierbij komen opvallend veel foutmeldingen naar voren. Wanneer kun je zo’n melding negeren? En wanneer is een bestand corrupt en wat moet je dan doen?
Het onderzoek had als conclusie dat sommige meldingen niet zo erg zijn als ze in eerste instantie lijken. Kunnen we op in dit vakgebied niet van elkaars ervaringen leren, dacht het Nationaal Archief. En zo geschiedde. Samen met de internationale preservation community zet het Nationaal Archief een kennisbank voor dit soort foutmeldingen op.
Om alvast input te verzamelen werden de deelnemers gevraagd naar hun eigen bevindingen met preservation vraagstukken. De uitkomsten liepen zeer uiteen, variërend van het gebrek aan commitment bij het management tot lastige kwesties rondom informatiebeveiliging. Maar ook: headaches rondom wet- en regelgeving en het moeilijk kunnen vinden van mensen die kennis van zowel IT als preservering hebben.
Bij het bewaren van digitale bestanden wordt gewerkt met preserveringsmetadata, oftewel alle gegevens om bestanden duurzaam toegankelijk te houden. Traditioneel maakte de Koninklijke Bibliotheek een onderscheid tussen bibliografische metadata en preserveringsmetadata, vertelt Suzanne van den Eijkel (Koninklijke Bibliotheek). In hun nieuwe preserveringsstrategie gebruiken ze een bredere definitie: ‘[Het betreft] alle metadata die nodig is om preserveringsdoelen te ondersteunen, met het oog op het garanderen van toegang tot digitale objecten op de lange termijn’. ‘Het is misschien niet mogelijk om de inhoud [van een bestand] volledig hetzelfde te houden, vandaar dat het belangrijk is om essentiële kenmerken te benoemen die behouden moeten blijven bij een transformatie. Dit maakt dat het duurzaam opslaan van digitaal materiaal een levend proces is,’ zo valt in de preserveringsstrategie te lezen.
De nieuwe preserveringsstrategie van de Koninklijke Bibliotheek bestaat uit drie lagen: strategisch, tactisch en operationeel. Op strategisch niveau is een duurzaamheidsbeleid ontwikkeld, op tactisch niveau hebben ze dit uitgewerkt in een preserveringsplan en op operationeel niveau mondt het uit in het collectieprofiel.
Er zijn verschillende manieren om grip uit te oefenen op de bestandsformaten. Zo kun je een voorkeursformatenbeleid opstellen en de digitale bestanden bij opname in een archief hierop toetsen. Maar wat als je, zoals de Koninklijke Bibliotheek, geen eisen kan stellen aan je inbewaargevers en de diversiteit van de formaten simpelweg te groot is? Daarom wordt per bestandsformaat beschreven wat de beste strategie is voor preservering. Voor de meest voorkomende bestandsformaten is dit uitgebreid vastgelegd, voor minder voorkomende algemener. Het voordeel van deze methode van ‘kennisniveaus’ is dat de Koninklijke Bibliotheek flexibel kan inspelen op wat op hen afkomt. Komt er bijvoorbeeld een nieuwe aanwinst in een bestandsformaat dat algemeen beschreven is, dan kan het bestandsformaat vervolgens uitgebreider worden opgetekend.
Sanne van Splunter (Koninklijke Bibliotheek) doet onderzoek naar inclusiviteit en bibliografische metadata in de trefwoordensystemen van haar organisatie. ‘Je moet je er blijvend van bewust zijn dat je gebruikte terminologie niet neutraal is,’ zegt ze. Ooit gebruikte termen kunnen nu als kwetsend ervaren worden. Hoe ga je hiermee om? Je kunt bijvoorbeeld een extra beschrijving toevoegen, extra uitleg geven of verwijzen naar een andere terminologiebron. In haar presentatie gebruikte Sanne termen rondom homoseksualiteit; die zou je bijvoorbeeld kunnen linken aan de Homosaurus.
Als erfgoedsector zetten we in op het duurzaam bewaren van digitale bestanden. Maar wat is de ecologische voetafdruk ervan? Zijn we ons daarvan bewust? Reden voor Tamara van Zwol (Netwerk Digitaal Erfgoed) en Robert Gillesse (IISG) om de Werelddag van de Digitale Duurzaamheid af te sluiten met een rondetafelsessie over ‘Green IT’.
Hoeveel bedraagt bijvoorbeeld de CO2-uitstoot om digitale bestanden dubbel op te slaan en al het materiaal 24/7 beschikbaar te houden? Of neem de vele migraties van digitale bestanden. En weten we wat de ecologische voetafdruk is om iets op internet te raadplegen?
Vaak willen we een gebouw voorzien van groene energie, maar zou dat ook niet moeten gelden voor digitale opslag? Een eenvoudig rekenvoorbeeld met een AA-batterij laat zien dat het menens is. Je telefoon doet 24 uur met een AA-batterij, je laptop 5 minuten en het uploaden van een vier minuten durend YouTube-filmpje kost 5 batterijen. En als dat filmpje vervolgens 5 miljoen keer bekeken wordt, kom je uit op 40.000 ton CO2…
Het laatste woord over ‘Green IT’ is nog lang niet gezegd. Daarom gaat een werkgroep Green IT binnen het Netwerk Digitaal Erfgoed de milieu-impact van het duurzaam bewaren van digitale bestanden en het gebruik ervan onderzoeken. Dit gebeurt aan de hand van een specifieke casus, het platform Delpher. De resultaten worden gedeeld met het hele veld.
Deze publicatie verscheen eerder op netwerkdigitaalerfgoed.nl
Afbeelding: Electronic Superhighway, Nam June Paik – geüpload door Libjbr, CC-BY-SA-3.0