Werkplan kenisplatform preservation
Het kennisplatform Preservation bestaat nu een jaar of twee. Begin 2016 zijn we gestart met een kick-o...
Op 30 november vond de eerste de Internationale Dag van de Digitale Duurzaamheid (International Digital Preservation Day) plaats. Deze dag is een initiatief van de Britse Digital Preservation Coalition. Het was werkelijk een mondiaal evenement. Verspreid over de hele wereld – van Nieuw-Zeeland tot aan de Verenigde Staten - vonden bijeenkomsten plaats, werden blogs geschreven, tweets gestuurd (#IDPD17) en stukken gepubliceerd.
Het Netwerk Digitaal Erfgoed (NDE) coördineerde de Nederlandse bijdrage. Deze bestond uit een aantal bijeenkomsten met als thema het duurzaam toegankelijk houden van ons maatschappelijke digitale geheugen.
De grootste bijeenkomst vond plaats in Den Haag bij het ministerie van OCW en werd georganiseerd door het kennisplatform Preservation in samenwerking met de NDE en de NCDD (Nationale Coalitie Digitale Duurzaamheid). Het ochtendprogramma stond in het teken van e-mailarchivering. Welke mails bewaren we? Welke metadata passen we toe? Hoe beschermen we de privacy? Experts uit binnen- en buitenland brachten de deelnemers op de hoogte van de actuele kennis en stand van zaken over dit onderwerp. Marens Engelhard, voorzitter van de NDE en algemene rijksarchivaris, opende de dag. De keynote werd verzorgd door James Lappin van de Universiteit van Loughborough, die schetste hoe overheden de afgelopen jaren geprobeerd hebben om e-mails al dan niet geautomatiseerd op te slaan in record management systemen. Helaas tot nu toe met 'mixed results' dus er is nog veel werk te verrichten.
Robert Gillesse vertelde hoe het Internationaal Instituut voor Sociale Geschiedenis momenteel midden in een implementatietraject van een nieuw e-depot zit. E-mail wordt door IISG gezien als een belangrijke bron van historisch materiaal en moet in het nieuwe systeem (Archivematica) worden gearchiveerd. Maar hoe dat precies moet? Daar is nog veel denkwerk voor nodig.
Namens het Nationaal Archief introducteerde Robbert Jan Hageman samen Jesper Harmes van het ministerie van BZK het onderzoeksprogramma E-mail Archivering bij de Rijksoverheid. Hoe gaan we de meer dan 1 miljard mails die de rijksoverheid jaarlijks verstuurd selecteren? En vervolgens duurzaam toegankelijk houden? En hoe kunnen we na overbrenging naar het Nationaal Archief een goede balans vinden tussen privacy en openbaarheid?
Mette van Essen van het Nationaal Archief sloot de ochtend af met een presentatie van de resultaten van een pilot met automatische classificatie van e-mails. Hierbij wordt de computer getraind om automatisch zakelijke mails van privémails te onderscheiden. Kunnen we een algoritme leren om, zoals een spamfilter spam herkent, relevante e-mails te herkennen die in aanmerking komen voor archivering?
In de middag ging het programma verder met het onderwerp essentiële kenmerken. Dit zijn de eigenschappen van digitale objecten die altijd bewaard moeten blijven. Zo worden authenticiteit en toegankelijkheid gewaarborgd. Het bepalen van essentiële kenmerken is niet eenvoudig vanwege de verschillende abstractieniveaus van de kenmerken, de vele opties die bij migratie mogelijk zijn en de vele soorten eigenschappen en gedrag die digitale objecten kunnen hebben. Ook het beoogde doel van het object en de gebruikers ervan zijn van invloed. Bijvoorbeeld: als een cijfer bijvoorbeeld rood is, is dat dan eenvoudigweg omdat het mooi staat, of omdat er sprake is van een negatief bedrag?
Sprekers van respectievelijk het Nederlands Instituut voor Beeld en Geluid (Annemieke de Jong), IISG (opnieuw Robert Gilesse), het Nationaal Archief (Remco van Veenendaal) en de Koninklijke Bbliotheek (Jeffrey van der Hoeven), vertelden kort hoe hun eigen organisaties hier mee omgaan. Zo is het Nationaal Archief er verantwoordelijk voor om digitale informatie authentiek en betrouwbaar te beheren en beschikbaar te stellen. Het NA moet daarbij weloverwogen beslissen welke essentiële kenmerken van de beheerde informatie door de tijd heen wordt meegenomen, en waarom. Hierbij beperkt het NA zich niet tot de meer technische kenmerken zoals hoogte, breedte en aantal cijfers achter de komma. Ook de (hard- en software)omgeving, de (juridische en creatie)context en de belanghebbende(n) spelen een rol.
De middagsessie werd afgesloten door Jon Tillbury van Preservica. Hij schetste een mooi toekomstbeeld waarbij systemen voor digitale archivering volledig geautomatiseerde black boxen zijn waar de gebruikers niet meer hoeven te weten wat er onder de moterkap allemaal gebeurt. Essentiële kenmerken worden daarin, volgens op internationale best practices gebaseerde regels, automatisch geëxtraheerd en automatisch bij migraties meegenomen.
Tussendoor was er de bekendmaking van de 'Bit List' of Digitally Endangered Species. Dit is een door de internationale preservation community samengestelde lijst van ‘most at risk’ digitaal materiaal dat in meer of mindere mate met uitsterven wordt bedreigd. Initiatiefnemer The Digital Preservation Coalition wil hiermee aandacht vestigen op de kwetsbaarheid van digitale informatie. En belanghebbenden ertoe aanzetten om zich over deze informatie te ontfermen.
Meer dan 100 mensen afkomstig uit heel het land (en ook uit België) waren op de bijeenkomst afgekomen. Een geweldig grote opkomst, zeker gezien de vrij specifieke, technische onderwerpen. Alleen al daarom kan de dag een groot succes worden genoemd. Een nieuwe traditie is geboren. Op naar volgend jaar! #IDPD18
NCDD nieuws: Eerste internationale dag digitale duurzaamheid groot succes
NCDD events: E-mailarchivering
DPC-news: Inaugural international digital preservation day
DPC-news: Worlds most at risk digital materials identified
En lees de tientallen tweets van over de hele wereld terug via # IDPD17