Emulatie voor preservatie: resultaten van een stage bij het Nationaal Archief

  • 27 feb
  • Remco van Veenendaal
  • 272
Remco van Veenendaal
Preservation Digitaal Erfgoed
  • Bram Klapwijk
  • Laura M van Noort
  • Kirstie van de Rijdt
  • Jasper Slob

Door Anton van Es (student UvA)

To emulate or not to emulate?

Nu steeds meer met behulp van een computer gemaakte archiefbescheiden worden opgenomen in de digitale archiefdepots, wordt het steeds belangrijker na te denken over hoe deze archiefbescheiden in de lange termijn bewaard kunnen worden.

Deze ‘digitaal geboren’ (naar het Engelse ‘born-digital’) archiefbescheiden zijn fundamenteel gerepresenteerd als een bitstroom: een reeks enen en nullen waarin informatie over vorm en inhoud is gecodeerd. De manier waarop informatie gecodeerd is, hangt af van het bestandsformaat waarin het is opgeslagen. Omdat het mogelijk is perfecte kopieën van deze bitstroom te maken is het theoretisch mogelijk de bitstroom voor eeuwig te bewaren.

Voor het interpreteren van digitale archiefbescheiden is het echter ook nodig dat de bitstromen gedecodeerd kunnen worden, zodat de archiefbescheiden weergegeven kunnen worden. Dat kan echter alleen zolang de bestandsformaten in kwestie ondersteund worden door software zoals viewers en verwerkers. Als die ondersteuning stopt, is één van de mogelijkheden die een archief heeft het bewaren van toegang tot de oorspronkelijke software met behulp van emulatie. Het was mijn stageopdracht om uit te zoeken of dat voor het Nationaal Archief een waardevolle toevoeging zou zijn aan de digitalepreservatiestrategie.

Converteren of emuleren?

Emulatie is niet de enige methode om om te gaan met digitale archiefbescheiden in verouderde bestandsformaten. De meest gebruikte strategie nu is bestandsformaatconversie, ook wel migratie genoemd. Hierbij wordt een bestand omgezet naar een nieuwer of duurzamer bestandsformaat: een WordPerfectdocument wordt dan bijvoorbeeld omgezet naar een PDF. Dit verandert de archiefbescheiden uiteraard wel op het niveau van hun bitstroom, en om de authenticiteit van de geconverteerde archiefbescheiden vast te stellen is het nodig te verifiëren dat alle essentiële kenmerken van de oorspronkelijke archiefbescheiden ook aanwezig zijn in de geconverteerde versies.

Daarnaast is bestandsformaatconversie niet altijd mogelijk, bijvoorbeeld wanneer er geen alternatief bestandsformaat bestaat waarin de essentiële kenmerken van een archiefbescheid kunnen worden vastgelegd. Dat is bijvoorbeeld het geval bij de interactieve Adobe Flash objecten die ingebed zijn in gearchiveerde websites in het e-depot van het Nationaal Archief.

Software die hardware nadoet

Om digitaal geboren archiefbescheiden in hun oorspronkelijke softwareomgeving te kunnen tonen, zou het natuurlijk mogelijk zijn een oude computer te gebruiken. Het is echter praktischer gebruik te maken van een emulator: een stukje software wat op moderne computers kan draaien en in feite doet alsof het hardware is. Op de emulator kan dan een besturingssysteem zoals Windows XP worden geïnstalleerd, en signalen die dat besturingssysteem normaal naar de hardware van de computer zou sturen worden ondervangen door de emulator. De emulator kan dan precies nabootsen hoe een bepaalde computer zou hebben gereageerd op die signalen, en wat er teruggezonden zou worden naar het besturingssysteem.

Op deze manier kunnen allerlei verouderde besturingssystemen worden gedraaid door emulatoren op een moderne computer. Zo kan ook verouderde toegangssoftware voor digitaal geboren archiefbescheiden op een moderne computer worden geopend. Het voordeel van deze methode is dat het archiefbescheiden in hun oorspronkelijke vorm duurzaam toegankelijk maakt. Ook is de manier om archiefbescheiden met emulatie weer te geven in essentie hetzelfde voor elk bestandstype.

Authentieke weergave

Tijdens mijn stage heb ik de weergave van een aantal gearchiveerde websites uit de collectie van het Nationaal Archief in een moderne web browser vergeleken met de weergave in een geëmuleerde browser uit dezelfde tijd als de website. Een opvallend voorbeeld van het verschil in weergave was een webpagina met een Adobe Flash object. Oudere versies van Internet Explorer konden dit object probleemloos weergeven, maar met een moderne browser ontbrak elk spoor van het object.

Wie de website slechts met een moderne browser bekijkt zou geen idee hebben dat het object daar wél hoort te zijn en zou omgekeerd op geen enkele andere pagina er op het eerste gezicht zeker van kunnen zijn dat de volledige inhoud wordt weergegeven. Om de authenticiteit van de weergave met de moderne browser te kunnen vaststellen zou van elke pagina de broncode moeten worden geïnspecteerd op de aanwezigheid van niet weergeefbare objecten. Met behulp van emulatie is het eenvoudiger om de authenticiteit van een weergave te waarborgen.

Een soortgelijk verschijnsel is breder waar te nemen. Om de authenticiteit van de weergave van een digitaal archiefbescheid door middel van emulatie vast te stellen is het slecht nodig je te verzekeren dat de bitstroom onveranderd is en dat een emulator naar verwachting werkt, terwijl het maken van eenzelfde soort vaststelling voor geconverteerde bestanden complexer is.

Uitdagingen

Helaas zijn er nog uitdagingen te overbruggen voordat emulatie op schaal toegepast zou kunnen worden. Eén hiervan is dat archieven dan ook toegangssoftware voor hun archiefbescheiden zouden moeten verkrijgen en bewaren om in een emulator te gebruiken. Een ander is dat ook software auteursrechtelijk beschermd is, waardoor een archief—afhankelijk van de licentie—zeer beperkt is in hoe het een geëmuleerde omgeving met toegangssoftware kan gebruiken. Hiervoor zal dus nog aan oplossingen gewerkt moeten worden.

Trefwoorden