Monitoring van bestaande en nieuwe opslagtechnieken 2: Criteria voor opslag

  • dec 2022
  • Ad van Heijst
  • ·
  • Aangepast 25 okt
  • 1
  • 219
Ad van Heijst
Preservation Digitaal Erfgoed
  • Mathé van der Velden
  • Leonoor Hamers
  • Lotte Wijsman
  • Sjoerd Van Hooijdonk
  • Rein van 't Veer

Samenvatting

Dit artikel is een tweede van een serie over het monitoren van bestaande en innovatieve technieken voor de opslag van informatie. Dit project maakt deel uit van het NDE-programma Preservation Watch. De resultaten worden gepubliceerd op het KIA platform preservation en via de KIA Kennisindex Preservation Watch

In de vorige blog spraken we over de bedreigingen die duurzame digitale opslag tot een uitdaging maken. We willen dat informatieobjecten vindbaar, beschikbaar, leesbaar, interpreteerbaar, betrouwbaar en toekomstbestendig worden opgeslagen. Digitale preservering omvat alle acties om informatieobjecten toegankelijk en bruikbaar te houden voor zolang dit nodig is. Door te preserveren schep je de condities waarbij de gegevens optimaal bruikbaar en betrouwbaar blijven.

Bij preservering zijn de opslagmethoden en -technieken heel belangrijk. Internationaal spreken we over Preservation Storage. Door de enorme massa aan digitale informatieobjecten die we als mensheid produceren bereiken we de grenzen aan de opslagmogelijkheden. Daarom wordt gezocht naar nieuwe technieken die ons kunnen helpen informatie duurzaam op te slaan, terwijl zo weinig mogelijk grondstoffen, arbeid en kosten hiervoor worden gebruikt. Een voorbeeld uit de filmwereld spreekt boekdelen: alleen al de overall storage voor media en entertainment groeit naar verwachting met 420% per jaar.

Digitale opslagtechnologieën houden verschillende risico's in voor de langetermijnbewaring van digitale objecten, zo stelt het Digital Preservation Handbook. Deze risico's kunnen worden beperkt door een digitale opslagstrategie te gebruiken die één of meer opslagsystemen en ten minste twee kopieën van de gegevens omvat. Een goede praktijk is dat een strategie de volgende kenmerken heeft:

  1. er bestaan meerdere onafhankelijke kopieën van het digitale materiaal

  2. deze kopieën zijn geografisch gescheiden op verschillende locaties

  3. de kopieën maken gebruik van verschillende opslagtechnologieën

  4. de kopieën gebruiken een combinatie van online- en offline-opslagtechnieken, en

  5. de opslag wordt actief gemonitord om ervoor te zorgen dat eventuele problemen snel worden ontdekt en verholpen.

Een digitale opslagstrategie kan gefaseerd worden uitgevoerd, te beginnen met een basisniveau van bescherming en toegang tot de digitale content (de informatieobjecten met hun metadata) die overgaat in een meer geautomatiseerde en schaalbare aanpak, met een hoger niveau van veiligheid en -beveiliging van de gegevens.

Risico's voor de digitale gegevens komen uit verschillende bronnen en een digitale opslagstrategie helpt de kosten van digitale opslag af te wegen tegen de vermindering van die risico's. Voorbeelden van risico's zijn brand, overstroming, het niet volgen van de juiste processen of procedures, aanvallen van buitenaf, aantasting van media en veroudering van opslagsystemen en -technologieën. De belangrijkste risico's en de middelen om ze aan te pakken of te beperken worden vastgelegd in het calamiteitenplan of de continuïteitsplanning van een organisatie.

Het maken van meer dan één kopie van het digitale materiaal is van fundamenteel belang om een basisniveau van gegevensveiligheid te bereiken. Het gebruik van verschillende soorten opslag voor de kopieën zorgt voor risicospreiding. Eén kopie kan bijvoorbeeld worden bewaard op een online opslagserver (die snelle toegang biedt) en één kopie op een ander opslagmedium dat weinig kost en een relatief hoog veiligheidsniveau heeft.

De Preservation Criteria

Preservation Storage maakt onder andere deel uit van het OAIS-referentiemodel voor een digitaal depot (ISO 14721), waar het archival storage wordt genoemd. Binnen deze context omvat preservation storage dezelfde functies als nodig zijn om de informatieobjecten op te slaan, in opslag te houden en weer op te halen. De preservation criteria zijn bedoeld voor leveranciers van oplossingen voor digitale Preservation Storage en voor gebruikers. Dit varieert van instellingen die net beginnen met preserveren tot instellingen met de nodige ervaring. De criteria zijn ontwikkeld door Kate Zwaard, Gail Truman, Sibyl Schaefer, Jane Mandelbaum, Nancy McGovern, Steve Knight en Andrea Goethals ter voorbereiding van een iPRES 2016 workshop. (Goethals et al., 2016). Inmiddels is er al een derde versie van de criteria verschenen, we hebben ze ook vertaald. Een Google-discussiegroep is opgericht, via deze dpstorage-groep kun je jezelf op de hoogte houden.

Organisaties dienen de criteria aan te passen aan hun lokale omstandigheden. Sommige criteria zullen niet, of op onderdelen van toepassing zijn. Afhankelijk van de rol die een instelling speelt op het gebied van preservering, zullen zij de criteria vanuit een ander perspectief interpreteren. Het criterium "Gedocumenteerde toegang" is bijvoorbeeld gedefinieerd als "Zorgt voor onveranderlijke logs en/of rapporten die alle toegangen tot het systeem weergeven". Een aanbieder van diensten op het gebied van opslag zou kunnen vinden dat hij verantwoordelijk is voor het verstrekken van logs en rapporten, terwijl de koper dit criterium interpreteert als zou hij de logs en rapporten kunnen ontvangen. Elk van de criteria kan worden geïnterpreteerd als "verstrekken" of "ontvangen", afhankelijk van de rol die men heeft op het gebied van de Preservation Storage.

Opslagmedia maken onderdeel uit van de totale preservation storage, waaronder verder vallen:

- De preservation planning, die de technische ontwikkelingen volgt voor opslag en bit preservation (voorkomen van het uitvallen van bits onder andere, het zogenaamde bit rot). Dan gaat het over migratie, conversie, emulatie en de organisatie en technologie die nodig zijn om de opslag goed te laten verlopen;

- Het beheer van de informatieobjecten, waarbij de relatie tussen objecten en metadata behouden blijft;

- de administratieve werking van het systeem over hoe en waar het object is opgeslagen en de processen die door het systeem worden uitgevoerd.

Voor Preservation Storage zijn 61 criteria ontwikkeld, verdeeld in de volgende categorieën:

- Integriteit van content

- Onafhankelijke check van de integriteit

- Kostenoverwegingen

- Flexibiliteit

- Informatiebeveiliging

- Veerkracht

- Schaalbaarheid en prestaties

- Ondersteuning en transparantie.

Wanneer een organisatie een opslagmedium kiest, moet het wel de beste keus zijn, omdat anders gegevens verloren gaan of functionaliteit van informatieobjecten verdwijnt. Om die reden zal een organisatie bestanden op meerdere plaatsen opslaan, dus kopiebestanden maken van de informatieobjecten. Na een risico inventarisatie moet worden beoordeeld welke beveiligingsmaatregelen nodig zijn waarbij steeds gekeken zal worden naar de risico’s, nieuwe inzichten, technische en organisatorische mogelijkheden.

We zullen dus voor de huidige en toekomstige opslagtechnieken bij herhaling een aantal criteria moeten overwegen:

- Risicobeheer: welke risico’s loopt de organisatie op het gebied van preservering en welke invloed hebben deze criteria voor de bewaring?

- Opslag van kopiebestanden en de afhankelijkheden tussen deze bestanden: hoe kunnen we zorgen voor betrouwbare kopieën, hoeveel kopieën zijn nodig om eventuele fouten te herstellen, waar slaan we die op, hoe verhouden die zich tot elkaar? Kunnen nieuwe technieken hier oplossingen bieden voor verbetering?

- Hoe controleren we de informatieobjecten op fouten en zorgen we dat deze worden gesignaleerd en hersteld?

- Het beoordelen van de kosten van opslag: elke organisatie worstelt met budgetten. Deze kunnen onder andere leiden tot andere overwegingen op het gebied van opslag.

Een balanceeroefening wordt het genoemd in de User Guide for the Preservation Storage Criteria. En dat is het ook. Geld kan maar één keer worden uitgegeven en budgetten zijn vaak niet of nauwelijks toereikend voor de wensen die leven op velerlei gebied. Daarom dat het zo belangrijk is dat er nieuwe, goedkopere, betere, opslagsystemen, -methoden en -technieken komen. Deze dienen zich nu aan, waarover in de volgende bijdrage meer.

De volledige serie van Ad van Heijst:
blog 1: Inleiding
blog 2: Criteria voor opslag
blog 3: Magnetische opslag
blog 4: Opslag van informatie op glas
blog 5: Informatieopslag in de vorm van DNA
blog 6: Technology: that's what it's all about