Monitoring van opslagtechnieken 4: opslag van informatie op glas

  • jan 2023
  • Ad van Heijst
  • ·
  • Aangepast 25 okt
  • 113
Ad van Heijst
Preservation Digitaal Erfgoed
  • Monica Preller
  • Lotte Wijsman
  • Leonoor Hamers
  • Mathé van der Velden
  • Gerdine Kruizinga

Samenvatting

Dit is het vierde artikel over het monitoren van bestaande en innovatieve opslagtechnieken. Dit project maakt deel uit van het NDE-programma Preservation Watch. De resultaten worden gepubliceerd als blogposts op het KIA platform preservation en via de KIA Kennisindex Preservation Watch gedeeld.

Het eerste artikel ging over de uitdagingen waarmee de langetermijnbewaring wordt geconfronteerd. Het tweede artikel over preservation storage en de daarvoor ontwikkelde criteria . In de derde blog werd gefocust op verandering in het denken over de opslag op magnetische dragers: van block storage naar object storage. Deze verandering is actueel nu we ons bewust worden van de problematiek van de toegankelijkheid van informatieobjecten, het toenemende energieverbruik en de daarbij behorende CO2-uitstoot die bij het beheer van digitale informatie komen kijken. Dit artikel gaat over de opslag van informatie op glas.

Bedrijfssystemen beheren steeds grotere hoeveelheden heterogene gegevens. Deze heterogeniteit betekent dat één enkele storage oplossing niet de beste aanpak is. In plaats daarvan is het beter om de verschillende soorten gegevens op te slaan, gericht op gebruikspatronen. We spreken dan over polyglot persistence: de oplossing die een mix van digital data storage technologieën gebruikt.

Het selecteren van de juiste data storage voor verzamelingen van informatieobjecten is een belangrijke ontwerpbeslissing. Voorafgaand aan de keuze moet worden onderzocht welke behoeften een organisatie heeft bij de opslag en het terugvinden van informatieobjecten. Data storage wordt vaak gecategoriseerd op basis van de manier waarop gegevens worden gestructureerd en de soorten bewerkingen die worden ondersteund. Op basis daarvan overweeg je vervolgens een bepaalde data store binnen die categorie, op basis van factoren als functieset, kosten en beheersgemak.

Een organisatie zal dus altijd een mix toepassen van meerdere storageoplossingen, hebben we al gezien in het vorige artikel. De hot data moet steeds beschikbaar zijn. Voor veel informatieobjecten mag de toegang echter wel wat langer duren. Daarvoor zijn inmiddels alternatieve oplossingen mogelijk om informatie duurzaam op te slaan. In dit artikel kijken we wat op het gebied van de optische informatiedragers speelt.

Optische informatiedragers zijn er al heel lang, om er enkele te noemen: denk aan de obelisken, de grotten van Lascaux (die onlangs nog nieuwe geheimen prijsgaven), graf- en gedenkstenen, papyri, perkament, permanent papier en microfilm. Duurzame vormen van informatieopslag die de tand des tijds glansrijk doorstaan. In Nature werd een aardig overzicht gegeven van de manier hoe de optische informatieopslag door de eeuwen heen zich heeft ontwikkeld: het artikel is zeer aan te bevelen in deze context.

Digitalisering heeft geleid tot een enorme verandering in onze omgang met informatie. In 2020 produceerden we per hoofd van de wereldbevolking 1,7 MB aan digitale gegevens per seconde. Hoe houden we die enorme gegevensmassa toegankelijk en bruikbaar? Het adagium ‘write once, read many times’ is immers in veel gevallen ‘write once, read maybe’. We zouden in meerdere opzichten winnen wanneer we de minder frequent gebruikte informatie zouden opslaan in ‘cold storage’, waar ze -na een laatste review voorafgaand aan de opslag- ook niet meer gewijzigd kunnen worden. We moeten dus beter overdenken wát we willen bewaren, voor welke periode en hóe we de informatie willen beschikbaar houden. Dit betekent dat we een informatiearchitectuur moeten opzetten, waarin we zo veel mogelijk vooraf vaststellen welke informatie we wanneer denken nodig te hebben, hoe lang het terugvinden mag duren en tegen welke kosten en risico’s we het beheren. En, zoals in de sport de records al worden gerekend in duizendsten van seconden, zullen we dat ook doen in de prestaties van informatiesystemen.

Daarbij zullen we risico’s bij het informatiebeheer willen uitsluiten. De top van de informatiepiramide - de hot data- is bijzonder kwetsbaar en staat aan steeds agressievere hackingpogingen bloot, zoals onder andere bleek bij de Universiteit van Maastricht die daarover volledige openheid van zaken heeft gegeven. Van recenter datum zijn de hacks van de Vlaamse steden, onder andere Antwerpen en Diest. Data dienen daarom optimaal beschermd te worden. Onnodig, overtollig materiaal dient zo spoedig mogelijk te worden verwijderd en zaken die niet (meer) hot zijn kunnen op andere media worden dus het beste opgeslagen als cold data. Hiervoor dient een bedrijfsbrede strategie te worden opgezet in samenwerking tussen ICT, informatieprofessionals en de informatieproducenten. Voor deze ‘cold’ opslag zijn meerdere alternatieven voorhanden. Optische opslag op glasplaten is er een van.

Optische, eeuwigdurende informatieopslag gebruikt lasertechniek om informatie op te slaan en op te halen. Enkele voorbeelden van optische opslagmedia zijn: de CD, de DVD en Blu-Ray. Het principe is bij deze media hetzelfde: een schijf met een spiraal van ingebrande putjes en bultjes, de enen en nullen die een binair patroon vormen. Een laserstraal volgt dit patroon. De media worden beschreven met een sterke laser die het patroon van putjes en bultjes aanbrengt. Het uitlezen gebeurt dan met een optische microscoop. Optische schijven bieden snelle toegangstijden door hun hiërarchische bestandsindeling. Het is een efficiënte manier om grote hoeveelheden gegevens snel op te slaan en op te halen. IBM noemt de volgende voordelen van optische opslag:

- Duurzaamheid: de levensduur is langer dan 50 jaar;

- Archiefopslag: WORM (Write once, read many times) voor onveranderbaar archiveren van grote hoeveelheden gegevens: als een nieuwe versie wordt bijgeplaatst, blijven vorige versies bestaan en eens geschreven is altijd lezen;

- Standaardisatie: de optische UDF-media (het Universal Disc Format) kan worden gelezen door elk besturingssysteemplatform dat UDF ondersteunt;

- Directe toegang: door deze directe toegang is het ophalen van relevante gegevens op verzoek eenvoudiger.

Inmiddels wordt gezocht naar opslagmethoden die een onbeperkte levensduur hebben, dus zelfs langer dan de hierboven genoemde 50 jaar. De Universiteit van Southampton kwam in 2013 met een -experimentele- oplossing van altijddurende 5D-storage in een nanofotonenstructuur. Microsoft experimenteert met optische opslag op glazen platen: het project Silica, dat werd ontwikkeld samen met Warner Brothers: hierbij mag de film over Superman niet onvermeld blijven. Ook Hitachi is sinds 2012 met deze ontwikkeling bezig en Panasonic brengt sinds 2016 een optische freeze-ray opslagoplossing op de markt, waaraan Facebook/Meta heeft meegewerkt. Facebook stelt zich als doel om alles wat gebruikers ooit hebben gedeeld op Facebook beschikbaar te houden. Het oproepen van oudere, nooit gebruikte gegevens zal wel wat langer duren, maar is voor de gebruiker in wachttijd nog steeds nauwelijks merkbaar. Er is een archival disc standaard, ontwikkeld door Panasonic en Sony; een eerste versie in 2013. De derde generatie uit 2019 kan 2.900 TB aan data opslaan: we praten over ongelofelijk grote hoeveelheden data!

Ant Rowston van Microsoft Research Cambridge zegt het als volgt in een instructiefilmpje (aanrader!): “we moeten echt onze opslagsystemen en technologieën fundamenteel opnieuw bedenken en we denken dat glas het ideale medium is voor deze technologie.” Hoe dit dan werkt in de Project Silica Library ziet u in het prototype: het filmpje zegt weer meer dan 1000 woorden.

De glazen platen worden geladen met data op de bekende manier: het branden van putjes door lasers die ook chirurgen gebruiken voor oogoperaties. Hiermee worden minuscule geometrische vormen – voxels genaamd – in glas gebrand in wel 74 lagen. Deze driedimensionele equivalent van de pixel bevat de bits. Het teruglezen gebeurt met de bekende optische techniek: door weerkaatsing van licht en een microscoop. De levensduur van een glasplaat wordt geschat op minimaal 1000 jaar en de platen zijn bestand tegen zeer hoge en lage temperaturen.

Gaan we nu meteen glasplaten kopen? De ontwikkelingen van de techniek gaan supersnel, zie deze verschillende timelines van het Computer History Museum in Boston. Al eerder is deze techniek commercieel verkocht: de glasplaat is uitgevonden in 1958 en werd in de zeventiger jaren op de markt gebracht als laser disc: het medium was zijn tijd ver vooruit. In de jaren tachtig had onder meer de gemeente Eindhoven een optical discsysteem van Wang Laboratories en Toshiba leverde aan meerdere organisaties een jukebox met glazen discs, waarop informatie kon worden weggeschreven. Commercieel was de laser disc een flop, ook al omdat de formaten waaronder de informatie werd weggeschreven, merkgebonden waren. Belangrijk is dus dat er een standaard komt voor -onder andere- de manier van opslag: wat wordt bijvoorbeeld de vorm en het formaat van de glasplaten? Wat wordt het beschrijvings- en afleesformaat? Hoeveel verschillende lagen beschrijving wordt standaard?

Opslag van cold data wordt bij gebruik van optische data veel goedkoper. Eenmaal opgeborgen verbruiken de data geen energie of koelwater: een hard disk daarentegen vraagt zelfs in slaapstand nog enig vermogen. Daarbij zijn optische opslagmedia robuust en bieden zij bescherming tegen wijziging van de gegevens: de systemen zijn read-only. Het is goed mogelijk controles uit te voeren op de integriteit van de gegevens. En een doorontwikkeling naar massa-opslag (op dit moment al 350 TB per glasplaat) is ingezet.

Maar is deze techniek inmiddels te koop? Een onderzoek op Internet levert hierover nog niet veel informatie, al is het dat de grote leveranciers dicht bij een toepassing zijn. De ontwikkelingen gaan echter razendsnel en zijn veelbelovend zoals blijkt uit deze studie.

Optische opslag op glas is een levensvatbaar alternatief voor cold storage waarmee we in de toekomst nog veel te maken zullen krijgen. Op dat moment kunnen we ervoor zorgen dat minder informatie op schijven draait en hebben we eigenlijk weer de oude situatie terug, waarbij we een dynamisch, semi-statisch en statisch archief beheren en informatie ‘just a click away’ is en blijft.

De volledige serie van Ad van Heijst:
blog 1: Inleiding
blog 2: Criteria voor opslag
blog 3: Magnetische opslag
blog 4: Opslag van informatie op glas
blog 5: Informatieopslag in de vorm van DNA
blog 6: Technology: that's what it's all about