1% van alle data ter wereld bewaren – wat kost dat aan CO2-uitstoot?

  • dec 2023
  • Tineke van Heijst
  • ·
  • Aangepast 28 jun
  • 548
Tineke van Heijst
Green IT
  • Caspar Almalander
  • Else Laura Rademaker
  • Verwijderde gebruiker
  • Leonoor Hamers
  • Ad van Heijst
  • Lizanne Gille - van der Zweth

Dit is blog 5 in de blogreeks over Green IT.

Er wacht ons een data-explosie: in 2026 zal de hoeveelheid data mogelijk ruim 200 keer groter zijn dan de zandkorrels op alle stranden wereldwijd bij elkaar. Deze enorme hoeveelheid krijgt hoofdzakelijk een plaats in de cloud, wat resulteert in aanzienlijke CO2-uitstoot. Dit vooruitzicht baart het vakgebied van digitale preservering grote zorgen. In deze blog onderzoeken we de hypothetische CO2-impact als slechts 1 procent van deze data behouden zou worden, zoals berekend door Matthew Addis, directeur van softwareleverancier Arkivum.

Het idee om dit te berekenen ontstond tijdens een paneldiscussie over de groei van data tijdens iPres 2023, een wereldwijd congres over digitale preservering. De discussie, getiteld 'Tipping Point' (1), onderzocht of we een punt hebben bereikt waarop de jaarlijkse datacreatie zo omvangrijk is dat we deze niet meer op een betekenisvolle[1] manier kunnen verwerken. Laat staan dat we deze data kunnen beheren en voor de lange termijn bewaren. De discussie benadrukte tevens de klimaatkosten van digitale preservering.

Nattevingerwerk

De Engelse ondernemer Matthew Addis nam deel aan deze paneldiscussie. Hij doet al enige tijd onderzoek naar de milieu-impact van digitale preservering. Naar aanleiding van de discussie, waarin opviel dat er geen concrete cijfers bestaan over de impact van het langdurig bewaren van enorme hoeveelheden data, besloot hij een hypothetische berekening te maken (2).

Op basis van zijn berekening, uitgevoerd op twee verschillende manieren, concludeerde hij dat het behouden van 1 procent van de jaarlijks gecreëerde data zou leiden tot een CO2-uitstoot van 10 MegaTon. Dit komt ongeveer overeen met de jaarlijkse uitstoot van een stad met 10 miljoen inwoners, vergelijkbaar met steden zoals Chicago – waar toevallig iPres 2023 plaatsvond.

Hoewel Matthew opmerkt dat zijn berekening 'nattevingerwerk' is, blijft het nog steeds interessant om zijn redenering via deze blog met jullie te delen.

Hoe komt hij aan deze cijfers?

Matthew gebruikte twee methoden om tot deze conclusie te komen: een top-downredenering, waarbij hij het wereldwijde datavolume en de CO2-uitstoot van de ICT-sector als basis nam, en een bottom-upbenadering, gebaseerd op daadwerkelijke metingen van de voetafdruk van de preserveringsactiviteiten van Arkivum op grote schaal.

Top-downredenering vanuit het wereldwijde volume aan data

Laten we eerst kijken naar de top-downbenadering. Matthew gaat uit van een rond getal, waarbij het totale volume van wereldwijd gecreëerde data 100 Zettabytes is. De jaarlijkse mondiale CO2-uitstoot bedraagt 40 GigaTon. Verschillende onderzoeken suggereren dat de CO2-uitstoot van de IT-sector tussen de 2 en 4% ligt. Dat zou betekenen dat de IT-sector verantwoordelijk zou zijn voor ongeveer 1 GigaTon CO2-uitstoot per jaar om de productie, verwerking, distributie en consumptie van 100 ZB data te ondersteunen.

Als we dan (bij wijze van ruwe schatting) ervan uit zouden gaan dat we hiervan 1% blijvend willen bewaren, dan zou het verwerken, opslaan, toegankelijk maken en gebruik van deze data gepaard gaan met een CO2-uitstoot van 10 MegaTon per jaar.

Getallen uit casestudy Arkivum als uitgangspunt

Wat leverde de bottom-upbenadering op? Arkivum heeft onderzoek gedaan naar de werkelijke CO2-voetafdruk van haar preserveringsactiviteiten, waarbij het energiegebruik en de geïntegreerde voetafdruk (3) van alle betrokken ICT-apparatuur zijn beoordeeld (4).

Als we kijken naar de enorme hoeveelheden data, is op dit moment de cloud de enige infrastructuur die de capaciteit heeft om deze hoeveelheid op een duurzame manier te bewaren. De CO2-uitstoot varieert afhankelijk van het datatype, datavolume, hoe het wordt gebruikt, opgeslagen en benaderd. Volgens de cijfers uit de Arkivum-casestudie komt het verwerken, opslaan en toegankelijk maken van 1 terabyte data overeen met een uitstoot van 10 kg CO2. Trek je dit door naar 1 ZB data, dan kom je ook uit op 10 MegaTon CO2-uitstoot per jaar.

Zoals aangegeven is dit een hypothetische benadering, waarover je kunt twisten. De berekening is gebaseerd op voorspelde groeicijfers, energieverbruik en de aanname van 1 procent. Bovendien zijn de cijfers voor het gemak afgerond. Hoewel het voornamelijk draait om het denkproces, zijn de cijfers desondanks indrukwekkend – en ze hebben een link naar de realiteit.

Aanbevelingen uit de paneldiscussie

De discussie tijdens iPres 2023 richtte zich op de aanpak van de groeiende databerg, terwijl het vakgebied van digitale preservering kampt met uitdagingen zoals een tekort aan personeel, vaardigheden, financiële middelen en technologie. Daarbij komen ook nog de ecologische gevolgen van ons werk. Enkele voorgestelde oplossingen waren:

- Bewaar minder en ben selectiever, zodat alleen data die echt voor de lange termijn behouden moet worden bewaard wordt en de rest wordt weggegooid.

- Accepteer dat we niet alles kunnen preserveren, hoe graag we dat ook zouden willen.

- Kijk kritisch naar de processen die we toepassen om digitale content veilig te stellen voor de toekomst. Zijn alle handelingen wel nodig?

- Stel de verwachtingen rondom toegang tot onze collecties bij. Moet echt alles, overal, tegelijk en direct beschikbaar zijn?

- Kijk naar efficiëntie in de gehele sector: maak gebruik van gezamenlijke platforms en voorkom het dubbel opslaan van collectie-items in de eigen collectie maar ook overkoepelend bij verschillende instellingen.

Tot slot

In het laatste thema van deze blogreeks zullen we dieper ingaan op bovenstaande vragen, die eigenlijk gebruikersdilemma's zijn. Deze blog had voornamelijk tot doel om de omvang van wat op ons afkomt aan digitaal materiaal en de mogelijke CO2-impact ervan onder de aandacht te brengen. Stel dat we jaarlijks een hoeveelheid data gaan bewaren die een CO2-uitstoot heeft vergelijkbaar met een stad van 10 miljoen inwoners? Kunnen we dat verantwoorden naar toekomstige generaties? Heeft onze sector een verantwoordelijkheid om dit schrikbeeld te voorkomen?

Blogserie

Deze blogpost is onderdeel van een serie blogposts over Green IT geschreven in opdracht van de gelijknamige netwerkgroep van het Netwerk Digitaal Erfgoed (NDE). Deze netwerkgroep monitort de ontwikkelingen rondom Green IT en de impact van de voortschrijdende digitalisering op het klimaat. Specifiek wordt daarbij gekeken naar de (toenemende) digitalisering binnen de erfgoedsector.

Eerder verschenen in deze blogserie

Thema: Introductie Green IT

1. De dubbele rol van IT in duurzaamheid

2. De noodzaak van een duurzaamheidskader voor de erfgoedsector

Thema: Dataopslag

3. De digitale databerg

4. De verborgen impact van cloudopslag

Gebruikte bronnen

(1) Stokes, Paul en Colbron, Karin, 'Tipping point: Have we gone past the point where we can handle the Digital Preservation Deluge?', iPres 2023 paper, beschikbaar online, laatst bekeken op 29 oktober 2023.

(2) Addis, Matthew, 'What is the carbon footprint of large-scale global digital preservation?', gepubliceerd op DPC online op 3 oktober 2023, laatst bekeken op 29 oktober 2023.

(3) Zoals in de introductie blog al beschreven is er veel discussie over de manier waarop de CO2-voetafdruk wordt gemeten. Sommige studies focussen alleen op het energieverbruik, anderen nemen de volledige ICT levenscyclus van de apparatuur mee. Wanneer de ICT levenscyclus wordt meegenomen spreken we over een ‘embodied footprint’ of 'geïntegreerde voetafdruk’.

(4) Addis, Matthew, 'Does net zero emissions from energy usage in the cloud mean carbon free digital preservation is on the horizon?, gepubliceerd op DPC online op 31 juli 2023, laatst bekeken op 29 oktober 2023.

Trefwoorden