Jaarplan Kennisplatform E-depot
Beste leden, onlangs heeft de kerngroep van dit kennisplatform een eerste bijeenkomst gehad en daar z...
Ons eerste webinar zit er op en zoals zo vaak: achteraf lijkt alles makkelijker.
Na een te lange periode van inactiviteit was het Kennisplatform E-Depot begin dit jaar vol enthousiasme om weer een aantal bijeenkomsten te organiseren. Omdat een aantal van de voorgestelde onderwerpen nogal raakte aan de toegankelijkheid van data besloten we hiervoor samen op te trekken met het Kennisplatform Toegang tot Data. Terwijl Brabant al in lockdown was, planden we in gedachten al vier sessies in en een beoogde locatie werd benaderd. Die locatie hield de boot echter af vanwege te verwachten restricties en vlak daarna bleken ze daar groot gelijk in te hebben: het Grote Thuiswerken was begonnen en al onze aandacht ging uit naar het aanpassen van de eigen werkzaamheden aan de nieuwe situatie. De plannen gingen weer even de ijskast in.
Met weinig concrete vooruitzichten wanneer alles weer ‘normaal’ zou worden, moet je op enig moment toch gaan bepalen of je vasthoudt aan een fysieke bijeenkomst of dat je ‘digitaal gaat’. Het werd het tweede, en gelukkig maar, want enkele maanden later is er eigenlijk nog maar weinig echt ten goede gekeerd. We werden hierbij ook gestimuleerd door Harm Pieters van het Nationaal Archief, die ook meer werk wilde gaan maken van het inzetten van webinars voor KIA-bijeenkomsten. De digitale overlegomgeving van het Nationaal Archief, WebEx, bleek zich hier bovendien prima voor te lenen.
Dan is het altijd nog maar de vraag of je beoogde sprekers wel zin hebben om een webinar te houden (ja dus) en of er wel voldoende deelnemers op af komen (ja dus) en zodoende konden we gisteren aan de bak.
Een digitale bijeenkomst is toch echt wel wat anders dan een ‘echte’. Een verhaal overbrengen kan ook prima online, al mis je de directe feedback van je publiek. Het coördineren van de vragen blijkt echter toch nog best een hoop gedoe en iemand hiervoor aanwijzen was ook echt wel nodig. En dat is helaas ook wel de makke van welke vorm van online bijeenkomsten dan ook: het werkt wel, maar het vraagt meer coördinatie en daarmee verdwijnt de spontaniteit. Ook het sociale aspect van een bijeenkomst komt nauwelijks tot zijn recht, want ook dat laat zich lastig centraliseren. Tegelijkertijd is de laagdrempeligheid natuurlijk een groot pré: door alle bijkomende reistijd kon een sessie van effectief twee uur voor sommigen al snel een hele werkdag kosten. Ik zie voor de toekomst dus wel heil in een afwisseling van online en offline bijeenkomsten. Zover zijn we echter nog niet, voorlopig gaan we nog even uitsluitend online verder, want de bijeenkomst van gisteren smaakt naar meer.
Want interessant was het zeker. De ervaringen die het HCO inmiddels heeft opgedaan met enerzijds het beschikbaar maken van kaarten, maar zeker ook met het geo-referencen van veldnamen (pre-kadastrale aanduidingen voor locaties) waren zeer bruikbaar voor andere archiefdiensten die hier mee aan de slag willen. En ook het webinar van Erfgoed Leiden over de opname in hun E-Depot van ruimtelijke plannen was erg verhelderend en het bood mij in ieder geval aanknopingspunten om hier zelf verder mee te gaan.
Ter afsluiting: nogmaals dank voor onze sprekers: Jos Mooijweer (excuses dat ik je naam verkeerd had) van het Historisch Centrum Overijssel, Egbert Griffioen van MapGear, Marita Langerak van Van Kaliber en Relinde Reuvekamp van Erfgoed Leiden en Omstreken.
Zoals beloofd vinden jullie bijgevoegd de sheets van Relinde en Marita. Van HCO en MapGear volgt nog een factsheet.
Edit 30-09 en ook het beloofde factsheet is toegevoegd.
Groet,
Wouter
Reacties
Dank voor de organisatie van deze interessante webinar. Helaas kwam mijn vraag als laatste en haperde de verbinding, zodat de strekking niet duidelijk was. Daarom leg ik de vraag hier nogmaals neer, zodat iedereen die kan volgen.
Erfgoed Leiden heeft gekozen voor WARC om de plannen binnen te halen. Het was mij niet duidelijk hoe deze "container" duurzaam in een e-depot kan worden opgenomen.
Het antwoord was dat het een bestandsformaat was, maar net als ZIP is dat formaat niet zomaar duurzaam op te nemen: het kan alleen dienen voor transport en de afzonderlijk erin opgenomen onderdelen zullen eruit moeten worden gehaald om ze duurzaam te beheren. In een ZIP kan immers van alles zitten, dus ik neem aan in een WARC ook.
Hoe gaat het e-depot dan om met bv. vectorkaarten met meerdere lagen? Worden die bv. in GML opgeslagen?
Hallo Dick,
ik begrijp je bezwaar. Toch is een WARC-bestand in dezen naar mijn mening wel iets anders dan een ZIP-bestand. Die tweede is ook niets anders dan een container en dient in principe voor simpeler transport dan wel voor compressiedoeleinden, terwijl een WARC-bestand een archiefwaardig formaat is, dat bovendien ook geschikt is om te presenteren. Dat komt volgens mij ook wel zo'n beetje overeen met wat Pepijn Lucker hier een paar jaar geleden over schreef.
WARC is inmiddels de de facto standaard voor webarchieven. Als je die container uit elkaar trekt en de bestanden afzonderlijk gaat opslaan en beheren, dan betwijfel ik overigens of je nog een raadpleegbaar bestand overhoudt.
Dat neemt inderdaad niet weg dat de bestandsformaten in die container verouderd kunnen raken. Ik heb vooralsnog geen idee hoe je hier vanuit een preserveringsstandpunt het beste mee om kunt gaan, wellicht moet je dan de raadpleegsoftware gaan preserveren?
Groet,
Wouter
Beste Wouter en Dick,
Wat duurzame raadpleegbaarheid van het WARC-formaat betreft vond ik het toch verontrustend toen ik op een studiedag over websitearchivering hoorde vertellen dat één van de weinige beschikbare raadplegingstools voor WARC, Openwayback, enkel overweg kan met de recentste versie van WARC conform ISO 28500/2017, maar niet met de oudere versie conform ISO 28500/2007. Als beschikbare software nog niet in staat is om één versie terug te ondersteunen gaan we dan op termijn in staat zijn om de nodige software aan de praat te houden of te emuleren voor het WARC-formaat in zijn verschillende versies?
Zie
https://www.projectcest.be/wiki/Publicatie:Project:_Catching_the_digital_heritage#Wget_versus_Heritrix_.28met_handleidingen.29 en
https://www.liberas.eu/slotevenement-catching-the-digital-heritage-workshop-website-archivering/
NB: het zou een goede zaak zijn mochten er tools worden ontwikkeld waarmee je WARC naar HTML-bestanden kunt omzetten en omgekeerd.
Hartelijke groet
Willem
Hallo Willem,
dat is inderdaad een zorgwekkende constatering. Ik houd me altijd maar vast aan de hoop dat als we als wij als beroepsgroep blijven hameren op standaardisatie, dat we daarmee de bruikbaarheid uiteindelijk wel kunnen borgen, maar dat is dus geen garantie.
Een discussie die waarschijnlijk die hier misschien niet helemaal thuis hoort, maar biedt HTML betere toekomstkansen? Dan moet je namelijk naar mijn mening HTML als archiveringsstandaard gaan aanwijzen, en ik heb eigenlijk geen idee welke ellende je je dan op de hals haalt.
Groet,
Wouter
Beste Willem,
Volgens mij gebeurde websitearchivering al enige tijd met HTML, want dat is slechts platte tekst met gestandaardiseerde codes (duurzaam). Vroeger archiveerde het stadsarchief Rotterdam met het gratis programma HTTrack en dat gebruik ik ook nog wel. Voordeel is dat de samenhang blijft bestaan en dat alle op een website gebruikte formaten duidelijk te onderscheiden en dus te preserveren zijn. HTML is een aanbevolen standaard volgens het Forum Standaardisatie.
Groet,
Dick
Dag Wouter
Wat mij betreft is HTML een geschikt archiveringsformaat. Het is een officiële standaard, het is wijdverspreid en kent een brede ondersteuning. Het is ook een eenvoudig formaat want eigenlijk niet meer dan platte tekst met markeringen en codes. Bovendien lijkt de compatibiliteit van hedendaagse browsers met oudere versies van HTML vooralsnog geen probleem te vormen.
Dat een archiefkopie van een website meestal bestaat uit veel met elkaar gelinkte HTML-pagina's in combinatie met veel hulpbestanden in diverse formaten schept natuurlijk wel enkele bijkomende uitdagingen. Als toekomstige preserveringsacties zoals bijvoorbeeld migratie van verouderde formaten nodig zouden zijn, ga je immers niet alleen verouderde formaten moeten migreren maar er ook voor moeten zorgen dat linken blijven werken of reconstrueerbaar zijn. Gezien de open en gestandaardiseerde opbouw van HTML lijkt me dat echter geen onoverkomelijk probleem. Bij containerformaten als WARC lijkt me dit problematischer. De diverse bestandsformaten zitten immers in het containerbestand 'verborgen'. Hoe ga je dan weten of er formaten tussen zitten die niet langer ondersteund zijn? Hoe ga je er voor zorgen dat ze worden getraceerd en zo nodig gemigreerd? Om maar te zeggen dat ik me toch wel meer zorgen maak over WARC dan over HTML.
Hartelijke groet
Willem