Oproep voor vrijgeven historische persoonsgegevens als #opendata
Onderstaande open innovatie brief heb ik begin deze week verstuurd aan de directeuren van de 11 Region...
Ik heb onlangs een inventarisatie gedaan van aangeboden open data door archiefinstellingen. Ik heb hiertoe alle archiefinstellingen van de ArchiefWiki gepakt (beschikbaar voor hergebruik onder een CC-BY-SA licentie!) en heb hieraan al de mij bekende open data sets toegevoegd, waarbij OpenCultuurData.nl en OpenCultuurData.be belangrijke "leveranciers" zijn. Het resultaat is het Overzicht van open data geboden door archiefinstellingen.
Het overzicht op de website van Open Archieven is eenvoudig van opzet. Er is een opdeling in beschrijvingen, indexen en afbeeldingen (met definities onder de tabel/kaart). Per archief wordt er met een groen vlak aangegeven als er door de betreffende archiefinstelling materiaal als open data beschikbaar wordt gesteld, een rood vlak als dit (nog) niet zo is.
Doel van dit overzicht is enerzijds om de open data van archiefinstellingen zichtbaar te maken zodat deze hergebruikt wordt en anderzijds om meer open data beschikbaar te krijgen. Een organisatie wil liever niet met 3 rode vlakken in het overzicht staan, terwijl 3 groene vlakken een terechte hurray oplevert.
Het staat toch al op onze website/archieven.nl/Europeana/... ?
Om het overzicht onder de aandacht te brengen en om feedback te vragen zijn alle archiefinstellingen per e-mail aangeschreven. Uit de reacties valt op te maken dat nog niet iedereen precies weet wat open data is. Diverse archiefinstellingen reageerden op de e-mail met een opsomming welk materiaal er op hun website beschikbaar was. Of ze gaven aan dat de data online beschikbaar was op websites als archieven.nl en European Archives. Of dat de archiefbeschrijvingen gewoon in PDF formaat te downloaden waren. Reacties die mij de mogelijkheid gaven uit te leggen wat onder open data wordt verstaan, iets wat ik ook in deze blog wil uiteenzetten.
Wat is open data?
Bij open data kun je beginnen met het geven van de definitie, maar een belangrijk aspect komt daarin naar mijn smaak niet naar voren: open data is niet voor eindgebruikers maar voor ontwikkelaars!
Enthousiaste ontwikkelaars (hobbyisten, professionals, bij verenigingen of bedrijven en ook zeer serieuze onderzoekers en datajournalisten) willen applicaties (of analyses) maken met één of meerdere open data sets, hiertoe:
moet de data hergebruikt mogen worden (dus geen copyright dat standaard op werken zit en hergebruik in de weg zit maar een open licentie zoals Creative Commons die hergebruik mogelijk maakt)
moet de data te downloaden of te harvesten zijn, dus beschikbaar in machine leesbaar formaat, bij voorkeur op basis van een (open) standaard. Theoretisch kan een ontwikkelaar een website als archieven.nl 'scrapen' of PDF-jes proberen te interpreteren, maar in de praktijk is dit ondoenlijk, dus zal een ontwikkelaar 'jouw' data links laten liggen. Biedt de EAD's ter download, publiceer CSV's of geef de URL van je OAI-PMH koppeling.
moet de data beschreven zijn, zodat bekend is dat er open data wordt geboden, hoe de data in elkaar steekt en wat er mee mag (de eerder genoemde open licentie). Vaak verwijs ik naar de datablogs op Open Cultuur Data of de open data pagina van het Nationaal Archief voor goede voorbeelden.
Bij de reageerders waren ook enkele partijen met beeldbanken en partijen in een meer 'exploiterende' rol. Foto's zijn lastig qua auteursrecht, maar de meta-data (indexen) beschik je als organisatie meestal wel over, waarom deze niet als open data beschikbaar stellen? Je kunt open data ook inzetten om je omzet (zoals foto/scan verkoop) te verhogen, zoals ik al eerder in Open data en het verdienmodel schreef.
Maak er groene vlakken van!
Dus archiefinstellingen, heb je digitale informatie en staat deze op je website? Mooi, zet dan de volgende stap en biedt het voor hergebruik aan! Maak het beschikbaar als download/harvest, beschrijf het en hang er een open licentie aan. Volg het Stappenplan Open Data op de ArchiefWiki of volg de Masterclass Open Cultuur Data. Speciaal voor erfgoedinstellingen in Noord-Holland start er een Masterclass Open Cultuur Data in februari (inschrijven kan nog tot 20 januari), later in het jaar volgt er hopelijk nog een Open Cultuur Data Masterclass (alvast je interesse aangeven kan geen kwaad).
Wie weet wordt het mooie archiefmateriaal hierna ook op andere websites of in apps gebruikt en krijgt het nog meer exposure, op manieren die je zelf niet voor mogelijk had gehouden of waar je zelf geen budget/kennis voor had.
Met vriendelijke groet,
Bob Coret Initiatiefnemer van Open Archieven
PS 1. Heeft u als archiefinstelling ervaring met open data? Deel het met collega archiefinstellingen in het forum op Archief 2.0!
PS 2. In het overzicht zit ook de 'Vraag erom' knop, deze verwijst naar de pagina van de archiefinstelling op de ArchiefWiki. De ArchiefWiki is een initiatief van een groep enthousiastelingen uit het archiefveld, waar een ieder informatie kan toevoegen en corrigeren. Bekijk de pagina van uw archiefinstelling even om te controleren of alle adresgegevens, openingstijden, sociale media en dergelijke nog kloppen.
Reacties
Bob, wij (=Regionaal Archief Tilburg) werken aan de twee rode knoppen. In 2015 kun je die groen gaan maken. Ik houd je op de hoogte!
Overigens een heel mooie slogan: open data is niet voor eindgebruikers maar voor ontwikkelaars! Daar ga ik mijn voordeel mee doen!
Mooi initiatief en overzicht, Bob!
Zoals je weet loopt het BHIC niet voorop in de hele open data beweging, maar bungelen we ook niet helemaal achteraan. Tot nu toe beperken onze inspanningen zich echter doorgaans tot gerichte verzoeken, zoals recentelijk medewerking verlenen aan de ontwikkeling van een historische geocoder door het aandragen van een gegevensbestand. Maar hopelijk breiden we de komende tijd ons open data aanbod uit.