Oproep voor vrijgeven historische persoonsgegevens als #opendata

  • mei 2014
  • Bob Coret
  • ·
  • Aangepast 27 jun
  • 5
  • 120
Bob Coret
KIA Community
  • Wim van Dongen
  • Verwijderde gebruiker
  • Christian van der Ven

Onderstaande open innovatie brief heb ik begin deze week verstuurd aan de directeuren van de 11 Regionale Historische Centra en het Nationaal Archief, tezamen het Convent. Omdat de oproep ook van belang is voor andere archiefinstellingen plaats ik deze open brief ook hier op Archief 2.0.

Geachte directeur,

Waar Genlias – een zoekmachine voor historische persoonsgegevens – een dure en verouderde oplossing leek, is de opvolger WieWasWie noch goedkoper noch innovatief. De gekozen organisatie­vorm met "veel kapiteins op één schip", een qua visie en IT-kennis zwakke exploitatiepartner en een traditioneel beheer contract met IT leverancier dragen niet bij aan innovatie. Deze situatie lijkt mijns inziens helaas erg op Genlias; de website die in de 15 jaar dat deze bestond niet is doorontwikkeld. Deze rem op innovatie is voor zowel archiefsector als archiefgebruikers betreurenswaardig.

Ik realiseer mij dat dit een hard oordeel is. Een oordeel dat voortkomt vanuit mijn kennis en ervaring als genealoog, informaticus, ondernemer en consultant. U hoeft dit oordeel niet met mij te delen, wel hoop ik dat u open staat voor innovatie en dit stimuleert.

Als directeur van een grote archiefinstelling heeft u namelijk de sleutel tot innovatie in handen: de meta-data van akten (oftewel nadere toegangen). Deze grondstof kunt u aanbieden voor hergebruik, oftewel bestempelen als open data. Creatievelingen – hobbyisten, bedrijven, verenigingen, programmeurs en onderzoekers – kunnen dan aan de slag met het mooie materiaal. Dit kan leiden tot innovatieve toepassingen in de vorm van websites, apps of linked open data, mooie analyses en nieuwe inzichten, kwaliteitsverbetering, meer website bezoek en/of meer verkoop uit de eigen webwinkel!

Of zoals Neelie Kroes (Europees Commissaris voor de Digitale Agenda) het zei: "Opening up data that is already collected, that taxpayers have already paid for, is right for transparency, and is the cheapest way we know to unlock innovation potential. It’s the best way we know to help Europeans create the jobs and economic growth that we so desperately need."

Omdat uw archiefinstelling deelnemer is in WieWasWie is de technische kant van de openstelling van de data al op orde: u beschikt over een OAI-PMH koppeling op basis van het Archive 2 All model. De eerste stappen die gezet kunnen worden zijn dan ook eenvoudig: maak een nieuwsbericht op uw website of een datablog op de website van Open Cultuur Data, waarin u aangeeft dat de historische persoonsgegevens beschikbaar zijn voor hergebruik, van welk adres de gegevens geharvest kunnen worden en onder welke voorwaarden dit gebeurt (bijvoorbeeld een Creative Commons licentie).

Kijk naar archiefinstellingen als Erfgoed Leiden en omstreken, Gemeentearchief Ede, Streekarchief Langstraat Heusden Altena, Gemeentearchief Tholen en het Nationaal Archief. Deze archieven hebben reeds de strategische keuze genomen om historische persoonsgegevens als open data te bieden. En archiefinstellingen als Regionaal Archief Tilburg, Stadsarchief Enschede en Gemeentearchief Schouwen-Duiveland hebben aangegeven bezig te zijn om de historische persoonsgegevens als open data beschikbaar te stellen.

Het bieden van open data kan 'concurrentie' betekenen voor WieWasWie (en de eigen website). Maar concurrentie is goed voor ontwikkeling! In het 'ergste' geval ontstaan alternatieven die mooier, slimmer en beter zijn. In dat geval kunt u overwegen om te stoppen met uw jaarlijkse bijdrage voor WieWasWie of om minder investeren te in de eigen website waardoor u geld overhoudt voor andere initiatieven. Wellicht zullen de innovaties door open data een prikkel vormen die de exploitatie- en IT-partij van WieWasWie aanzetten om ook te volgen en te verbeteren.

Mijn schrikbeeld is dat we over 15 jaar geen stap verder zijn gekomen. Al het mooie openbare materiaal, waaronder een grote hoeveelheid historische persoonsgegevens, dat grotendeels door vrijwilligers en met publiek geld is geïndexeerd, kan niet tot innovatie leiden als het opgesloten blijft in de archiefsystemen en er vastgehouden wordt aan een gesubsidieerd data-monopolie.

Wilt u innovatie? Zet de historische persoonsgegevens vrij als open data!

Met vriendelijke groet,

ir. Bob Coret

Reacties

5 reacties, meest recent: 10 februari 2015
  • Beste RHC/NA directeuren,

    Het is alweer 5 maanden geleden dat ik jullie een persoonlijke brief stuurde met daarin de oproep voor het vrijgeven van historische persoonsgegevens als open data. Ik weet niet zeker of jullie de brief ontvangen hebben, daar ik tot nu toe nog geen enkele officiële reactie heb mogen ontvangen, zelfs geen ontvangstbevestiging. Maar in de wandelgangen heb ik wel vernomen dat het punt op de agenda heeft gestaan (en staat?) van het Convent. Ik ben benieuwd wat de stand van zaken is in jullie open data debat! Mochten er nog vragen zijn, jullie hebben mijn contactgegevens. Maar wellicht nog beter: voer het debat in de openheid, bijvoorbeeld hier op Archief 2.0.

    mvg, Bob Coret

    Bob Coret
  • Dank Bob, voor je inspanningen om het onderwerp (weer) op de kaart te zetten. De dialoog aangaan en samen stappen zetten om data houdbaar, vindbaar, zichtbaar èn herbruikbaar te maken, daar moeten we aan werken. Ik hoop dat de werkconferentie Archieven Open! op 25 maart daar ook een bijdrage aan kan leveren.

    Verwijderde gebruiker
  • In het kader van de open data voorlichting een tweetal reacties op de brief.

    De overheid stelt zo veel mogelijk (eigen) data vrij beschikbaar, zodat hergebruik kan leiden tot de ontwikkeling van diverse nieuwe toepassingen. Een mooi voorbeeld van zo'n toepassing is het Archieven Portaal Europe (APE).

    APE is gebaseerd op data die archieven aan dit platform aanleveren, maar deze data wordt door de archieven niet vrij aan een ieder beschikbaar gesteld voor hergebruik, dus APE is niet gebaseerd op open data. De data op APE mag hergebruikt worden, maar ik zie nergens een beschrijving of download/harvest mogelijkheid, dus APE is ook geen bron van open data. Zonder verder een oordeel te geven over APE, lijkt mij APE niet het juiste voorbeeld in het kader van open data.

    De RHC's en het Nationaal Archief hebben herbruikbare open data niet in dezelfde mate beschikbaar. De informatie die beschikbaar is, wordt op de diverse websites van de RHC's en het NA aangeboden.

    Allereerst de term 'herbruikbare open data'... een pleonasme, of is er zoiets als niet-herbruikbare open data (hersenkrakertje :-). Ten tweede, als informatie wordt aangeboden op een website is het nog geen open data (data downloadbaar/harvestbaar in beschreven en machineleesbaar formaat dat onder open licentie mag worden hergebruikt). Tenslotte,, de eerste zin zou in de volgende vorm het probleem beter beschrijven: "De RHC's en het Nationaal Archief hebben veel (openbare) data beschikbaar maar stellen deze nog niet in dezelfde mate beschikbaar als open data.". En hier verwacht ik actie!

    Bob Coret
  • Bob, ik wil graag even reageren op je opmerkingen over het Archieven Portaal Europa (APE) en open data:

    APE is afhankelijk van de manier waarop archiefinstellingen hun data (kunnen) aanleveren. Je hebt gelijk als je stelt dat dit tot nu toe vooral via een rechtstreekse, dus 'gesloten', data verbinding gaat (o.a. via het handmatig uploaden van zipbestanden), maar sinds de implementatie van de volautomatische harvesting en verwerking van data in het APE Dashboard op basis van OAI-PMH, wordt de laatste tijd juist deze manier van aanleveren steeds meer gebruikt.

    Toegegeven: ook een OAI-PMH verbinding is niet per definitie een 'open data' verbinding. Zo kun je bijvoorbeeld je OAI-PMH repository met een wachtwoord of op IP-adres 'beveiligen' en dus op die manier data exclusief aan een of enkele partijen aanleveren (o.a. het geval voor de manier waarop de RHC's data aan APE leveren), maar toch maakt APE steeds meer gebruik van OAI-PMH repositories die wél volledig 'open' zijn, zoals bijvoorbeeld die van het Nationaal Archief. In die zin klopt m.i. het statement wel dat APE een voorbeeld is in het kader van open data.

    Maar natuurlijk kan APE meer betekenen in het kader van open data. Je stelt terecht dat het op dit moment niet mogelijk is om APE data te downloaden of te harvesten. Dit regelen staat echter wel op ons 'to do'-lijstje. Het APE team is van plan de in het portaal verzamelde data in het basis format apeEAD 'open' ter beschikking te stellen voor iedereen die daar iets mee wil, maar uiteraard wel – in overeenstemming met het APE concept dat de data aanbieder steeds 'in control' is – als de deelnemende archiefinstellingen (lees: content eigenaren), dat willen. Deze functionaliteit zal in het APE Dashboard dan ook op dezelfde manier worden geïmplementeerd als de al beschikbare mogelijkheid voor doorlevering van data naar Europeana: de deelnemende archiefinstelling zal dit desgewenst zelf in het APE Dashboard moeten activeren.

    Wim van Dongen

Trefwoorden