Vernietigen van data die zijn gebruikt voor wetenschappelijk onderzoek

  • jun 2021
  • Annemarie Meijer
  • ·
  • Aangepast 27 jun
  • 6
  • 46
Annemarie Meijer
InformatiehuishoudingOverheden
  • Violet
  • Nicole Fielmieg
  • Rens Ouwerkerk
  • Chido Houbraken
  • Dick Bunskoeke

In de Archiefwet is het vernietigen van informatie een verplichting, geen recht. Maar wat te doen als (te vernietigen) data (en we werken tegenwoordig bijna uitsluitend nog met data) wordt (her-)gebruikt voor wetenschappelijk onderzoek? De wetenschap schrijft voor dat onderzoeken controleerbaar en herhaalbaar moeten zijn. Enerzijds om te toetsen of het onderzoek juist is uitgevoerd, anderzijds om het onderzoek met de dezelfde data te kunnen herhalen. Dit impliceert een blijvende bewaring. Zeker nu we bij de overheid steeds meer gaan doen met data, bv datagedreven werken, wordt dit vraagstuk interessant voor de archivaris van dienst.

Reacties

6 reacties, meest recent: 5 juli 2021
  • Dat is inderdaad een interessant punt, maar wat nu als we als overheid niet op de hoogte zijn alle hergebruik van onze data? Dan heb je als archivaris wel een probleem.
    Mijn stelling is dat we als overheid niet verantwoordelijk kunnen zijn voor gegevens die elders een nieuwe functie hebben gekregen, maar dat we onze data uitgaande van de functie in onze eigen processen beheren en dus ook bewaren of vernietigen.

    Dick Bunskoeke
  • @ Dick Bunskoeke: Misschien heb je wel gelijk. Echter: het is in oorsprong "onze" data. Dus ook onze verantwoordelijkheid om te weten aan wie we de informatie beschikbaar hebben gesteld. Voor jouw oplossing zou m.i. vervreemding van de informatie moeten plaatsvinden. En daar komt bij : met datagedreven werken, gebruiken we zelf ook onze data voor andere doeleinden dan ze oorspronkelijk zijn bedoeld. En ook daarvoor geldt dat er op zijn minst een andere bewaartermijn is en soms zelfs blijvende bewaring. Hierbij is ook ook nog vaak sprake van ketenwerking met andere overheden of zelfs private partijen. Ik noem als voorbeeld de droogtemonitor die vorig jaar is gemaakt, om per perceel in Nederland de mate van uitdroging (of vernatting) te kunnen inzien. Deze werkt met data van RVO en waterschappen, boeren en andere partijen.

    Annemarie Meijer
  • @Annemarie Meijer
    Je hebt gelijk dat we ons bij het beschikbaar stellen van data moeten realiseren wat de consequenties kunnen zijn. Helaas gebeurt dat vrij weinig en een disclaimer met "deze data wordt na 5 jaar vernietigd" heb ik nog nooit zien staan...
    Daarnaast heb je er niet altijd zicht op wie er over "onze" data kan beschikken. Die wordt ook verder verspreid door anderen zonder dat we daar zelf van op de hoogte zijn.
    Daarom pleit ik ervoor dat de gebruiker zelf actie onderneemt als hij dat nodig acht, bv. na het lezen van die disclaimer, waarna overheden eventueel tot bewaring kunnen besluiten.

    Voor wat betreft (her)gebruik door overheden zelf vallen data nog steeds onder wat ik onze eigen processen heb genoemd: daar zijn we verantwoordelijk voor. Als je in ketens werkt moeten daar altijd afspraken over worden gemaakt, want anders weet je niet wie wat, waar, wel of niet bewaart en is reconstructie niet mogelijk. Zijn er private partijen bij betrokken, dan moet een overheid instaan voor de particuliere data als die behouden moet blijven.

    Dick Bunskoeke
  • De verplichting tot vernietiging is alleen van kracht als het als zodanig gewaardeerd is in een Selectielijst.
    Als de omstandigheden/inzichten wijzigen, waardoor informatie niet meer vernietigd moet worden (of een langere bewaartermijn moet krijgen), dan moet de Selectielijst aangepast worden. De Selectielijst is niet heilig, ook al wordt dat ding vaak met een hoofdletter geschreven.

    Als de Selectielijst niet op korte termijn te wijzigen is, dan bestaat er de optie om eea gemotiveerd uit te zonderen van vernietiging, totdat de lijst is aangepast.

    (Overigens toont jouw voorbeeld weer aan hoe volslagen achterhaald het huidige vernietigingsconcept is. Ik hoop dat we dat in de nieuwe Archiefwet kunnen rechttrekken.)

    Chido Houbraken
  • Een en ander hangt er denk ik een beetje vanaf hoe de data voor het onderzoek beschikbaar wordt gesteld.

    Onze gemeente stelt diverse datasets als open data beschikbaar. In dat geval weet je niet wie wanneer en waarom de data gebruikt. Onze archivaris is van mening dat alles wat als open data wordt aangeboden permanent te bewaren is (in afwijking van de huidige gemeentelijke selectielijst). Vaak wordt deze open data ook niet rechtstreeks vanuit de bron aangeboden, maar wordt er eerst een afslag gemaakt die vanuit een aparte omgeving (geanonimiseerd en/of geaggregeerd) wordt gepubliceerd. Feitelijk is er dan sprake van een nieuwe dataset met een nieuw doel en daarmee in potentie ook met een andere bewaartermijn dan in de bron wordt gehanteerd.

    Daarnaast wordt er intern onderzoek gedaan, onze eigen onderzoekers halen dan een dataextract uit de bron(nen) en bewerken die eerst. Bijvoorbeeld combineren, verrijken, anonimiseren, aggregeren. Zo ontstaat er ook weer een 'nieuwe' dataset die op maat is gemaakt voor het onderzoek en die bij het uiteindelijke onderzoeksrapport bewaard kan worden.

    Dit zijn qua beheer en archivering de makkelijke varianten, maar op dit moment wel nog de meest voorkomende heb ik de indruk. Maar als je data meer en meer rechtstreeks vanuit de bron beschikbaar stelt, dan zul je het beheer op het niveau van het datamodel moeten regelen in plaats van op het niveau van het informatiemodel. Informatie is dan immers een view op data en wordt niet vastgelegd in een 'hard' beheerbaar informatieobject dat in de context van een dossier bewaard kan worden.
    Qua archivering allemaal geen onoverkomelijke problemen, maar betekent wel een andere manier van denken. En dat kan betekenen dat het bestaande instrumentarium (zoals selectielijsten) aanpassingen nodig heeft om die andere manier van werken mogelijk te maken.

    Even los van dit voorbeeld van wetenschappelijk onderzoek, is een grote uitdaging voor het archiefwezen wat mij betreft sowieso om los te komen van het document- en informatiedenken.

    Rens Ouwerkerk
  • @Rens, is voor open data idd een oplossing. Maar is dat wettelijk geoorloofd? Overigens ga ik er van uit dat de eerst komende jaren de data met name zal worden gebruikt voor wetenschappelijk onderzoek (dus aan onderzoekers ter beschikking gesteld) en niet algemeen openbaar. Verder zullen de data worden gebruikt voor allerlei toepassingen voor onze "klanten", die worden dan ook in house ontwikkeld.

    Annemarie Meijer

Trefwoorden