Handreiking – Nieuwe uitzondering voor tekst- en datamining

  • mrt 2021
  • Maarten Zeinstra
  • ·
  • Aangepast 28 jun
  • 111
Maarten Zeinstra
Informatierecht
  • Reem Weda
  • Chido Houbraken
  • KIA Community Manager

De aanpassingen op de auteurswet die op 7 juni 2021 van kracht worden, bevatten twee nieuwe uitzonderingen die tekst- en datamining mogelijk maken. Deze beperkingen zorgen ervoor dat je geen inbreuk op het auteursrecht en aanverwante rechten maakt wanneer je kopieën maakt van tekst en gegevens die je gebruikt voor je onderzoek. In deze post gaan we in detail in op deze uitzonderingen. We kijken specifiek naar de wettekst, de memorie van toelichting en de overwegingen uit de richtlijn die vorm hebben gegeven aan deze artikelen.

De uitzonderingen zijn ontstaan omdat er een rechtsonzekerheid was rondom tekst- en datamining. Eén van de vuistregels van het auteursrecht is dat je altijd toestemming nodig hebt voordat je iets kopieert, tenzij daar een uitzondering voor is. De huidige auteurswet en aanverwante rechten voorzagen niet in een uitzondering die het breed kunnen kopiëren, bewaren, en analyseren van digitale informatie toestond. Hierdoor ontstond een rechtsonzekerheid over deze relatief nieuwe trend. (Volgend uit overweging 8 van de richtlijn)

In de praktijk heb je waarschijnlijk weinig gemerkt van deze rechtsonzekerheid, veel organisaties gingen ervan uit dat tekst- en datamining toegestaan was onder artikel 13a van de auteurswet. Dit artikel zegt kort door de bocht dat je een tijdelijke reproductie van voorbijgaande aard mag maken als die een integraal en essentieel onderdeel vormt van een technisch procédé. Zonder deze uitzondering was het internet niet mogelijk geweest. Het bezoeken van een webpagina betekent namelijk het maken een tijdelijke kopie van die pagina op je computer. Het was wachten op een rechtszaak die meer duidelijkheid zou verschaffen over tekst- en datamining. Met deze aanpassingen op de auteurswet is er meer helderheid.

Wat is tekst- en datamining?

Het is belangrijk om de gangbare term van tekst- en datamining los te koppelen van de juridische definitie in de zin van deze wetswijziging. Tekst- en datamining vanuit het juridisch perspectief is namelijk beperkter dan alle technologische handelingen die onder tekst- en datamining kunnen vallen.

De implementatiewet definieert tekst- en datamining als een:

“[...] een geautomatiseerde analysetechniek die gericht is op de ontleding van tekst en gegevens in digitale vorm om informatie te genereren zoals, maar niet uitsluitend, patronen, trends en onderlinge verbanden. ” Artikel 25a, lid 3 Auteurswet, artikel 1(s) Wet op Naburige rechten, en artikel 1(h) Databankenwet

Met tekst en gegevens wordt verwezen naar de literaire en artistieke werken die onder de auteurswet vallen, de opnames van een uitvoering, fonogrammen, en eerste vastlegging van een film, of opname van een programma uit de naburige rechten, en de databank zoals beschreven in de databankenwet.

Op werken waar deze wetten niet van toepassing zijn is er dan ook geen regel voor tekst- en datamining. Zo is tekst- en datamining op feiten en publiek domein werken dus niet onderhevig aan de regels van deze wetten. Uiteraard is dat geen vrijbrief om andere regels te overtreden om bij dat publiek domein werk of feiten te komen (Volgend uit overweging 9 van de richtlijn).

Ook is het belangrijk dat het om een reproductiehandeling moet gaan. Wanneer je geen reproductiehandeling doet, bijvoorbeeld wanneer je via een programma webpagina analyseert en feitelijke informatie onttrekt (scraped) en geen kopieën opslaat, dan is deze uitzondering niet van toepassing en ook niet nodig. Dan maak je gebruik van de uitzondering beschreven in artikel 13a van de Auteurswet

Concrete voorbeelden van tekst- en datamining is het halen van keywords uit boeken om doorzoekbaarheid van een collectie te verbeteren. Ook kunstmatige intellegentie (AI) bevat behelst vaak tekst- en datamining. Bijvoorbeeld projecten waarbij AI gebruikt worden om onderwerpen van foto’s te herkennen, uit tekst handschrift herkenning mogelijk te maken door een systeem te trainen op het herkennen van letters, en uit een collectie van tweets een sentiment analyse te doen.

Goed om op te merken dat, naar mijn analyse van de wettekst, websites archiveren niet onder deze regels vallen. Bij het archiveren van hele websites, maak je immers wel een kopie en die neem je op in je permanente collectie. Maar het doel is daarbij niet om de tekst en gegevens te ontleden en daaruit nieuwe gegevens te genereren.

De artikelen

Hieronder zijn de twee nieuwe uitzonderingen geciteerd. Artikel 15n is de tekst- en datamining uitzondering voor onderzoeksorganisaties en cultureel erfgoedinstellingen. Artikel 15o is een uitzondering voor gebruikers die niet bij onderzoeksorganisaties of cultureel erfgoedinstellingen werken. Deze laatste is bijvoorbeeld van toepassing op het publiek dat erfgoedinstellingen raadpleegt.

Artikel 15n

  1. Als inbreuk op het auteursrecht op een werk van letterkunde, wetenschap of kunst wordt niet beschouwd de reproductie door onderzoeksorganisaties en cultureel erfgoedinstellingen om met het oog op wetenschappelijk onderzoek tekst- en datamining te verrichten op het werk waartoe zij rechtmatige toegang hebben.

  2. De reproductie bedoeld in het eerste lid wordt opgeslagen met een passend niveau van bescherming en mag worden bewaard voor doeleinden in verband met wetenschappelijk onderzoek.

  3. De makers van werken van letterkunde, wetenschap of kunst en hun rechtverkrijgenden kunnen maatregelen nemen met het oog op de veiligheid en de integriteit van de netwerken en databanken waar die werken zijn opgeslagen. Deze maatregelen gaan niet verder dan wat nodig is om die doelstelling te verwezenlijken.

  4. Van de bepalingen in dit artikel kan niet bij overeenkomst worden afgeweken.

Artikel 15o

  1. Onverminderd het bepaalde in artikel 15n wordt een reproductie in het kader van tekst- en datamining niet als inbreuk op het auteursrecht op een werk van letterkunde, wetenschap of kunst beschouwd mits degene die de tekst- en datamining verricht rechtmatig toegang heeft tot het werk en het auteursrecht door de maker of zijn rechtverkrijgenden niet uitdrukkelijk op passende wijze is voorbehouden, zoals door middel van machinaal leesbare middelen bij een online ter beschikking gesteld werk.

  2. De reproductie gemaakt overeenkomstig het in het eerste lid bepaalde mag worden bewaard zolang dit nodig is voor tekst- en datamining.

Gebruikte termen

Rechtmatig toegang

Onder rechtmatige toegang moet worden verstaan toegang tot tekst en gegevens op basis van toestemming (bijvoorbeeld door je abonnement, of licentie hebt op een publicaties). Overweging 14 van de richtlijn geeft aan dat vrijelijk online beschikbare tekst en gegevens ook onder deze term vallen. Het is dus niet noodzakelijk om een overeenkomst te hebben voordat je mag tekst- en dataminen.

Bewaartermijn

Onderzoeksinstellingen en Erfgoedinstellingen mogen materiaal dat voortkomt uit tekst- en dataminingactivitivietien die zij nodig hebben bij wetenschappelijk onderzoek bewaren voor deze wetenschappelijke doeleinden. Dit betekent bijvoorbeeld dat je data mag opslaan wanneer dat de argumentatie van een wetenschappelijk paper ondersteund.

Tekst- en dataminers die niet verbonden zijn aan onderzoeksorganisaties of cultureel erfgoedinstellingen hebben deze luxe niet. Zij mogen de informatie en gegevens die als bron dienen bij tekst- en datamining alleen maar bewaren zolang dat nodig is voor de mining zelf.

Dit neemt overigens niet weg dat andere wet- en regelgeving hier nog aanvullende beperkingen op kunnen leggen. Je moet je uiteraard alsnog aan de AVG houden wanneer je in tekst- en datamining bezig met persoonsgegevens. Meer informatie op KIA over de AVG kan je hier vinden.

Dwingend recht

Artikel 15n is een beperking van dwingend recht, dat betekent het onderzoeksintellingen niet contractueel verboden mag worden om tekst- en datamining te doen. Rechthebbende en datahoudende instanties mogen wel maatregelen nemen om tekst- en datamining tegen te gaan. Zo kan er wel een beperking opgelegd worden van het aantal verzoeken op data, of data achter een inlog plaatsen, enzovoort.

Machinaal leesbare middelen

Artikel 15o spreekt van machinaal leesbare middelen om te communiceren dat er geen gebruik mag gemaakt worden van de uitzondering die voor het algemeen publiek geldt. Er zijn hiervoor nog geen best practices voor ontwikkelt.

Praktische implicaties

Erfgoedinstellingen zijn een intermediair van data. Erfgoedinstellingen krijgen data van onze zorgdragers en schenkers. Deze data stellen wij vervolgens, als dat mogelijk is, beschikbaar aan het brede publiek via collectiesites, downloadmogelijkheden, etc. Daarnaast doen wij zelf ook aan tekst- en datamining, vaak met objecten uit de eigen collecties, maar ook dan zijn de regels van deze nieuwe artikelen van toepassing.

Nieuwe overeenkomsten nodig?

Zijn er nieuwe overeenkomsten met zorgdragers en schenkers nodig? In beginsel heb je geen nieuwe schenkingsovereenkomsten nodig om tekst- en datamining voor je gebruikers toe te staan. Wanneer je in overeenkomsten niets opneemt over tekst- en datamining kan de rechthebbende immers niet uitdrukkelijk op passende wijze het recht tot tekst- en dataminen voorbehouden.

Wil je als organisatie tekst- en datamining door je gebruikers beperken dan zul je wel je overeenkomsten met zorgdragers of schenkers moet aanpassen om dit voorbehoud te regelen. Auteursrechtelijk is de erfgoedinstelling zelf namelijk vaak geen rechthebbende. Zij kunnen die voorbehoud niet voor de rechthebbende bepalen. Wel mag je natuurlijk beperkingen leggen op toegang van je platformen.

Machine leesbare middelen invoeren

Wanneer je als erfgoedinstelling je gebruikers niet wil toestaan om tekst- en datamining te doen dan suggereert artikel 15o om machinaal leesbare middelen in te voeren om dit te communiceren. Dit is alleen nodig is wanneer je de gebruiker gaat verbieden om te minen. Wanneer er geen tekst- en datamining restricties zijn hoef je deze dus ook niet in te voeren.

We weten nog niet hoe we een voorbehoud op tekst- en datamining op machine leesbare manier kunnen communiceren. Er is geen standaard om te communiceren dat er geen tekst- en datamining toegestaan is. Het dichtste bij een standaard die we hebben is robots.txt. Dit is een bestand op je website dat aangeeft wat machines met een website, zoals indexers van zoekmachines, mogen doen.

Meer lezen?

Lees de relevante bronteksten hier zelf:

Deze blogpost is geschreven door Maarten Zeinstra, auteursrechtcoördinator van KVAN, met hulp van experts uit de sector.