Cookie wetgeving en statistieken

  • okt 2012
  • Verwijderde gebruiker
  • ·
  • Aangepast 27 jun
  • 26
  • 64
Verwijderde gebruiker
KIA Community
  • Joost Salverda
  • Christian van der Ven
  • Bob Coret
  • Ernest Verhees

Er is nogal wat te doen omtrent de zgn cookiewet. Een aantal archieven heeft ondertussen een voorziening op hun site waarmee ze voldoen aan de wet. Een korte rondvraag laat bij die archieven een gelijkluidend beeld zien. Na invoering daalt het aantal bezoekers met 70-80%!

Voor velen van ons is een goede bezoekersstatistiek van groot belang voor rapportage naar wethouder, bestuur etc.

Even leek het er op dat het gebruik van een zgn serverside statistiekprogramma soulaas zou bieden, maar helaas blijken die, als we de wet goed uitvoeren ook niet te mogen.

Wat rest ons nu? Accepteren we het feit dat driekwart van de bezoekers, al dan niet bewust, cookies voor statistiekdoeleinden weigert? Worden we burgerlijk ongehoorzaam en lappen we de wet aan onze laars? Of gaan we als archief zover als bijvoorbeeld de publieke omroepen die zeggen "geen cookie? dan ook geen toegang tot onze site!"

Wat ik in ieder geval belangrijk vind is dat we proberen als Nederlandse archieven hier een gezamenlijke strategie te ontwikkelen

Reacties

26 reacties, meest recent: 26 november 2012
  • Ik ben een beetje verbaasd door het zinnetje:

    Na invoering daalt het aantal bezoekers met 70-80%!

    Bedoel je niet dat het aantal door Analytics geregistreerde bezoekers met 70-80% daalt?

    Overigens zou ik de Publieke-Omroep-optie nooit doen, dat lijkt me niet erg "klantvriendelijk". Dan de wethouder maar uitleggen dat de bezoekersstatistieken minder accuraat zijn.

    Verwijderde gebruiker
  • Begrijp ik dat 80% van je bezoekers op jullie website er bewust voor kiezen om cookies uit te schakelen? of staan ze standaard uit en werken cookies pas als de bezoeker dat goed vindt? dat laatste zal dan inderdaad weinig gebeuren

    Toevallig vandaag ook over gehad. Gelders Archief heeft voor dezelfde oplossing gekozen als bol.com (toch geen kleine jongen): alleen een melding dat ze gebruikt worden, geen optie om cookies uit te schakelen.

    Ernest Verhees
  • Is het de overtuiging van het Gelders Archief dat deze oplossing conform de 'cookiewet' is? Ik zou jullie optie classificeren als 'burgerlijke ongehoorzaamheid' (hulde! Ik kies dezelfde route...).

    Er is volgens mij namenlijk consensus dat, hoewel de Europese wetgeving een informatieplicht voorschrijft, de Nederlandse wet een aanvullende toestemmingsvereiste kent. Bol.com is geen Nederlands bedrijf, dus ik denk dat zij willen testen hoe ver de Nederlandse arm van wet rijkt, want die stelt dat buitenlandse bedrijven die zich richten op Nederland zich er ook aan de Nederlandse cookiewet moeten houden.

    Bob Coret
  • Hi Ingmar, 

    Inderdaad ietwat onzorgvuldig geformuleerd. Het moet zijn 'het aantal geregistreerde bezoekers daalt met 70-80%'

    Als ik echter kijk naar het dataverbruik dan blijft dat op hetzelfde niveau, waaruit ik concludeer dat het echte gebruik dus niet veel zal afwijken 

    Ingmar Koch zei:

    Ik ben een beetje verbaasd door het zinnetje:

    Na invoering daalt het aantal bezoekers met 70-80%!

    Bedoel je niet dat het aantal door Analytics geregistreerde bezoekers met 70-80% daalt?

    Overigens zou ik de Publieke-Omroep-optie nooit doen, dat lijkt me niet erg "klantvriendelijk". Dan de wethouder maar uitleggen dat de bezoekersstatistieken minder accuraat zijn.

    Verwijderde gebruiker
  • Hi Ernest,

    Bij de oplossing die Picturae gerealiseerd heeft voor zijn klanten staan de cookies standaard aangevinkt en moet de klant ze zelf uitvinken. Alhoewel ik begrip heb voor de door jullie gekozen oplossing, voldoe je hiermee absoluut niet aan de wet.

    Picturae is hier eens goed ingedoken, omdat we wilden kijken of we het probleem konden ondervangen door serverside stats zodat je er geen cookies voor hoeft te gebruiken, maar zelfs dat mag niet.

    Heel simpel gezegd, je mag niets vastleggen/bewaren dat te herleiden is naar een gebruiker (en dat is een ip adres dus ook) zonder dat de bezoeker hiervoor toestemming heeft gegeven. Ernest Verhees zei:

    Begrijp ik dat 80% van je bezoekers op jullie website er bewust voor kiezen om cookies uit te schakelen? of staan ze standaard uit en werken cookies pas als de bezoeker dat goed vindt? dat laatste zal dan inderdaad weinig gebeuren

    Toevallig vandaag ook over gehad. Gelders Archief heeft voor dezelfde oplossing gekozen als bol.com (toch geen kleine jongen): alleen een melding dat ze gebruikt worden, geen optie om cookies uit te schakelen.

    Verwijderde gebruiker
  • Op welke gronden zouden de logfiles - die elke webserver bijhoudt - niet gebruikt kunnen worden voor statistieken? Dit wordt niet door de cookiewet verboden! Wel is het zo dat je moet uitkijken met de Wet Bescherming Persoonsgegevens. Nederland loopt ook daar weer uit de pas met de rest van de wereld door een IP adres als persoonsgegeven aan te merken...  

    Ik heb overigens naar de pakketten als AWStats en Webalizer gekeken die logfiles analyseren, maar deze tools zijn sinds 2003 niet bijgewerkt, ze gebruiken oude technologie en hebben zeer achterhaalde kennis over spiders, browsers, enz., om deze reden geen optie.

    Bob Coret
  • Ben ik nog even benieuwd naar iets gerelateerds: wie past er eigenlijk een correctie toe op de statistiek van (unieke) bezoekers die bijvoorbeeld Google Analytics geeft? Of worden die cijfers simpelweg overgenomen richting de rapportages voor bestuur en zo?

    (Op het BHIC wordt dit cijfer op basis van onderzoek en navraag minstens met 50% naar beneden bijgesteld, en dat wordt nog méér.)

    Christian van der Ven
  • @Bob en Walther, om een klein misverstand weg te nemen, ik werk bij het Regionaal Archief Nijmegen waar we nog nadenken over de beste oplossing voor dit probleem. Hierbij kwam toevallig gisteren het voorbeeld van de collega's van het Gelders Archief langs.

    dus in Leiden kiest 80% er bewust voor het zelf uit te zetten? verrassend veel!

    Hoe houd je eigenlijk bij dat iemand al een keuze heeft gemaakt voor wel of geen cookies (met een cookie?)?

    @Christian dat vind ik wel een interessante, is dat eigen onderzoek of door derden? en waarom dan precies? ik vind het ook lastig om precies de waarde toe te kennen aan de cijfers van analytics. als je steeds vasthoudt aan de gegeven cijfers van bezoeken en bezoekers (welke gebruik je?) kun je in ieder geval wel een ontwikkeling zien.

    Ernest Verhees
  • @Ernest Sorry, domme fout ;-( Volgens mij wordt dit inderdaad gedaan door een cookie. Maar dat is dan weer een soort dat wel mag

    @Christian. Wij doen dat niet. Ben wel heel benieuwd waar jullie dat op baseren.

    Verwijderde gebruiker
  • De "cookiewet" is eigenlijk een artikel in de Telecommunicatiewet.De naam "cookiewet" is m.i. misleidend. Andere artikelen in de Telecommunicatiewet verwijzen naar de Wet Bescherming Persoonsgegevens, en die laatste verbiedt server-side tracking. Bob Coret zei:

    Op welke gronden zouden de logfiles - die elke webserver bijhoudt - niet gebruikt kunnen worden voor statistieken? Dit wordt niet door de cookiewet verboden! Wel is het zo dat je moet uitkijken met de Wet Bescherming Persoonsgegevens. Nederland loopt ook daar weer uit de pas met de rest van de wereld door een IP adres als persoonsgegeven aan te merken...  

    Ik heb overigens naar de pakketten als AWStats en Webalizer gekeken die logfiles analyseren, maar deze tools zijn sinds 2003 niet bijgewerkt, ze gebruiken oude technologie en hebben zeer achterhaalde kennis over spiders, browsers, enz., om deze reden geen optie.

    Verwijderde gebruiker
  • @Ernest en Walther: Voor het analyseren van trends maken de absolute aantallen inderdaad een stuk minder uit, maar toch, we moeten ons niet rijk rekenen...

    Het is een vak apart om alle analytics goed op hun waarde te beoordelen en er zinvolle conclusies aan te verbinden, afhankelijk van wat je wilt weten. Bovendien hangt het van het pakket af wat je gebruikt (de ene service 'telt' unieke bezoekers anders dan de ander).

    In dit geval gaat het me om het 'tellen' van bezoekers (dus unieke personen die in een bepaalde periode je website bezoeken). Dat aantal wordt doorgaans berekend op basis van de aan- of afwezigheid van cookies. Met andere woorden: staat er voor de gekozen periode al een cookie op de computer, dan is het een herhaalbezoek, en is de bewuste bezoeker dus al in de statistiek van unieke bezoekers meegenomen.

    Niet alle mensen accepteren cookies (en dat wordt dus alleen maar erger), soms worden ze automatisch weggegooid na het einde van een browsersessie, na een maand, een half jaar of handmatig. In de statistiek van unieke bezoekers zitten dus veel dubbele bezoekers. Bedrijven als comScore hebben ervaringscijfers en daarop hebben wij ons gebaseerd. Daarnaast een extra correctie voor eigen personeel, mensen die via je studiezaal op je site komen enzovoort. Het blijft een schatting en keuze, maar het uiteindelijke beeld is dan weer een stukje realistischer geworden. En bovendien wordt het 'benchmarken' dan ook een stuk interessanter.

    Bij de cijfers voor bijvoorbeeld aantallen bezoeken en pageviews speelt dit 'probleem' niet.

    Christian van der Ven
  • Wij zijn per 1 oktober ook over gegaan tot het implementeren van de aanpassing van Picturae. Net als bij Walther blijkt dat de cijfers teruglopen tussen de 70 en 80%. Maar je kunt natuurlijk wel op basis van je eerdere gegevens uitleggen waarom de cijfers nu lager zijn en eventueel een correctie toepassen.

    De uitleg van Christian laat ook zien dat die teruggang van 70-80% niet een werkelijke daling is. Er wordt veel dubbeld geteld.

    Overigens vindt ik collega;s die de website bezoeken en gebruikers en je studiezaalbezoekers ook gewoon bezoekers die je niet uit je cijfers zou moeten filteren. Gebruik is gebruik.

    Verwijderde gebruiker
  • @Luud: Je zegt "gebruik is gebruik" en daar zit hem nu juist de keuze in waar ik het over had. Op het BHIC willen we namelijk niet simpelweg 'gebruik' meten, maar 'gebruik door klanten (liefst klanten op afstand)'. (Overigens is de correctie op basis van eigen gebruik en studiezaalgebruik maar een paar procent; de correctie op basis van dubbeltellingen omvat echter tientallen procenten.)

    Zie het als de statistiek van je studiezaalbezoek. Daarin neem je eigen collega's toch ook niet mee? Terwijl dat ook gebruik is. (Ik verbaas me overigens ook nog altijd over archiefdiensten die al hun vrijwilligers en rondgeleide groepen en zo simpelweg als 'bezoeker' tellen, zonder dat nader uit te leggen.)

    Maar goed, we zijn nu tegenwoordig nu eenmaal allemaal gericht op zo groot mogelijke cijfers...

    Ik denk trouwens vooral dat het een kwestie is van transparant zijn tegenover degenen tegenover wie je je verantwoordt, en eerlijk tegenover jezelf. Een paragraaf of zo in je jaarverslag waarin je aangeeft hoe de cijfers gelezen moeten worden, hoe ze tot stand zijn gekomen en wat de beperkingen zijn, lijkt me ook prima, in plaats van allerlei correcties.

    Christian van der Ven
  • @Luud een beetje een zijspoor. ik zag dat bij jullie alleen de cookies van googleanalytics uit te schakelen zijn (want de enige die een probleem zijn volgens de wet). hoe zit dat met de Tilburg wiki, volgens mij gebruikt Mediawiki ook cookies of hebben jullie deze uitgeschakeled? Ik probeer te achterhalen of en hoe dit moet in onze wiki.

    Ernest Verhees
  • @Christian

    Ik snap jullie overwegingen wel, maar met afnemende openingstijden wordt dat minder relevant mijns inziens op het totaal van het websitegebruik.

    @Ernest

    We hebben deze aanpassing tot nu toe alleen op onze hoofdwebsite staan en alle bijproducten, TilburgWiki, Tilburg op de Kaart, weblogs en communities niet. We zijn nog gedeeltelijk burgerlijk ongehoorzaam.

    In het geval van de MediaWiki is er volgens mij geen derde partij die de bezoekgegevens uitleest en gebruikt voor andere doeleinden dan puur het tellen van het bezoek aan de verschillende pagina's.

    Verwijderde gebruiker
  • @ Christian  Vind je het niet lastig om met een regelmatig aangepast set van waarden te  moeten werken?

    Niet enkel voor je zelf want de cijfers zijn veel lastiger te gebruiken als je de correcties regelmatig aanpast, maar ook omdat je in rapportages, jaarverslagen etc iedere keer moet uitleggen wat er veranderd is en hoe het nu gelezen moet worden.

    Misschien geeft Google analytics wel redelijk wat vervuiling, maar het blijft dan wel vergelijkbaar.

    Ik denk dat wij voor onze rapportage er maar een ander gegeven aan toe gaan voegen, namelijk stats over dataverkeer.

    Zegt niets over aantallen bezoekers en hoe uniek ze zijn, maar geven wel heel betrouwbaar aanhoe intensief jouw site en de daarop beschikbare informatie gebruikt wordt.

    Persoonlijk vind ik de hele cookie wetgeving weer typisch zo'n voorbeeld van Nederland dat het netste jongetje van de klas wil zijn. Het is echt een inbreuk op mijn privacy als een website weet dat ik hem bezocht heb, maar ben ik klaar met surfen op het net, en ik ga de stad in om te shoppen, wordt er bij de ingang van de Bijenkorf  echt niet aan mij persoonlijk gevraagd of ik er bezwaar tegen heb, dat ik gefilmd wordt door beveiligingscamera's. Er hangt hooguit een bordje dat ze er zijn, zodat je weet dat je gefilmd wordt. Als zo'n waarschuwing in real life wel voldoende is, waarom dan niet in de virtuele wereld?

    Verwijderde gebruiker
  • Ik krijg in deze discussie de indruk dat er alleen wordt gekeken naar de bezoekersaantallen ter verantwoording. Maar jullie willen toch ook wel weten:

    • welke taal bezoekers spreken/waar komen ze vandaan?

    • welke browsers en besturingssystemen er worden gebruikt?

    • hoeveel mobiele bezoekers er zijn?

    • welke inhoud het op de website goed/minder goed doet?

    • wat de "klikpadden" ijn?

    • waar het website verkeer vandaan komt?

    • via welke zoekwoorden men op jullie website komt?

    • hoe snel jullie website is?

    • hoe vaak bepaalde gebeurtenissen voorkomen (inschrijven nieuwsbrief, aankoop, registratie, download, ...)?

    Dit is stuurinformatie om je gebruikers beter te leren kennen en je website te optimaliseren. Juist dat maakt van Google Analytics zo'n krachtige tool voor website eigenaren, en dit gaat naar mijn mening niet ten koste van de privacy van gebruikers. Je kunt zelfs aangeven dat ze de laatste cijfers van het IP adres niet opslaan. Maar een optie om al dit moois zonder cookies mogelijk te maken (wat technisch voor een heel groot deel gewoon kan) biedt Google nog niet :-(

    Bob Coret
  • @Luud: Voor wat betreft gebruik op de studiezaal heb je natuurlijk gelijk; ik zei dan ook al dat het slechts om een paar procent gaat. Maar het ging mij dus in eerste instantie om de dubbeltellingen. En dat gaat dus om meer dan de helft van je digitale bezoekers. En naarmate het digitale publiek groeit, zijn er dat dus steeds meer, zeker in absoluut aantal.

    @Walther: Nee hoor, bepaald niet lastig. In een paar jaar tijd is dit nu pas de tweede keer dat we navraag hebben gedaan, met andere woorden de cijfers worden al een paar jaar met hetzelfde percentage gecorrigeerd en je hoeft dus niet voortdurend vanalles om te rekenen (vergelijkingen zijn dus prima mogelijk). In jaarverslagen en zo zijn dat een paar regels tekst 'verantwoording' die je dus ook niet iedere keer hoeft aan te passen.

    Dat het zonder correcties béter vergelijkbaar blijft, klopt dus ook niet, want gedurende de jaren verandert het percentage (tegenwoordig worden cookies bijvoorbeeld vaker en sneller geweigerd of verwijderd dan pak-em-beet vijf jaar geleden). Met andere woorden: als je geen correctie toepast op je statistiek, dan vergelijk je cijfers met daarin ongelijke 'vervuiling'. Da's een oneerlijke vergelijking... ;-)

    De 'vervuiling' wordt trouwens ook groter naarmate de periode waarover je cijfers genereert, langer is. In de bezoekerscijfers over een maand zit bijvoorbeeld beduidend minder vervuiling dan in de cijfers over een jaar.

    Slim trouwens dat jullie dataverkeer gaan meten! Ben benieuwd hoe jullie ervaringen gaan zijn. (Ook die cijfers gaan natuurlijk gepaard met vele mitsen en maren. Een hoog dataverkeer kan wijzen op een supergoedgebruikte site, maar kan tegelijkertijd wijzen op een superslecht gebouwde site. Of onnodig grote scans. De combinatie van dit cijfer met andere cijfers maakt het weer een stuk waardevoller.)

    Met andere woorden: cijfers zeggen op zich weinig; het gaat er om wat je ermee wil, hoe je ze waardeert en verbindt en wat je er vervolgens mee doet.

    (Ik hoef trouwens ook niemand te overtuigen van het nut van zo'n correctie; het ging er mij alleen even om of ook anderen op die manier kritisch hun statistieken benaderden.)

    @Bob: Die indruk zou je kunnen krijgen, maar da's in ieder geval wat ons betreft beslist niet het geval hoor.

    Mijn persoonlijke favorieten zijn de klikpaden, bouncerates en uitstappagina's.

    Christian van der Ven
  • @Bob

    Ik weet dat je nog veel meer te weten kunt komen uit de statistieken van Google Analytics, maar eerlij kgezegd heb ik vaak geen idee wat ik ermee zou moeten doen. Taal? Browsers? Besturingssystemen?

    Taal vind ik niet zo relevant en besturingssystemen ook niet.

    Ik zeg bij websitebouw altijd dat het in de top 4 browsers goed moet gaan: Safari, Chrome, Firefox en Chrome. Al sinds jaar en dag is IE de baas in browserland en samen met de andere drie heb je 95 % van je gebruikers te pakken.

    Waar je naar op zoek moet is natuurlijk de informatie over onderdelen waar je invloed op kunt gaan uitoefenen. En dan liefst eenbeetje substantieel. Inzet van middelen en mensen zo efficiënt mogelijk gebruiken en niet streven om alles en iedereen het naar de zin te maken.

    Ik realiseer me wel dat we niet alles uit de mogelijkheden van Analytics halen. Een goede informatieve cursus of training zou dan ook welkom zijn. 

    Verwijderde gebruiker
  • @Christian

    Je zegt dat de vervuiling groter wordt naarmate je de onderzoeksperiode langer neemt. Dat geldt echter niet voor de unieke bezoekers. Als je die voor een heel jaar laat berekenen krijg je een lager getal dan als je dat per maand doet en dat voor een jaar optelt. Logisch ook natuurlijk. Dus daar zou je juist het jaartotaal als uitgangspunt moeten nemen voor je gewenste reductiesom.

    Verwijderde gebruiker
  • @Luud: Als je de maandtotalen van het aantal bezoekers bij elkaar optelt, dan heb je niet alleen te maken met de vervuiling die sowieso in Analytics zit, maar -en dat is waar jij op doelt- ook nog eens met de vervuiling die je er vervolgens zelf instopt door die cijfers op te tellen en daardoor zelf voor verdubbelingen te zorgen. Da's inderdaad logisch, maar niet wat ik bedoelde.

    Ik bedoel, dat naarmate een periode langer is, het aantal cookies dat is geweigerd en verwijderd natuurlijk toeneemt. Als je een jaar neemt, dan is er kans dat sommige mensen in die periode herhaaldelijk dubbel zijn geteld, bijvoorbeeld als ze maandelijks hun cookies verwijderen. Het meten van unieke bezoekers op basis van cookies wordt dus onbetrouwbaarder als de periode waarover je cijfers laat genereren langer is. Hoe kleiner de periode waarover je de statistiek laat berekenen, hoe kleiner de kans op vervuiling. Een berekening over een dag geeft nog wel het meest betrouwbare resultaat. (Helaas kun je met die berekening natuurlijk niets, als je jaarcijfers wil hebben.)

    De vervuiling zit hem in eerste instantie dus al in Analytics zelf, niet in wat je vervolgens met die cijfers gaat doen.

    Je kunt dit trouwens zelf ook logisch beredeneren, zelfs zonder te weten wat er achter de cijfers zit: pak bijvoorbeeld de Analytics van je eigen weblog en laat die zien over de periode van een maand, een jaar, vijf jaar... Zonder een rekenwonder te zijn, zal iedereen begrijpen dat de cijfers voor het aantal unieke bezoekers simpelweg niet kúnnen kloppen.

    Of we moeten wel een superoptimistisch beeld hebben van het publieksbereik van onze weblogs (en archieven). ;-)

    (Cursussen en trainingen zijn een goed idee, maar ook online is al heel veel informatie te vinden, bijvoorbeeld in de helppagina's van Analytics zelf. Onder andere de uitleg van wat welk cijfer inhoudt, hoe het wordt berekend en wat er de beperkingen van zijn, is veel waard.)

    Christian van der Ven
  • @Christian Als je de 'vervuiling' enigszins wil kunnen filteren is het handig een marge aan te houden als slag om de arm. Henk Voorbij (KB) heeft hier enkele jaren geleden al een interessant artikel over gepubliceerd.

    Joost Salverda
  • @Joost: Die marge ligt nu dus in ieder geval al op -60% als het over de bezoekers gaat. ;-)

    Dank voor de leestip! Dat artikel kende ikzelf in ieder geval nog niet. Ga ik beslist lezen!

    Christian van der Ven
  • Jammer, het artikel zelf zag ik zo snel niet online. Maar het is gebaseerd op een aantal rapporten van DEN (ook door Henk Voorbij) die wél online stonden. Zo kwam ik weer bij het dossier Webstatistieken van DEN. Veel leesvoer op die pagina kende ik al, maar zeker niet alles. Goede tip dus!

    (Kan het trouwens niet nalaten om even te melden dat het BHIC in een van de rapporten door Henk nog even een pluimpje krijgt voor de manier waarop het aantal unieke bezoekers wordt berekend ;-))

    Christian van der Ven
  • De oorspronkelijke vraag van Walther naar cookies en statistieken is enigszins verwaterd naar een, weliswaar zeer interessante, discussie over het gebruik van analytics.

    Het probleem met de oplossing voor analytics gebruikers- en voor degene die de pictura-oplossing niet kunnen gebruiken - blijft er nog wel. Ik las op 'Mag google-analytics nog onder de cookiewet?'  van Arnoud Engelfriet dat de juristen/webmasters er ook niet helemaal uit zijn. Helemaal onderaan bij de reacties vond ik een verwijzing naar 123privacy.nl. dat lijkt me wel een handige oplossing zonder eigen ontwikkelwerk- en -kosten. of zitten hier nadelen aan, behalve geen keuze in de vormgeving van de knop?

    Ernest Verhees

Trefwoorden