Verslagen #conf01 Koning of Bedelaar: Stefan Hoevenaar over datavisualisatie

  • feb 2012
  • Christian van der Ven
  • ·
  • Aangepast 27 jun
  • 89
Christian van der Ven
KIA Community

Voor de inleiding bij dit verslag: zie het eerste verslag.

De vorm van informatie (praktijk)

Na het verhaal van Karin over hoe vormgeving zorgt voor het toegankelijk maken van informatie, vertelde Stefan Hoevenaar (Ilumy) over het fenomeen datavisualisatie: data vormgeven in beelden.

Het verhaal van Stefan was niet echt een verhaal, maar eerder een aaneenschakeling van inspirerende voorbeelden van datavisualisaties. Zoals Hitsplitter, waarmee je bijvoorbeeld kunt bekijken waar en hoe vaak over bepaalde onderwerpen is gesproken op het web. Of Het Verhalenarchief van het Nationaal Archief, dat bijvoorbeeld verhalen over 65 jaar bevrijding op een tijdlijn of een kaart plaatst.

Door middel van visualiseren van data ga je op zoek naar duiding, betekenis en context. Je stelt vragen aan de data. Voorbeelden:

  • Verhoudingen?

  • Verloop in tijd?

  • Wat zit er achter?

  • Wat komt het meest voor?

  • Hoe is het verdeeld?

  • Wat zijn uitschieters?

  • Waar ligt iets op de kaart?

Of combinaties daarvan. Er zijn vervolgens allerlei mogelijkheden om data te visualiseren, zoals drill-downs (filters), top-10-lijstjes, (info)graphics, tijdlijnen en netwerken. Voor die laatste waarschuwt Stefan direct: ze zijn weliswaar mooi, maar ook ingewikkeld en lang niet altijd nuttig. Zoals die metrokaarten.

Grofweg zijn er drie verschillende soorten datavisualisaties:

  • Handmatig (je moet zelf aan de slag, maar hebt dan wel alle vrijheid)

  • Automatisch

  • Interactief (je kunt als gebruiker door middel van een interface kiezen wat en hoe je gevisualiseerd wilt hebben)

Nog wat websites met goede voorbeelden: FlowingData en Information Aesthetics. Voor kaarten kan ik trouwens ook Worldmapper aanraden.

Datavisualisaties kunnen verraderlijk zijn. Stefan illustreerde dit aan de hand van The N.F.L. Players Mentioned Most on “SportsCenter”, een plaatje dat op een mooie manier laat zien over welke sportmannen het meest wordt gesproken. De reus aan de linkerkant is Tim Tebow, met ongeveer 1.450 vermeldingen. Dat zijn er meer dan Tom Brady, met ongeveer 850 vermeldingen. De verhouding tussen deze twee is echter misleidend. Het aantal vermeldingen bepaalt de hoogte van de figuur in de afbeelding, maar door het volume van die figuur krijg je het gevoel dat het aantal vermeldingen veel meer verschilt dan 'slechts' 600 (zie ook de reacties hier).

Maar mits goed gebruikt en gecombineerd geven datavisualisaties allerlei mooie inzichten. En kunnen ze ook verregaande consequenties hebben. Zoals The Homicide Report, die uiteindelijk in een aantal gevallen leidde tot waardedalingen van huizen in de buurten waar veel moorden werden gepleegd.

Goed voorbeeld van het combineren van data, is trouwens een afbeelding die Karin al tijdens haar presentatie liet zien, namelijk die waarin de grootte van Napoleons leger tijdens de invasie in Rusland wordt afgezet tegen de temperatuur.

Voor het BHIC maakte Stefan eens een datavisualisatie op basis van een zoekopdracht in de genealogische database. Het zoekresultaat kopieerde hij naar Excel en daar bakte hij er grafieken en dergelijke van. Wat was de top-10 van namen en plaatsen? Hoe was het verloop van het aantal geboorten over enkele jaren? Waarom staken sommige plaatsen er met kop en schouders bovenuit? Data visualiseren kan verborgen trends en verhalen zichtbaar maken en laat je extra vragen stellen.

Denk dan ook:

  • Wat zou de gebruiker willen weten? Help de data-context te duiden.

  • Data is ook statistiek. Denk vooral aan frequenties.

  • Laat ontwerpers je data 'uitproberen'.

  • Kies voor handmatig, automatisch of interactief, afhankelijk van je doelgroep.

  • Maak data 'open'.

  • Verbind met bestaande data.

De presentatie door Stefan bevatte veel inspiratie, maar weinig handvat. Misschien is dat ook lastig. Met de tips en aandachtspunten die hij gaf, moet je dus vooral zelf aan de slag. Of anderen aan de slag laten. Het BHIC heeft, samen met Bob Coret, op dit moment bijvoorbeeld een klein projectje lopen rond onze genealogische data. Daarover later meer.

Discussie

Interessant was nog het discussiepunt over wat de rol van archiefdiensten zou moeten zijn, met name hoe ver die zou moeten gaan. De meesten leken het er wel over eens dat wij vooral moeten zorgen voor het openstellen van onze datasets/collecties. En dat anderen die data zouden moeten bewerken, verbinden en visualiseren.

Ook werd eens te meer duidelijk dat 'open data' minder en minder onze eigen 'keuze' is. Zijn het geen richtlijnen die ons data dwingen open te stellen, dan zijn het wel de gebruikers zelf die hem - al dan niet met toestemming vooraf of achteraf - openbreken. Als voorbeeld noemde Stefan de fotodata van het Stadsarchief Amsterdam. Die was ingebracht voor de wedstrijd Apps for Amsterdam... maar niet door het stadsarchief zelf (dat overigens later wel medewerking verleende en erg blij was met de resultaten van die wedstrijd!) Voor een paar honderd euro heb je al spiders die andermans data crawlen, volgens Stefan.

Doe ermee wat je wilt.

Afbeelding bovenaan: stilte in beeld

Trefwoorden