Datavisualisatie met Excel: Liegen met grafieken

Het boek van de maand februari is ExpertHandboek Datavisualisatie in Excel. Het is geschreven door Wim de Groot. Deze maand publiceren we op dit blog een aantal voorproefjes uit boek. Een interview dat we eerder met Wim de Groot hadden lees je HIER. Dit 3de voorproefje is afkomstig uit uit het 12de hoofdstuk en gaat over het misbruiken van grafieken door ermee te ‘liegen’: Liegen met grafieken!
Het 1ste voorproefje over de basis van het maken van grafieken in Excel vind je HIER. Het 2de voorproefje, over het opmaken en aanpassen van grafieken, vind je HIER. Een gastblogpost van Wim de Groot over zijn boek vind je HIER. (H.F.)

Liegen met Grafieken

Een bekend gezegde luidt: ‘Er zijn leugens, grove leugens en statistiek’ (toegeschreven aan Mark Twain). Die zouden we kunnen uitbreiden tot: ‘Er zijn leugens, grove leugens, statistiek en visualisatie’. Al in 1954 schreef Darrel Huff het boek ‘How to lie with Statistics’. Het is heel goed mogelijk om grafieken te misbruiken in uw eigen voordeel. Dit hoofdstuk gaat over liegen met grafieken.

  • U laat het verschil tussen twee kolommen veel groter overkomen door niet op nul te beginnen.
  • Als twee gebeurtenissen toevallig tegelijk voorkomen, betekent dit nog niet dat er ook een oorzakelijk verband tussen beide bestaat, maar u kunt een verband wel suggereren.
  • Als u uw eigen cijfers het voordeligst wilt laten uitkomen, maakt u uw eigen kolom een stuk dikker.
  • Of laat gegevens weg die niet goed van pas komen; laat u de cijfers weg die hoger staan dan uzelf, dan staat u vanzelf bovenaan.
  • U kunt de ene lijn boven de andere plaatsen (waar dat niet terecht is) door een secundaire as te gebruiken en die te manipuleren.
  • Als u appels met peren vergelijkt, brengt u een verband aan tussen gegevens die los van elkaar staan.
  • En als u uit een langere periode net dat ene stukje haalt dat afwijkt van de rest, haalt u de cijfers uit hun context.

De zeven hoofdzonden herkennen

Met datavisualisatie kunt u feitelijke informatie laten zien, maar de kijker ook op het verkeerde been zetten. Dat is zoiets als wollig taalgebruik: met mooie woorden de dingen iets anders zeggen, zonder helemaal te liegen. Er zijn diverse manieren om grafieken zo te manipuleren, dat ze de waarheid geweld aandoen. Ik noem zeven manieren, ofwel ‘zeven hoofdzonden’.

Verschil overdrijven

Als u aantallen met elkaar vergelijkt, zet u die meestal in kolommen naast elkaar. Wilt u het verschil tussen twee kolommen benadrukken, dan kunt u alleen het bovenste deel van de kolommen weergeven. U past hiervoor de verticale as zo aan, dat deze niet op nul begint; hiervoor kiest u As opmaken en geeft u bij Minimum een waarde groter dan nul op. U kunt het verschil tussen beide kolommen overdrijven, door de kleinste kolom erg kort te maken. Heeft de ene kolom bijvoorbeeld een waarde van 50 en de andere een waarde van 100, dan is de grootste kolom tweemaal zo lang als de andere. Maar u kunt dan voor de verticale as als minimum 40 opgeven. De kortste kolom is dan 10 hoog en de langste 60, waardoor deze zesmaal zo lang is en het lijkt alsof zijn waarde ook zesmaal zo groot is.

  • Gaat het om een staafdiagram (met liggende balken), dan kiest u voor de horizontale as As opmaken en geeft u daarbij Minimum een vast getal op, groter dan nul.

Gebruikt u een kolomgrafiek, zet dan de kolom altijd op de nullijn. Ziet u een grafiek met kolommen die niet op de nullijn staan, dan is de kans groot dat iemand probeert de zaak te bedriegen. U weet nu hoe u dat kunt ontmaskeren.

Liegen met grafieken

Als de kolommen niet op nul beginnen, wordt het verschil overdreven. Hier is 100 het dubbele van 50, dus moet de grootste kolom tweemaal zo lang zijn als de andere.

Het volgende voorbeeld laat zien welke tien fabrikanten van smartphones het best hebben verkocht in Nederland in de eerste helft van 2016. Samsung stond met een marktaandeel van 41,6 procent bovenaan en Apple was tweede met 28,2 procent. U kunt een kolomgrafiek maken en daarin de kleinere merken negeren. U stelt hiervoor de verticale as in op een minimum van 0,25 (u moet in het venster As opmaken het Minimum als een decimaal getal opgeven, dus 25% typt u als 0,25). De kolom van Samsung wordt hierdoor vijfmaal langer dan de kolom van Apple.

Liegen met grafieken

Het marktaandeel van Samsung lijkt veel groter dan dat van Apple, doordat de verticale as op 25% begint.

Dit is een vorm van liegen met grafieken: de indruk wordt gewekt dat Samsung een veel groter marktaandeel had dan Apple, en dat de acht andere merken niets voorstelden. Opnieuw is het devies: laat de verticale as van een kolomgrafiek op nul beginnen. Dat heb ik in de volgende afbeelding (12.3) gedaan. U ziet dat het verschil tussen Samsung en Apple veel minder groot is, dat Huawei en Alcatel ook een partijtje meeblazen en dat de overige merken ongeveer even klein zijn.

Overigens zijn de merken moeilijk te lezen, doordat ze gekanteld zijn. Om deze teksten goed weer te geven is het prettiger om een staafgrafiek te gebruiken.

  • Om de langste staaf bovenaan te krijgen, kiest u voor de verticale as via As opmaken voor Categorieën in omgekeerde volgorde.

De verticale as van een kolomgrafiek moet altijd op nul beginnen.

Liegen met grafieken

Voor langere woorden gebruikt u liever een staafgrafiek, zodat de tekst goed leesbaar is.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.