Uitgelicht

Statistiek en de werkelijkheid

Bij Opiniez bespreekt de Amerikaanse hoogleraar economie Nikolai G. Wenzel een boek van zijn collega-econoom Paul Collier. Als ik Wenzel goed begrijp, pleit Collier in zijn boek voor minder ideologie en meer pragmatisme. Dat pragmatisme behelst herverdeling om de grote ongelijkheid te bestrijden en staatsingrijpen om marktfalen op te lossen. Volgens Wenzel: “een simplistisch boek … dat een verkeerde diagnose van de problemen geeft en hij stelt als recept meer van de giftige stoffen voor, die ons in deze moeilijke situatie hebben gebracht.” Die giftige stoffen betreft het ‘pragmatische overheidsingrijpen’ dat Collier voorstelt. Om zijn betoog kracht bij te zetten bespeelt Wenzel de loftrompet over de resultaten van het kapitalisme. Bij dat getrompetter kunnen de nodige vragen worden gesteld. 

Bron: Pixabay

Wenzel: “Op mondiaal niveau is het percentage van de wereldbevolking dat in extreme armoede leeft, gedaald van 36% in 1990 tot 10% in 2015.” Inderdaad is de extreme armoede wereldwijd gedaald. Maar is dat een verdienste van het kapitalisme? Zoemen we wat in op die daling van de armoede dan komt een groot deel hiervan voor rekening van China. In dat land leefde in 1990 nog 62% van de mensen in armoede, nu is dat nog maar 3%.  Eén probleem, China is nu niet een schoolvoorbeeld van kapitalisme. Het land wordt centraal geleid door de communistische partij.

(H)et gemiddelde inkomen van de laagste twee kwintielen is met respectievelijk 22% en 15% gestegen en het mediane inkomen is met 21% gestegen.” Ook dat cijfer zal best kloppen alleen heeft de gemiddelde Amerikaan niets aan die inkomensstijging. “In fact, despite some ups and downs over the past several decades, today’s real average wage (that is, the wage after accounting for inflation) has about the same purchasing power it did 40 years ago. And what wage gains there have been have mostly flowed to the highest-paid tier of workers,” zo concluded Pew research

Maar daarvoor kunnen ze wel meer tv en wasmachine kopen, aldus Wenzel: “Een standaardpakket huishoudelijke apparaten kostte de gemiddelde werknemer 885,6 uur werk in 1959, tegenover 170,4 uur werk in 2013. In die tijd daalden de “arbeidsuren” bij het gemiddelde loon van de werknemer van 100,5 naar 23,3 voor een wasmachine; 90,9 tot 20,7 voor een vaatwasser; en 127,8 tot 20,7 voor een kleuren-tv – en al deze voorbeelden laten kwaliteitsverandering binnen de goederen zelf buiten beschouwing.” Bovendien wordt: “Dit effect (…) nog groter door een bijzonder feit: het “hele scala van items die algemeen worden aangetroffen in Amerikaanse huishoudens, inclusief arme gezinnen, die zelfs een generatie geleden niet bestonden.” Daar heeft Wenzel een punt, een generatie geleden hadden we nog geen pc, tablet en ‘smartphone’ en die hebben ze nu wel: allemaal toegenomen welvaart. Hierbij vergeet Wenzel echter dat je nu bijna niet meer zonder die apparaten kunt, ze zijn een ‘basisgoed’. Net zoals een wasmachine dat is. Het pakket basisgoederen is gegroeid en die groei eet de winst van de goedkopere wasmachine weer op.

Wenzel gaat verder: “Evenzo zijn voor het gemiddelde Amerikaanse huishouden de voedseluitgaven gedaald in de afgelopen eeuw van een derde naar een achtste van het inkomen. Het ministerie van Landbouw in de Verenigde Staten meldt dat de voedseluitgaven als percentage van het inkomen tussen 1970 en 2007 zijn gedaald van 14% naar 9%.” Alleen zegt een gemiddelde niet veel. Als er negen mensen zijn met 0 inkomen en eentje met 100, dan is het gemiddelde inkomen 10, alleen zal niemand zich in dat gemiddelde herkennen. Zo ook voor uitgaven aan voedsel. Als de bovenste 10% hun inkomen met 100% ziet groeien en de rest gelijk blijft, dan zal het percentage dat een gemiddeld inkomen aan voedsel besteedt dalen, alleen hebben die 90% waarvan het inkomen gelijk is gebleven, daar niets aan. Het percentage dat zij aan voedsel uitgeven is nog steeds hetzelfde.

Tsja, cijfers blijven lastig.

Artificiële Intelligentie en de ‘wielenman’

Zou de uitvinder van het wiel krediet hebben gekregen van een algoritme? Die vraag kwam bij me op na het lezen van een artikel in de Volkskrant over de rol die Artificiële Intelligentie (AI) steeds meer gaat spelen bij het nemen van beslissingen. Bij een kredietaanvraag wordt niet alleen gekeken naar de betaalhistorie van iemand, maar ook: “‘niet-financiële data’ over het gedrag van potentiële kredietnemers, zoals startende ondernemers. Dat zijn vragenlijsten, maar ook gegevens die afkomstig zijn van de socialemedia-accounts van klanten of van hun zoekgeschiedenis.” De kredietaanvrager moet daar natuurlijke ‘toestemming’ voor geven. Probleem is alleen dat geen toestemming geven geen krediet betekent.  

Illustratie: Flickr

Wat zegt een database met gegevens over de toekomst? Zelfs als die, als dat al mogelijk is, ‘zuivere gegevens’ bevat? En vooral wat zegt een database over de toekomst van één individu? Wat de AI doet is niets anders dan kans berekenen en daarbij gebruik maken van gemiddelden: mensen die X doen, doen in zes van de tien gevallen ook Y. En dat over heel veel gegevens. Dat zegt niets over één persoon die X doet. Hoe eerlijk en rechtvaardig is het om die persoon te beoordelen op alle eerdere personen die X deden?  

Terug naar mijn vraag met betrekking tot de uitvinder van het wiel. Laten we er even vanuit gaan dat het grote probleem uit het artikel is opgelost. Dat zijn de gegevens waarin de AI zoekt. Want: “kunstmatige intelligentie gedraagt zich wat dat betreft behoorlijk voorspelbaar: als je er rommel instopt, komt er ook rommel uit.”  Nee, de data zijn perfect. De ‘wielenman’ is, net als bijna alle uitvinders een mens die afwijkt van het normale. De ‘wielenman’ kan trouwens ook een vrouw zijn. Een man met ‘wilde ideeën’ en daarover schrijft op zijn sociale media accounts. Reageert op anderen die niet vernieuwend zijn en die anderen reageren ook op zijn ideeën. Dat gaat er soms wild aan toe en ook toen golden: “twee bekende (internet)wetten: Godwin en Sturgeon. De wet van Godwin luidt: ‘Naarmate onlinediscussies langer worden, nadert de waarschijnlijkheid van een vergelijking met de nazi’s of Hitler tot 1.’ Als we daar de wet van sciencefictionauteur Theodore Sturgeon aan toevoegen (‘90 procent van alles is troep’).” En omdat de ‘wielenman’ ook maar mens is, laat hij zich soms laatdunkend en ongelukkig uit over anderen. Hij wijkt af van het gangbare, van de norm in de databases. Vindt een AI iemand die afwijkt van de norm, kredietwaardig?

Zal hij niet ook nul op het rekest krijgen als die database vol zit met alle uitvindingen en pogingen daartoe? Pogingen tot een uitvinding zijn immers veel talrijker dan successen. Zal AI daaruit niet concluderen dat de kans op mislukken te groot is? AI zoekt correlatie en door daar besluiten aan te verbinden wordt het gepresenteerd als causaliteit. De AI zal ijsjes verbieden omdat er veel mensen verdrinken. 

Hedendaagse ‘Stalins’

‘Een sterfgeval is een tragedie, honderd sterfgevallen is een statistiek’ Een uitspraak die wordt toegedicht aan Sovjetdictator Jozef Stalin. Een uitspraak die ook van toepassing is of lijkt op de manier waarop er naar het vluchtelingenprobleem wordt gekeken. Alleen al door het woord ‘vluchtelingenprobleem’ wordt het een statistisch gebeuren. Zoals een andere beroemde uitspraak waarvan niet duidelijk is wie er het ‘copyright’ op heeft, zijn er: ‘three kinds of lies: lies, damned lies, and statistics.’ Een uitspraak die in het debat over het vluchtelingenprobleem weer wordt bevestigd.

Stalin_in_July_1941

Foto: Wikimedia Commons

“In de binnenzak van zijn jasje zit een stukje baksteen verwikkeld in twee lagen plastiek. Dat was het enige wat hij kon vastpakken nadat zijn huis in elkaar stortte alsof het uit zand gebouwd was. Zo verschroeiend was de kracht van de bommen. Voor de puinhoop zaten zijn vrouw en kinderen te wenen, maar hij had zoveel pijn dat hij niet kon wenen.” de eerste alinea van een column van Bleri Lleshi op de Belgische site MO.be. “Je bent een mens,” is de titel van de column waarin Lleshi de wereld beschrijft door de ogen van een vluchteling. Aan die column is niets toe te voegen. Niets toe te voegen, maar wel bij aan te vullen. Dat aanvullen doet Sipan Morad in een filmpje op Youtube.

Een column en een filmpje die de vluchtelingenproblematiek terugbrengen tot de kern: het leed van mensen. Mensen die huis en haard hebben moeten verlaten omdat ze hun leven niet meer zeker zijn. Omdat huis, haard en stad er niet meer zijn. Als het grote vluchtelingenprobleem wordt teruggebracht tot het levens verhaal van Sipan dan is de eerste reflex van bijna iedereen om de jongeman te helpen. Zijn het er duizenden, dan wordt het een ander verhaal. Dan raakt het onze gevoelens. Ten minste die van het overgrote deel van ons. Alleen delven die duizenden individuele verhalen vol leed, het onderspit tegen de derde soort leugen, de statistiek.

Aan Stalin die ik eerder aanhaalde wordt ook de volgende uitspraak toegedicht: ‘Vermoord één man en je bent een moordenaar, vermoord er een heleboel en je bent een held.’ Een uitspraak die ook van toepassing is op het vluchtelingendebat. Immers worden de politici die het strengste zijn, die er alles aan doen om vluchtelingen te weren en zo wellicht bijdragen aan de dood van velen, niet als hedendaagse ‘Stalins’ vereerd? En worden de mensen die vluchtelingen uit zee vissen en redden van de verdrinkingsdood daarentegen niet als criminelen weggezet?

 

Moslims, knikkers, wetenschap en profetie

Migranten, islam, antisemitisme, woorden die vaak in combinatie voorkomen. Zo ook in een artikel van Robert Bor bij Opiniez. Bor: “Als je weet hoe mensen in moslimlanden over Joden denken, dan heb je een goed beeld welke overtuigingen men meeneemt van het thuisland naar het gastland.” Wat Bor zegt lijkt op het eerste gezicht logisch. Als je een pot met 1.000 knikkers hebt waarvan er 40% zwart en 60% wit zijn en ze zijn goed gemengd, dan zal een willekeurige greep uit de pot ongeveer 40% zwarte knikkers bevatten. Zou dat ook opgaan voor mensen?

marbles-3275438_960_720

Illustratie: Pixabay

Is het per definitie zo dat een deelverzameling (de vluchtelingen) dezelfde overtuigingen meenemen dan de totale verzameling (het thuisland) waaruit ze wordt gehaald? Wat als er regionale of culturele verschillen in opvattingen zijn en vluchtelingen vooral uit een specifieke regio of cultuur komen? Wat als met name de mensen die gruwen van antisemitisme vluchten? Een land met mensen en opvattingen is niet te vergelijken met een pot levenloze knikkers. 

Bor reageert op een rapport waaraan onder andere de Leidse hoogleraar migratiegeschiedenis Leo Lucassen heeft meegewerkt. Lucassen ziet dat anders  en concludeert dat de huidige islamitische vluchtelingen niet de oorzaak zijn van de vermeende toename van antisemitisme. Bor hierover: “Voor degenen die gehoopt hadden dat de sociale wetenschappen op klip en klare wijze nu eindelijk hebben aangetoond hoe het echt zit, zal dit rapport een teleurstelling zijn.” Wetenschap die ‘klip en klaar’ aantoont hoe het echt zit en dan vooral sociale wetenschappen? Wetenschap als een soort god, die zekerheid geeft?

Wetenschap levert kennis, laat licht schijnen op zaken, maar zekerheid? Kan de wetenschapper en vooral een sociale wetenschapper, die bieden? Als wetenschap ‘klip en klaar’ zou aantonen hoe iets zit, als ze zekerheid zou geven, dan zou ze zich niet ontwikkelen. Dan zou de uitdrukking ‘voortschrijdend inzicht’ niet bestaan. Vooral in de sociale wetenschappen beïnvloedt het beweerde het onderzochte, heb je te maken met zichzelf bevestigende en ontkennende beweringen en uitspraken.

De enige zekerheid die een wetenschapper, zeker een sociale wetenschapper, kan geven is dat niets zeker is. Beweert de wetenschapper andere zekerheid te geven, dan is het een ‘profeet’ en moet je met ‘profeten’ niet uitkijken? 

In de sterren geschreven

Een artikel in de Volkskrant over de lancering van Tess (Transit Exoplanet Survey Satellite) zorgde voor een leuke serie van lezersbrieven. Tess is opvolger van Kepler en: “Tess volgt een andere strategie bij zijn speurtocht. (…) Kepler had een relatief grote telescoop waarmee hij diep het heelal in kon turen. De sterren die Kepler bestudeerde, stonden ver weg – honderden lichtjaren. Vanwege zijn grote telescoop kon Kepler maar een klein deel van de hemel bekijken. (…) Tess is kleiner en gaat de complete hemel bestuderen, zowel het noordelijk als zuidelijk halfrond. Maar liefst 200 duizend sterren zal Tess de komende jaren in zijn vizier krijgen, op enkele tot honderd lichtjaren.” Rond die sterren wordt gezocht naar planeten en vooral naar planeten waar leven zou kunnen zijn.

andromeda-galaxy-755442_960_720

Foto: pixabay

De brievencorrespondentie begon met een brief van Uri Lavy. Lavy vindt de miljarden die aan Tess en andere dergelijke zaken worden uitgegeven, verspild geld. Dat er planeten zullen zijn met leven, is voor Lavy een statistisch gegeven. “Maar even duidelijk is dat de mensheid absoluut niets aan het identificeren van zo’n planeet kan hebben – zeker niet zolang we niet met ten minste de snelheid van het licht kunnen reizen. En dan nog, bij aankomst kan blijken dat de moederster intussen allang uitgedoofd is.” Dus verspilling van geld, aldus Lavy.

Een duidelijke redenering waar lastig een speld tussen is te krijgen. Alleen zijn conclusie dat dergelijke investeringen zinloos zijn, wordt betwist door sterrenkundige Lucas Ellerbroek in de Volkskrant. Die investeringen zijn niet zinloos: “Die kennis kunnen we verkrijgen door in eerste instantie de aarde te observeren (onder andere door observatie met  dure! satellieten) en onze plek in het heelal te vergelijken met zijn soortgenoten. (…)  Kennis heeft de mensheid gebracht waar zij nu is. Alleen door meer kennis te verkrijgen en daar wijs mee om te gaan, waarborgen we een gezonde toekomst voor ons nageslacht.” Ook een duidelijke redenering waarbij je wel de vraag kunt stellen of kennis wijs wordt gebruikt? Immers techniek kan ook ten kwade worden aangewend.

Met die opmerking kom ik bij de reactie van Frank Rijckaert. Hij is het volledig eens met Lavy” “maar niet met zijn bewering dat het statistisch duidelijk is dat het aantal planeten waar intelligent leven bestaat naar oneindigheid zal neigen. Er is slechts één waarneming van een planeet waarop intelligent leven voorkomt. Daarmee valt geen statistiek te bedrijven.” En daar heeft Rijckaert een punt, met één waarneming kun je geen statistiek bedrijven. Sterker nog, en dat punt mist Rijckaert, je kunt er zelfs niet de conclusie aan verbinden dat op die ene planeet, de aarde, intelligent leven voorkomt. Wat is immers de schaal waaraan je intelligentie op planeten afmeet? 

Dat er andere sterren met planeten zijn, lijkt zeker. Dat er planeten met leven zullen zijn ook. Of er intelligent leven is en of het leven op aarde intelligent is, dat staat … in de sterren geschreven.

Tapijt

Witte Onschuld het laatste boek van Gloria Wekker . Ik schreef er twee keer eerder over. De eerste keer over ‘ witte onschuld’ een gebrek aan kennis dat volgens Wekker tot macht leidt. De tweede keer over het alles verklarende ‘culturele archief’ waarnaar zij verwijst. Er is nog een punt in haar boek dat grote vraagtekens bij mij oproept.

tapijt

Foto: Pixabay

Dat punt heeft betrekking op een manier waarop zij tot algemene uitspraken komt. In haar boek schrijft ze over protesten die het project Read the Masks: Tradition is not Given in Eindhoven dat handelde over zwarte piet. Het project bestond onder andere uit een protestmars. Die protestmars leidde tot reuring en dan volgt er een bijzonder redenering. Lees mee op pagina 208: “Over de protestmars, die in de zomer was gepland, werd geschreven in het rechtse dagblad De Telegraaf, dat indertijd de grootste oplage in het land had. Dit leidde tot een lawine van overwegend negatieve reacties.” Wekker rubriceert en analyseert de ongeveer vijftienhonderd reacties en komt dan tot de volgende conclusie: “Omdat de thema’s elkaar overlappen en in elkaar overvloeien, betoog ik dat ze samen een dik tapijt vertegenwoordigen van de huidige Nederlandse zelfrepresentatie, belaagd door vijanden binnen en buiten de natie.” Lezen we hier dat de lezers van, of eigenlijk nog beter de reageerders op een artikel in De Telegraaf het denken van Nederland vertegenwoordigen? Ja, De Telegraaf had in die tijd de grootste oplage. Ja, vijftienhonderd reacties is veel. Maar om te concluderen dat dit representatief is voor Nederland?

Heeft mevrouw Wekker geen kennis van de basisbeginselen van statistisch onderzoek? Dat er, om valide uitspraken te kunnen doen over een groep als de Nederlanders, meer nodig is dan vijftienhonderd reacties uit één hoek van de Nederlandse samenleving? Het is zelfs maar helemaal de vraag of die 1.500 reageerders een goede afspiegeling vormen van de toenmalige Telegraaflezer. De meeste krantenlezers reageren immers niet op artikelen, het is maar een kleine groep lezers die zich die moeite getroost. Bovendien is de vraag opportuun hoe sturend het bericht in De Telegraaf is geformuleerd.

Ja, de in thema’s gerubriceerde reacties vertegenwoordigden een dik tapijt van de toenmalige Telegraafreageerder. Voor alle Telegraaflezers zal dat tapijt al flink wat dunner zijn en voor de Nederlander wellicht niet meer dan wat versleten draden.

… geen garantie voor de toekomst

“Klinisch oordeel voorspelt niet, actuariële risicotaxatie wel. Ook, juist, in ‘individuele zaken’. Zoals wij in het rapport schrijven is een groep niets meer dan een verzameling individuen.”

Een zin uit het betoog in de Volkskrant van Corinne Dettmeijer-Vermeulen, de Nationaal Rapporteur Mensenhandel en Seksueel Geweld tegen Kinderen en Laura Meneti, onderzoeker bij Nationaal Rapporteur, waarin zij zich verweren tegen kritiek op de statistische manier van risicotaxatie van recidive, waarvan zij pleitbezorgers zijn. Een manier waarbij naar risicofactoren en welk deel van de mensen die risicofactor hun eerdere foute gedrag herhalen. Die ‘actuariële risicotaxatie moet vervolgens bepalen welke straf of behandeling de betrokken persoon krijgt.

statitstiek

Illustratie: foodnavigator.com

Een redelijk betoog. Die statistische berekeningen zijn immers volgens de kunst van de wetenschap uitgevoerd. Zo kan een besluit in een individuele zaak wetenschappelijk worden onderbouwd en hangt het niet af van selectieve beoordelingen door personen. Het persoonlijke oordeel wordt uit de beoordeling gehaald, het oordeel wordt objectiever.

Toch roept dit bij mij wat vragen op. Gebeurt er zo niet nog iets anders? Wordt op deze manier niet ook het persoonlijke van de mens die terecht staat uit het oordeel gehaald? Draait het zo niet alleen om factoren van de persoon die als risicovol worden gezien? Wordt hij zo niet beoordeeld en bij het bepalen van zijn strafmaat veroordeeld, voor het bezitten van die factoren? Hoe zit het met andere kenmerken of factoren van deze persoon? Kenmerken die het risico beperken? Wellicht bezit deze persoon juist een combinatie van kenmerken die herhaling voorkomt. Kenmerken die zo buiten beschouwing worden gelaten. Zou daar ook niet naar gezocht en gekeken moeten worden?

Nog een slagje verder. Wordt iemand zo niet be- en veroordeeld op basis van de daden van anderen? Die actuariële risicotaxatie is een verzameling gegevens uit het verleden. gegevens waarbij mensen zijn ontleed in kenmerken en waarbij per kenmerk is geturfd hoevaak iemand zijn fout herhaalde. Hoe terecht is het om iemand in het heden te beoordelen op mogelijke daden in de toekomst, waarbij het oordeel is gebaseerd op deelgegevens van anderen uit het verleden? Deelgegevens, want die gegevens handelen niet over personen maar over kenmerken.

Moet in een rechtszaak en dus ook bij het inschatten van het risico op recidive niet de hele persoon met al zijn kenmerken, nukken, eigenaardigheden, goede en slechte eigenschappen worden beoordeeld en niet slechts enkele risicofactoren? Of een groep niet meer dan een verzameling individuen is, daar kun je een boom over opzetten. Een individu is zeker meer dan een verzameling kenmerken. In de beleggerswereld staan statistische gegevens ook centraal en bij ieder product dat daar wordt aangeboden eindigt de reclame met een volgende soort zin: “ Let op. Rendementen uit het verleden bieden geen garantie voor de toekomst.’