WikiLeaks, goed voor een vast aandeel in het dagelijkse nieuws, heeft de laatste paar maanden de koers gewijzigd.
Door de documentenkraan bijna dicht te doen en innige verhoudingen aan te gaan met gevestigde journalisten is de organisatie van klokkenluidersite veranderd in persbureau.
Die wijziging heeft geleid tot mediasucces, ook in Nederland. Het puikje van de nationale media kreeg de exclusieve beschikking over alle ambtsberichten van de Amerikaanse ambassade in Den Haag uit de grote zak 'Cablegate'- documenten, en zette deze op computers in een kamer van internet afgesloten. Journalisten mogen in die ruimte onderzoekswerk doen, en er items of artikelen uit brouwen, druppel voor druppel.
Dat die Hilversumse kamer is afgesloten van internet is veelzeggend. De documenten zijn nu in de veilige handen van de journalistiek. Het mes snijdt aan twee kanten. Met de documenten achter slot en grendel kunnen zaken gecheckt en personen beschermd worden met journalistieke zorgvuldigheid. De druppelsgewijze vrijgave op een NOS-website via de journalistieke flessenhals zorgt voor een kleine maar verslavende dagelijkse dosis aandacht voor WikiLeaks-nieuws.
In de publieke opinie lijken de Iraqi War Logs en de Afghan War Logs, de andere twee grote stunts van WikiLeaks in 2010, alweer vergeten. Dat is tegen de verhoudingen in. Van het veelbesproken Cablegate zijn nog geen drieduizend documenten vrijgegeven. Tegelijk staan er meer dan honderd keer zoveel oorlogsberichten uit Irak en Afghanistan op de WikiLeaks-site, 466.743. Dit zijn aantallen die niet meer te bevatten zijn voor een gemiddelde lezer of zelfs de geoefende onderzoeksjournalist. Simpelweg te veel tekst. Met een gemiddelde lengte van honderd woorden per oorlogsbericht bevat het WikiLeaks-oorlogsarchief genoeg tekst om drie jaar de krant van voor tot achter te vullen.
Toen WikiLeaks tegelijk met de Afghaanse oorlogsdocumenten ook een video vrijgaf waarin een groep burgers en journalisten werd beschoten vanuit Amerikaanse legerhelikopters, trokken die beelden alle aandacht. De berichtgeving naar aanleiding van de vrijgave van de honderdduizenden berichten beperkte zich vooral tot het geven van globale statistieken en het herhaald tonen van de video. WikiLeaks voorzag de documenten van categorieën als 'sektarisch geweld' en 'bermbom', en de pers slaagde er zelden in om meer te produceren dan strakke infographics, gebaseerd op deze categorieën, die lieten zien dat verreweg de meeste doden in Irak burgerslachtoffers waren en dat het dodelijk geweld in Irak piekte in 2006 en 2007.
De staafdiagrammen en hun analyses zijn typische voorbeelden van een belangrijke nieuwe trend in de onderzoeksjournalistiek: data journalism. In het gebruik van het woord data schuilt een probleem: veel van de beschikbare data is tekst, veel lastiger te behandelen dan cijfers of categorieën. Om te beginnen kan de tekst in het Chinees of Arabisch zijn. Maar ook als het Nederlands of Engels is, staat de vraag nog ver open hoe je in al die tekst naar een verhaal kunt zoeken. De journalist die precies wil weten hoeveel kindslachtoffers er gevallen zijn onder de burgerdoden in Irak zal meer moeten doen dan googelen op 'child', want dat levert alle duizenden artikelen op waarin kinderen genoemd worden, en niet noodzakelijk als dodelijk slachtoffer. Wat nodig is, is een informatielaag over iedere tekst, die weergeeft wat er aan belangrijke zaken in staan, ongeacht hoe dat in woorden werd gevat. Hoe macaber ook, oorlogsincidenten zijn als weerberichten: ze zijn te vatten in een vast en klein aantal kenmerken zoals plaats, tijd en het aantal doden en gewonden.
De technologie waarmee een tekst een algemene informatielaag krijgt, bestaat al enige decennia, de laatste jaren onder de naam text analytics. Ook in Nederland wordt op verschillende universiteiten gewerkt aan deze technologie en er is een bedrijfstak ontstaan die andere bedrijven helpt met omzetten van grote aantallen documenten naar hanteerbare en doorzoekbare databases. Ook grote mediabedrijven zetten text analytics in, maar net als bij WikiLeaks wordt de druppelmethode gehanteerd; met het oog op de mogelijke nieuwswaarde en concurrentiepositie worden belangrijke gegevens achtergehouden en pas naar buiten gebracht als er artikelen over zijn geschreven.
Iedere wannabe journalist of blogger die op eigen houtje op zoek wil naar de geheimen van WikiLeaks moet op dit moment wel een dosis computervaardigheden en liefst ook vakkennis meenemen. Toch zal het naar mijn verwachting snel gaan met de ontwikkeling van gebruiksvriendelijke online hulpmiddelen die de crowd, de duizenden geïnteresseerde leken die allemaal wat willen graven, in staat zal stellen om de enorme bergen informatie door te ploegen. Onderzoeksjournalisten doen mee met deze trend, maar zullen niet meer de enigen zijn. De strijd tussen gecontroleerd druppelen uit de flessenhals en met z'n allen goudzoeken in grote gegevensstromen is losgebarsten.
Antal van den Bosch is hoogleraar Geheugen, taal en betekenis (Universiteit van Tilburg). Hij verzorgt daar morgen een column tijdens een discussie over WikiLeaks; vanaf 14.30 uur in zaal DZ1.
© Brabants Dagblad 2012, op dit artikel rust copyright.
Niet beschikbaar!


















