Ook de burger kan snel schatgraven in WikiLeaks

Auteur: door Antal van den Bosch |   woensdag 26 januari 2011 | 09:30 | Laatst bijgewerkt op: woensdag 26 januari 2011 | 10:04

Tekstgrootte tekst verkleinentekst vergroten
Julian Assange. EPA

Julian Assange. EPA

WikiLeaks, goed voor een vast aandeel in het dagelijkse nieuws, heeft de laatste paar maanden de koers gewijzigd.

Door de documentenkraan bijna dicht te doen en innige verhoudingen aan te gaan met gevestigde journalisten is de organisatie van klokkenluidersite veranderd in persbureau.

Die wijziging heeft geleid tot mediasucces, ook in Nederland. Het puikje van de nationale media kreeg de exclusieve beschikking over alle ambtsberichten van de Amerikaanse ambassade in Den Haag uit de grote zak 'Cablegate'- documenten, en zette deze op computers in een kamer van internet afgesloten. Journalisten mogen in die ruimte onderzoekswerk doen, en er items of artikelen uit brouwen, druppel voor druppel.

Dat die Hilversumse kamer is afgesloten van internet is veelzeggend. De documenten zijn nu in de veilige handen van de journalistiek. Het mes snijdt aan twee kanten. Met de documenten achter slot en grendel kunnen zaken gecheckt en personen beschermd worden met journalistieke zorgvuldigheid. De druppelsgewijze vrijgave op een NOS-website via de journalistieke flessenhals zorgt voor een kleine maar verslavende dagelijkse dosis aandacht voor WikiLeaks-nieuws.

In de publieke opinie lijken de Iraqi War Logs en de Afghan War Logs, de andere twee grote stunts van WikiLeaks in 2010, alweer vergeten. Dat is tegen de verhoudingen in. Van het veelbesproken Cablegate zijn nog geen drieduizend documenten vrijgegeven. Tegelijk staan er meer dan honderd keer zoveel oorlogsberichten uit Irak en Afghanistan op de WikiLeaks-site, 466.743. Dit zijn aantallen die niet meer te bevatten zijn voor een gemiddelde lezer of zelfs de geoefende onderzoeksjournalist. Simpelweg te veel tekst. Met een gemiddelde lengte van honderd woorden per oorlogsbericht bevat het WikiLeaks-oorlogsarchief genoeg tekst om drie jaar de krant van voor tot achter te vullen.

Toen WikiLeaks tegelijk met de Afghaanse oorlogsdocumenten ook een video vrijgaf waarin een groep burgers en journalisten werd beschoten vanuit Amerikaanse legerhelikopters, trokken die beelden alle aandacht. De berichtgeving naar aanleiding van de vrijgave van de honderdduizenden berichten beperkte zich vooral tot het geven van globale statistieken en het herhaald tonen van de video. WikiLeaks voorzag de documenten van categorieën als 'sektarisch geweld' en 'bermbom', en de pers slaagde er zelden in om meer te produceren dan strakke infographics, gebaseerd op deze categorieën, die lieten zien dat verreweg de meeste doden in Irak burgerslachtoffers waren en dat het dodelijk geweld in Irak piekte in 2006 en 2007.

De staafdiagrammen en hun analyses zijn typische voorbeelden van een belangrijke nieuwe trend in de onderzoeksjournalistiek: data journalism. In het gebruik van het woord data schuilt een probleem: veel van de beschikbare data is tekst, veel lastiger te behandelen dan cijfers of categorieën. Om te beginnen kan de tekst in het Chinees of Arabisch zijn. Maar ook als het Nederlands of Engels is, staat de vraag nog ver open hoe je in al die tekst naar een verhaal kunt zoeken. De journalist die precies wil weten hoeveel kindslachtoffers er gevallen zijn onder de burgerdoden in Irak zal meer moeten doen dan googelen op 'child', want dat levert alle duizenden artikelen op waarin kinderen genoemd worden, en niet noodzakelijk als dodelijk slachtoffer. Wat nodig is, is een informatielaag over iedere tekst, die weergeeft wat er aan belangrijke zaken in staan, ongeacht hoe dat in woorden werd gevat. Hoe macaber ook, oorlogsincidenten zijn als weerberichten: ze zijn te vatten in een vast en klein aantal kenmerken zoals plaats, tijd en het aantal doden en gewonden.

De technologie waarmee een tekst een algemene informatielaag krijgt, bestaat al enige decennia, de laatste jaren onder de naam text analytics. Ook in Nederland wordt op verschillende universiteiten gewerkt aan deze technologie en er is een bedrijfstak ontstaan die andere bedrijven helpt met omzetten van grote aantallen documenten naar hanteerbare en doorzoekbare databases. Ook grote mediabedrijven zetten text analytics in, maar net als bij WikiLeaks wordt de druppelmethode gehanteerd; met het oog op de mogelijke nieuwswaarde en concurrentiepositie worden belangrijke gegevens achtergehouden en pas naar buiten gebracht als er artikelen over zijn geschreven.

Iedere wannabe journalist of blogger die op eigen houtje op zoek wil naar de geheimen van WikiLeaks moet op dit moment wel een dosis computervaardigheden en liefst ook vakkennis meenemen. Toch zal het naar mijn verwachting snel gaan met de ontwikkeling van gebruiksvriendelijke online hulpmiddelen die de crowd, de duizenden geïnteresseerde leken die allemaal wat willen graven, in staat zal stellen om de enorme bergen informatie door te ploegen. Onderzoeksjournalisten doen mee met deze trend, maar zullen niet meer de enigen zijn. De strijd tussen gecontroleerd druppelen uit de flessenhals en met z'n allen goudzoeken in grote gegevensstromen is losgebarsten.

Antal van den Bosch is hoogleraar Geheugen, taal en betekenis (Universiteit van Tilburg). Hij verzorgt daar morgen een column tijdens een discussie over WikiLeaks; vanaf 14.30 uur in zaal DZ1.

© Brabants Dagblad 2012, op dit artikel rust copyright.

Reageren

blij blozend boos cool verrast droevig egaal gemeen huilend vertwijfeld knipoog lachen rollendeogen tongeruit wijdogig

Regels voor artikelreacties

Het Brabants Dagblad lezers graag de mogelijkheid te reageren op nieuwsartikelen. Hieraan zijn voorwaarden verbonden. Lees de regels.

  1. Het Brabants Dagblad houdt zich het recht voor om zonder opgaaf van redenen reacties te weigeren of te verwijderen.
  2. Reacties met als afzender een overduidelijk valse naam, bijvoorbeeld die van een bekende Nederlander, of met in de afzender scheld- of schuttingwoorden worden niet geplaatst.
  3. Verwijzingen naar websites worden niet geplaatst.
  4. Er mag geen sprake zijn van het schenden van het copyright van derden (citeren mag, complete publicaties overnemen niet).
  5. Letterlijk identieke reacties worden niet geplaatst.
  6. Reacties in een buitenlandse taal kunnen we niet plaatsen.
  7. Commerciële boodschappen worden niet geplaatst
  8. Reacties die het technisch functioneren van de website zouden kunnen hinderen, worden niet geplaatst.
  9. Reacties waarin niet fatsoenlijk wordt omgegaan met anderen, andermans mening niet wordt gerespecteerd of anderen worden beschuldigd worden niet geplaatst.
  10. Oproepen tot oproer en demonstraties worden niet geplaatst.
  11. Doodsverwensingen en reacties met scheldwoorden en/of beledigingen worden niet geplaatst.
  12. De wet mag niet worden overtreden. Denk met name de wetsartikelen over discriminatie.
  13. Van -ook geweigerde- reacties waarin concreet bedreigingen worden geuit tegen personen of groepen personen, doen wij aangifte.

Het IP-adres vanwaar wordt gereageerd wordt vastgelegd.

Zie ook de Leidraad ethisch handelen van de redactie van het Brabants Dagblad.

  • www.probeereenkrant.nl
  • www.autotrack.nl
  • www.jobtrack.nl
  • www.mensenlinq.nl
  • www.funda.nl
  • www.kleintjesmarkt.nl
  • www.tickettrack.nl
  • www.deondernemer.nl
  • www.lekkerpuzzelen.nl
  • www.sweetdeal.nl