Antropoloog in Twitterland

Met nieuwe software op zoek naar taalschatten in Twitter.

Helaas hebben we niet meer de rechten op de originele afbeelding
adformatie

&;Twitter waait wel weer over.&; In 2008 was ik er als masterstudent computercommunicatie stellig van overtuigd dat we met een kortstondige trend te maken hadden. Steeds je bezigheden onderbreken om over diezelfde bezigheden een berichtje te tikken, wie houdt dat vol?

Ruziemakende tieners
Maar ik had het flink mis. Ruziemakende tieners, campagnevoerende politici en euforische voetbalfans, steeds meer mensen zouden het voorbeeld volgen van de kleine groep Twitteradepten. Inmiddels worden alleen al in Nederland elke dag meerdere miljoenen tweets het web op geslingerd. Deze tweets onthullen veel over de wereld om ons heen, ze bevatten interessante informatie. Voor een mens is het echter onmogelijk om alle tweets die op een dag gepost worden tot zich te nemen; laat staan om een beeld te krijgen van de grotere patronen gevormd door tweets over een langere periode.

Gereedschap
Zonde, want juist deze patronen bieden een schat aan kennis die geenszins met een simpele zoekopdracht in Twitter opgehaald kan worden. Denk aan de mate van agressief taalgebruik in aanloop naar een voetbalwedstrijd, of de snelheid en de wijze waarop woorden als swagger en yolo door mensen worden overgenomen. Dit is het onderzoek waar ik me dagelijks op stort: ik lever een bijdrage aan het gereedschap dat nodig is om zulke schatten op te graven.

Gevatte grappen
Mijn vakgebied heet taaltechnologie en is een vorm van kunstmatige intelligentie. Het doel is om datgene waar de mens heel goed in is – taal interpreteren- na te doen, en zo mogelijk beter. Denk aan schaakcomputer Deep Blue die als eerstecomputer een schaakgrootmeester, Gary Kasparov, aftroefde. Wij taaltechnologen pretenderen (nog) niet dat we de computer vaardiger kunnen maken dan de mens in het écht begrijpen van betekenis of het maken van gevatte grappen. De computer is echter wel razendsnel in het lezen van woorden en het oppervlakkige begrip hiervan. Geen overbodige luxe in een tijd dat het web zich vult met gigantisch veel geschreven tekst. Door middel van taaltechnologie helpt de zoekmachine van Google ons om de gewenste informatie op te halen uit het web, en behoeden spamfilters ons van het lezen van onzinmail.

Coole software
Ook Twitter bedient de gebruiker met een zoeksysteem om tweets over de gewenste onderwerpen te vinden, als aanvulling op de bekende trending topics en het volgen van accounts. Maar zoals gezegd: hiermee wordt niet het hele verhaal verteld. Er is coole software nodig die de interessante patronen uit de immer doorstromende Twitterrivier kan vissen.

Mickey Mouse-hand
De komende tijd zal ik op deze plek mijn ervaringen bij het ontwikkelen van deze software met je delen. Want mijn werk is niet alleen nuttig, maar ook nog eens heel leuk om te doen! Daarnaast ga je wat meekrijgen van een langdurige persoonlijke worsteling. Want de negatieve houding die ik in 2008 over Twitter had, is nog steeds niet helemaal verdwenen: De tweets die ik in een jaar vanaf mijn persoonlijke account verstuur, zijn op een Mickey Mouse-hand te tellen. In dat opzicht voel ik me soms een antropoloog die observeert wat er in Twitterland gaande is, zonder de taal nog echt te spreken. Misschien wordt het tijd om het quotum wat op te schroeven.

*Deze blogs verschijnen oorspronkelijk op , als onderdeel van het Faces of Science project van KNAW, De Jonge Akademie, KennisLink en Fastfacts. 

Plaats als eerste een reactie

Ook een reactie plaatsen? Word lid van Adformatie!

Word lid van Adformatie → Login →
Advertentie