Op de internationale dag tegen haatspraak, die de Verenigde Naties jaarlijks op 18 juni vieren, staat de vraag centraal hoe goed kunstmatige intelligentie (AI) in staat is om haatdragende inhoud online te herkennen en te verwijderen. VN-secretaris-generaal António Guterres waarschuwde dat sociale mediaplatforms haatspraak eerder versterken dan tegengaan.
Haatspraak wordt door de VN omschreven als elke vorm van communicatie — gesproken, geschreven of in gedragsvorm — die mensen discrimineert of aanzet tot geweld op basis van wie ze zijn of worden geacht te zijn. Daarbij gaat het om kenmerken zoals ras, etniciteit, religie, geslacht, seksuele geaardheid of een beperking. Haatspraak beperkt zich niet tot woorden alleen: ook afbeeldingen, cartoons, gebaren en zelfs voorwerpen kunnen er een uitingsvorm van zijn.
Uit een gezamenlijk onderzoek van opiniepeiler Ipsos en UNESCO uit 2023, waarbij ruim 8.000 mensen in 16 landen werden ondervraagd, bleek dat meer dan twee derde van de internetgebruikers weleens haatspraak online is tegengekomen. Volgens de respondenten zijn LGBTQI-personen het vaakst doelwit (33 procent), gevolgd door etnische en raciale minderheden (28 procent) en vrouwen (18 procent).
Opmerkelijk is dat Meta, het moederbedrijf van Facebook en Instagram, de afgelopen jaren aanzienlijk minder haatdragende berichten heeft verwijderd. In het laatste kwartaal van 2025 werden respectievelijk 1,3 miljoen berichten van Instagram en 1,3 miljoen van Facebook verwijderd. Ter vergelijking: in hetzelfde kwartaal een jaar eerder waren dat nog 7,4 miljoen op Instagram en 5,8 miljoen op Facebook. Deze daling hangt samen met een beleidswijziging waarbij Meta minder proactief op zoek gaat naar haatspraak en meer vertrouwt op meldingen van gebruikers zelf.
TikTok liet daarentegen weten in het vierde kwartaal van 2025 maar liefst 96,3 procent van alle haatdragende inhoud te hebben verwijderd.
AI-systemen worden steeds vaker ingezet om haatspraak automatisch te detecteren, maar ze schieten op meerdere vlakken tekort ten opzichte van menselijk oordeel. Zo hebben deze modellen moeite met context, ironie en culturele nuances. Een zin die in de ene cultuur als beledigend wordt beschouwd, kan in een andere volkomen onschuldig zijn. Ook sarcasme en humor worden door AI regelmatig verkeerd geïnterpreteerd.
Daarnaast zijn AI-modellen vaak getraind op datasets die bepaalde talen en culturen oververtegenwoordigen, waardoor ze minder goed presteren bij minder gangbare talen of dialecten. Haatspraak die zich bedient van codetaal, eufemismen of nieuwe slang ontsnapt bovendien regelmatig aan geautomatiseerde detectie.
Menselijke moderators begrijpen subtiele sociale en politieke context beter, maar zijn op hun beurt niet schaalbaar genoeg om de enorme hoeveelheid online content bij te houden. De uitdaging ligt dan ook in een effectieve samenwerking tussen mens en machine, waarbij AI het grove werk doet en mensen de lastige gevallen beoordelen.
