Het Amerikaanse AI-bedrijf Anthropic heeft zijn twee meest geavanceerde kunstmatige intelligentie-modellen uitgeschakeld, nadat de Amerikaanse overheid het bedrijf opdracht gaf de toegang voor buitenlandse gebruikers te blokkeren. Als reden werden nationale veiligheidszorgen aangehaald, zonder dat daar verdere details bij werden gegeven.
Anthropic maakte vrijdag bekend dat het de modellen, intern bekend als Fable 5 en Mythos 5, per direct heeft uitgeschakeld voor alle gebruikers wereldwijd. Het bedrijf ontving een exportcontrolemaatregel van de overheid, maar kreeg geen concrete onderbouwing voor de beslissing.
Volgens Anthropic gaat de overheid ervan uit dat er een methode bestaat om een beveiligingslaag in Fable 5 te omzeilen, ook wel aangeduid als ‘jailbreaking’. Via deze methode zou het model mogelijk kunnen worden ingezet om kwetsbaarheden in software op te sporen, iets wat als een veiligheidsrisico wordt beschouwd.
Het besluit komt op een moment dat de verhouding tussen Anthropic en de Amerikaanse regering al onder druk stond. Eerder dit jaar raakte het bedrijf in conflict met de Trump-administratie nadat het weigerde zijn AI-modellen beschikbaar te stellen voor binnenlandse surveillance door het Amerikaanse leger en voor volledig autonome wapensystemen. Als reactie daarop plaatste de overheid Anthropic op een zwarte lijst voor toeleveringsketens, die later dit jaar van kracht zou worden. De afgelopen weken leken de spanningen enigszins af te nemen, maar de nieuwe maatregel betekent een forse escalatie.
De stap is ook opmerkelijk in bredere zin: tot nu toe richtten Amerikaanse exportbeperkingen op het gebied van kunstmatige intelligentie zich voornamelijk op de chips en hardware die nodig zijn om AI te ontwikkelen. Het direct beperken van toegang tot AI-modellen zelf is een nieuwe en verdergaande aanpak.
Anthropic zelf is het niet eens met de redenering van de overheid. Het bedrijf stelt slechts ‘mondelinge aanwijzingen over een mogelijk beperkte en niet-universele jailbreak’ te hebben ontvangen. Volgens Anthropic rechtvaardigt het bestaan van zo’n smalle potentiële kwetsbaarheid niet het volledig terugtrekken van een model dat door honderden miljoenen mensen wordt gebruikt.
Het bedrijf benadrukt dat de overheidsactie niet voldoet aan de principes van eerlijke en op feiten gebaseerde regelgeving. Dat is opvallend, omdat Anthropic nog maar enkele dagen eerder, op woensdag, juist had gepleit voor strenger Amerikaans toezicht op AI, inclusief de mogelijkheid om modellen met onaanvaardbare risico’s te blokkeren.
De situatie illustreert de toenemende spanning tussen AI-ontwikkelaars en overheden over de vraag hoe risico’s van zogenoemde jailbreaks beoordeeld moeten worden en welke maatregelen daarbij proportioneel zijn.






