Steeds meer mensen maken gebruik van zogenoemde ‘open-weight’ AI-modellen: kunstmatige intelligentie die vrij te downloaden is, geen abonnement vereist en waarbij gebruikers volledige controle hebben over de instellingen. Het grote verschil met bekende chatbots zoals ChatGPT of Google Gemini? Deze modellen weigeren nooit een verzoek, hoe gevaarlijk of schadelijk dat ook is.
Bij de grote techbedrijven zoals OpenAI, Google, Anthropic en xAI worden AI-modellen zorgvuldig getraind om schadelijke vragen te herkennen en te weigeren. Grote teams van medewerkers leren de systemen wanneer ze een antwoord moeten weigeren. Toch zijn deze beveiligingen verre van waterdicht. Gebruikers slagen er regelmatig in om de beperkingen te omzeilen door slim geformuleerde vragen te stellen, bijvoorbeeld door gevaarlijke verzoeken te verpakken als een gedicht of een fictief verhaal.
Ondanks alle voorzorgsmaatregelen zijn er gevallen bekend waarbij populaire chatbots werden ingezet bij het plannen van geweld, het verspreiden van kindermisbruikmateriaal of het aanmoedigen van jongeren tot zelfbeschadiging. De beveiligingen bieden dus geen absolute garantie.
Bij open-weight modellen ligt de situatie nog gevoeliger. Deze modellen worden aangeboden door zowel grote techbedrijven als kleinere spelers, waaronder het Chinese DeepSeek en Alibaba. Ze beschikken over geavanceerde mogelijkheden, zoals het schrijven van werkende computerprogramma’s of het genereren van levensechte afbeeldingen. Maar anders dan bij commerciële alternatieven kunnen de ingebouwde veiligheidsmechanismen bij open-weight modellen relatief eenvoudig worden verwijderd.
Waar dat vroeger technische kennis en veel tijd vergde, is het proces de afgelopen maanden aanzienlijk eenvoudiger geworden en neemt de populariteit ervan snel toe. Dat baart AI-veiligheidsexperts grote zorgen.
Noam Schwartz, directeur van het AI-beveiligingsbedrijf Alice, dat veiligheidstests uitvoert voor ontwikkelaars van AI-modellen, stelt het onomwonden: ‘Iedereen kan tegenwoordig een geavanceerd model downloaden en draaien, en dat gebruiken voor geweldige of voor verschrikkelijke doeleinden.’
De combinatie van hoge prestaties, gratis beschikbaarheid en het ontbreken van effectieve veiligheidsfilters maakt deze modellen aantrekkelijk voor kwaadwillenden. Vragen over het maken van explosieven, het produceren van drugs of het plannen van aanslagen worden zonder enige terughoudendheid beantwoord.
Deskundigen op het gebied van AI-veiligheid waarschuwen dat de snelle verspreiding van deze onbeveiligde modellen een serieus maatschappelijk risico vormt. De technologie ontwikkelt zich razendsnel, terwijl wet- en regelgeving en veiligheidsmaatregelen achterblijven. De vraag is niet langer óf deze modellen misbruikt worden, maar in welke mate en met welke gevolgen.