Art. 51 EU AI Act: een GPAI-model classificeren als systeemrisico
Art. 51 bepaalt wanneer een AI-model voor algemene doeleinden wordt geclassificeerd als model met systeemrisico. Een model komt in de systeemrisico-categorie wanneer het capaciteiten met grote impact heeft, wat wordt vermoed zodra de cumulatieve rekenkracht die voor de training is gebruikt meer dan 10^25 floating-point operaties (FLOP) bedraagt, of wanneer de Commissie het als zodanig aanwijst. Classificatie als systeemrisico activeert de aanvullende verplichtingen van Art. 55 bovenop de basisverplichtingen van Art. 53 die voor elke GPAI-aanbieder gelden.
Wat Art. 51 doet
De EU AI Act reguleert AI voor algemene doeleinden op het niveau van het model, niet van het systeem. Hoofdstuk V creëert een gelaagd regime: elke aanbiederaanbiederDe actor die een AI-systeem ontwikkelt (of laat ontwikkelen) en het onder eigen naam op de markt brengt of in gebruik neemt, met fabrikantachtige plichten: ontwerpcontrols, documentatie, conformiteit. Zie gebruiksverantwoordelijke, AI-verplichtingen.Open full entry → van een AI-model voor algemene doeleinden draagt de basisverplichtingen van Art. 53, en een kleinere groep waarvan de modellen een hogere capaciteitsdrempel halen draagt de aanvullende, zwaardere verplichtingen van Art. 55. Art. 51 is de poort tussen de twee niveaus. Het definieert wanneer een GPAI-model wordt geclassificeerd als een AI-model voor algemene doeleinden met systeemrisicosysteemrisicoCategorie van de EU AI Act voor de meest capabele general-purpose modellen (verondersteld boven een drempel van trainingsrekenkracht), wat extra plichten activeert: evaluaties, tegenwerkend testen, incidentmelding, cyberbeveiliging. Zie general-purpose AI-model, general-purpose AI.Open full entry →.
De twee routes naar systeemrisico
Een model wordt via een van twee routes als systeemrisico geclassificeerd.
De eerste is capaciteiten met grote impact. Een model heeft systeemrisico als het capaciteiten met grote impact heeft, beoordeeld met passende technische instrumenten, methodologieën en benchmarks. Art. 51(2) hangt hier een vermoeden aan: een model wordt vermoed capaciteiten met grote impact te hebben wanneer de cumulatieve rekenkracht die voor de training is gebruikt, gemeten in floating-point operaties, meer dan 10^25 FLOP bedraagt. Deze rekendrempel is de praktische trigger die de huidige voorhoede van de meest geavanceerde modellen vangt.
De tweede is aanwijzing door de Commissie. Los van het rekenvermoeden kan de Commissie een model als systeemrisico aanwijzen op basis van de criteria in Annex XIII, wanneer het capaciteiten of impact heeft die gelijkwaardig zijn aan die welke door de drempel worden gevangen. Deze route laat het regime een model vangen dat systeemrisico vormt om andere redenen dan pure trainingsrekenkracht.
De drempel ligt niet vast
De drempel van 10^25 FLOP is een vermoeden, geen onverzettelijke lijn. Art. 51(3) geeft de Commissie de bevoegdheid om de drempels te wijzigen en de benchmarks en indicatoren aan te vullen via gedelegeerde handeling, zodat de classificatie de technologische ontwikkeling bijhoudt. Naarmate trainen efficiënter wordt, kan dezelfde capaciteitsvoorhoede met minder rekenkracht worden bereikt, dus de drempel kan in de loop van de tijd worden verlaagd om alleen de werkelijk meest capabele modellen te blijven vangen. Een aanbieder waarvan het model de rekendrempel overschrijdt kan het systeemrisico-vermoeden ook betwisten door aan te tonen dat het model, ondanks de rekenkracht, geen capaciteiten met grote impact heeft die met de meest geavanceerde modellen overeenkomen.
Waarom het ertoe doet
Classificatie als systeemrisico is ingrijpend omdat het de lijn is die het basis-GPAI-regime scheidt van het voorhoede-modelregime. Onder de lijn draagt een aanbieder de Art. 53-verplichtingen: technische documentatietechnische documentatieRegistraties die een aanbieder voor een hoog-risico-AI-systeem moet samenstellen en bewaren om conformiteit aan te tonen, met dekking van het ontwerp, de data, het testen, het risicobeheer en de monitoring. Zie aanbieder, bewijs, model card.Open full entry →, downstream-transparantietransparantieOpenheid over het feit dát AI wordt gebruikt en hoe het in het algemeen werkt: openbaarmakingen, documentatie, kennisgevingen. Vormt een paar met uitlegbaarheid, die over individuele uitkomsten gaat. Zie uitlegbaarheid, principe.Open full entry →, een auteursrechtbeleid, en een openbare samenvatting van de trainingsinhoud. Boven de lijn draagt de aanbieder daarnaast de Art. 55-verplichtingen: modelevaluatie en adversarial testing, beoordeling en mitigatie van systeemrisico, melding van ernstige incidenten aan het AI Office, en cyberbeveiliging van het model. Voor de meeste organisaties is de praktische relevantie indirect: de foundation-modellen waarop ze bouwen worden doorgaans geleverd door de kleine groep bedrijven waarvan de modellen deze drempel overschrijden, wat betekent dat die modellen wettelijk onderworpen zijn aan systematische veiligheidsevaluatie.
In de GovCompass-7
Art. 51 is primair een verantwoordelijkheidsbepaling: het bepaalt welke partij welke set verplichtingen op modelniveau draagt. Het systeemrisico-regime dat het opent reikt ook in de pijlers beveiliging en robuustheidbeveiliging en robuustheidHet principe dat een AI-systeem aanvallen, manipulatie en tegenwerkende of onverwachte invoer weerstaat. De aanvalsvectoren omvatten data poisoning, modelextractie, membership inference en prompt injection; de controls zijn ML-beveiligingstesten en een geharde data- en modelpijplijn. Zie robuustheid, principe, control.Open full entry → en veiligheid en betrouwbaarheid, omdat de Art. 55-verplichtingen die het activeert gaan over het evalueren, mitigeren en beveiligen tegen risicorisicoIn de termen van de EU AI Act de combinatie van de waarschijnlijkheid dat een schade optreedt en de ernst ervan als dat gebeurt. De schakel tussen een principe (via de schade die het zou schenden) en een control (de maatregel die het vermindert). Het benoemen van de schade en het inschatten van het risico is op grond van Art. 9 vereist voordat een maatregel wordt gekozen. Zie schade, control, restrisico.Open full entry → op modelniveau.