Agentic AI en governance: waarom autonomie de beheersingsvraag verscherpt
Agentic AI heeft geen nieuw soort governance nodig. Autonomie vergroot de afstand tussen wat een systeem doet en wie ervoor accountable is, wat de bestaande governance-keten, control die naar risico traceert en vooruit naar bewijs, belangrijker maakt, niet minder. De acties zijn echt en soms onomkeerbaar, dus de inzet op elke control stijgt.
De vocabulaire van agentic AI is overal op dit moment: harness, loop, context, memory, tool use, orchestration, guardrails, human in the loop. Deze termen beschrijven hoe een agent werkt: de engineering waarmee een model zelfstandig taken uitvoert in plaats van alleen vragen beantwoordt. Ze zijn de moeite waard om te kennen. Maar weten waaruit een agent is opgebouwd, vertelt je niet hoe je hem onder controle houdt, en dat is de vraag die een organisatie daadwerkelijk moet beantwoorden voordat ze er een inzet.
Dit artikel neemt de gangbare agentic-vocabulaire als startpunt en stelt de governancegovernanceHet stelsel waarmee een organisatie zichzelf bestuurt: corporate governance, risicobeheer, compliance, verantwoordingslijnen, risicobereidheid en het besturingsmodel. Het bestaat over alles wat de organisatie doet, voor en los van AI. AI governance is ditzelfde stelsel, uitgebreid voor AI. Zie AI governance, governance design, executie.Open full entry →-vraag die de vocabulaire overslaat: wanneer een AI-systeemAI-systeemEen machinaal systeem dat voor expliciete of impliciete doelen uit invoer afleidt hoe het uitvoer genereert, voorspellingen, inhoud, aanbevelingen of beslissingen, die fysieke of virtuele omgevingen kunnen beïnvloeden. De OESO-achtige definitie die de EU AI Act volgt. Zie algoritme, machine learning.Open full entry → niet langer alleen output produceert maar zelfstandig acties onderneemt, wat gebeurt er dan met controlcontrolDe concrete, toetsbare maatregel die een specifiek risico vermindert en daarmee het achterliggende principe beschermt. Ook wel risicobeheersmaatregel, risicorespons of risicobehandeling genoemd. Altijd herleidbaar tot het risico dat het adresseert: onder EU AI Act Art. 9 moet elke control terug te voeren zijn op een specifiek risico, en controls die los van hun risico's worden vastgelegd vormen een erkende compliance-fout. Het werkt in een van drie typen: preventief, detectief of correctief. Zie risico, control-typen, bewijs.Open full entry →, toezicht, bewijsbewijsHet concrete bewijs dat een control is ontworpen, geïmplementeerd en werkt: een testrapport, een audit trail, een impactassessment, een monitoringlog. Elke schakel in de governance-keten levert een artefact op, en samen zijn ze wat een organisatie overhandigt aan haar eigen bestuur, een toezichthouder, een klant of een betrokkene om te tonen, niet te zeggen, dat een systeem bestuurd is. De afwezigheid ervan is zelf het falen: een risicoregister zonder testresultaten, of een maatregel die wordt geclaimd zonder validatie, is een governance-gat, geen papierwerk-gat. De sluitende schakel van de governance-keten. Zie control, governance.Open full entry → en verantwoordelijkheid? Kort gezegd: autonomie creëert geen nieuwe soort governance. Het vergroot de afstand tussen wat het systeem doet en wie ervoor verantwoordelijk is, en dat maakt de bestaande governance-ketengovernance-ketenDe herleidbare lijn waarlangs een enkele pijler voor een enkel systeem wordt geborgd: principe, dan de schade die het zou schenden, dan het risico van die schade, dan de control die het risico vermindert (preventief, detectief of correctief), dan het restrisico geoordeeld tegen de risicobereidheid, bewezen met bewijs. De keten maakt verantwoorde AI verantwoordbaar in plaats van aspiratief, en stelt een organisatie in staat een principe van een beleidsuitspraak naar een werkende control te brengen die ze kan aanwijzen. Zie principe, schade, risico, control, restrisico, bewijs.Open full entry → belangrijker, niet minder belangrijk.
Wat er verandert als een systeem agentic wordt
Een traditioneel AI-systeem produceert een output: een score, een classificatie, een stuk tekst. Een mens leest het en beslist wat te doen. De beslissing, en de verantwoordelijkheid ervoor, ligt duidelijk bij de persoon.
Een agentic systeem verkleint die afstand of haalt hem weg. Het suggereert niet alleen; het handelt. In de gangbare vocabulaire: tool use betekent dat de agent zelf de database bevraagt, de e-mail verstuurt of het record bijwerkt; een loop betekent dat hij de cyclus van handelen-controleren-beslissen herhaalt zonder dat een mens elke stap goedkeurt; orchestration betekent dat meerdere van deze acties aan elkaar geketend worden over tools heen. Het doel van al deze engineering is om het systeem te laten werken zonder dat een mens elke stap controleert. Dat is precies de eigenschap die het nuttig maakt, en precies de eigenschap die het governance-probleem creëert.
Want dit is wat er verschuift: in een traditioneel systeem is de mens standaard het controlepunt, dat tussen de output en de handeling staat. In een agentic systeem staat die mens niet langer automatisch in het pad. Het controlepunt verdwijnt niet; het moet ontworpen worden. Als je het niet ontwerpt, heb je een systeem dat echte acties onderneemt zonder dat iemand gepositioneerd is om de ene actie te onderscheppen die je niet ongedaan kunt maken.
De control-vraag: guardrails zijn controls, geen features
In de agentic-vocabulaire zijn guardrails "de grenzen aan wat een agent mag doen." Dat klopt op zichzelf, maar het presenteert een guardrail als een productfeature, een instelling. In governance-termen is een guardrail een control: een doelbewuste beperking die terug te voeren is op een specifiek risicorisicoIn de termen van de EU AI Act de combinatie van de waarschijnlijkheid dat een schade optreedt en de ernst ervan als dat gebeurt. De schakel tussen een principe (via de schade die het zou schenden) en een control (de maatregel die het vermindert). Het benoemen van de schade en het inschatten van het risico is op grond van Art. 9 vereist voordat een maatregel wordt gekozen. Zie schade, control, restrisico.Open full entry → en bewijs produceert dat ze standhield.
Het onderscheid doet ertoe omdat het verandert hoe je erover redeneert. Een feature is iets dat je aanzet. Een control is iets waar je naar kunt wijzen en kunt zeggen: deze adresseert dat risico, ze is preventief (ze stopt de handeling voordat die plaatsvindt) in plaats van detectief (ze merkt het achteraf), en hier is het logboek dat bewijst dat ze van kracht was toen de agent draaide. Het "iets dat je niet ongedaan kunt maken" waar iedereen zich zorgen over maakt bij agents is, in governance-taal, een risico op onomkeerbare schadeschadeDe concrete schade die een AI-systeem kan aanrichten en die een principe van verantwoorde AI beoogt te voorkomen: in de termen van de EU AI Act schade aan iemands gezondheid, veiligheid of grondrechten. Schade is de brug tussen een abstract principe en een bestuurbaar risico; governance wordt operationeel op het moment dat een organisatie de specifieke schades benoemt die ze wil voorkomen. Voor eerlijkheid is een schade dat een groep stelselmatig slechtere uitkomsten krijgt vanwege een kenmerk dat niet had mogen meetellen. Zie principe, risico.Open full entry →, en een risico op onomkeerbare schade is precies het soort dat om een preventieve control met bewijs erachter vraagt, niet om een instelling waarvan iemand hoopt dat hij aanstaat.
Dit is het GovCompass-model toegepast op agents: elke guardrail is een control, elke control traceert naar een risico en vooruit naar bewijs. Agents veranderen die logica niet. Ze verhogen de inzet ervan, want de acties zijn echt en soms onomkeerbaar. (Voor de volledige keten, zie wat is AI governance.)
De toezichtsvraag: "human in the loop" is niet automatisch toezicht
De vocabulaire biedt human in the loop: "een persoon keurt goed voordat de agent iets doet dat ertoe doet." Dit is de meest overschatte term in de agentic-vocabulaire, want de frase beschrijft een positie en suggereert stilzwijgend dat die control biedt, terwijl dat niet hetzelfde is.
De EU AI Act vereist in Artikel 14 dat high-risk AI-systemen zo ontworpen zijn dat ze effectief door mensen overzien kunnen worden. Het sleutelwoord is effectief. Een mens in de loop zetten voldoet aan het organogram; het voldoet niet aan Artikel 14 tenzij die mens betekenisvol kan ingrijpen. Een persoon die veertig agent-acties per uur moet goedkeuren, zonder een reële mogelijkheid om elke afzonderlijke te beoordelen, is geen toezicht. Een persoon die goedkeurt omdat de interface hem naar "ja" duwt en hem geen basis geeft om "nee" te zeggen, is geen toezicht. Dat is automation biasautomation biasDe menselijke neiging om geautomatiseerde uitkomsten te veel te vertrouwen, een aanbeveling van een systeem aanvaarden zonder het geval echt te wegen, wat het menselijk toezicht uitholt. Zie menselijk toezicht.Open full entry → verkleed als control, en de Act benoemt het direct: Artikel 14 vereist dat toezichthouders zich bewust kunnen blijven van de neiging om te veel te vertrouwen op de output van een systeem. Het is een van de meest voorkomende manieren waarop agentic-implementaties de effectiviteitstoets niet doorstaan.
Betekenisvol toezicht vereist vier dingen die de frase "human in the loop" niet garandeert: de autoriteit om te overrulen zonder repercussies, de expertise om de handeling van de agent te beoordelen, de informatie om te begrijpen wat de agent op het punt staat te doen, en de tijd om het te beoordelen. Haal er één weg en de mens is een stempel, en het systeem is onbeheerst ongeacht wie nominaal in de loop zit.
Veelzeggend: de Act koppelt de zwaarte van het toezicht direct aan autonomie. Artikel 14 vereist dat de toezichtsmaatregelen evenredig zijn aan de risico's, het niveau van autonomie, en de gebruikscontext. De wet zelf zegt met andere woorden dat hoe autonomer het systeem is, hoe meer toezicht het vraagt, wat precies het punt is dat een agentic-implementatie zich niet kan veroorloven te missen.
De bewijsvraag: evals zijn bewijs, niet alleen tests
In de vocabulaire zijn evals "een gescoorde set taken waartegen je een agent test, zoals unit-tests voor AI." De analogie is goed voor engineers. De governance-herkadering is dat evals bewijs zijn: niet alleen een controle tijdens de ontwikkeling dat de agent werkt, maar onderdeel van het dossier dat aantoont, aan een toezichthouder of auditor, dat het systeem deed wat je beweerde en getest is tegen de risico's die ertoe doen.
Het verschil tussen een test en bewijs is duurzaamheid en doel. Een test vertelt je vandaag of het ding werkt. Bewijs is wat je maanden later kunt overleggen wanneer iemand je vraagt aan te tonen dat het systeem geschikt was voor gebruik, binnen zijn grenzen handelde, en na de lancering werd gemonitord. Agents maken dit lastiger, want hun gedrag hangt af van de context en kan driften, dus het bewijs kan geen eenmalige momentopname zijn. Het moet het soort doorlopend dossier zijn dat de governance-keten is gebouwd om te produceren.
De verantwoordelijkheidsvraag: iemand is accountable, ongeacht autonomie
Dit is waar agentic AI mensen het sterkst verleidt tot een categoriefout: hoe autonomer het systeem, hoe makkelijker het is om te praten alsof de agent verantwoordelijk is. Dat is hij niet. Accountability verschuift niet naar software.
De EU AI Act is hier expliciet over voor gebruiksverantwoordelijken. Artikel 26 maakt de gebruiksverantwoordelijkegebruiksverantwoordelijkeEen organisatie die een AI-systeem onder eigen gezag in haar activiteiten gebruikt, met exploitantplichten: gebruik volgens de instructies, toezicht, relevantie van de invoer, monitoring, kennisgevingen. Zie aanbieder, AI-verplichtingen.Open full entry → accountable voor het high-risk AI-systeem dat hij inzet, ongeacht wie het bouwde, inclusief de plicht om human oversight toe te wijzen en de logs van het systeem te bewaren. Autonomie verdunt dat niet. Een agent die zelfstandig handelt, is nog steeds een agent die iemand koos in te zetten, configureerde, en accountable voor is. Hoe lastiger het systeem te traceren is, hoe meer de last bij de gebruiksverantwoordelijke ligt om de controls, het toezicht en het bewijs te hebben gebouwd die laten zien dat het onder controle was.
Het praktische gevolg: naarmate een systeem agentic-er wordt, wordt de vraag "wie is accountable als dit schade veroorzaakt" niet vager; hij wordt veeleisender. Je kunt niet naar de autonomie wijzen en je schouders ophalen. Je moet wijzen naar de control die het had moeten onderscheppen, het toezicht dat had moeten ingrijpen, en het bewijs dat laat zien of een van beide aanwezig was.
Waarom dit governance belangrijker maakt, niet minder
Het is verleidelijk om te denken dat een systeem dat slim genoeg is om zelfstandig te handelen, minder bestuur nodig heeft. Het tegendeel is waar. Elke eigenschap die een agent nuttig maakt, handelen zonder een mens in het pad, tools aan elkaar ketenen, verbeteren met geheugen, opereren in een loop, vergroot ook de afstand tussen de handeling en de accountable persoon. Governance is wat die afstand overbrugt: de control die de handeling beperkt, het toezicht dat hem kan stoppen, het bewijs dat aantoont wat er gebeurde, en de met naam genoemde persoon die er accountable voor is.
Agentic AI heeft geen nieuw governancemodel nodig. Het heeft het bestaande nodig, met meer rigueur toegepast, want de acties zijn echt, soms onomkeerbaar, en lastiger te traceren. De vocabulaire vertelt je hoe agents werken. Governance vertelt je hoe je in command blijft, en dat is het deel dat bepaalt of het inzetten van een agent verantwoord is.
Verder lezen
Veelgestelde vragen
- Heeft agentic AI andere governance nodig?
- Nee. Het heeft het bestaande governancemodel nodig, met meer rigueur toegepast. Autonomie creëert geen nieuwe categorie; het vergroot de afstand tussen wat het systeem doet en wie accountable is, wat de standaardketen, control die naar risico traceert en vooruit naar bewijs, belangrijker maakt, niet minder. De acties zijn echt en soms onomkeerbaar, dus de inzet op elke control stijgt.
- Zijn guardrails hetzelfde als controls?
- Een guardrail is een control, maar het een "feature" noemen onderschat het. Een feature is iets dat je aanzet; een control is een doelbewuste beperking die terug te voeren is op een specifiek risico en bewijs produceert dat ze standhield. Een guardrail als control kaderen is wat je in staat stelt te redeneren of ze preventief is, welk risico ze adresseert, en of je kunt bewijzen dat ze van kracht was.
- Is "human in the loop" genoeg voor naleving van de EU AI Act?
- Niet op zichzelf. Artikel 14 vereist dat high-risk systemen zo ontworpen zijn dat een mens er effectief toezicht op kan houden. Een persoon die in de loop is gepositioneerd maar niet betekenisvol kan ingrijpen, door gebrek aan autoriteit, expertise, informatie of tijd, haalt die drempel niet. De Act koppelt het vereiste toezicht ook aan het niveau van autonomie van het systeem, dus autonomere agents vragen meer.
- Wie is accountable als een autonome agent schade veroorzaakt?
- De gebruiksverantwoordelijke, in EU AI Act-termen. Artikel 26 maakt de gebruiksverantwoordelijke van een high-risk AI-systeem accountable ongeacht wie het bouwde, inclusief het toewijzen van human oversight en het bewaren van logs. Accountability verschuift niet naar de software omdat die zelfstandig handelt. Hoe lastiger de agent te traceren is, hoe meer de last bij de gebruiksverantwoordelijke ligt om aan te tonen dat de controls, het toezicht en het bewijs aanwezig waren.