Progressieve autonomie: een volwassenheidsmodel voor agent-inzet
De veiligste manier om een agent in te zetten is om het de minste autonomie te geven die het zijn werk laat doen, en die autonomie pas te verbreden naarmate bewijs van betrouwbaar gedrag zich opbouwt. Progressieve autonomie is voor agentische governance wat de drie controlelagen zijn voor de rest van de GovCompass-7: de operationele discipline die een principe in een praktijk verandert. Dit artikel zet een volwassenheidsmodel uiteen voor agent-inzet langs drie dimensies, beslissingsbevoegdheid, procesautonomie, en verantwoordelijkheidsreikwijdte, en de controls die op elk niveau aanwezig moeten zijn.
Dit is onderdeel van het element Agentic AI van de GovCompass-7.
Waarom autonomie verdiend moet worden, niet verleend
De meest voorkomende agentische governance-fout is te grote afhankelijkheid: een organisatie verleent een agent meer autonomie dan zijn aangetoonde betrouwbaarheid rechtvaardigt, meestal omdat de agent het goed deed in een demo. Demo-prestatie is het agentische equivalent van een pre-deployment bias-test die nooit wordt herhaald. Het vertelt je dat de agent één keer werkte, op een bekende input, in een gecontroleerde setting. Het vertelt je niets over hoe het zich gedraagt over de live-verdeling van inputs, in de tijd, in combinatie met andere agents.
Progressieve autonomie behandelt autonomie als iets dat een agent verdient door bewijs, niet als iets dat het door configuratie wordt verleend. De agent start met een smalle scope en acties met lage gevolgen, opereert onder nauwe observatie, en krijgt pas bredere scope wanneer het bewijs het ondersteunt. Dit is dezelfde logica als de GovCompass-7 volwassenheidsladder, waar een element van preventief-alleen naar volledig bestuurd beweegt naarmate meer controlelagen in werking treden. Toegepast op agents wordt het een inzetdiscipline.
Drie dimensies van autonomie
Autonomie is niet één grootheid. Het is nuttig om een agent langs drie dimensies te volgen, omdat een agent op de ene gevorderd en op de andere beperkt kan zijn.
Beslissingsbevoegdheid is hoe ingrijpend de beslissingen zijn die de agent mag nemen. Aan de lage kant beveelt de agent aan en beslist een mens. Aan de hoge kant beslist de agent en handelt zonder beoordeling.
Procesautonomie is hoeveel van een meerstapsproces de agent uitvoert zonder menselijk controlepunt. Aan de lage kant voltooit de agent één stap en geeft terug. Aan de hoge kant voert de agent een hele workflow uit, inclusief het aanroepen van sub-agents, van begin tot eind.
Verantwoordelijkheidsreikwijdte is hoe ver de gevolgen van de acties van de agent reiken. Aan de lage kant zijn acties intern, omkeerbaar en van lage waarde. Aan de hoge kant raken acties klanten, zijn ze moeilijk terug te draaien, en dragen ze juridisch of financieel gewicht.
Een goed bestuurde inzet is expliciet over waar elke agent op alle drie de dimensies staat, en beweegt een agent pas langs een dimensie wanneer de controls voor het volgende niveau aanwezig zijn en het bewijs het rechtvaardigt.
Een vier-niveau-model
Niveau een, ondersteunend. De agent beveelt aan; een mens beoordeelt en voert elke actie uit. Beslissingsbevoegdheid, procesautonomie en verantwoordelijkheidsreikwijdte zijn alle laag. Vereiste controls: actie-logging, een helder menselijk beslispunt, en een gedocumenteerde scope. Dit is waar elke agent met grote gevolgen zou moeten starten.
Niveau twee, gesuperviseerd. De agent voert acties met lage gevolgen autonoom uit maar escaleert alles boven een gedefinieerde drempel naar een mens. Procesautonomie stijgt; beslissingsbevoegdheid en verantwoordelijkheidsreikwijdte blijven begrensd. Vereiste controls: escalatietriggers, gedragsmonitoring tegen een verwachte bandbreedte, en het vermogen om de agent te stoppen.
Niveau drie, begrensd autonoom. De agent voert volledige workflows uit binnen een gedefinieerde grens, inclusief het aanroepen van sub-agents, en een mens is on the loop in plaats van in the loop. Vereiste controls: action-level logging over de keten, drift-detectie, circuit breakers, terugdraaicapaciteit waar het domein dat toelaat, en een getest incidentproces. Dit is het niveau waarop de high-risk verplichtingen van de EU AI Act het hardst bijten, omdat het systeem nu beslissingen materieel beïnvloedt zonder menselijke beoordeling per actie.
Niveau vier, cross-agent bestuurd. Meerdere agents opereren als een bestuurd systeem, met een governance-overzicht over het geheel, aandacht toegewezen aan de zwakste agent, en het agentische landschap gerund als een levend managementsysteem. Dit is het agentische equivalent van de ISO/IEC 42001 managementsysteem-volwassenheid waar het GovCompass-7 raamwerk naar wijst.
Hoe het model te gebruiken
Plaats voor elke agent in je inventaris het op de drie dimensies en de vier niveaus, en bevestig dat de controls die voor zijn niveau vereist zijn ontworpen, geïmplementeerd en aantoonbaar zijn. Een agent die op niveau drie opereert met alleen niveau-een controls is het agentische equivalent van een element dat alleen door preventieve controls wordt bestuurd: het oogt capabel in een demo en faalt stil in productie.
De discipline is om autonomie een beslissing te maken die wordt gedocumenteerd, bestuurd en herzien, niet een default die omhoog kruipt naarmate het team zich comfortabeler voelt bij de agent. Comfort is geen bewijs. De agent verdient zijn volgende niveau door betrouwbaar gedrag onder monitoring aan te tonen, en de organisatie verleent het bewust, met de controls voor dat niveau al aanwezig.