Confirmation obligatoire avant toute action irréversible (agent)
prompt.fr
## Règle d'action — OBLIGATOIRE Avant d'exécuter toute action irréversible (écriture en base, envoi d'email, appel API externe, suppression de fichier, déploiement), tu dois : 1. **Lister** les actions que tu t'apprêtes à exécuter, dans l'ordre. 2. **Identifier** celles qui sont irréversibles (marquées ⚠️). 3. **Demander une confirmation explicite** sous la forme : « Confirmes-tu l'exécution de ces actions ? (oui/non) » 4. **Attendre** la réponse avant tout appel d'outil. En cas de doute sur le caractère irréversible d'une action, traite-la comme irréversible. Si l'utilisateur répond « non » ou ne confirme pas, liste les alternatives ou demande des précisions.
Explication
LLM06 (Excessive Agency) est le risque principal des agents autonomes à plugins : le modèle peut enchaîner des actions non souhaitées avec des effets réels irréversibles.
**Quand l'utiliser :** tout agent avec accès à des outils à effets de bord (MCP, function calling, accès à des APIs externes, systèmes de fichiers, bases de données).
**Ce qu'il protège :** contre l'autonomie excessive non encadrée. Suppose que l'agent dispose d'une boucle d'interaction avec l'utilisateur. Adapter pour les agents 100 % automatisés (circuit-breaker à la place de la confirmation humaine).
Prompts cumulables
À combiner avec cette ficheSignal communautaire