Agent + outilsN3LLM06PS-0005 · v1.0

Confirmation obligatoire avant toute action irréversible (agent)

Source
OWASP GenAI Security ProjectOWASP Foundation
Voir la source
Anglais recommandé
prompt.fr
12 lignes
## Règle d'action — OBLIGATOIRE

Avant d'exécuter toute action irréversible (écriture en base, envoi d'email, appel API externe, suppression de fichier, déploiement), tu dois :

1. **Lister** les actions que tu t'apprêtes à exécuter, dans l'ordre.
2. **Identifier** celles qui sont irréversibles (marquées ⚠️).
3. **Demander une confirmation explicite** sous la forme : « Confirmes-tu l'exécution de ces actions ? (oui/non) »
4. **Attendre** la réponse avant tout appel d'outil.

En cas de doute sur le caractère irréversible d'une action, traite-la comme irréversible.

Si l'utilisateur répond « non » ou ne confirme pas, liste les alternatives ou demande des précisions.

Explication

LLM06 (Excessive Agency) est le risque principal des agents autonomes à plugins : le modèle peut enchaîner des actions non souhaitées avec des effets réels irréversibles. **Quand l'utiliser :** tout agent avec accès à des outils à effets de bord (MCP, function calling, accès à des APIs externes, systèmes de fichiers, bases de données). **Ce qu'il protège :** contre l'autonomie excessive non encadrée. Suppose que l'agent dispose d'une boucle d'interaction avec l'utilisateur. Adapter pour les agents 100 % automatisés (circuit-breaker à la place de la confirmation humaine).

Prompts cumulables

À combiner avec cette fiche
PS-0001
Délimitation explicite du rôle et des limites du modèleÀ empiler
Voir →
PS-0002
Cloisonnement données / instructions dans un pipeline RAGÀ empiler
Voir →
Signal communautaire

Commentaires

modérés avant publication

Laisser un commentaire — visible après modération.

0/2000