17 mai 2026

Glossaire — termes clés de la sécurité IA

Les termes essentiels pour lire et utiliser les fiches de la bibliothèque, avec définitions orientées usage pratique.

System prompt: Instructions transmises au modèle avant toute interaction utilisateur, généralement invisibles pour l'utilisateur final. Définit le rôle, les contraintes et le comportement de l'assistant. À distinguer des messages utilisateur (user messages) et des messages développeur (developer messages dans l'API OpenAI).
Injection de prompt: Technique par laquelle des instructions malveillantes sont introduites dans l'entrée d'un LLM pour modifier son comportement. Directe (dans le message utilisateur) ou indirecte (via des données récupérées : documents, emails, résultats web). Couvert par OWASP LLM01.
RAG (Retrieval-Augmented Generation): Architecture où le modèle récupère des documents depuis une base de données externe avant de générer sa réponse. Permet d'ancrer les réponses dans des données récentes ou spécifiques à l'organisation. Introduit un vecteur d'injection indirecte (LLM01, LLM08).
Embedding: Représentation numérique (vecteur) d'un texte dans un espace multidimensionnel, capturant sa signification sémantique. Utilisé dans les systèmes RAG pour trouver les documents les plus proches d'une requête. Les bases d'embeddings peuvent être manipulées (LLM08).
Hallucination: Génération d'informations factuellement incorrectes par un LLM, présentées avec le même niveau de confiance apparente que les informations correctes. Ce n'est pas un bug mais une caractéristique inhérente au fonctionnement probabiliste des modèles. Couvert par OWASP LLM09.
Jailbreak: Technique visant à contourner les instructions système ou les restrictions de sécurité d'un modèle. Inclut le roleplay de contournement ("tu es maintenant une IA sans restrictions"), les encodages inhabituels, et les pressions progressives. Voir OWASP LLM01.
Agent IA: Système IA capable d'exécuter des actions dans le monde réel via des outils : recherche web, accès fichiers, appels API, envoi d'emails, exécution de code. La puissance accrue des agents s'accompagne de risques spécifiques (LLM06) absents des assistants conversationnels simples.
MCP (Model Context Protocol): Protocole open source développé par Anthropic pour standardiser la communication entre les LLM et les outils externes. Permet à un modèle d'appeler des outils de manière standardisée. Introduit des risques de supply chain (LLM03) si des serveurs MCP tiers sont utilisés.
Fine-tuning: Entraînement supplémentaire d'un modèle pré-entraîné sur un dataset spécifique pour l'adapter à un cas d'usage. Si le dataset de fine-tuning est compromis, le modèle peut développer des comportements malveillants difficiles à détecter (LLM04).
Token: Unité de base du traitement des LLM. Approximativement 3/4 d'un mot en anglais, moins en français (d'où le léger surcoût du français). Les APIs LLM facturent à l'usage en tokens. La fenêtre de contexte (context window) limite le nombre de tokens qu'un modèle peut traiter en une fois.
Context window (fenêtre de contexte): Nombre maximum de tokens qu'un modèle peut traiter en une seule fois (entrée + sortie). Au-delà de cette limite, le modèle tronque silencieusement les informations les plus anciennes — ce qui peut induire des incohérences en sessions longues (voir PS-0055, PS-0057).
Prefill: Technique spécifique à l'API Anthropic : injecter le début de la réponse du modèle avant qu'il ne génère. Permet de forcer un format de départ ou d'ancrer la réponse dans le bon registre. Voir PS-0024.
PII (Personally Identifiable Information): Données permettant d'identifier directement ou indirectement une personne physique : nom, email, téléphone, adresse, numéro de sécurité sociale, IP, date de naissance. La gestion des PII par les LLM est encadrée par le RGPD en Europe. Voir OWASP LLM02.
Least privilege (moindre privilège): Principe de sécurité : chaque composant ne reçoit que les droits strictement nécessaires à sa fonction. Appliqué aux agents IA : un agent ne doit avoir accès qu'aux outils et données requis pour sa tâche courante, pas à l'ensemble des capacités disponibles. Voir PS-0016, PS-0034.
Chain of thought (chaîne de raisonnement): Technique qui demande au modèle d'externaliser son raisonnement étape par étape avant de produire sa réponse finale. Réduit les hallucinations sur des tâches complexes et permet un audit du raisonnement. Voir PS-0023.