LLM02 — Fuite de données sensibles
Les LLM peuvent révéler des données personnelles, des secrets ou des informations confidentielles — dans leurs réponses, ou par rémanence de leurs données d'entraînement.
LLM02 couvre les risques de divulgation non intentionnelle d'informations sensibles par un modèle de langage. Trois vecteurs principaux : les données personnelles (PII) présentes dans le contexte de session, les informations confidentielles extraites par requête habile, et les données potentiellement mémorisées lors de l'entraînement.
La réglementation RGPD impose une minimisation des données et une protection active — un assistant IA qui répète des informations personnelles sans nécessité est en violation de ce principe, indépendamment de l'intention.
Les prompts de cette section établissent des règles de non-divulgation, de filtrage des sorties et de minimisation des données dans le contexte conversationnel.