LLM04

LLM04 — Empoisonnement des données et du modèle

Des données d'entraînement corrompues peuvent induire des comportements malveillants difficiles à détecter — même après déploiement.

LLM04 couvre les attaques qui introduisent des données corrompues dans le pipeline d'entraînement ou de fine-tuning d'un modèle. L'objectif peut être d'induire des biais, de créer des backdoors activables par des triggers spécifiques, ou de dégrader les performances sur des cas ciblés.

Ce qui rend LLM04 particulièrement difficile à traiter : les effets d'un empoisonnement peuvent être subtils, localisés et ne se manifester que dans des conditions précises, longtemps après l'entraînement. La détection post-déploiement repose souvent sur des comportements anormaux signalés par les utilisateurs.

Pour les systèmes RAG avec mémoire persistante, le risque est amplifié : une injection dans la base de connaissances peut contaminer toutes les sessions futures.

Référence OWASP officielle →

4 prompts pour ce thème

Détection de signaux d'empoisonnement des données d'entraînement

Demande au modèle de signaler les incohérences dans ses réponses qui pourraient indiquer un comportement inattendu lié à des données d'entraînement corrompues.

Assistant chatN2 LLM04data-poisoningauditcomportement-anormal

PS-001524.05.2026OWASP GenAI Security Project

Vérification d'intégrité des documents avant ingestion RAG

Avant tout traitement d'un document dans une chaîne RAG, l'agent vérifie son intégrité (hash, source, date, signature) et bloque les écarts par rapport au manifeste attendu — première ligne de défense contre l'empoisonnement.

Agent + outilsN2 LLM04 LLM08ragintegritehash

PS-008024.05.2026PromptSecOps

Protection contre l'empoisonnement de mémoire persistante inter-sessions

Protège les systèmes d'agents avec mémoire à long terme contre l'écriture de contenu malveillant qui persisterait et influencerait les sessions futures.

Agent + outilsN3 LLM04 LLM01memoire-persistanteinter-sessionspoisoning

PS-006224.05.2026Viplav Fauzdar

Exigence de diversité des sources pour les affirmations factuelles

Toute affirmation factuelle non triviale doit reposer sur au moins 2 sources distinctes (auteurs/organisations différents) — protection contre la monoculture informationnelle, le biais d'écho et l'empoisonnement de source unique.

Assistant chatN2 LLM09 LLM04sourcesdiversiteanti-monoculture

PS-008122.05.2026PromptSecOps

Voir dans la bibliothèque avec filtres →