LLM08

LLM08 — Vulnérabilités des vecteurs et embeddings

Les bases vectorielles RAG sont une surface d'attaque souvent négligée : un document malveillant indexé peut injecter des instructions dans toutes les sessions qui le récupèrent.

LLM08 couvre les vulnérabilités spécifiques aux systèmes utilisant des embeddings et des bases vectorielles pour la recherche sémantique (RAG). Ces systèmes sont vulnérables à plusieurs types d'attaques : injection de documents malveillants dans la base de connaissances, manipulation des embeddings pour orienter les résultats de recherche, et empoisonnement de la base RAG.

Le vecteur le plus courant est l'injection indirecte via un document récupéré : si un utilisateur peut faire indexer un document contenant des instructions malveillantes, ces instructions seront injectées dans le contexte du modèle lors de chaque requête qui récupère ce document.

Les prompts de cette section instruisent le modèle à traiter les documents récupérés avec méfiance et à valider leur source.

Référence OWASP officielle →

2 prompts pour ce thème

Vérification d'intégrité des documents avant ingestion RAG

Avant tout traitement d'un document dans une chaîne RAG, l'agent vérifie son intégrité (hash, source, date, signature) et bloque les écarts par rapport au manifeste attendu — première ligne de défense contre l'empoisonnement.

Agent + outilsN2 LLM04 LLM08ragintegritehash

PS-008024.05.2026PromptSecOps

Validation des sources RAG et embeddings avant utilisation

Instruit le modèle à évaluer la fiabilité des documents récupérés par RAG avant de les utiliser comme base factuelle, et à signaler les sources douteuses.

Agent + outilsN2 LLM08ragembeddingsvalidation-source

PS-001824.05.2026OWASP GenAI Security Project

Voir dans la bibliothèque avec filtres →