Instruction de budget de tokens dans le system prompt
prompt.fr
Règle de concision : tes réponses ne doivent pas dépasser [N] phrases sauf demande explicite contraire. Si une réponse complète nécessite plus, propose d'abord un résumé et demande si l'utilisateur souhaite les détails.
Explication
Sans contrainte explicite, les LLM tendent à produire des réponses longues par défaut. Ce prompt établit un plafond en langage naturel, complémentaire au paramètre `max_tokens` de l'API.
**Quand l'utiliser :** chatbots, assistants intégrés, tout contexte où la verbosité est un coût (tokens facturés, interface mobile, temps de réponse).
**Ce qu'il protège :** LLM10 (consommation non bornée de ressources). Simple, sans prérequis technique.
Signal communautaire