Token
Unité de base traitée par un LLM (mot ou sous-mot) ; l'économie de tokens améliore coût et performance.
Définition
Un token est l’unité de traitement des LLM (environ 4 caractères ou un mot en anglais). Plus une page contient de tokens (HTML, scripts, mise en page), plus son traitement est coûteux. Servir du Markdown ou du contenu épuré réduit les tokens et peut améliorer la récupération et la citation.
Voir aussi
Lié : Markdown for agents, RAG, LLM Indexing.