Tuto #11 : Optimiser sa consommation de tokens avec Claude

Tuto #11 : Optimiser sa consommation de tokens avec Claude

Date de création
April 15, 2026
Sélectionner
IA

Avant d'aller plus loin : si vous n'avez pas vu les premiers tutos vous pouvez les consulter ici :

Pourquoi on se retrouve aussi vite à cours de tokens avec Claude ?

C’est clairement le sujet qui revient le plus souvent ces derniers jours / semaines lorsqu’on me parle de Claude !

En fait quand vous vous travaillez avec Claude, tout ce que vous lui envoyez (fichier, prompts…) occupe de l'espace dans ce qu'on appelle la fenêtre de contexte. C'est la mémoire de travail de Claude pour une conversation donnée. Et celle ci se retrouve vite saturée.

image

Concrètement, une fenêtre de contexte saturée ça donne : des réponses qui perdent en précision, des analyses qui "oublient" ce qui a été dit plus haut dans la conversation, et vous vous retrouvez vite à cours de Token (même avec un abonnement pro !)

La bonne nouvelle : avec quelques réflexes simples, on peut réduire significativement sa consommation sans rien sacrifier sur la qualité des outputs. C'est ce qu'on voit dans ce tuto.

1. Organiser ses discussions en Projets

Le problème des conversations fourre-tout

Je vois autour de moi des Claudistes (utilisateur invétéré de Claude : marque déposé) qui travaillent souvent dans quelques discussions à rallongent. Ils accumulent des échanges sur plusieurs jours, et se retrouvent avec un fil de discussion qui pèse des dizaines de milliers de tokens, dont une bonne partie ne sert plus à rien.

En gros : Un projet discussion !

Ce que les Projets changent

Un projet permet de définir un contexte persistant : des instructions fixes, des fichiers de référence, un cadre de travail qui reste là d'une conversation à l'autre. Claude charge ces éléments une seule fois et les garde en tête automatiquement.

Résultat : vous n'avez plus besoin de réexpliquer à chaque nouvelle conversation qui est votre client, quelle est sa thématique, quel ton adopter, quelles sont ses URLs principales. Tout ça est dans le projet, pas dans le fil de discussion.

📌 Toute la doc sur les projets Claude

Bonne pratique : 1 projet = 1 contexte stable

  • 1 projet par client : vous y stockez les infos récurrentes (nom de domaine, mots-clés cibles, ton éditorial, personas)
  • 1 projet par type de tâche : un projet "Briefs SEO", un projet "Propositions commerciales", un projet "Reporting mensuel"
  • Chaque conversation dans le projet reste courte et ciblée sur une tâche précise
image

Ce qu'il faut éviter : transformer le fil de conversation en entrepôt. Une conversation = une tâche accomplie, puis on passe à la suivante.

Les instructions système du projet : votre meilleure arme

Dans les paramètres d'un projet, vous pouvez rédiger des instructions persistantes. C'est l'équivalent d'un briefing permanent que Claude lit au début de chaque conversation.

Exemple concret pour mes projet client SEO :

Client : [Nom du client]
Secteur : [secteur d'activité]
Domaine : [URL]
Ton éditorial : 
Mots-clés SEO cibles : 
Format de sortie préféré : Markdown avec titres H2/H3
Objectif SEO

En stockant ces éléments ici plutôt que dans chaque prompt, vous économisez des tokens à chaque échange.

2. Les formats de fichiers et leur impact

Tous les fichiers ne se valent pas du point de vue des tokens. Certains formats obligent Claude à faire un travail de "lecture" beaucoup plus coûteux que d'autres.

Le classement par type de fichier

Le tableau ci-dessous donne des ordres de grandeur issus de la documentation Anthropic et des mesures communautaires, ce ne sont pas des valeurs exactes car elles varient selon le contenu, mais elles donnent une idée claire des écarts entre formats.

Format
Consommation estimée
Pourquoi
PDF scanné (images)
~1 500 à 3 000 tokens / page
Claude traite chaque page comme une image, lecture visuelle pixel par pixel
Screenshot / capture d'écran
~1 200 à 1 600 tokens / image
Même mécanisme que les images, quel que soit le contenu affiché
DOCX / PPTX
Élevée (overhead +30-50% vs TXT)
Métadonnées de mise en forme invisibles mais bien présentes pour Claude
CSV brut (> 500 lignes)
Variable, souvent très élevé
Chaque cellule est tokenisée, un export complet peut saturer le contexte
PDF texte natif
Moyenne (~800-1 500 tokens / page)
Mieux qu'un PDF scanné, mais reste verbeux selon la mise en page
JSON structuré
Faible à moyen
Dense, pas de redondance, facile à parcourir pour Claude
Markdown / TXT brut
✅ Optimal (~600-800 tokens / page)
Structure légère, aucun bruit de formatage

Sources : documentation Anthropic sur les PDFs et mesures rapportées par limitededitionjonathan.substack.com (avril 2026)

Pour donner un repère concret : The Great Gatsby (72 000 mots) uploadé en PDF représente environ 60 000 tokens. Le même texte en Markdown brut tourne autour de 90 000 mots-tokens, et surtout, Claude le traite de façon beaucoup plus fiable.

Le réflexe à prendre : convertir avant d'envoyer

Quelques exemples concrets :

  • Vous avez un rapport DOCX → copiez-collez uniquement la section utile dans le prompt
  • Vous avez un CSV de 3 000 lignes → exportez un résumé agrégé (totaux, moyennes, top 10) plutôt que les données brutes
  • Vous avez un PDF scanné → si c'est possible, cherchez la version texte native ou retapez les éléments clés
  • Vous avez une capture d'écran d'un tableau → retranscrivez le tableau en Markdown directement

3. Ce qu'on demande à Claude et comment le demander

Le contenu du fichier compte, mais la façon dont on structure la demande change aussi la qualité des résultats. Anthropic a publié des données concrètes sur ce sujet.

Le context rot : pourquoi trop de contexte nuit

La documentation officielle d'Anthropic est claire là-dessus : plus le contexte grossit, moins Claude est précis. Ils appellent ça le "context rot" : à mesure que le nombre de tokens dans la fenêtre augmente, la capacité du modèle à rappeler et utiliser correctement les informations se dégrade. La conclusion d'Anthropic est directe : soigner ce qu'on met dans le contexte est aussi important que de savoir combien d'espace on a.

📌 Source : docs.anthropic.com/build-with-claude/context-windows

Deux techniques documentées par Anthropic pour améliorer la précision

1. Placer les données longues en tête, la question à la fin

Si vous envoyez un document long + une question, mettez le document en premier et votre instruction tout à la fin. Selon les tests Anthropic, placer la question après le document plutôt qu'avant peut améliorer la qualité des réponses jusqu'à 30%, en particulier sur des inputs complexes multi-documents.

📌 Source : docs.anthropic.com/prompt-engineering/long-context-tips

2. Demander à Claude d'extraire les passages pertinents avant de répondre

Pour les tâches sur des documents longs, demandez à Claude de citer d'abord les extraits pertinents avant de produire son analyse. Anthropic indique que cette technique aide Claude à "couper à travers le bruit" du reste du document et réduit les risques d'hallucination.

Exemple de formulation : "Avant de me donner tes recommandations, cite les passages du document sur lesquels tu t'appuies, puis produis l'analyse."

📌 Source : docs.anthropic.com/prompt-engineering/long-context-tips

Ce qui reste du bon sens non sourcé

Deux réflexes que je recommande sans étude derrière, mais qui coulent de source :

  • Coupez avant d'envoyer : si votre question porte sur les pages 12 à 14 d'un document de 20 pages, copiez seulement ces pages.
  • Une tâche par conversation : ne chaînez pas analyse + rédaction + traduction dans le même fil. Ouvrez une nouvelle conversation dans le projet. Le contexte client est préservé, le fil reste propre.

4. Le Skill token-compressor

Bon. Tout ce qu'on vient de voir, c'est très bien en théorie mais en pratique personne ne le fais et moi le premier

Alors plutôt que de compter sur votre bonne volonté, j’ai préparer un Skill qui s'en charge à votre place. Son rôle : avant de traiter votre demande, Claude compresse automatiquement les inputs verbeux, il extrait ce qui est utile, écarte le bruit, et reformate pour minimiser la consommation. Vous envoyez ce que vous avez, il fait le ménage avant de bosser.

Intégrer le Skill

Voici le fichier SKILL.md à télécharger :

token-compressor-SKILL.md5.2 KiB

Deux méthodes pour l'installer :

Dans Claude Desktop :

  1. Créez le dossier du skill dans votre répertoire skills : mkdir -p ~/Library/Application\ Support/Claude/skills/token-compressor
  2. Copiez le fichier SKILL.md dans ce dossier
  3. Redémarrez Claude Desktop

Dans l'interface claude.ai :

Ouvrez un Projet > Instructions du projet > collez directement le contenu du SKILL.md dans les instructions système.

Ce que fait le Skill concrètement

Quand vous envoyez un document ou un prompt chargé, le Skill demande à Claude d'appliquer systématiquement une séquence de compression avant de répondre :

  1. Identifier ce qui est utile pour répondre à votre question
  2. Écarter le superflu : métadonnées, répétitions, contexte non pertinent
  3. Reformater les données brutes en représentation compacte (résumés, tableaux agrégés)
  4. Signaler ce qu'il a mis de côté et pourquoi

Résultat : vous obtenez la même qualité d'analyse avec une fraction du contexte utilisé.

Exemple avant / après

  • Situation : vous envoyez un export CSV Screaming Frog de 2 000 URLs avec toutes les colonnes et demandez une analyse de la structure du site.
  • Sans le Skill : Claude lit les 2 000 lignes × toutes les colonnes → consommation maximale du contexte, réponse souvent moins structurée car noyée dans les données.
  • Avec le Skill : Claude identifie d'abord les colonnes utiles (URL, status code, depth, title), agrège les données (nombre d'URLs par statut, distribution par profondeur, patterns de titres manquants), puis fait l'analyse sur cette représentation comprimée → même insight, contexte réduit de 80%.

Attention, il faut être clair sur ce que le Skill ne fait pas : il n'empêche pas Claude de lire un PDF en entier. Quand vous uploadez un PDF, Claude l'ingère visuellement avant même que le Skill s'active, les tokens sont déjà consommés à ce stade. La compression se passe après l'ingestion, pas avant.

Le Skill est donc vraiment efficace sur les fichiers texte et CSV. Pour les PDFs lourds, il ne règle pas le problème à la racine.

Pour aller plus loin : Markitdown (Claude Desktop uniquement)

Si vous travaillez sur Claude Desktop, la vraie solution pour les PDFs est de les convertir en Markdown avant de les envoyer à Claude. L'outil s'appelle Markitdown, c'est un projet open source de Microsoft qui convertit PDF, DOCX, PPTX et XLSX en Markdown propre.

Le principe :

  1. Vous passez votre fichier dans Markitdown
  2. Vous récupérez un .md léger
  3. Vous l'envoyez à Claude, qui le traite comme du texte, pas comme une image

Il existe des MCP communautaires qui wrappent Markitdown pour l'intégrer directement dans Claude Desktop. Claude peut alors appeler l'outil de conversion automatiquement avant de traiter votre fichier. C'est le workflow idéal, mais il nécessite une configuration technique que je couvrirai dans un prochain tuto.

Pour l'instant, le réflexe manuel reste valable : si vous avez un PDF important à analyser régulièrement, convertissez-le une fois en Markdown avec Markitdown et gardez cette version pour vos échanges avec Claude.

image
image
image

FOUCAULD HENIN

Senior SEO consultant et fondateur de 30A  

Je vous accompagne dans conception et la mise en place de vos chantiers SEO.

Après plusieurs expériences chez des retaillers, clients grand comptes et scale up, j’apporte une vision rationnelle et data driven dans les stratégies SEO.

Références : Oscaro, Total Energie, Intermarché, Oreegami

#bigquery #Looker #data analyse