Coûts réduits
Jusqu'à 98 % de tokens en moins envoyés au LLM, sans perte de signal sur le contenu important.
Chaque token compte. Distill compresse le contexte LLM en amont, avant qu'il n'entre en mémoire — pour réduire les coûts, accélérer les réponses, et améliorer la qualité des sorties.
Quand tu travailles avec un assistant de codage IA, tu envoies constamment de gros blocs de contexte : sorties de build, logs, fichiers de code, stacktraces. La plupart est redondant ou inutile.
Une sortie d'erreur de build typique, c'est des milliers de tokens de bruit pour 5 à 10 lignes réellement utiles. Tu paies pour du vide — et tu noies le LLM dans du contexte qui l'empêche de se concentrer.
Distill résout ce problème en compressant intelligemment ton contexte avant qu'il n'atteigne le modèle. Tu ne gardes que le signal.
Distill est un serveur MCP (Model Context Protocol) open-source, qui expose trois outils toujours chargés dans Claude Code.
Détecte le type de contenu (build, logs, diffs, code, stacktraces) et applique la compression adaptée.
Lit la structure AST au lieu du fichier brut. 7 langages, 5 modes (auto, full, skeleton, extract, search).
Exécute du TypeScript en sandbox QuickJS pour batcher 5 à 10 opérations en un seul appel MCP.
Pas de clés API. Pas de services cloud. Pas d'auth. Install + usage immédiat.
Jusqu'à 98 % de tokens en moins envoyés au LLM, sans perte de signal sur le contenu important.
Moins de contexte = moins de tokens à traiter = time-to-first-token plus court.
Moins de bruit, plus de signal. Le LLM se concentre sur l'essentiel, la qualité des sorties grimpe.
Marqueur [DISTILL:COMPRESSED], hook PreCompact, sous-agent distill-compressor, slash commands. Zéro config côté API.
Une commande suffit pour setup Claude Code avec Distill.