2026 Classement Top 10 des outils CLI OpenRouter : selection Agent par tokens et matrice de location Mac cloud
Choisir un agent IA uniquement d apres les scores MMLU ignore que les pipelines CLI absorbent environ 70 pour cent du volume hebdomadaire OpenRouter en 2026 — Hermes Agent seul atteint 4,94 billions de tokens la semaine du 2 au 8 juin. Ce guide decode le premier Top 10 public par debit de tokens CLI, fournit une matrice de decision pour Hermes, Kilo Code et Claude Code, une matrice hardware Mac cloud et un runbook en cinq etapes pour un gateway 7j/7.
Table des matieres
- 1. Trois points de friction dans le choix d un agent CLI
- 2. Source de donnees : semaine OpenRouter 2-8 juin 2026
- 3. Outils CLI : 70 pour cent du volume hebdomadaire
- 4. Top 10 outils CLI par tokens
- 5. Pourquoi Hermes Agent domine avec 4,94T
- 6. Matrice outil CLI et modele
- 7. Matrice config location Mac cloud par charge CLI
- 8. Runbook de deploiement en cinq etapes
- 9. Faits techniques citables
- 10. FAQ
- 11. Conclusion
1. Trois points de friction dans le choix d un agent CLI
- Les classements de modeles ne refletent pas la realite CLI. OpenRouter liste les tokens par modele — DeepSeek-V4-Flash, Claude Sonnet — mais les developpeurs invoquent ces modeles via des couches CLI : Hermes Agent, Kilo Code, Claude Code, OpenClaw. Chaque couche ajoute des boucles Tool Calling, des relectures de contexte et des sous-taches paralleles. Un modele gagnant en benchmark peut consommer dix fois plus de tokens dans un pipeline Telegram Hermes.
- Le hardware est choisi independamment de l outil CLI. Les equipes louent des VPS Linux bon marche pour des gateways Node alors qu Hermes et OpenClaw documentent macOS, launchd, Keychain et la toolchain Apple native. Un mauvais hote provoque des ruptures 429 et des arrets en veille meme si la route OpenRouter est correcte.
- Les couts tokens escaladent avec le CLI, pas avec le chat. Un seul refactor Claude Code peut generer 200 000 tokens d entree par relectures repetees de fichiers. Kilo Code avec routage multi-modeles double l effet lors des bascules de fallback. Sans suivre le Top 10 CLI chaque semaine, vous payez une prime pour le mauvais outil — pas seulement le mauvais modele.
Cet article complete notre classement hebdomadaire du 6 juin (niveau modele) et la analyse tendances : ici nous ciblons la couche outil CLI qui represente la majorite du debit payant en 2026.
2. Source de donnees : semaine OpenRouter 2-8 juin 2026
OpenRouter agrege plus de 300 modeles et 60+ fournisseurs avec environ 100 billions de tokens mensuels. Depuis le printemps 2026, le classement public filtre aussi par type de client — appels API directs versus pipelines agent CLI. Fenetre de mesure : 7 jours glissants, 2-8 juin 2026.
La dimension CLI est nouvelle et decisive : Hermes Agent, Kilo Code et Claude Code n apparaissent pas comme modeles mais comme appelants avec leur propre empreinte tokens. OpenRouter classifie le User-Agent et les metadonnees gateway pour distinguer extension IDE, agent terminal ou gateway headless.
3. Outils CLI : 70 pour cent du volume hebdomadaire
| Indicateur | Donnees (semaine 2-8 juin) | Variation hebdo |
|---|---|---|
| Volume hebdomadaire global | 31,6 billions de tokens | +9,3 % |
| Pipelines agent CLI | 22,1 billions (~70 %) | +12,1 % |
| Appels API directs | 9,5 billions (~30 %) | +3,2 % |
| Part Top 3 CLI du volume CLI | 33,6 % (Hermes + Kilo + Claude Code) | concentre |
La part CLI est passee d environ 52 % debut 2025 a 70 % en juin 2026 — les workflows agent avec Tool Calling, iteration fichiers et boucles multi-tours sont la nouvelle norme. Le codage depasse toujours 50 % du flux total ; les outils CLI concentrent ce trafic.
4. Top 10 outils CLI par tokens (semaine 2-8 juin 2026)
| Rang | Outil CLI | Tokens hebdo | Var. hebdo | Scenario typique |
|---|---|---|---|---|
| 1 | Hermes Agent | 4,94T | +18 % | Telegram/OpenClaw 7j/7, Memory Tree |
| 2 | Kilo Code | 1,22T | +24 % | Fork VS Code, agent multi-modeles |
| 3 | Claude Code | 606B | +9 % | Outil terminal officiel Anthropic |
| 4 | OpenClaw CLI/Gateway | 512B | +14 % | Gateway multi-canal, agents Cron |
| 5 | Cursor Agent CLI | 478B | +11 % | Skills, SKILL.md, integration IDE |
| 6 | Aider | 391B | +6 % | Refactoring natif Git |
| 7 | Gemini CLI | 347B | -8 % | Terminal Google, incertitude politique |
| 8 | Continue CLI | 298B | +5 % | Plugin IDE open source |
| 9 | Cline | 256B | +12 % | Agent VS Code, outils navigateur |
| 10 | GitHub Copilot CLI | 221B | +3 % | SSO entreprise, integration gh |
Hermes Agent seul consomme plus de tokens que les rangs 4 a 10 combines — signal que l automation gateway headless (Telegram, Slack, Cron) domine le marche CLI, pas les sessions interactives isolees.
5. Pourquoi Hermes Agent domine avec 4,94T
Hermes combine trois proprietes qui font exploser les tokens : fonctionnement 7j/7 sans pause utilisateur, sous-agents paralleles via gateway OpenClaw et Memory Tree avec relecture de long contexte. Chaque message Telegram entrant peut declencher cinq a douze appels d outils ; sur des milliers d evenements quotidiens, on atteint l echelle billions.
Kilo Code croit le plus vite du Top 3 avec +24 % — le fork VS Code avec routage multi-modeles integre attire les developpeurs des pipelines Anthropic purs. Claude Code reste stable a 606B : haute qualite, mais le pricing Anthropic limite le batch de masse face a Hermes plus tier Flash.
6. Matrice outil CLI et modele
| Scenario | Outil CLI recommande | Tier modele OpenRouter | Justification (base tokens) |
|---|---|---|---|
| Agent Telegram/Slack 7j/7 | Hermes Agent | DeepSeek-V4-Flash + fallback Sonnet | 4,94T valide le marche ; Flash pour le debit |
| Codage IDE avec changement de modele | Kilo Code | Multi-modeles : Flash principal, Sonnet critique | 1,22T, +24 % — routage flexible |
| Terminal entreprise, piste audit | Claude Code | Claude Sonnet 4.6 / Opus | 606B, moins de deraillement sur chemins critiques |
| Gateway multi-canal | OpenClaw CLI | Flash + 2 fallbacks | 512B, chemins launchd documentes |
| Batch refactor Git | Aider | DeepSeek-V4-Flash | 391B, rentable pour scans de depot |
7. Matrice config location Mac cloud par charge CLI
Le debit tokens CLI n est que la moitie de l equation — l hote doit porter des processus gateway paralleles, le runtime Node et optionnellement des fallbacks Ollama locaux. La matrice relie le classement CLI OpenRouter au hardware VPSMAC (guide config detaille).
| Charge CLI | Config Mac cloud recommandee | RAM | Mode operation |
|---|---|---|---|
| CLI solo (Aider, Continue, Cline local) | M4 base | 16 Go | A la demande, SSH |
| Kilo Code / Cursor Agent (IDE intensif) | M4 / M4 Pro | 32 Go | Interactif + VNC optionnel |
| Hermes Agent 7j/7 + gateway OpenClaw | M4 Pro | 32-64 Go | launchd, location mensuelle |
| Sous-agents paralleles + Memory Tree | M4 Pro | 64 Go | Headless, 7j/7, isolation cles |
| Claude Code + toolchain Xcode | M4 Pro | 32 Go | macOS natif, chemins Notary |
Bande passante : gateways SSH-only suffisent avec 10-20 Mbps ; VNC plus sync d artifacts volumineux necessite 50 Mbps+. Une latence sous 50 ms RTT ameliore la reactivite CLI interactive.
8. Runbook de deploiement en cinq etapes
Etape 1 — Suivre le Top 10 CLI chaque semaine
Chaque lundi ouvrir openrouter.ai/rankings, filtre Client : CLI. Noter les parts Hermes, Kilo et Claude Code ; detecter tot les breakouts comme Cline (+12 %).
Etape 2 — Associer outil CLI et tier de modele
Router selon la matrice section 6 : Hermes sur Flash, Claude Code sur Sonnet, Kilo avec stack multi-modeles configurable. Ne jamais tout defaulter sur Opus.
Etape 3 — Choisir le plan Mac cloud selon la charge CLI
Hermes 7j/7 : M4 Pro 32 Go minimum. Aider solo : M4 16 Go suffit. Details dans le guide installation Hermes.
Etape 4 — Configurer route OpenRouter dans CLI/gateway
Etape 5 — Persistance launchd et monitoring
Suivre tokens et USD en parallele dans le tableau de bord OpenRouter. Changements d architecture trimestriels, ajustements de route hebdomadaires.
9. Faits techniques citables
- Semaine OpenRouter 2-8 juin 2026 : volume global 31,6T ; pipelines agent CLI ~70 % (~22,1T).
- Hermes Agent : 4,94T tokens hebdo (#1 CLI) ; Kilo Code 1,22T (+24 %) ; Claude Code 606B.
- Le Top 3 CLI concentre 33,6 % du volume CLI total — l automation gateway bat les sessions interactives isolees.
10. FAQ
A quelle frequence le classement CLI se met-il a jour ? Fenetre glissante de 7 jours ; revue hebdomadaire chaque lundi.En quoi differe-t-il du classement modeles ? Le classement modeles mesure quel LLM est appele ; le classement CLI mesure quel outil terminal orchestre les appels.Hermes peut-il tourner sur VPS Linux ? Techniquement oui, mais la documentation launchd, Keychain et chemins toolchain Apple sont valides sur macOS — Mac cloud reduit le risque operationnel.
11. Conclusion : les tokens CLI comme boussole de selection Agent
Le marche choisit les outils agent par les tokens, pas par les communiques : Hermes Agent a 4,94T, Kilo Code a 1,22T et Claude Code a 606B montrent que l automation gateway headless et les forks IDE multi-modeles definissent juin 2026. Un portable ou un VPS Linux bon marche peut tester ces pipelines CLI brièvement, mais pas les soutenir durablement — fermeture du capot, habitudes launchd absentes et toolchain Apple non native mangent les economies des modeles Flash. Pour des environnements de production avec suivi hebdomadaire du classement CLI, ajustements rapides de route et un gateway Hermes ou OpenClaw toujours joignable, louer un noeud Mac cloud M4 VPSMAC reste en general la meilleure voie : les classements changent, vous mettez a jour la route ; launchd maintient le gateway avec cles isolees et acces SSH — selection d outil basee sur les tokens et fonctionnement 7j/7 dans un environnement macOS auditable.