Agent de code gratuit : comment configurer une stack open source sans abonnement
Zéro dollar, zéro abonnement : coder avec l'IA est possible gratuitement via OpenCode et OpenRouter. Voici comment installer et utiliser cette stack, et jusqu'où elle peut vous mener.

Les abonnements IA deviennent intenables
Les prix des agents de code s'envolent : 8, 20, 100, parfois 200 dollars par mois. Aux États-Unis, certains développeurs dépassent 1 000 dollars mensuels en cumulant les solutions. Uber a dû plafonner à 1 500 dollars par employé et par mois les dépenses en IA. Pourtant, une alternative existe : coder gratuitement avec une stack open source, sans voler de clefs d'API ni se limiter à des modèles locaux aux capacités réduites.
Un agent de code = un modèle + un harness
Tout agent de code (Claude Code, Gemini CLI, Codex) repose sur deux composants : le modèle et le harness, la brique logicielle qui l'orchestre. Actuellement, 100 % du coût provient du modèle. Le harness n'engendre aucun coût pour l'éditeur, mais il est souvent propriétaire et refuse légalement tout modèle tiers.
Pour un agent entièrement gratuit, il faut donc un harness open source et un modèle gratuit. OpenCode est l'agent de code open source le plus populaire et le plus complet, calqué sur les agents propriétaires. Il compte plus de 7,5 millions d'utilisateurs mensuels dans le monde.
Les modèles gratuits : une vraie limite
OpenCode propose nativement quelques modèles gratuits pour le grand public : Big Pickle, DeepSeek V4 Flash Free, MiMo-V2.5 Free, Nemotron 3 Super Free. Leurs performances en code restent modestes.
La vraie alternative : OpenRouter, qui met à disposition plusieurs modèles entièrement gratuits. Le revers : la plupart des éditeurs récupèrent vos données d'input et d'output pour entraîner la prochaine génération. Le risque est donc important pour du code propriétaire.
Second frein majeur : la latence. Les modèles gratuits ont une priorité plus faible que les payants. Il en résulte une utilisation très lente (parfois moins de 20 tokens par seconde) et des erreurs d'appels API fréquentes.
Quand utiliser cette stack ?
Cette solution convient surtout aux projets personnels sans données commerciales ou privées. Elle permet de développer un MVP sans coût ou d'éditer une base de code existante. La génération d'un projet complet de A à Z est possible, mais en acceptant les écueils cités ci-dessus.
Pour du code commercial ou confidentiel, le calcul reste défavorable au regard du risque sur la confidentialité.
Quel modèle gratuit choisir ?
En juin 2026, OpenRouter propose 8 modèles gratuits utilisables comme moteur d'agent de code : Owl Alpha, Poolside Laguna XS.2, Poolside Laguna M.1, Kimi K2.6, Nemotron 3 Super, GPT-oss-120b, GPT-oss-20b et GLM 4.5 Air.
Le trio Nemotron 3 Ultra, Kimi K2.6 et GPT-oss-120b se distingue par ses capacités en tool use et ses résultats sur les benchmarks de code. Kimi K2.6 offre le meilleur rapport performance/latence : 107 tokens par seconde en moyenne.
Vérifiez régulièrement la liste sur OpenRouter : certains modèles sont dépréciés rapidement. OpenRouter propose aussi un endpoint automatique (openrouter/free), mais nous le déconseillons avec OpenCode — la sélection aléatoire peut vous faire tomber sur un modèle sans tool calling, générant plus d'erreurs.
Installation pas à pas
Étape 1 : installer OpenCode
Ouvrez un terminal et entrez :
curl -fsSL https://opencode.ai/install | bash
Puis lancez l'agent :
opencode
Étape 2 : connecter OpenRouter
Créez un compte sur OpenRouter et récupérez votre jeton d'API sur https://openrouter.ai/workspaces/default/keys.
Dans OpenCode, tapez /connect et choisissez OpenRouter comme provider. Entrez votre clef d'API.
Étape 3 : choisir le modèle
Tapez /model et sélectionnez Kimi K2.6. Vérifiez que la mention « free » apparaît à côté du nom : certains modèles existent en version gratuite et payante sur OpenRouter.
Votre agent de code entièrement gratuit est maintenant configuré.
Test en conditions réelles
Nous avons demandé à l'agent de créer un jeu de Snake simple : « Crée un fichier index.html autonome (HTML, CSS et JS dans le même fichier, sans dépendance externe) : le jeu du Snake jouable au clavier. »
Le jeu a été généré en moins d'une minute. L'interface est sobre mais entièrement fonctionnelle : compteur de points, gestion des directions, gestion de la longueur du serpent. Le tout a été créé gratuitement.
Les limites : quand cette stack ne suffit pas
Cette combinaison OpenCode + OpenRouter tient sa promesse : coder sans abonnement et sans débourser un centime. Mais ses limites la cantonnent à un rôle de complément plutôt que de remplaçant.
- Latence variable : ralentissements aux heures de pointe
- Récupération de données : vos entrées et sorties servent à entraîner les modèles futurs
- Dépréciation rapide : les modèles gratuits disparaissent vite
C'est la solution à utiliser quand votre quota de tokens est épuisé, pour une édition rapide ou un projet personnel sans données sensibles. C'est aussi la réponse au harness fermé de Claude Code, qui refuse légalement tout modèle tiers.
Le vrai basculement : l'inférence locale
Le vrai changement arrivera le jour où un modèle du calibre de Claude Opus tournera entièrement en local sur la machine du développeur, sans transiter par un fournisseur tiers. On en est encore loin : les capacités hardware grand public restent le principal verrou.
Mais la trajectoire est encourageante. Les derniers petits modèles ouverts, comme Gemma 4 12B, montrent qu'un écart longtemps jugé infranchissable se resserre rapidement. Reste à voir si cette dynamique tiendra ses promesses sur les tâches de code agentique réelles, où le tool use et la cohérence sur de longues séquences font encore la différence.
Articles liés
toolsHermes + Ollama : pourquoi c'est mon outil d'IA locale préféré
Après avoir testé de nombreuses applications d'IA locale, Hermes s'impose comme la meilleure option. Cet agent autonome combine modèles, mémoire, compétences et automatisations dans une interface fluide.
toolsClaude Code coûte 200 $/mois. Goose fait pareil gratuitement
Anthropic augmente les prix et les limites d'utilisation. Goose, un agent IA open source de Block, offre les mêmes capacités sans abonnement ni restrictions. Les développeurs basculen.
toolsPaddleOCR 3.5 : lire les documents avec Transformers au lieu de Paddle
PaddleOCR 3.5 intègre désormais Transformers comme option d'exécution. L'outil de reconnaissance de texte fonctionne maintenant nativement dans l'écosystème Hugging Face, simplifiant l'intégration dans vos projets IA.
toolsHF CLI : l'outil en ligne de commande de Hugging Face optimisé pour les agents IA
Hugging Face a reconstruit hf CLI pour servir les agents intelligents comme Claude Code et Codex. Résultat : jusqu'à 6 fois moins de tokens sur les tâches complexes.
