toolsPublié le 17 juin 20264 min de lecture

Agent de code gratuit : comment configurer une stack open source sans abonnement

Zéro dollar, zéro abonnement : coder avec l'IA est possible gratuitement via OpenCode et OpenRouter. Voici comment installer et utiliser cette stack, et jusqu'où elle peut vous mener.

وكيل كود مجاني اللي كيشتغل فعلا: شنو هي الحيلة؟

Les abonnements IA deviennent intenables

Les prix des agents de code s'envolent : 8, 20, 100, parfois 200 dollars par mois. Aux États-Unis, certains développeurs dépassent 1 000 dollars mensuels en cumulant les solutions. Uber a dû plafonner à 1 500 dollars par employé et par mois les dépenses en IA. Pourtant, une alternative existe : coder gratuitement avec une stack open source, sans voler de clefs d'API ni se limiter à des modèles locaux aux capacités réduites.

Un agent de code = un modèle + un harness

Tout agent de code (Claude Code, Gemini CLI, Codex) repose sur deux composants : le modèle et le harness, la brique logicielle qui l'orchestre. Actuellement, 100 % du coût provient du modèle. Le harness n'engendre aucun coût pour l'éditeur, mais il est souvent propriétaire et refuse légalement tout modèle tiers.

Pour un agent entièrement gratuit, il faut donc un harness open source et un modèle gratuit. OpenCode est l'agent de code open source le plus populaire et le plus complet, calqué sur les agents propriétaires. Il compte plus de 7,5 millions d'utilisateurs mensuels dans le monde.

Les modèles gratuits : une vraie limite

OpenCode propose nativement quelques modèles gratuits pour le grand public : Big Pickle, DeepSeek V4 Flash Free, MiMo-V2.5 Free, Nemotron 3 Super Free. Leurs performances en code restent modestes.

La vraie alternative : OpenRouter, qui met à disposition plusieurs modèles entièrement gratuits. Le revers : la plupart des éditeurs récupèrent vos données d'input et d'output pour entraîner la prochaine génération. Le risque est donc important pour du code propriétaire.

Second frein majeur : la latence. Les modèles gratuits ont une priorité plus faible que les payants. Il en résulte une utilisation très lente (parfois moins de 20 tokens par seconde) et des erreurs d'appels API fréquentes.

Quand utiliser cette stack ?

Cette solution convient surtout aux projets personnels sans données commerciales ou privées. Elle permet de développer un MVP sans coût ou d'éditer une base de code existante. La génération d'un projet complet de A à Z est possible, mais en acceptant les écueils cités ci-dessus.

Pour du code commercial ou confidentiel, le calcul reste défavorable au regard du risque sur la confidentialité.

Quel modèle gratuit choisir ?

En juin 2026, OpenRouter propose 8 modèles gratuits utilisables comme moteur d'agent de code : Owl Alpha, Poolside Laguna XS.2, Poolside Laguna M.1, Kimi K2.6, Nemotron 3 Super, GPT-oss-120b, GPT-oss-20b et GLM 4.5 Air.

Le trio Nemotron 3 Ultra, Kimi K2.6 et GPT-oss-120b se distingue par ses capacités en tool use et ses résultats sur les benchmarks de code. Kimi K2.6 offre le meilleur rapport performance/latence : 107 tokens par seconde en moyenne.

Vérifiez régulièrement la liste sur OpenRouter : certains modèles sont dépréciés rapidement. OpenRouter propose aussi un endpoint automatique (openrouter/free), mais nous le déconseillons avec OpenCode — la sélection aléatoire peut vous faire tomber sur un modèle sans tool calling, générant plus d'erreurs.

Installation pas à pas

Étape 1 : installer OpenCode

Ouvrez un terminal et entrez :

curl -fsSL https://opencode.ai/install | bash

Puis lancez l'agent :

opencode

Étape 2 : connecter OpenRouter

Créez un compte sur OpenRouter et récupérez votre jeton d'API sur https://openrouter.ai/workspaces/default/keys.

Dans OpenCode, tapez /connect et choisissez OpenRouter comme provider. Entrez votre clef d'API.

Étape 3 : choisir le modèle

Tapez /model et sélectionnez Kimi K2.6. Vérifiez que la mention « free » apparaît à côté du nom : certains modèles existent en version gratuite et payante sur OpenRouter.

Votre agent de code entièrement gratuit est maintenant configuré.

Test en conditions réelles

Nous avons demandé à l'agent de créer un jeu de Snake simple : « Crée un fichier index.html autonome (HTML, CSS et JS dans le même fichier, sans dépendance externe) : le jeu du Snake jouable au clavier. »

Le jeu a été généré en moins d'une minute. L'interface est sobre mais entièrement fonctionnelle : compteur de points, gestion des directions, gestion de la longueur du serpent. Le tout a été créé gratuitement.

Les limites : quand cette stack ne suffit pas

Cette combinaison OpenCode + OpenRouter tient sa promesse : coder sans abonnement et sans débourser un centime. Mais ses limites la cantonnent à un rôle de complément plutôt que de remplaçant.

  • Latence variable : ralentissements aux heures de pointe
  • Récupération de données : vos entrées et sorties servent à entraîner les modèles futurs
  • Dépréciation rapide : les modèles gratuits disparaissent vite

C'est la solution à utiliser quand votre quota de tokens est épuisé, pour une édition rapide ou un projet personnel sans données sensibles. C'est aussi la réponse au harness fermé de Claude Code, qui refuse légalement tout modèle tiers.

Le vrai basculement : l'inférence locale

Le vrai changement arrivera le jour où un modèle du calibre de Claude Opus tournera entièrement en local sur la machine du développeur, sans transiter par un fournisseur tiers. On en est encore loin : les capacités hardware grand public restent le principal verrou.

Mais la trajectoire est encourageante. Les derniers petits modèles ouverts, comme Gemma 4 12B, montrent qu'un écart longtemps jugé infranchissable se resserre rapidement. Reste à voir si cette dynamique tiendra ses promesses sur les tâches de code agentique réelles, où le tool use et la cohérence sur de longues séquences font encore la différence.

Articles liés