open-sourcePublié le 4 juin 20265 min de lecture

NousCoder-14B : le modèle de code open source qui défie Claude

Nous Research lance un modèle de programmation open source entraîné en 4 jours seulement. Ses performances rivalisent avec les systèmes professionnels bien plus coûteux.

NousCoder-14B: نموذج كود مفتوح المصدر فوقت Claude Code

Nous Research, une entreprise spécialisée dans l'IA open source (soutenue par Paradigm, un fonds d'investissement crypto), vient de lancer un nouveau modèle de programmation appelé NousCoder-14B. Selon ses créateurs, ses performances égalent ou surpassent des systèmes professionnels bien plus volumineux — et tout cela en seulement 4 jours d'entraînement sur 48 GPU Nvidia (les puces informatiques les plus puissantes du marché).

Mais le timing est crucial. Claude Code d'Anthropic, le nouvel outil d'écriture de code par IA, a dominé les discussions sur les réseaux sociaux depuis le 1er janvier. Les développeurs affirment que cet outil accomplit en une heure ce qui prenait des mois de travail.

Cette bataille entre Nous Research et Anthropic reflète une réalité évidente : la génération de code par IA est devenue une technologie fondamentale, et les grandes comme les petites entreprises se battent pour dominer le marché.

Les chiffres : 67,87 % de précision sur un test difficile

NousCoder-14B a atteint une précision de 67,87 % sur LiveCodeBench v6, un benchmark (test de référence comparant les performances de différents modèles d'IA) qui évalue les modèles sur des problèmes de programmation réels d'août 2024 à mai 2025. Ce score représente une amélioration de 7 points par rapport au modèle de base (Qwen3-14B d'Alibaba).

En termes d'évaluation humaine : le modèle est passé du niveau 1600-1750 (débutant) au niveau 2100-2200 (professionnel). Joe Li, le chercheur qui a entraîné le modèle (et ancien programmeur compétitif lui-même), a déclaré que cette amélioration équivaut au saut qu'il a réalisé après deux ans d'entraînement intensif.

Mais qu'est-ce qui a fait la différence ? La quantité de données. Joe Li en avait besoin de 1000 problèmes sur deux ans. Le modèle en a eu besoin de 24 000 problèmes en 4 jours.

Ce qui rend Nous Research différente : la transparence totale

La plupart des entreprises lancent un modèle et c'est tout. Nous Research a fait quelque chose de différent : elle a tout publié.

Pas seulement le modèle lui-même — elle a aussi publié :

L'ensemble complet des données d'entraînement
Le système de renforcement complet (Reinforcement Learning environment)
Les outils d'évaluation
Tout le code d'entraînement (basé sur le framework Atropos)

Cela signifie que n'importe quel chercheur disposant de la puissance de calcul suffisante peut reproduire cette expérience, l'améliorer ou s'en inspirer. C'est une véritable transparence.

Comment le modèle a-t-il été entraîné ? Un système de « jugement automatisé »

La technique utilisée s'appelle apprentissage par renforcement (Reinforcement Learning) — un type d'entraînement qui permet au modèle d'apprendre par essai et erreur, comme un enfant qui apprend à marcher. L'idée est simple :

Le modèle écrit une solution à un problème de programmation
La solution est testée sur des données de test
Le modèle reçoit une réponse simple : correct ou incorrect

Mais appliquer cette idée à 24 000 problèmes nécessite une infrastructure massive. Nous Research a utilisé Modal (une plateforme de calcul cloud) pour exécuter les codes en parallèle (simultanément).

Chaque problème a des centaines de cas de test. Le système doit vérifier que le code s'exécute rapidement (15 secondes maximum) et sans consommation excessive de mémoire (4 GB maximum).

Et voici ce qui est remarquable : le modèle travaille sur un nouveau problème tandis que la solution précédente est vérifiée. Cette technique de « pipelining » a considérablement amélioré l'utilisation des GPU.

Le grand problème : les données s'épuisent

Joe Li a écrit quelque chose d'important dans son rapport :

« Le nombre de problèmes de programmation compétitive disponibles sur Internet est à peu près égal au nombre que nous avons utilisé (24 000). Nous avons atteint la limite des bonnes données. »

Cette observation reflète un problème plus large dans le monde de l'IA : les bonnes données ne sont pas infinies.

La puissance de calcul peut croître facilement — il suffit d'acheter plus de GPU. Mais les données ? Les données utilisables pour l'entraînement sont limitées.

Joe Li a proposé une solution : le modèle génère lui-même de nouveaux problèmes. Comme une partie d'échecs : un modèle joue contre lui-même, apprend de chaque partie. Cette idée s'appelle « self-play » (jouer contre soi-même).

« Les humains sont doués pour créer des problèmes utiles pour les développeurs. Mais les modèles d'IA ont encore un grand écart à combler dans ce domaine. »

L'investissement : 65 millions de dollars sur le pari open source

Nous Research a levé 50 millions de dollars en avril 2025 auprès de Paradigm. Le total atteint 65 millions de dollars selon certains rapports.

Cet investissement reflète une tendance claire : les grandes et petites entreprises parient sur l'IA open source. Nous Research a déjà lancé auparavant :

Hermes 4 : des modèles affirmant surpasser ChatGPT
DeepHermes-3 : le premier modèle capable de « réflexion profonde » (Extended thinking) à la demande

Mais il y a des critiques : certains affirment que l'entreprise se concentre trop sur le marketing (leur branding anime) et l'amélioration des benchmarks, plutôt que sur des applications pratiques.

Que vient ensuite ?

Joe Li a identifié plusieurs directions importantes :

1. Apprentissage multi-tentatives

Actuellement, le modèle reçoit une réponse simple : correct ou incorrect. Mais les vrais problèmes de programmation donnent des retours nuancés : « Le code ne compile pas », « Le résultat est incorrect », « C'est trop lent ». Le modèle pourrait apprendre de ces erreurs et se corriger.

2. Contrôle de la longueur de la réponse

Ils ont remarqué que les codes incorrects sont plus longs que les corrects. Cela remplit rapidement la fenêtre de contexte (Context window) — la quantité de texte que le modèle peut lire et mémoriser en une session.

3. Génération de problèmes et apprentissage autonome

C'est l'idée la plus ambitieuse : le modèle génère de nouveaux problèmes, les résout, apprend de lui-même. Cela résoudrait le problème du manque de données.

Qu'est-ce que cela signifie pour vous ?

Les développeurs marocains qui travaillent dans des entreprises locales ou en remote — ces évolutions changent la façon de travailler. Des outils comme Claude Code et NousCoder deviennent essentiels, pas optionnels. Le développeur qui n'utilise pas d'outils IA sera plus lent que celui qui les utilise.

Même les freelances — architectes écrivant du code pour des projets, avocats construisant de petites applications — peuvent en bénéficier. Un problème de programmation qui prenait deux heures en prend maintenant 15 minutes.

Dans un futur proche (un ou deux ans), les développeurs ayant de l'expérience dans l'entraînement et l'amélioration de modèles d'IA comme NousCoder seront très demandés, particulièrement par les entreprises européennes travaillant en remote. Ce domaine ouvre de véritables opportunités pour les talents marocains.

Articles liés

<bdi>Hermes</bdi> + <bdi>Ollama</bdi>: الثنائي اللي بدل طريقة اشتغالي مع الـ <bdi>AI</bdi> المحلي

tools

Hermes + Ollama : pourquoi c'est mon outil d'IA locale préféré

Après avoir testé de nombreuses applications d'IA locale, Hermes s'impose comme la meilleure option. Cet agent autonome combine modèles, mémoire, compétences et automatisations dans une interface fluide.

4 min de lectureLire la suite

الاتحاد الأوروبي بغى يكون مستقل تكنولوجيا: 4 محاور جديدة

infrastructure

L'UE dévoile son plan pour l'autonomie numérique européenne

La Commission européenne présente un paquet de mesures pour renforcer ses capacités en semi-conducteurs, cloud, IA et open source, réduisant sa dépendance aux fournisseurs extérieurs.

3 min de lectureLire la suite

<bdi>Claude Code</bdi> كتكلف 200 دولار فالشهر. <bdi>Goose</bdi> كتدير نفس الحاجة بلا فلوس

tools

Claude Code coûte 200 $/mois. Goose fait pareil gratuitement

Anthropic augmente les prix et les limites d'utilisation. Goose, un agent IA open source de Block, offre les mêmes capacités sans abonnement ni restrictions. Les développeurs basculen.

5 min de lectureLire la suite

<bdi>Granite 4.1</bdi>: كيفاش <bdi>IBM</bdi> بنات نماذج لغوية قوية وصغيرة

llm

Granite 4.1 : comment IBM crée des modèles IA puissants et légers

IBM lance Granite 4.1, une famille de modèles de langage entraînés sur 15 trillions de tokens. Le modèle 8B rivalise avec un modèle 4 fois plus gros. Le secret ? La qualité des données et l'entraînement intelligent.

5 min de lectureLire la suite

← Tous les articles