NousCoder-14B : le modèle de code open source qui défie Claude
Nous Research lance un modèle de programmation open source entraîné en 4 jours seulement. Ses performances rivalisent avec les systèmes professionnels bien plus coûteux.

Nous Research, une entreprise spécialisée dans l'IA open source (soutenue par Paradigm, un fonds d'investissement crypto), vient de lancer un nouveau modèle de programmation appelé NousCoder-14B. Selon ses créateurs, ses performances égalent ou surpassent des systèmes professionnels bien plus volumineux — et tout cela en seulement 4 jours d'entraînement sur 48 GPU Nvidia (les puces informatiques les plus puissantes du marché).
Mais le timing est crucial. Claude Code d'Anthropic, le nouvel outil d'écriture de code par IA, a dominé les discussions sur les réseaux sociaux depuis le 1er janvier. Les développeurs affirment que cet outil accomplit en une heure ce qui prenait des mois de travail.
Cette bataille entre Nous Research et Anthropic reflète une réalité évidente : la génération de code par IA est devenue une technologie fondamentale, et les grandes comme les petites entreprises se battent pour dominer le marché.
Les chiffres : 67,87 % de précision sur un test difficile
NousCoder-14B a atteint une précision de 67,87 % sur LiveCodeBench v6, un benchmark (test de référence comparant les performances de différents modèles d'IA) qui évalue les modèles sur des problèmes de programmation réels d'août 2024 à mai 2025. Ce score représente une amélioration de 7 points par rapport au modèle de base (Qwen3-14B d'Alibaba).
En termes d'évaluation humaine : le modèle est passé du niveau 1600-1750 (débutant) au niveau 2100-2200 (professionnel). Joe Li, le chercheur qui a entraîné le modèle (et ancien programmeur compétitif lui-même), a déclaré que cette amélioration équivaut au saut qu'il a réalisé après deux ans d'entraînement intensif.
Mais qu'est-ce qui a fait la différence ? La quantité de données. Joe Li en avait besoin de 1000 problèmes sur deux ans. Le modèle en a eu besoin de 24 000 problèmes en 4 jours.
Ce qui rend Nous Research différente : la transparence totale
La plupart des entreprises lancent un modèle et c'est tout. Nous Research a fait quelque chose de différent : elle a tout publié.
Pas seulement le modèle lui-même — elle a aussi publié :
- L'ensemble complet des données d'entraînement
- Le système de renforcement complet (Reinforcement Learning environment)
- Les outils d'évaluation
- Tout le code d'entraînement (basé sur le framework Atropos)
Cela signifie que n'importe quel chercheur disposant de la puissance de calcul suffisante peut reproduire cette expérience, l'améliorer ou s'en inspirer. C'est une véritable transparence.
Comment le modèle a-t-il été entraîné ? Un système de « jugement automatisé »
La technique utilisée s'appelle apprentissage par renforcement (Reinforcement Learning) — un type d'entraînement qui permet au modèle d'apprendre par essai et erreur, comme un enfant qui apprend à marcher. L'idée est simple :
- Le modèle écrit une solution à un problème de programmation
- La solution est testée sur des données de test
- Le modèle reçoit une réponse simple : correct ou incorrect
Mais appliquer cette idée à 24 000 problèmes nécessite une infrastructure massive. Nous Research a utilisé Modal (une plateforme de calcul cloud) pour exécuter les codes en parallèle (simultanément).
Chaque problème a des centaines de cas de test. Le système doit vérifier que le code s'exécute rapidement (15 secondes maximum) et sans consommation excessive de mémoire (4 GB maximum).
Et voici ce qui est remarquable : le modèle travaille sur un nouveau problème tandis que la solution précédente est vérifiée. Cette technique de « pipelining » a considérablement amélioré l'utilisation des GPU.
Le grand problème : les données s'épuisent
Joe Li a écrit quelque chose d'important dans son rapport :
« Le nombre de problèmes de programmation compétitive disponibles sur Internet est à peu près égal au nombre que nous avons utilisé (24 000). Nous avons atteint la limite des bonnes données. »
Cette observation reflète un problème plus large dans le monde de l'IA : les bonnes données ne sont pas infinies.
La puissance de calcul peut croître facilement — il suffit d'acheter plus de GPU. Mais les données ? Les données utilisables pour l'entraînement sont limitées.
Joe Li a proposé une solution : le modèle génère lui-même de nouveaux problèmes. Comme une partie d'échecs : un modèle joue contre lui-même, apprend de chaque partie. Cette idée s'appelle « self-play » (jouer contre soi-même).
« Les humains sont doués pour créer des problèmes utiles pour les développeurs. Mais les modèles d'IA ont encore un grand écart à combler dans ce domaine. »
L'investissement : 65 millions de dollars sur le pari open source
Nous Research a levé 50 millions de dollars en avril 2025 auprès de Paradigm. Le total atteint 65 millions de dollars selon certains rapports.
Cet investissement reflète une tendance claire : les grandes et petites entreprises parient sur l'IA open source. Nous Research a déjà lancé auparavant :
- Hermes 4 : des modèles affirmant surpasser ChatGPT
- DeepHermes-3 : le premier modèle capable de « réflexion profonde » (Extended thinking) à la demande
Mais il y a des critiques : certains affirment que l'entreprise se concentre trop sur le marketing (leur branding anime) et l'amélioration des benchmarks, plutôt que sur des applications pratiques.
Que vient ensuite ?
Joe Li a identifié plusieurs directions importantes :
1. Apprentissage multi-tentatives
Actuellement, le modèle reçoit une réponse simple : correct ou incorrect. Mais les vrais problèmes de programmation donnent des retours nuancés : « Le code ne compile pas », « Le résultat est incorrect », « C'est trop lent ». Le modèle pourrait apprendre de ces erreurs et se corriger.
2. Contrôle de la longueur de la réponse
Ils ont remarqué que les codes incorrects sont plus longs que les corrects. Cela remplit rapidement la fenêtre de contexte (Context window) — la quantité de texte que le modèle peut lire et mémoriser en une session.
3. Génération de problèmes et apprentissage autonome
C'est l'idée la plus ambitieuse : le modèle génère de nouveaux problèmes, les résout, apprend de lui-même. Cela résoudrait le problème du manque de données.
Qu'est-ce que cela signifie pour vous ?
Les développeurs marocains qui travaillent dans des entreprises locales ou en remote — ces évolutions changent la façon de travailler. Des outils comme Claude Code et NousCoder deviennent essentiels, pas optionnels. Le développeur qui n'utilise pas d'outils IA sera plus lent que celui qui les utilise.
Même les freelances — architectes écrivant du code pour des projets, avocats construisant de petites applications — peuvent en bénéficier. Un problème de programmation qui prenait deux heures en prend maintenant 15 minutes.
Dans un futur proche (un ou deux ans), les développeurs ayant de l'expérience dans l'entraînement et l'amélioration de modèles d'IA comme NousCoder seront très demandés, particulièrement par les entreprises européennes travaillant en remote. Ce domaine ouvre de véritables opportunités pour les talents marocains.
مقالات ذات صلة
fundingAnthropic غادي تدخل البورصة: Daniela Amodei شنو قالت على الشكوك
Anthropic بغاتش تدخل البورصة بعد جولة تمويل ب 965 مليار دولار. الـ CEO قالت: الـ AI كيتطلب فلوس ضخمة، والسوق العام هو الحل.
agentsGemini Spark ديال Google: وكيل ذكي 24/7 كيخدم بشكل فعلي
جربنا Gemini Spark، الوكيل الذكي الجديد ديال Google. كيدير مهام يومية بسهولة، ولكن كاين بعض النقائص. شنو الحقيقة؟
newsترامب وقّع أمر تنفيذي على الـ AI: مراجعة طوعية، ماشي إجبارية
الحكومة الأمريكية بغات تراجع نماذج الـ AI قبل الإطلاق، لكن الشركات ضغطات وخفّفات الشروط. 30 يوم بدل 90.
