open-sourceنُشر فـ 4 juin 20265 دقائق قراءة

NousCoder-14B: نموذج كود مفتوح المصدر فوقت Claude Code

Nous Research طلقات نموذج برمجة مفتوح المصدر كيقارع الأنظمة الكبيرة. مدرب فـ 4 أيام، وكيفهم الكود بحال المطورين المحترفين.

Nous Research، شركة متخصصة فـ AI مفتوح المصدر (محمولة من طرف Paradigm، صندوق استثمار متخصص فالعملات الرقمية)، طلقات الاثنين نموذج برمجة جديد اسمو NousCoder-14B. هاد النموذج كيقول بلي أداؤو كيطابق ولا كيتجاوز أنظمة احترافية أكبر منو — وكل هاد بـ 4 أيام تدريب فقط باستعمال 48 GPU ديال Nvidia (أقوى الرقاقات الحاسوبية ديالهم).

ولكن التوقيت مهم بزاف. Claude Code ديال Anthropic، الأداة الجديدة لكتابة البرامج بـ AI، كانت موضوع النقاش الأول فالشبكات الاجتماعية منذ 1 يناير. مطورين كيقولو بلي هاد الأداة كتخلص الشغل اللي كيقضي الشهور فيه فساعة واحدة.

هاد المعركة بين Nous Research و Anthropic كتعكس حقيقة واضحة: برمجة الكود بـ AI ولات تقنية أساسية، والشركات الكبيرة والصغيرة كتقاتل باش تهيمن على السوق.

الأرقام: 67.87% دقة فاختبار صعب

NousCoder-14B حقق نسبة دقة 67.87% فـ LiveCodeBench v6، اختبار معياري (Benchmark — اختبار قياسي كيقارن أداء نماذج AI مختلفة) كيختبر النماذج على مسائل برمجة حقيقية من أغسطس 2024 لـ ماي 2025. هاد النسبة كتمثل تحسن ديال 7 نقاط على النموذج الأساسي ديالو (Qwen3-14B ديال Alibaba).

بحال تقييم بشري: النموذج كان فرتبة 1600-1750 (مبتدئ)، ولا وصل ل 2100-2200 (محترف). جو لي (Joe Li)، الباحث اللي درب النموذج (ومطور برمجة تنافسي سابق نفسو)، قال بلي هاد التحسن كيطابق القفزة اللي هو قضا سنتين ديال تمرين مكثف باش يحققها.

ولكن هاد الشي اللي خلا الفرق؟ الكمية ديال البيانات. لي احتاج 1000 مسألة فسنتين. النموذج احتاج 24000 مسألة فـ 4 أيام.

الشي اللي خلا Nous Research مختلفة: الشفافية الكاملة

معظم الشركات كتطلق نموذج وخلاص. Nous Research عملات حاجة مختلفة: نشرات كل حاجة.

ماشي غير النموذج نفسو — نشرات:

البيانات كاملة ديال التدريب
نظام التعزيز كاملو (Reinforcement Learning environment — نظام كيعلم النموذج عبر تجربة وخطأ)
أدوات التقييم
كل الكود ديال التدريب (بناء على إطار Atropos)

هاد الشي يعني: أي باحث عندو القوة الحاسوبية كافية يقدر يكرر نفس التجربة، ولا يحسنها، ولا يبني عليها. هادا شفافية حقيقية.

كيفاش كدرب النموذج؟ نظام "الحكم الآلي"

التقنية اللي استعملوها اسمها التعلم بالتعزيز (Reinforcement Learning ⚠️ — نوع من التدريب كيخلي النموذج يتعلم من التجربة والخطأ، بحال طفل كيتعلم المشي). الفكرة بسيطة:

النموذج كيكتب حل لمسألة برمجة
الحل كيتختبر على بيانات تجريبية
النموذج كيحصل على جواب واحد: صحيح ولا غلط

لكن تطبيق هاد الفكرة على 24000 مسألة كيتطلب بنية تحتية ضخمة. Nous Research استعملات Modal (منصة حوسبة سحابية) باش تشغل الأكواد فموازاة (في نفس الوقت).

كل مسألة عندها مئات ديال الحالات التجريبية. النظام خاصو يتأكد بلي الكود يشتغل بسرعة (15 ثانية أقصى) وبدون استهلاك ذاكرة مفرطة (4 GB أقصى).

وهاد الشي اللي عجيب: النموذج كيشتغل على مسألة جديدة بينما كيتحقق من الحل القديم. هاد "الـ Pipelining" (تقنية كتسرع المعالجة) خلى استعمال الـ GPUs أحسن بكثير.

المشكل الكبير: البيانات قاعدة تنتهي

لي كتب فالتقرير ديالو شي حاجة مهمة بزاف:

"عدد مسائل البرمجة التنافسية المتاحة على الإنترنت تقريبا نفس عدد اللي استعملنا (24000). يعني احنا وصلنا لحد البيانات الجيدة."

هاد الملاحظة كتعكس مشكل أكبر فعالم الـ AI: البيانات الجيدة ماشي لانهائية.

الحوسبة (Compute) كتقدر تنمو بسهولة — شري GPUs أكثر. لكن البيانات؟ البيانات اللي تقدر تستعملها للتدريب محدودة.

لي اقترح حل: النموذج كيكتب مسائل جديدة لنفسو. بحال لعبة الشطرنج: نموذج كيلعب ضد نفسو، كيتعلم من كل لعبة. هاد الفكرة كتسمى "Self-play" (اللعب ضد النفس).

"البشر بارعين فخلق مسائل مفيدة للمطورين. لكن نماذج الـ AI ما زال عندها فجوة كبيرة فهاد الناحية."

الاستثمار: 65 مليون دولار على الرهان المفتوح المصدر

Nous Research جمعات 50 مليون دولار فأبريل 2025 من Paradigm (صندوق استثمار متخصص فالعملات الرقمية). المجموع كوصل ل 65 مليون دولار حسب بعض التقارير.

هاد الاستثمار كيعكس اتجاه واضح: الشركات الكبرى والصغيرة كتراهن على الـ AI مفتوح المصدر. Nous Research كانت طلقات قبل كذا:

Hermes 4: نماذج كتقول بلي أداؤها أحسن من ChatGPT
DeepHermes-3: أول نموذج كيقدر يفعل "التفكير المعمق" (Extended thinking) على الطلب

لكن كاين انتقادات: شي واحد كال بلي الشركة كتركز بزاف على التسويق (الـ anime branding ديالهم) وعلى تحسين الـ Benchmarks، وماشي على الحاجات العملية.

شنو اللي خاص يجي بعد كذا؟

لي حدد عدة اتجاهات مهمة:

1. التعلم متعدد المحاولات

حاليا، النموذج كيحصل على جواب واحد: صحيح ولا غلط. لكن مسائل البرمجة الحقيقية كتعطي تغذية راجعة (Feedback) وسيطة: "الكود ما كيتجمع"، "النتيجة غلط"، "بطيء بزاف". النموذج كيقدر يتعلم من هاد الأخطاء ويصحح حالو.

2. التحكم فطول الجواب

لاحظو بلي الأكواد الغلطة كتكون أطول من الصحيحة. هاد الشي كيملي نافذة السياق (Context window ⚠️ — كمية النص اللي النموذج قادر يقرا ويستحضر فالذاكرة فجلسة واحدة) بسرعة.

3. توليد المسائل والتعلم الذاتي

هاد الفكرة الأكثر طموحا: النموذج كيكتب مسائل جديدة، كيحلهم، كيتعلم من حالو. هاد الشي كيحل مشكل نقص البيانات.

شنو كيعني هاد الشي ليك؟

المطورين المغاربة كيشتغلو فشركات محلية ولا remote — هاد التطورات كتغير طريقة الشغل. أدوات بحال Claude Code و NousCoder كتصبح أساسية، ماشي اختيارية. المطور اللي ما كيستعملش AI tools غادي يكون أبطأ من اللي كيستعملهم.

حتى المهنيين المستقلين — مهندسين معماريين كيكتبو كود للمشاريع، محامين كيبنيو تطبيقات صغيرة — كيقدرو يستفدو. مسألة برمجة كانت كتقضي ساعتين، دابا كتقضي 15 دقيقة.

فالمستقبل القريب (سنة ولا سنتين)، المطورين اللي عندهم خبرة فتدريب وتحسين نماذج AI بحال NousCoder غادي يكون عليهم طلب كبير، خاصة فالشركات الأوروبية اللي كتشتغل remote. هاد المجال ولا فتح فرص حقيقية للمواهب المغربية.