researchنُشر فـ 4 juin 20264 دقائق قراءة

كيفاش Nvidia كتولد بيانات اصطناعية ذكية باش تدرب نماذج AI أقوى

Nvidia طورات طريقة جديدة لتوليد بيانات تدريب اصطناعية من المهام العامة. النتيجة: تحسن بزاف فقدرات الاستدلال والعلوم بدون ما تضيع الأساسيات.

واحد من أكبر التحديات فتدريب نماذج الـ AI الحديثة: البيانات. ماشي غير الكمية — الجودة والنوعية. Nvidia اكتشفات حاجة مهمة: بدل ما تجمع بيانات خام كثيرة، تقدر تولد بيانات مقصودة اللي تحسن قدرات معينة — بحال الاستدلال المنطقي ولا الفهم العلمي.

هاد الطريقة اللي بنشرح ليك الآن هي اللي استعملاتها Nvidia فتدريب عائلة Nemotron ديالها، وأعطاتها نتائج كبيرة. والأهم: ماشي غير تقنية Nvidia — تقدر أي فريق يستعملها.

شنو هي المشكلة الأساسية؟

ملي كتدرب نموذج LLM (النموذج اللغوي الكبير — نموذج AI كيفهم وكيكتب نص بحال إنسان) على مليارات الكلمات من الإنترنت، النموذج كيتعلم أشياء عامة كثيرة. ولكن بعض المهام الصعبة — بحال حل مسائل علمية معقدة ولا الاستدلال المنطقي متعدد الخطوات — كتحتاج تدريب موجه (targeted training).

المشكل: البيانات الجيدة للمهام الصعبة نادرة وغالية. فلوس كثيرة باش تجمع وتنظف.

الحل اللي اكتشفات Nvidia؟ استعمل البيانات اللي كاينة بالفعل — مجموعات المهام العامة المتوفرة — وولد منها بيانات جديدة ومقصودة.

كيفاش كتخدم الطريقة؟

العملية عندها 5 مراحل بسيطة:

1. جمع "البذور" (Seeds)

Nvidia اختارات حوالي 70 مجموعة مهام عامة من مكتبة lm-eval-harness — هاد مكتبة عامة فيها مئات المهام: علوم، منطق، كود، رياضيات، وغيرهم. من كل مجموعة، اختارات غير التدريب، وماشتغلتش على بيانات الاختبار (باش ما تعملش cheating).

2. توحيد الصيغة

كل مجموعة مهام عندها صيغة مختلفة. Nvidia حولات كلش لصيغة موحدة (JSONL): السؤال، الخيارات (إيلا كاينة)، والإجابة.

3. توليد أسئلة جديدة

هاد الخطوة مهمة: النموذج كيقرا السؤال الأصلي، ولكن ماشي كيعيد نفس السؤال — كيولد سؤال جديد كتماما بنفس الفكرة الأساسية. مثال:

السؤال الأصلي (من PIQA — اختبار الحدس الفيزيائي):

"إيلا بغيتي تنظف الأوساخ تحت الأظفار، شنو أفضل طريقة؟" الخيارات: أ) استعمل فرشاة، ب) استعمل الماء الدافي

السؤال المولد:

"إيلا بغيتي تنظف الأوساخ من الجلد بعد الشغل فالحديقة، شنو أفضل حل؟"

نفس المبدأ (تنظيف)، محتوى مختلف تماما.

4. إغناء الإجابات بالتفكير

هاد الخطوة الحقيقية هي الذهب. بدل ما تعطي النموذج غير الإجابة (مثلا: "الخيار ب")، كتعطيه المسار الكامل من السؤال للجواب:

السؤال: "إيلا بغيتي تنظف الأوساخ من الجلد..."

الإجابة + التفكير:
"الجواب: الماء الدافي (الخيار ب)

لماذا؟ الماء الدافي كيفتح المسام ويخلي الأوساخ تخرج بسهولة. 
الماء البارد ما كيفتح المسام، والفرشاة قاسية وكتخدش الجلد."

هاد الإضافة ديال التفكير والسياق كتخلي البيانات أقوى بكثير للتدريب.

5. التصفية والتنظيف

آخر خطوة: التأكد من أن البيانات المولدة صحيحة ومنسقة بشكل صحيح.

النتائج: تحسن كبير فالمهام الصعبة

Nvidia جربات هاد الطريقة على نموذج صغير (Nemotron-3 Nano) وأضافات البيانات المولدة فآخر مراحل التدريب (100 مليار token — وحدة صغيرة من النص). شنو اللي حصل:

المهمة	التحسن
MMLU-Pro (أسئلة متعددة الاختيار صعيبة)	+1.8%
الكود (كتابة وحل مشاكل البرمجة)	+1.9%
الفهم الحدسي (commonsense)	+1.6%
GPQA (أسئلة علمية صعبة جدا)	+11.1% 🚀
الرياضيات	مستقرة (ما تراجعتش)

التحسن الأكبر هو فـ GPQA — أسئلة علمية معقدة. ليش؟ لأن البيانات المولدة عندها تفكير وسياق، وهاد الشي بالضبط اللي محتاج للأسئلة الصعيبة.

ليش هاد الطريقة ذكية؟

الفكرة الأساسية هي نقل التعلم عبر المهام (Transfer Learning across task families). مثلا:

سؤال علوم يقدر يساعد النموذج على الفهم الحدسي
سؤال منطق يقدر يساعد على المقارنة بين البدائل
سؤال رياضيات ولا كود يقدر يساعد على التخطيط متعدد الخطوات

النموذج ماشي كيتعلم المهام الفردية — كيتعلم أنماط عامة كتنفع فمهام مختلفة.

ليش السياق والتفكير مهمين بهاد الشكل؟

Nvidia جربات نسختين من نفس البيانات:

بدون سياق: غير الإجابة ("الخيار ب")
مع سياق: الإجابة + التفكير والتعريفات

النسخة الثانية أعطات نتائج أفضل بزاف — خاصة فالمهام اللي محتاجة علوم ولا استدلال معقد.

السبب بسيط: النموذج كيحتاج خريطة الطريق من السؤال للجواب، ماشي غير الجواب الأخير.

شنو الدروس العملية؟

Nvidia اكتشفات حاجات عملية مهمة:

التنوع مهم: استعمال مهام متنوعة (70 مجموعة) أفضل من التركيز على مهمة واحدة
الصيغة مهمة: كتابة الإجابة كـ نص ("الماء الدافي") أفضل من كتابة الخيار ("ب")
المهام متعددة الاختيار أسهل للتحقق: النموذج كيقدر يتأكد الإجابة صحيحة. المهام المفتوحة (بحال كتابة قصة) أصعب
الخليط مهم: إيلا استعملتي كثير بيانات من مهمة واحدة، النموذج قد يتعلم غير تلك المهمة بالضبط

شنو كيعني هاد الشي ليك؟

هاد الطريقة ماشي غير لـ Nvidia — أي فريق يقدر يستعملها. المطورين المغاربة اللي كيشتغلو على نماذج AI محلية (بحال نماذج Darija) يقدرو يستافدو بزاف من هاد الفكرة. بدل ما يجمعو بيانات خام كثيرة (غالي وصعيب)، يقدرو يستعملو مجموعات المهام المتوفرة ويولدو بيانات مقصودة للمهام اللي بغيتو ينحسنوها. حتى الشركات الصغيرة والمستقلين يقدرو يطبقوها. والفكرة الأساسية — إضافة التفكير والسياق للبيانات — تنفع ماشي غير فالـ AI، تنفع حتى فالتعليم والتدريب البشري.