NVIDIA Cosmos 3: النموذج الأول كيفهم ويدير الفيزياء الحقيقية
Cosmos 3 هي أول نموذج موحد كيفهم الحركة والفيزياء والسببية. مفيدة للروبوتات والسيارات المستقلة والبيانات الصناعية.

NVIDIA أطلقات Cosmos 3، نموذج AI جديد مخصص لشي حاجة لم تكن سهلة قبل هسا: فهم الفيزياء الحقيقية. ماشي غير فهم الصور والكلمات — فهم الحركة، السببية (إيلا وقعت الكرة، غادي تنزل)، والعلاقات المكانية.
هاد النموذج كيشتغل على الروبوتات، السيارات المستقلة، والمصانع الذكية. والخبر الأهم: هو مفتوح المصدر (Open source) على Hugging Face، وتقدر تحملو وتخدمو بيه دابا.
شنو الجديد فـ Cosmos 3؟
الفرق الكبير: نموذج واحد بدل خمسة.
قبل، إيلا بغيتي تبني نظام كيفهم الفيزياء، خاصك تشتغل مع نماذج منفصلة:
- نموذج لتوليد الفيديو (Cosmos Predict)
- نموذج لتحكم الحركة (Cosmos Transfer)
- نموذج لفهم المشهد (Cosmos Reason)
- نموذج لسياسات الحركة (Cosmos Policy)
Dabaa، كل هاد الحاجات فنموذج واحد. هاد الـ Omni-model (نموذج متعدد الاستخدامات — نموذج AI كبير يقدر يخدم عدة مهام مختلفة) كيستعمل بنية اسمها Mixture-of-Transformers (MoT)، يعني Transformers متعددة (البنية التقنية اللي بناو عليها معظم نماذج الـ AI الحديثة بحال GPT و Claude) كتخدم مع بعضها بذكاء.
النتيجة: تقدر تدير كل هاد الحاجات فـ forward pass واحد:
- توليد فيديوهات واقعية من نص، صور، ولا فيديوهات أخرى
- التنبؤ بالحركات والتسلسلات المستقبلية
- الفهم الفيزيائي للمشاهد المعقدة
علاش هاد الشي مهم فـ Physical AI؟
الـ AI الحالي كيفهم الصور والكلمات. ولكن الروبوتات والسيارات المستقلة محتاجة شي حاجة مختلفة: فهم الفيزياء بالفعل.
تخيل ليك روبوت خاصو يطي حاجات من رف. ماشي كافي يقول: "هاد شي مستطيل". خاصو يفهم:
- كيفاش كيتحرك الشي إيلا ضربتو
- الوزن والتوازن
- السرعة والقوة اللي محتاج
Cosmoss 3 كيدير هاد كلو. الشركات كتستعملو لـ:
- الروبوتات: تدريب روبوت على حركات معقدة بدون ما يكسر الحاجات
- السيارات المستقلة: محاكاة سيناريوهات خطرة (debris فالطريق، حوادث محتملة)
- الأمان الصناعي: توليد بيانات تدريب لأنظمة المراقبة
نسختان: Nano و Super
NVIDIA طلقات نسختين:
Cosmos 3 Nano (16 مليار معامل)
النسخة الخفيفة، تقدر تشتغل على GPU workstation بحال RTX PRO 6000. مثالية للشركات الصغيرة والمطورين الفرادى. موجودة مجانا على Hugging Face.
Cosmos 3 Super (64 مليار معامل)
النسخة الثقيلة، لتوليد بيانات ضخمة وأبحاث. تحتاج NVIDIA Hopper ولا Blackwell GPUs (أحدث معالجات NVIDIA).
كيفاش تستعملو؟
NVIDIA ربطات Cosmos 3 مع Diffusers (مكتبة Hugging Face المشهورة للتوليد). يعني تقدر تستعملو بـ 5 أسطر كود فقط:
<bdi>from diffusers import Cosmos3OmniPipeline</bdi>
<bdi>pipe</bdi> = <bdi>Cosmos3OmniPipeline.from_pretrained</bdi>("<bdi>nvidia</bdi>/<bdi>Cosmos3-Nano</bdi>")
<bdi>result</bdi> = <bdi>pipe</bdi>(<bdi>prompt</bdi>="<bdi>Your prompt here</bdi>", <bdi>num_frames</bdi>=1)
الـ Prompts خاصها تكون تفصيلية. بدل ما تقول "robot picking up objects"، قول:
"A robotic arm with a metallic finish is mounted on a clean white workbench, its gripper positioned above colored objects. Overhead fluorescent lights illuminate the scene brightly."
كلما كانت التفاصيل أكثر، الفيديو أفضل.
البيانات والـ Post-training
NVIDIA أطلقات كذلك مجموعات بيانات اصطناعية (Synthetic Data Generation — SDG) باش الشركات تقدر تخصصو النموذج على حالتهم.
إيلا عندك روبوت معين، ولا بيئة معينة، تقدر تدرب Cosmos 3 على بيانات ديالك. هاد الـ Post-training (التدريب التخصصي — تخصيص النموذج على بيانات محددة باش يكون أحسن فمهمة معينة) كيتحسن الأداء كتير.
NVIDIA وضعات الـ scripts كاملة على GitHub، ماشي غير كود مغلق.
شنو كيعني هاد الشي ليك؟
الشركات المغربية فالقطاعات الصناعية — الفوسفات (OCP)، الصناعة الكهربائية، المصانع الذكية — كيقدرو يستفدو بزاف من هاد النوع ديال النماذج. توليد بيانات تدريب للروبوتات يعني توفير ملايين الدراهم (ماشي محتاج تشتري آلاف الروبوتات باش تجرب).
حتى المطورين المغاربة اللي كيخدمو remote للشركات الأوروبية، هاد مجال جديد بزاف: بناء أنظمة Physical AI كتحتاج خبرة فـ Computer Vision، Robotics، ولا Simulation. الطلب على المواهب هاد الجهة غادي يكون ضخم فالسنوات الجاية، خاصة فالشركات التقنية الكبرى. وملي الأداة مفتوحة المصدر، ماشي محتاج ترخيص غالي — تقدر تبدا تجرب دابا.
مقالات ذات صلة
fundingAnthropic غادي تدخل البورصة: Daniela Amodei شنو قالت على الشكوك
Anthropic بغاتش تدخل البورصة بعد جولة تمويل ب 965 مليار دولار. الـ CEO قالت: الـ AI كيتطلب فلوس ضخمة، والسوق العام هو الحل.
agentsGemini Spark ديال Google: وكيل ذكي 24/7 كيخدم بشكل فعلي
جربنا Gemini Spark، الوكيل الذكي الجديد ديال Google. كيدير مهام يومية بسهولة، ولكن كاين بعض النقائص. شنو الحقيقة؟
newsترامب وقّع أمر تنفيذي على الـ AI: مراجعة طوعية، ماشي إجبارية
الحكومة الأمريكية بغات تراجع نماذج الـ AI قبل الإطلاق، لكن الشركات ضغطات وخفّفات الشروط. 30 يوم بدل 90.
