في معرض CES 2026، أعلنت إنفيديا عما قد يكون أهم إصدار مفتوح المصدر للذكاء الاصطناعي حتى الآن. كشفت الشركة عن نماذج وبيانات وأدوات جديدة تشمل كل شيء من التعرف على الكلام إلى اكتشاف الأدوية.
النطاق مذهل:
- 10 تريليون رمز تدريب لغوي
- 500,000 مسار روبوتي
- 455,000 بنية بروتينية
- 100 تيرابايت من بيانات مستشعرات المركبات
شركات كبرى بما في ذلك Bosch وSalesforce وUber وPalantir وCrowdStrike تبني بالفعل على هذه التقنيات.
Nemotron RAG: بحث أذكى في المستندات

نموذج التضمين: Llama-Nemotron-Embed-VL-1B-V2 (1.7 مليار معامل)
نموذج إعادة الترتيب: Llama-Nemotron-Rerank-VL-1B-V2 (1.7 مليار معامل)
متوفر أيضاً: نموذج تضمين نصي فقط بـ 8 مليارات معامل
طول السياق: حتى 8,192 رمز
الترخيص: مسموح بالاستخدام التجاري
إيجاد المعلومات المدفونة في المستندات هو صراع يومي لعمال المعرفة. يجلب Nemotron RAG ذكاءً متعدد الوسائط للبحث في المستندات، حيث يعالج النصوص والصور معاً مع رؤى متعددة اللغات دقيقة عبر 26 لغة.
كيف يعمل
يجمع خط أنابيب Nemotron RAG بين ثلاثة مكونات:
- نموذج التضمين: يحول المستندات إلى تمثيلات متجهة للتخزين والاسترجاع
- نموذج إعادة الترتيب: يعيد ترتيب المرشحين المحتملين إلى ترتيب نهائي باستخدام الانتباه المتقاطع
- نموذج الاستدلال: يولد استجابات دقيقة بناءً على السياق المسترجع
مثال من العالم الحقيقي: وكيل مكتب مساعدة تكنولوجيا المعلومات
أظهرت إنفيديا كيف تعمل هذه النماذج معاً في وكيل مكتب مساعدة تكنولوجيا المعلومات:
- Nemotron Nano 9B V2: نموذج الاستدلال الأساسي لتوليد الاستجابات
- Llama 3.2 EmbedQA 1B V2: يحول المستندات إلى تضمينات متجهة
- Llama 3.2 RerankQA 1B V2: يعيد ترتيب المستندات المستردة حسب الصلة
تمكن هذه النماذج مجتمعة الوكيل من الإجابة على استفسارات المستخدمين بدقة من خلال الاستفادة من توليد اللغة واسترجاع المستندات وقدرات إعادة الترتيب.
من يستخدمه
Cadence تنمذج أصول تصميم المنطق مثل مستندات البنية الدقيقة والقيود وضمانات التحقق. يمكن للمهندسين طرح أسئلة مثل "أريد توسيع وحدة التحكم في المقاطعة لدعم حالة الطاقة المنخفضة، أظهر لي أقسام المواصفات التي تحتاج إلى تغييرات" والحصول فوراً على المتطلبات ذات الصلة.
IBM تجرب هذه النماذج لتحسين البحث والاستدلال عبر الوثائق التقنية.
Nemotron Speech: تحدث إلى أجهزتك كما لم يحدث من قبل
النموذج: Nemotron-Speech-Streaming-En-0.6B
المعاملات: 600 مليون
البنية: مشفر FastConformer واعٍ بالذاكرة المؤقتة + فك تشفير RNN-T
زمن الاستجابة: بث أقل من 100 ميلي ثانية
الترخيص: مسموح بالاستخدام التجاري
يقدم Nemotron Speech تعرفاً على الكلام في الوقت الفعلي بأداء أسرع 10 مرات من النماذج المماثلة ويتصدر لوحات صدارة ASR الحالية.

الميزات الرئيسية
- بنية بث واعية بالذاكرة المؤقتة: تعالج فقط أجزاء الصوت الجديدة مع إعادة استخدام سياق المشفر المخزن مؤقتاً
- أوضاع زمن استجابة قابلة للتكوين أثناء التشغيل: أجزاء 80 أو 160 أو 560 ميلي ثانية أو 1.12 ثانية دون إعادة تدريب
- دعم علامات الترقيم والأحرف الكبيرة الأصلية
- مدرب على 285,000 ساعة من البيانات الصوتية من مجموعة بيانات NVIDIA Granary
من يستخدمه
Bosch تستخدم بالفعل Nemotron Speech لتمكين السائقين من التفاعل مع المركبات من خلال الأوامر الصوتية. ServiceNow تدرب عائلة نماذج Apriel الخاصة بها على مجموعات بيانات Nemotron للحصول على أداء متعدد الوسائط فعال من حيث التكلفة.
توقع هذه التقنية في أجهزة المنزل الذكي وأنظمة خدمة العملاء وأدوات إمكانية الوصول طوال عام 2026.
Clara: اكتشاف أسرع للأدوية ورعاية صحية أفضل

La-Proteina: تصميم البروتين على مستوى الذرة
ReaSyn v2: جدوى تصنيع الأدوية
KERMT: اختبار السلامة الحسابي
RNAPro: التنبؤ بالشكل ثلاثي الأبعاد للـ RNA
مجموعة البيانات: 455,000 بنية بروتينية اصطناعية
تهدف نماذج Clara AI الجديدة من إنفيديا إلى سد الفجوة بين الاكتشاف الرقمي والطب في العالم الحقيقي. بينما لن تتفاعل مع هذه النماذج مباشرة، يمكن أن تؤثر بشكل كبير على رعايتك الصحية.
تفصيل النماذج
| النموذج | الوظيفة | التأثير |
|---|---|---|
| La-Proteina | تصميم بروتينات كبيرة بدقة على مستوى الذرة | دراسة أمراض لم يكن من الممكن علاجها سابقاً |
| ReaSyn v2 | دمج جدوى التصنيع في الاكتشاف | منع البحث المهدر على مركبات غير عملية |
| KERMT | التنبؤ بتفاعلات الدواء مع الجسم | اكتشاف المشاكل قبل التجارب السريرية المكلفة |
| RNAPro | التنبؤ بأشكال RNA ثلاثية الأبعاد | تمكين العلاجات القائمة على RNA الشخصية |
الخلاصة: يمكن أن تصل العلاجات إلى المرضى بشكل أسرع وبتكلفة أقل.
Alpamayo: جعل السيارات ذاتية القيادة أكثر ذكاءً

النموذج: Alpamayo-R1-10B
المعاملات: 10 مليارات (8.2 مليار عمود فقري Cosmos Reason + 2.3 مليار خبير إجراءات)
بيانات التدريب: أكثر من مليار صورة من 80,000 ساعة قيادة متعددة الكاميرات
مجموعة البيانات: أكثر من 1,700 ساعة من بيانات القيادة من 25 دولة
الترخيص: غير تجاري (بحثي)
ستسرع عائلة Alpamayo الجديدة من إنفيديا الطريق إلى المركبات ذاتية القيادة الحقيقية. هذا هو أول نموذج VLA استدلالي مفتوح في الصناعة مصمم للقيادة الذاتية.
الابتكار الرئيسي: الاستدلال المتسلسل
على عكس أنظمة AV التقليدية التي تكتشف الأشياء وتخطط المسارات فقط، يستخدم Alpamayo الاستدلال المتسلسل. يمكنه:
- معالجة مدخلات الفيديو من كاميرات متعددة
- توليد مسارات القيادة
- شرح المنطق وراء كل قرار
مثال على المخرجات: "انحرف إلى اليسار لزيادة المسافة من مخاريط البناء التي تتعدى على المسار"
ما المتضمن
- Alpamayo 1: نموذج VLA استدلالي بـ 10 مليارات معامل على Hugging Face
- AlpaSim: إطار محاكاة شامل مفتوح المصدر
- مجموعات بيانات الذكاء الاصطناعي المادي المفتوحة: أكثر من 1,700 ساعة تغطي حالات حافة نادرة من 25 دولة وأكثر من 2,500 مدينة
من يستخدمه
Lucid Motors وJLR وUber وBerkeley DeepDrive يستخدمون Alpamayo لتطوير مجموعات AV قائمة على الاستدلال للمستوى 4 من الاستقلالية.
Cosmos: تعليم الروبوتات فهم العالم المادي

Cosmos Reason 2: إصدارات بـ 2 و8 مليارات معامل
نافذة السياق: 256 ألف رمز (أكبر بـ 16 مرة من الإصدار الأول)
البنية: بناءً على Qwen3-VL
الترخيص: مسموح بالاستخدام التجاري (ترخيص NVIDIA للنماذج المفتوحة)
على Hugging Face، أصبحت الروبوتات القطاع الأسرع نمواً، مع نماذج إنفيديا الرائدة في التنزيلات.
عائلة نماذج Cosmos
| النموذج | المعاملات | الوظيفة |
|---|---|---|
| Cosmos Reason 2 | 2 مليار / 8 مليارات | VLM استدلال الذكاء الاصطناعي المادي للروبوتات ووكلاء الذكاء الاصطناعي |
| Cosmos Transfer 2.5 | - | نقل نمط الفيديو إلى العالم |
| Cosmos Predict 2.5 | 2 مليار / 14 مليار | التنبؤ بالحالة المستقبلية كفيديو |
الميزات الرئيسية لـ Cosmos Reason 2
- فهم محسّن للزمان والمكان بدقة الطابع الزمني
- تحديد موقع النقطة ثنائية/ثلاثية الأبعاد وإحداثيات المربع المحيط
- مخرجات بيانات المسار للتحكم الروبوتي
- دعم OCR لقراءة النص في البيئات
- الاستدلال المتسلسل مع علامات
<think>
Isaac GR00T N1.6: نموذج أساسي للروبوت البشري
المعاملات: 3 مليارات
VLM الأساسي: متغير Cosmos-Reason-2B
البنية: VLA مع محول انتشار من 32 طبقة
GR00T N1.6 هو نموذج رؤية-لغة-إجراء مفتوح مصمم خصيصاً للروبوتات البشرية. يفتح التحكم الكامل في الجسم ويستخدم Cosmos Reason لفهم سياقي أفضل.
من يستخدمه
- Franka Robotics وHumanoid وNEURA Robotics - محاكاة وتدريب والتحقق من سلوكيات الروبوت
- Salesforce وHitachi وUber وVAST Data - مراقبة حركة المرور وإنتاجية مكان العمل
- Milestone - وكلاء الذكاء الاصطناعي للرؤية للسلامة العامة
Nemotron Safety: بناء ذكاء اصطناعي جدير بالثقة

سلامة المحتوى: Llama-3.1-Nemotron-Safety-Guard-8B-v3
كشف PII: Nemotron-PII (قائم على GLiNER)
الترخيص: مسموح بالاستخدام التجاري
بالنسبة للشركات التي تنشر الذكاء الاصطناعي، يتضمن Nemotron Safety نماذج سلامة المحتوى وكشف PII بدقة عالية.
المكونات
- نموذج سلامة المحتوى: دعم متعدد اللغات موسع مع الفروق الثقافية الدقيقة
- كشف PII: يكتشف البيانات الشخصية الحساسة قبل تسربها
- التحكم في الموضوع: يدير المواضيع التي يمكن للذكاء الاصطناعي مناقشتها
من يستخدمه
- CrowdStrike وCohesity وFortinet: تعزيز أمان تطبيقات الذكاء الاصطناعي
- CodeRabbit: يشغل مراجعات كود الذكاء الاصطناعي بسرعة ودقة محسنتين
- Palantir: التكامل في إطار Ontology لوكلاء الذكاء الاصطناعي المتخصصين
ما يعنيه هذا للجميع
جميع النماذج والبيانات متاحة الآن على GitHub وHugging Face، وأيضاً كـ خدمات NVIDIA NIM الدقيقة للنشر القابل للتوسع.
ملخص البيانات المفتوحة
| مجموعة البيانات | الحجم | المحتوى |
|---|---|---|
| رموز اللغة | 10 تريليون | استدلال متعدد اللغات، برمجة، سلامة |
| مسارات الروبوتات | 500,000 | حركة ومعالجة الروبوت |
| بنى البروتين | 455,000 | بنى اصطناعية للذكاء الاصطناعي الطبي الحيوي |
| بيانات مستشعرات المركبات | 100 تيرابايت | ظروف قيادة متنوعة |
| فيديو القيادة | أكثر من 1,700 ساعة | حالات حافة نادرة من 25 دولة |
روابط للبدء
- نماذج Nemotron: developer.nvidia.com/nemotron
- نماذج Cosmos: github.com/nvidia-cosmos
- Alpamayo: developer.nvidia.com/drive/alpamayo
- Isaac GR00T: developer.nvidia.com/isaac/gr00t
بالنسبة للمستخدمين العاديين، يعني هذا الإصدار مساعدين صوتيين أفضل، وبحث أذكى في المستندات، وتطوير أسرع للأدوية، وسيارات ذاتية القيادة أكثر أماناً، وروبوتات أكثر قدرة. ستتسرب هذه التقنيات إلى المنتجات الاستهلاكية طوال عام 2026.
تراهن إنفيديا على أنه من خلال تمكين النظام البيئي بأكمله للذكاء الاصطناعي، ستبيع المزيد من وحدات معالجة الرسومات. بناءً على الشركات التي تتبنى هذه التقنيات بالفعل، فإن هذا الرهان يؤتي ثماره.


