إنفيديا تطلق مجموعة ضخمة من النماذج والبيانات والأدوات المفتوحة لتسريع تطوير الذكاء الاصطناعي

    /
    10 دقائق قراءة
    Ing. Patrik Kelemen
    إنفيديا تطلق مجموعة ضخمة من النماذج والبيانات والأدوات المفتوحة لتسريع تطوير الذكاء الاصطناعي

    أطلقت إنفيديا للتو واحدة من أكبر إصدارات الذكاء الاصطناعي مفتوحة المصدر في التاريخ. نماذج جديدة للكلام والروبوتات والمركبات ذاتية القيادة والرعاية الصحية والمزيد.

    Namiru AI

    دعم العملاء بالذكاء الاصطناعي لموقعك الإلكتروني

    الصق رابطك. احصل على وكيل دعم في 30 ثانية.

    في معرض CES 2026، أعلنت إنفيديا عما قد يكون أهم إصدار مفتوح المصدر للذكاء الاصطناعي حتى الآن. كشفت الشركة عن نماذج وبيانات وأدوات جديدة تشمل كل شيء من التعرف على الكلام إلى اكتشاف الأدوية.

    النطاق مذهل:

    • 10 تريليون رمز تدريب لغوي
    • 500,000 مسار روبوتي
    • 455,000 بنية بروتينية
    • 100 تيرابايت من بيانات مستشعرات المركبات

    شركات كبرى بما في ذلك Bosch وSalesforce وUber وPalantir وCrowdStrike تبني بالفعل على هذه التقنيات.


    Nemotron RAG: بحث أذكى في المستندات

    image

    نموذج التضمين: Llama-Nemotron-Embed-VL-1B-V2 (1.7 مليار معامل)
    نموذج إعادة الترتيب: Llama-Nemotron-Rerank-VL-1B-V2 (1.7 مليار معامل)
    متوفر أيضاً: نموذج تضمين نصي فقط بـ 8 مليارات معامل
    طول السياق: حتى 8,192 رمز
    الترخيص: مسموح بالاستخدام التجاري

    إيجاد المعلومات المدفونة في المستندات هو صراع يومي لعمال المعرفة. يجلب Nemotron RAG ذكاءً متعدد الوسائط للبحث في المستندات، حيث يعالج النصوص والصور معاً مع رؤى متعددة اللغات دقيقة عبر 26 لغة.

    كيف يعمل

    يجمع خط أنابيب Nemotron RAG بين ثلاثة مكونات:

    1. نموذج التضمين: يحول المستندات إلى تمثيلات متجهة للتخزين والاسترجاع
    2. نموذج إعادة الترتيب: يعيد ترتيب المرشحين المحتملين إلى ترتيب نهائي باستخدام الانتباه المتقاطع
    3. نموذج الاستدلال: يولد استجابات دقيقة بناءً على السياق المسترجع

    مثال من العالم الحقيقي: وكيل مكتب مساعدة تكنولوجيا المعلومات

    أظهرت إنفيديا كيف تعمل هذه النماذج معاً في وكيل مكتب مساعدة تكنولوجيا المعلومات:

    • Nemotron Nano 9B V2: نموذج الاستدلال الأساسي لتوليد الاستجابات
    • Llama 3.2 EmbedQA 1B V2: يحول المستندات إلى تضمينات متجهة
    • Llama 3.2 RerankQA 1B V2: يعيد ترتيب المستندات المستردة حسب الصلة

    تمكن هذه النماذج مجتمعة الوكيل من الإجابة على استفسارات المستخدمين بدقة من خلال الاستفادة من توليد اللغة واسترجاع المستندات وقدرات إعادة الترتيب.

    من يستخدمه

    Cadence تنمذج أصول تصميم المنطق مثل مستندات البنية الدقيقة والقيود وضمانات التحقق. يمكن للمهندسين طرح أسئلة مثل "أريد توسيع وحدة التحكم في المقاطعة لدعم حالة الطاقة المنخفضة، أظهر لي أقسام المواصفات التي تحتاج إلى تغييرات" والحصول فوراً على المتطلبات ذات الصلة.

    IBM تجرب هذه النماذج لتحسين البحث والاستدلال عبر الوثائق التقنية.


    Nemotron Speech: تحدث إلى أجهزتك كما لم يحدث من قبل

    النموذج: Nemotron-Speech-Streaming-En-0.6B
    المعاملات: 600 مليون
    البنية: مشفر FastConformer واعٍ بالذاكرة المؤقتة + فك تشفير RNN-T
    زمن الاستجابة: بث أقل من 100 ميلي ثانية
    الترخيص: مسموح بالاستخدام التجاري

    يقدم Nemotron Speech تعرفاً على الكلام في الوقت الفعلي بأداء أسرع 10 مرات من النماذج المماثلة ويتصدر لوحات صدارة ASR الحالية.

    image

    الميزات الرئيسية

    • بنية بث واعية بالذاكرة المؤقتة: تعالج فقط أجزاء الصوت الجديدة مع إعادة استخدام سياق المشفر المخزن مؤقتاً
    • أوضاع زمن استجابة قابلة للتكوين أثناء التشغيل: أجزاء 80 أو 160 أو 560 ميلي ثانية أو 1.12 ثانية دون إعادة تدريب
    • دعم علامات الترقيم والأحرف الكبيرة الأصلية
    • مدرب على 285,000 ساعة من البيانات الصوتية من مجموعة بيانات NVIDIA Granary

    من يستخدمه

    Bosch تستخدم بالفعل Nemotron Speech لتمكين السائقين من التفاعل مع المركبات من خلال الأوامر الصوتية. ServiceNow تدرب عائلة نماذج Apriel الخاصة بها على مجموعات بيانات Nemotron للحصول على أداء متعدد الوسائط فعال من حيث التكلفة.

    توقع هذه التقنية في أجهزة المنزل الذكي وأنظمة خدمة العملاء وأدوات إمكانية الوصول طوال عام 2026.


    Clara: اكتشاف أسرع للأدوية ورعاية صحية أفضل

    image

    La-Proteina: تصميم البروتين على مستوى الذرة
    ReaSyn v2: جدوى تصنيع الأدوية
    KERMT: اختبار السلامة الحسابي
    RNAPro: التنبؤ بالشكل ثلاثي الأبعاد للـ RNA
    مجموعة البيانات: 455,000 بنية بروتينية اصطناعية

    تهدف نماذج Clara AI الجديدة من إنفيديا إلى سد الفجوة بين الاكتشاف الرقمي والطب في العالم الحقيقي. بينما لن تتفاعل مع هذه النماذج مباشرة، يمكن أن تؤثر بشكل كبير على رعايتك الصحية.

    تفصيل النماذج

    النموذجالوظيفةالتأثير
    La-Proteinaتصميم بروتينات كبيرة بدقة على مستوى الذرةدراسة أمراض لم يكن من الممكن علاجها سابقاً
    ReaSyn v2دمج جدوى التصنيع في الاكتشافمنع البحث المهدر على مركبات غير عملية
    KERMTالتنبؤ بتفاعلات الدواء مع الجسماكتشاف المشاكل قبل التجارب السريرية المكلفة
    RNAProالتنبؤ بأشكال RNA ثلاثية الأبعادتمكين العلاجات القائمة على RNA الشخصية

    الخلاصة: يمكن أن تصل العلاجات إلى المرضى بشكل أسرع وبتكلفة أقل.


    Alpamayo: جعل السيارات ذاتية القيادة أكثر ذكاءً

    image

    النموذج: Alpamayo-R1-10B
    المعاملات: 10 مليارات (8.2 مليار عمود فقري Cosmos Reason + 2.3 مليار خبير إجراءات)
    بيانات التدريب: أكثر من مليار صورة من 80,000 ساعة قيادة متعددة الكاميرات
    مجموعة البيانات: أكثر من 1,700 ساعة من بيانات القيادة من 25 دولة
    الترخيص: غير تجاري (بحثي)

    ستسرع عائلة Alpamayo الجديدة من إنفيديا الطريق إلى المركبات ذاتية القيادة الحقيقية. هذا هو أول نموذج VLA استدلالي مفتوح في الصناعة مصمم للقيادة الذاتية.

    الابتكار الرئيسي: الاستدلال المتسلسل

    على عكس أنظمة AV التقليدية التي تكتشف الأشياء وتخطط المسارات فقط، يستخدم Alpamayo الاستدلال المتسلسل. يمكنه:

    • معالجة مدخلات الفيديو من كاميرات متعددة
    • توليد مسارات القيادة
    • شرح المنطق وراء كل قرار

    مثال على المخرجات: "انحرف إلى اليسار لزيادة المسافة من مخاريط البناء التي تتعدى على المسار"

    ما المتضمن

    • Alpamayo 1: نموذج VLA استدلالي بـ 10 مليارات معامل على Hugging Face
    • AlpaSim: إطار محاكاة شامل مفتوح المصدر
    • مجموعات بيانات الذكاء الاصطناعي المادي المفتوحة: أكثر من 1,700 ساعة تغطي حالات حافة نادرة من 25 دولة وأكثر من 2,500 مدينة

    من يستخدمه

    Lucid Motors وJLR وUber وBerkeley DeepDrive يستخدمون Alpamayo لتطوير مجموعات AV قائمة على الاستدلال للمستوى 4 من الاستقلالية.


    Cosmos: تعليم الروبوتات فهم العالم المادي

    image

    Cosmos Reason 2: إصدارات بـ 2 و8 مليارات معامل
    نافذة السياق: 256 ألف رمز (أكبر بـ 16 مرة من الإصدار الأول)
    البنية: بناءً على Qwen3-VL
    الترخيص: مسموح بالاستخدام التجاري (ترخيص NVIDIA للنماذج المفتوحة)

    على Hugging Face، أصبحت الروبوتات القطاع الأسرع نمواً، مع نماذج إنفيديا الرائدة في التنزيلات.

    عائلة نماذج Cosmos

    النموذجالمعاملاتالوظيفة
    Cosmos Reason 22 مليار / 8 ملياراتVLM استدلال الذكاء الاصطناعي المادي للروبوتات ووكلاء الذكاء الاصطناعي
    Cosmos Transfer 2.5-نقل نمط الفيديو إلى العالم
    Cosmos Predict 2.52 مليار / 14 مليارالتنبؤ بالحالة المستقبلية كفيديو

    الميزات الرئيسية لـ Cosmos Reason 2

    • فهم محسّن للزمان والمكان بدقة الطابع الزمني
    • تحديد موقع النقطة ثنائية/ثلاثية الأبعاد وإحداثيات المربع المحيط
    • مخرجات بيانات المسار للتحكم الروبوتي
    • دعم OCR لقراءة النص في البيئات
    • الاستدلال المتسلسل مع علامات <think>

    Isaac GR00T N1.6: نموذج أساسي للروبوت البشري

    المعاملات: 3 مليارات
    VLM الأساسي: متغير Cosmos-Reason-2B
    البنية: VLA مع محول انتشار من 32 طبقة

    GR00T N1.6 هو نموذج رؤية-لغة-إجراء مفتوح مصمم خصيصاً للروبوتات البشرية. يفتح التحكم الكامل في الجسم ويستخدم Cosmos Reason لفهم سياقي أفضل.

    من يستخدمه

    • Franka Robotics وHumanoid وNEURA Robotics - محاكاة وتدريب والتحقق من سلوكيات الروبوت
    • Salesforce وHitachi وUber وVAST Data - مراقبة حركة المرور وإنتاجية مكان العمل
    • Milestone - وكلاء الذكاء الاصطناعي للرؤية للسلامة العامة

    Nemotron Safety: بناء ذكاء اصطناعي جدير بالثقة

    image

    سلامة المحتوى: Llama-3.1-Nemotron-Safety-Guard-8B-v3
    كشف PII: Nemotron-PII (قائم على GLiNER)
    الترخيص: مسموح بالاستخدام التجاري

    بالنسبة للشركات التي تنشر الذكاء الاصطناعي، يتضمن Nemotron Safety نماذج سلامة المحتوى وكشف PII بدقة عالية.

    المكونات

    • نموذج سلامة المحتوى: دعم متعدد اللغات موسع مع الفروق الثقافية الدقيقة
    • كشف PII: يكتشف البيانات الشخصية الحساسة قبل تسربها
    • التحكم في الموضوع: يدير المواضيع التي يمكن للذكاء الاصطناعي مناقشتها

    من يستخدمه

    • CrowdStrike وCohesity وFortinet: تعزيز أمان تطبيقات الذكاء الاصطناعي
    • CodeRabbit: يشغل مراجعات كود الذكاء الاصطناعي بسرعة ودقة محسنتين
    • Palantir: التكامل في إطار Ontology لوكلاء الذكاء الاصطناعي المتخصصين

    ما يعنيه هذا للجميع

    جميع النماذج والبيانات متاحة الآن على GitHub وHugging Face، وأيضاً كـ خدمات NVIDIA NIM الدقيقة للنشر القابل للتوسع.

    ملخص البيانات المفتوحة

    مجموعة البياناتالحجمالمحتوى
    رموز اللغة10 تريليوناستدلال متعدد اللغات، برمجة، سلامة
    مسارات الروبوتات500,000حركة ومعالجة الروبوت
    بنى البروتين455,000بنى اصطناعية للذكاء الاصطناعي الطبي الحيوي
    بيانات مستشعرات المركبات100 تيرابايتظروف قيادة متنوعة
    فيديو القيادةأكثر من 1,700 ساعةحالات حافة نادرة من 25 دولة

    روابط للبدء


    بالنسبة للمستخدمين العاديين، يعني هذا الإصدار مساعدين صوتيين أفضل، وبحث أذكى في المستندات، وتطوير أسرع للأدوية، وسيارات ذاتية القيادة أكثر أماناً، وروبوتات أكثر قدرة. ستتسرب هذه التقنيات إلى المنتجات الاستهلاكية طوال عام 2026.

    تراهن إنفيديا على أنه من خلال تمكين النظام البيئي بأكمله للذكاء الاصطناعي، ستبيع المزيد من وحدات معالجة الرسومات. بناءً على الشركات التي تتبنى هذه التقنيات بالفعل، فإن هذا الرهان يؤتي ثماره.

    صنع بواسطة Namiru.ai - دردشة ذكاء اصطناعي جاهزة للاستخدام لموقعك.

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    هل استمتعت بهذا المقال؟

    اكتشف ما يمكن للذكاء الاصطناعي فعله لـ موقعك الإلكتروني

    الصق رابط موقعك وشاهد وكيل الذكاء الاصطناعي يبدأ العمل في ثوانٍ.

    عملاؤك يحصلون على إجابات فورية. أنت تحصل على عملاء محتملين وتحليلات ووقتك مرة أخرى.

    لا حاجة لبطاقة ائتمان

    Namiru.ai

    AI chat for your website