CES 2026'da NVIDIA, bugüne kadarki en önemli açık kaynak yapay zeka sürümünü duyurdu. Şirket, konuşma tanımadan ilaç keşfine kadar her şeyi kapsayan yeni modeller, veri setleri ve araçlar tanıttı.
Kapsam oldukça etkileyici:
- 10 trilyon dil eğitim tokeni
- 500.000 robotik yörünge
- 455.000 protein yapısı
- 100 terabayt araç sensör verisi
Bosch, Salesforce, Uber, Palantir ve CrowdStrike dahil olmak üzere büyük şirketler bu teknolojiler üzerine şimdiden çalışmalar yapıyor.
Nemotron RAG: Daha Akıllı Doküman Arama

Gömme Modeli: Llama-Nemotron-Embed-VL-1B-V2 (1,7 milyar parametre)
Yeniden Sıralama Modeli: Llama-Nemotron-Rerank-VL-1B-V2 (1,7 milyar parametre)
Ayrıca Mevcut: 8 milyar parametreli yalnızca metin gömme modeli
Bağlam Uzunluğu: 8.192 tokene kadar
Lisans: Ticari kullanıma izin verilir
Dokümanlarda gömülü bilgileri bulmak, bilgi çalışanları için günlük bir mücadeledir. Nemotron RAG, doküman aramaya çok modlu zeka getirerek hem metin hem de görselleri işler ve 26 dilde doğru çok dilli içgörüler sunar.
Nasıl Çalışır
Nemotron RAG hattı üç bileşeni birleştirir:
- Gömme Modeli: dokümanları depolama ve erişim için vektör temsillerine dönüştürür
- Yeniden Sıralama Modeli: çapraz dikkat kullanarak potansiyel adayları nihai sıraya göre yeniden sıralar
- Akıl Yürütme Modeli: alınan bağlama dayalı doğru yanıtlar üretir
Gerçek Dünya Örneği: BT Yardım Masası Ajanı
NVIDIA, bu modellerin bir BT Yardım Masası ajanında nasıl birlikte çalıştığını gösterdi:
- Nemotron Nano 9B V2: yanıt üretmek için birincil akıl yürütme modeli
- Llama 3.2 EmbedQA 1B V2: dokümanları vektör gömmelerine dönüştürür
- Llama 3.2 RerankQA 1B V2: alınan dokümanları alaka düzeyine göre yeniden sıralar
Bu modeller toplu olarak ajanın dil üretimi, doküman erişimi ve yeniden sıralama yeteneklerinden yararlanarak kullanıcı sorgularını doğru bir şekilde yanıtlamasını sağlar.
Kim Kullanıyor
Cadence, mikro mimari dokümanları, kısıtlamalar ve doğrulama teminatı gibi mantık tasarım varlıklarını modelliyor. Mühendisler "Kesinti denetleyicisini düşük güç durumunu destekleyecek şekilde genişletmek istiyorum, hangi özellik bölümlerinin değişmesi gerektiğini göster" gibi sorular sorabilir ve ilgili gereksinimleri anında ortaya çıkarabilir.
IBM, teknik dokümantasyon genelinde arama ve akıl yürütmeyi geliştirmek için bu modelleri pilot olarak kullanıyor.
Nemotron Speech: Cihazlarınızla Daha Önce Hiç Olmadığı Gibi Konuşun
Model: Nemotron-Speech-Streaming-En-0.6B
Parametreler: 600 milyon
Mimari: Önbellek farkında FastConformer kodlayıcı + RNN-T kod çözücü
Gecikme: 100ms altı akış
Lisans: Ticari kullanıma izin verilir
Nemotron Speech, karşılaştırılabilir modellerden 10 kat daha hızlı performans gösteren ve mevcut ASR lider tablolarında zirveye çıkan gerçek zamanlı konuşma tanıma sunar.

Temel Özellikler
- Önbellek farkında akış mimarisi: önbelleğe alınmış kodlayıcı bağlamını yeniden kullanırken yalnızca yeni ses parçalarını işler
- Çalışma zamanında yapılandırılabilir gecikme modları: yeniden eğitim olmadan 80ms, 160ms, 560ms veya 1,12s parçalar
- Yerel noktalama ve büyük harf desteği
- NVIDIA Granary veri setinden 285.000 saatlik ses verisi üzerinde eğitildi
Kim Kullanıyor
Bosch, sürücülerin sesli komutlarla araçlarla etkileşime girmesini sağlamak için Nemotron Speech'i şimdiden kullanıyor. ServiceNow, uygun maliyetli çok modlu performans için Apriel model ailesini Nemotron veri setleri üzerinde eğitiyor.
Bu teknolojiyi 2026 boyunca akıllı ev cihazlarında, müşteri hizmetleri sistemlerinde ve erişilebilirlik araçlarında görmeyi bekleyin.
Clara: Daha Hızlı İlaç Keşfi ve Daha İyi Sağlık Hizmeti

La-Proteina: Atom seviyesinde protein tasarımı
ReaSyn v2: İlaç sentezi fizibilitesi
KERMT: Hesaplamalı güvenlik testi
RNAPro: RNA 3D şekil tahmini
Veri Seti: 455.000 sentetik protein yapısı
NVIDIA'nın yeni Clara AI modelleri, dijital keşif ile gerçek dünya tıbbı arasındaki boşluğu kapatmayı hedefliyor. Bu modellerle doğrudan etkileşime girmeyecek olsanız da, sağlık hizmetlerinizi önemli ölçüde etkileyebilirler.
Model Dökümü
| Model | İşlev | Etki |
|---|---|---|
| La-Proteina | Büyük, atom seviyesinde hassas proteinler tasarlar | Daha önce tedavi edilemeyen hastalıkları inceler |
| ReaSyn v2 | Sentez fizibilitesini keşfe dahil eder | Pratik olmayan bileşikler üzerinde boşa harcanan araştırmayı önler |
| KERMT | İlaç-vücut etkileşimlerini tahmin eder | Pahalı klinik denemelerden önce sorunları yakalar |
| RNAPro | RNA 3D şekillerini tahmin eder | Kişiselleştirilmiş RNA tabanlı terapötikleri mümkün kılar |
Sonuç: Tedaviler hastalara daha hızlı ve daha düşük maliyetle ulaşabilir.
Alpamayo: Otonom Araçları Daha Akıllı Hale Getirmek

Model: Alpamayo-R1-10B
Parametreler: 10 milyar (8,2 milyar Cosmos Reason omurgası + 2,3 milyar eylem uzmanı)
Eğitim Verisi: 80.000 saatlik çok kameralı sürüşten 1+ milyar görüntü
Veri Seti: 25 ülkeden 1.700+ saatlik sürüş verisi
Lisans: Ticari olmayan (araştırma)
NVIDIA'nın yeni Alpamayo ailesi, gerçekten otonom araçlara giden yolu hızlandıracak. Bu, otonom sürüş için tasarlanmış sektörün ilk açık akıl yürütme VLA modeli.
Temel Yenilik: Düşünce Zinciri Akıl Yürütme
Sadece nesneleri algılayan ve yolları planlayan geleneksel AV sistemlerinin aksine, Alpamayo düşünce zinciri akıl yürütmesi kullanır. Şunları yapabilir:
- Birden fazla kameradan video girişi işler
- Sürüş yörüngeleri oluşturur
- Her kararın arkasındaki mantığı açıklar
Örnek çıktı: "Şeride giren inşaat konilerinden mesafeyi artırmak için sola doğru hafifçe kaydır"
Neler Dahil
- Alpamayo 1: Hugging Face'te 10 milyar akıl yürütme VLA modeli
- AlpaSim: açık kaynak uçtan uca simülasyon çerçevesi
- Fiziksel AI Açık Veri Setleri: 25 ülke ve 2.500+ şehirden nadir uç durumları kapsayan 1.700+ saat
Kim Kullanıyor
Lucid Motors, JLR, Uber ve Berkeley DeepDrive, Seviye 4 özerkliği için akıl yürütme tabanlı AV yığınları geliştirmek üzere Alpamayo'yu kullanıyor.
Cosmos: Robotlara Fiziksel Dünyayı Anlamayı Öğretmek

Cosmos Reason 2: 2 milyar ve 8 milyar parametreli versiyonlar
Bağlam Penceresi: 256K token (v1'den 16 kat daha büyük)
Mimari: Qwen3-VL tabanlı
Lisans: Ticari kullanıma izin verilir (NVIDIA Açık Model Lisansı)
Hugging Face'te robotik, NVIDIA'nın modelleri indirmelerde liderlik ederken en hızlı büyüyen segment haline geldi.
Cosmos Model Ailesi
| Model | Parametreler | İşlev |
|---|---|---|
| Cosmos Reason 2 | 2B / 8B | Robotlar ve AI ajanları için fiziksel AI akıl yürütme VLM'si |
| Cosmos Transfer 2.5 | - | Video-dünya stil aktarımı |
| Cosmos Predict 2.5 | 2B / 14B | Video olarak gelecek durum tahmini |
Cosmos Reason 2'nin Temel Özellikleri
- Zaman damgası hassasiyetiyle gelişmiş uzamsal-zamansal anlama
- 2D/3D nokta lokalizasyonu ve sınırlayıcı kutu koordinatları
- Robotik kontrol için yörünge veri çıktısı
- Ortamlarda metin okumak için OCR desteği
<think>etiketleriyle düşünce zinciri akıl yürütmesi
Isaac GR00T N1.6: İnsansı Robot Temel Modeli
Parametreler: 3 milyar
Temel VLM: Cosmos-Reason-2B varyantı
Mimari: 32 katmanlı difüzyon transformatörü ile VLA
GR00T N1.6, insansı robotlar için özel olarak tasarlanmış açık bir görsel-dil-eylem modelidir. Tam vücut kontrolünü açar ve daha iyi bağlamsal anlama için Cosmos Reason kullanır.
Kim Kullanıyor
- Franka Robotics, Humanoid ve NEURA Robotics: robot davranışlarını simüle eder, eğitir ve doğrular
- Salesforce, Hitachi, Uber ve VAST Data: trafik izleme ve işyeri verimliliği
- Milestone: kamu güvenliği için görsel AI ajanları
Nemotron Safety: Güvenilir AI Oluşturmak

İçerik Güvenliği: Llama-3.1-Nemotron-Safety-Guard-8B-v3
KKB Tespiti: Nemotron-PII (GLiNER tabanlı)
Lisans: Ticari kullanıma izin verilir
AI dağıtan işletmeler için Nemotron Safety, içerik güvenliği modelleri ve yüksek doğrulukla KKB tespiti içerir.
Bileşenler
- İçerik Güvenliği Modeli: kültürel nüanslarla genişletilmiş çok dilli destek
- KKB Tespiti: hassas kişisel verileri sızmadan önce tespit eder
- Konu Kontrolü: AI'nın hangi konuları tartışabileceğini yönetir
Kim Kullanıyor
- CrowdStrike, Cohesity ve Fortinet: AI uygulama güvenliğini güçlendirir
- CodeRabbit: geliştirilmiş hız ve doğrulukla AI kod incelemelerine güç verir
- Palantir: özelleştirilmiş AI ajanları için Ontology çerçevesine entegre ediyor
Bu Herkes İçin Ne Anlama Geliyor
Tüm modeller ve veriler GitHub ve Hugging Face'te şimdi mevcut, ayrıca ölçeklenebilir dağıtım için NVIDIA NIM mikro hizmetleri olarak da sunuluyor.
Açık Veri Özeti
| Veri Seti | Boyut | İçerik |
|---|---|---|
| Dil tokenleri | 10 trilyon | Çok dilli akıl yürütme, kodlama, güvenlik |
| Robotik yörüngeler | 500.000 | Robot hareketi ve manipülasyonu |
| Protein yapıları | 455.000 | Biyomedikal AI için sentetik yapılar |
| Araç sensör verisi | 100 TB | Çeşitli sürüş koşulları |
| Sürüş videosu | 1.700+ saat | 25 ülkeden nadir uç durumlar |
Başlamak İçin Bağlantılar
- Nemotron modelleri: developer.nvidia.com/nemotron
- Cosmos modelleri: github.com/nvidia-cosmos
- Alpamayo: developer.nvidia.com/drive/alpamayo
- Isaac GR00T: developer.nvidia.com/isaac/gr00t
Normal kullanıcılar için bu sürüm, daha iyi sesli asistanlar, daha akıllı doküman arama, daha hızlı ilaç geliştirme, daha güvenli otonom arabalar ve daha yetenekli robotlar anlamına geliyor. Bu teknolojiler 2026 boyunca tüketici ürünlerine süzülecek.
NVIDIA, tüm AI ekosistemini etkinleştirerek daha fazla GPU sattıklarına bahse giriyor. Bu teknolojileri şimdiden benimseyen şirketlere bakıldığında, bu bahis karşılığını veriyor.


