Na veletrhu CES 2026 NVIDIA oznámila možná nejvýznamnější open-source AI vydání dosud. Společnost představila nové modely, datasety a nástroje pokrývající vše od rozpoznávání řeči až po objevování léků.
Rozsah je pozoruhodný:
- 10 bilionů jazykových trénovacích tokenů
- 500 000 robotických trajektorií
- 455 000 proteinových struktur
- 100 terabajtů dat ze senzorů vozidel
Velké společnosti včetně Bosch, Salesforce, Uber, Palantir a CrowdStrike již na těchto technologiích staví.
Nemotron RAG: Chytřejší vyhledávání v dokumentech

Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7 miliard parametrů)
Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7 miliard parametrů)
Také k dispozici: 8B parametrový textový embedding model
Délka kontextu: Až 8 192 tokenů
Licence: Komerční použití povoleno
Hledání informací ukrytých v dokumentech je každodenní výzvou pro znalostní pracovníky. Nemotron RAG přináší multimodální inteligenci do vyhledávání dokumentů, zpracovává text i obrázky s přesnými vícejazyčnými poznatky napříč 26 jazyky.
Jak to funguje
Pipeline Nemotron RAG kombinuje tři komponenty:
- Embedding Model: převádí dokumenty do vektorových reprezentací pro ukládání a vyhledávání
- Reranking Model: přeřazuje potenciální kandidáty do finálního pořadí pomocí cross-attention
- Reasoning Model: generuje přesné odpovědi na základě získaného kontextu
Příklad z praxe: IT Help Desk Agent
NVIDIA předvedla, jak tyto modely spolupracují v IT Help Desk agentovi:
- Nemotron Nano 9B V2: primární reasoning model pro generování odpovědí
- Llama 3.2 EmbedQA 1B V2: převádí dokumenty do vektorových embeddingů
- Llama 3.2 RerankQA 1B V2: přeřazuje získané dokumenty podle relevance
Tyto modely společně umožňují agentovi přesně odpovídat na dotazy uživatelů využitím generování jazyka, vyhledávání dokumentů a schopností přeřazování.
Kdo to používá
Cadence modeluje logické návrhové assety jako dokumenty mikroarchitektury, omezení a verifikační podklady. Inženýři se mohou ptát například "Chci rozšířit řadič přerušení o podporu nízkopříkonového stavu, ukaž mi, které sekce specifikace potřebují změny" a okamžitě získat relevantní požadavky.
IBM pilotně testuje tyto modely pro zlepšení vyhledávání a uvažování napříč technickou dokumentací.
Nemotron Speech: Mluvte se svými zařízeními jako nikdy předtím
Model: Nemotron-Speech-Streaming-En-0.6B
Parametry: 600M
Architektura: Cache-aware FastConformer encoder + RNN-T decoder
Latence: Streamování pod 100ms
Licence: Komerční použití povoleno
Nemotron Speech poskytuje rozpoznávání řeči v reálném čase, které je 10x rychlejší než srovnatelné modely a vévodí současným ASR žebříčkům.

Klíčové vlastnosti
- Cache-aware streaming architektura: zpracovává pouze nové audio chunky při opětovném použití cachovaného kontextu encoderu
- Runtime-konfigurovatelné režimy latence: 80ms, 160ms, 560ms nebo 1,12s chunky bez přetrénování
- Nativní podpora interpunkce a velkých písmen
- Natrénováno na 285 000 hodinách audio dat z datasetu NVIDIA Granary
Kdo to používá
Bosch již používá Nemotron Speech k umožnění řidičům interagovat s vozidly pomocí hlasových příkazů. ServiceNow trénuje svou rodinu modelů Apriel na datasetech Nemotron pro nákladově efektivní multimodální výkon.
Očekávejte tuto technologii v chytrých domácích zařízeních, systémech zákaznického servisu a nástrojích pro přístupnost během roku 2026.
Clara: Rychlejší objevování léků a lepší zdravotní péče

La-Proteina: Návrh proteinů na atomové úrovni
ReaSyn v2: Proveditelnost syntézy léků
KERMT: Výpočetní bezpečnostní testování
RNAPro: Predikce 3D tvaru RNA
Dataset: 455 000 syntetických proteinových struktur
Nové AI modely Clara od NVIDIA mají za cíl překlenout propast mezi digitálním objevováním a reálnou medicínou. I když s těmito modely nebudete přímo interagovat, mohly by významně ovlivnit vaši zdravotní péči.
Přehled modelů
| Model | Funkce | Dopad |
|---|---|---|
| La-Proteina | Navrhuje velké proteiny s atomovou přesností | Studium dosud neléčitelných nemocí |
| ReaSyn v2 | Zahrnuje proveditelnost syntézy do objevování | Předchází plýtvání výzkumem na nepraktických sloučeninách |
| KERMT | Předpovídá interakce léku s tělem | Odhaluje problémy před nákladnými klinickými studiemi |
| RNAPro | Předpovídá 3D tvary RNA | Umožňuje personalizovanou terapii založenou na RNA |
Závěr: Léčba by mohla pacienty dosáhnout rychleji a za nižší cenu.
Alpamayo: Chytřejší samořídící auta

Model: Alpamayo-R1-10B
Parametry: 10 miliard (8,2B Cosmos Reason backbone + 2,3B action expert)
Trénovací data: 1+ miliarda obrázků z 80 000 hodin vícekanálového řízení
Dataset: 1 700+ hodin jízdních dat z 25 zemí
Licence: Nekomerční (výzkum)
Nová rodina Alpamayo od NVIDIA urychlí cestu k opravdu autonomním vozidlům. Toto je první otevřený reasoning VLA model v odvětví navržený pro autonomní řízení.
Klíčová inovace: Chain-of-Thought Reasoning
Na rozdíl od tradičních AV systémů, které jen detekují objekty a plánují trasy, Alpamayo používá chain-of-thought reasoning. Dokáže:
- Zpracovat video vstup z více kamer
- Generovat jízdní trajektorie
- Vysvětlit logiku za každým rozhodnutím
Příklad výstupu: "Posun doleva pro zvýšení odstupu od stavebních kuželů zasahujících do jízdního pruhu"
Co je zahrnuto
- Alpamayo 1: 10B reasoning VLA model na Hugging Face
- AlpaSim: open-source end-to-end simulační framework
- Physical AI Open Datasets: 1 700+ hodin pokrývajících vzácné hraniční případy z 25 zemí a 2 500+ měst
Kdo to používá
Lucid Motors, JLR, Uber a Berkeley DeepDrive používají Alpamayo k vývoji AV stacků založených na reasoning pro Level 4 autonomii.
Cosmos: Učíme roboty rozumět fyzickému světu

Cosmos Reason 2: Verze s 2B a 8B parametry
Kontextové okno: 256K tokenů (16x větší než v1)
Architektura: Založeno na Qwen3-VL
Licence: Komerční použití povoleno (NVIDIA Open Model License)
Na Hugging Face se robotika stala nejrychleji rostoucím segmentem, přičemž modely NVIDIA vedou ve stahování.
Rodina modelů Cosmos
| Model | Parametry | Funkce |
|---|---|---|
| Cosmos Reason 2 | 2B / 8B | Physical AI reasoning VLM pro roboty a AI agenty |
| Cosmos Transfer 2.5 | - | Video-to-world stylový přenos |
| Cosmos Predict 2.5 | 2B / 14B | Predikce budoucího stavu jako video |
Klíčové vlastnosti Cosmos Reason 2
- Vylepšené prostorově-časové porozumění s přesností časových značek
- 2D/3D bodová lokalizace a souřadnice ohraničujících rámečků
- Výstup trajektorických dat pro robotické řízení
- Podpora OCR pro čtení textu v prostředí
- Chain-of-thought reasoning s tagy
<think>
Isaac GR00T N1.6: Foundation Model pro humanoidní roboty
Parametry: 3B
Základní VLM: Varianta Cosmos-Reason-2B
Architektura: VLA s 32vrstvým difuzním transformerem
GR00T N1.6 je otevřený vision-language-action model speciálně vytvořený pro humanoidní roboty. Odemyká plné řízení těla a používá Cosmos Reason pro lepší kontextové porozumění.
Kdo to používá
- Franka Robotics, Humanoid a NEURA Robotics – simulují, trénují a validují chování robotů
- Salesforce, Hitachi, Uber a VAST Data – monitorování provozu a produktivita na pracovišti
- Milestone – vision AI agenti pro veřejnou bezpečnost
Nemotron Safety: Budování důvěryhodné AI

Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII Detection: Nemotron-PII (založeno na GLiNER)
Licence: Komerční použití povoleno
Pro firmy nasazující AI zahrnuje Nemotron Safety modely pro bezpečnost obsahu a detekci PII s vysokou přesností.
Komponenty
- Content Safety Model: rozšířená vícejazyčná podpora s kulturními nuancemi
- PII Detection: detekuje citlivá osobní data před jejich únikem
- Topic Control: spravuje témata, o kterých může AI diskutovat
Kdo to používá
- CrowdStrike, Cohesity a Fortinet: posilují bezpečnost AI aplikací
- CodeRabbit: pohání AI code reviews se zlepšenou rychlostí a přesností
- Palantir: integruje do frameworku Ontology pro specializované AI agenty
Co to znamená pro všechny
Všechny modely a data jsou dostupné nyní na GitHubu a Hugging Face, také jako NVIDIA NIM mikroslužby pro škálovatelné nasazení.
Přehled otevřených dat
| Dataset | Velikost | Obsah |
|---|---|---|
| Jazykové tokeny | 10 bilionů | Vícejazyčné uvažování, kódování, bezpečnost |
| Robotické trajektorie | 500 000 | Pohyb a manipulace robotů |
| Proteinové struktury | 455 000 | Syntetické struktury pro biomedicínskou AI |
| Data ze senzorů vozidel | 100 TB | Různé jízdní podmínky |
| Jízdní video | 1 700+ hodin | Vzácné hraniční případy z 25 zemí |
Odkazy pro začátek
- Nemotron modely: developer.nvidia.com/nemotron
- Cosmos modely: github.com/nvidia-cosmos
- Alpamayo: developer.nvidia.com/drive/alpamayo
- Isaac GR00T: developer.nvidia.com/isaac/gr00t
Pro běžné uživatele toto vydání znamená lepší hlasové asistenty, chytřejší vyhledávání v dokumentech, rychlejší vývoj léků, bezpečnější samořídící auta a schopnější roboty. Tyto technologie se během roku 2026 dostanou do spotřebitelských produktů.
NVIDIA sází na to, že umožněním celého AI ekosystému prodá více GPU. Na základě společností, které tyto technologie již přijímají, se tato sázka vyplácí.


