Na CES 2026 NVIDIA oznámila to, čo môže byť doteraz najvýznamnejším open-source AI vydaním. Spoločnosť odhalila nové modely, datasety a nástroje pokrývajúce všetko od rozpoznávania reči až po objav liekov.
Rozsah je pozoruhodný:
- 10 biliónov jazykových tréningových tokenov
- 500 000 robotických trajektórií
- 455 000 proteínových štruktúr
- 100 terabajtov dát zo senzorov vozidiel
Veľké spoločnosti vrátane Bosch, Salesforce, Uber, Palantir a CrowdStrike už na týchto technológiách stavajú.
Nemotron RAG: Inteligentnejšie vyhľadávanie v dokumentoch

Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7B parametrov)
Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7B parametrov)
Tiež dostupné: 8B parametrový textový embedding model
Dĺžka kontextu: Až 8 192 tokenov
Licencia: Povolené komerčné použitie
Hľadanie informácií ukrytých v dokumentoch je každodenným problémom pre pracovníkov s vedomosťami. Nemotron RAG prináša multimodálnu inteligenciu do vyhľadávania dokumentov, spracováva text aj obrázky s presnými viacjazyčnými poznatkami v 26 jazykoch.
Ako to funguje
Nemotron RAG pipeline kombinuje tri komponenty:
- Embedding Model: konvertuje dokumenty do vektorových reprezentácií na uloženie a vyhľadávanie
- Reranking Model: preradí potenciálnych kandidátov do finálneho poradia pomocou krížovej pozornosti
- Reasoning Model: generuje presné odpovede na základe získaného kontextu
Príklad z praxe: IT Help Desk Agent
NVIDIA demonštrovala, ako tieto modely spolupracujú v IT Help Desk agentovi:
- Nemotron Nano 9B V2: primárny reasoning model na generovanie odpovedí
- Llama 3.2 EmbedQA 1B V2: konvertuje dokumenty do vektorových embeddingov
- Llama 3.2 RerankQA 1B V2: preradí získané dokumenty podľa relevantnosti
Tieto modely spoločne umožňujú agentovi presne odpovedať na používateľské otázky využitím generovania jazyka, vyhľadávania dokumentov a preraďovacích schopností.
Kto to používa
Cadence modeluje logické dizajnové aktíva ako mikro-architektúrne dokumenty, obmedzenia a verifikačné podklady. Inžinieri môžu klásť otázky ako "Chcem rozšíriť interrupt controller o podporu nízkoenergetického stavu, ukáž mi, ktoré sekcie špecifikácie potrebujú zmeny" a okamžite získať relevantné požiadavky.
IBM pilotne testuje tieto modely na zlepšenie vyhľadávania a uvažovania v technickej dokumentácii.
Nemotron Speech: Rozprávajte sa so svojimi zariadeniami ako nikdy predtým
Model: Nemotron-Speech-Streaming-En-0.6B
Parametre: 600M
Architektúra: Cache-aware FastConformer enkodér + RNN-T dekodér
Latencia: Pod 100ms streaming
Licencia: Povolené komerčné použitie
Nemotron Speech poskytuje rozpoznávanie reči v reálnom čase, ktoré je 10x rýchlejšie ako porovnateľné modely a vedie súčasné ASR rebríčky.

Kľúčové vlastnosti
- Cache-aware streaming architektúra: zpracováva len nové audio úseky pri opätovnom použití cachovaného kontextu enkodéra
- Runtime-konfigurovateľné režimy latencie: 80ms, 160ms, 560ms alebo 1,12s úseky bez potreby pretréningu
- Natívna podpora interpunkcie a veľkých písmen
- Natrénované na 285 000 hodinách audio dát z NVIDIA Granary datasetu
Kto to používa
Bosch už používa Nemotron Speech na umožnenie vodičom interagovať s vozidlami prostredníctvom hlasových príkazov. ServiceNow trénuje svoju rodinu modelov Apriel na Nemotron datasetoch pre nákladovo efektívny multimodálny výkon.
Očakávajte túto technológiu v zariadeniach inteligentnej domácnosti, systémoch zákazníckych služieb a nástrojoch pre prístupnost počas celého roka 2026.
Clara: Rýchlejší objav liekov a lepšie zdravotníctvo

La-Proteina: Dizajn proteínov na atómovej úrovni
ReaSyn v2: Uskutočniteľnosť syntézy liekov
KERMT: Výpočtové bezpečnostné testovanie
RNAPro: Predikcia 3D tvaru RNA
Dataset: 455 000 syntetických proteínových štruktúr
Nové Clara AI modely od NVIDIA majú za cieľ preklenúť priepasť medzi digitálnym objavom a reálnou medicínou. Hoci s týmito modelmi nebudete priamo interagovať, mohli by výrazne ovplyvniť vašu zdravotnú starostlivosť.
Prehľad modelov
| Model | Funkcia | Dopad |
|---|---|---|
| La-Proteina | Dizajn veľkých, atómovo presných proteínov | Štúdium predtým neliečiteľných chorôb |
| ReaSyn v2 | Začlenenie uskutočniteľnosti syntézy do objavu | Predchádzanie zmárnenému výskumu na nepraktických zlúčeninách |
| KERMT | Predikcia interakcií liek-telo | Odhalenie problémov pred nákladnými klinickými skúškami |
| RNAPro | Predikcia 3D tvarov RNA | Umožnenie personalizovanej RNA-based terapeutiky |
Záver: Liečba by sa mohla k pacientom dostať rýchlejšie a za nižšie náklady.
Alpamayo: Robíme samočinné autá inteligentnejšími

Model: Alpamayo-R1-10B
Parametre: 10 miliárd (8,2B Cosmos Reason backbone + 2,3B action expert)
Tréningové dáta: 1+ miliarda obrázkov z 80 000 hodín viacerých kamier pri jazde
Dataset: 1 700+ hodín jazdných dát z 25 krajín
Licencia: Nekomerčná (výskum)
Nová rodina Alpamayo od NVIDIA urýchli cestu k skutočne autonómnym vozidlám. Toto je prvý otvorený reasoning VLA model v odvetví navrhnutý pre autonómnu jazdu.
Kľúčová inovácia: Chain-of-Thought Reasoning
Na rozdiel od tradičných AV systémov, ktoré len detegujú objekty a plánujú trasy, Alpamayo používa chain-of-thought reasoning. Dokáže:
- Spracovať video vstup z viacerých kamier
- Generovať jazdné trajektórie
- Vysvetliť logiku za každým rozhodnutím
Príklad výstupu: "Posunúť sa doľava na zvýšenie odstupu od stavebných kužeľov zasahujúcich do jazdného pruhu"
Čo je súčasťou
- Alpamayo 1: 10B reasoning VLA model na Hugging Face
- AlpaSim: open-source end-to-end simulačný framework
- Physical AI Open Datasets: 1 700+ hodín pokrývajúcich zriedkavé okrajové prípady z 25 krajín a 2 500+ miest
Kto to používa
Lucid Motors, JLR, Uber a Berkeley DeepDrive používajú Alpamayo na vývoj reasoning-based AV stackov pre Level 4 autonómiu.
Cosmos: Učíme roboty rozumieť fyzickému svetu

Cosmos Reason 2: 2B a 8B parametrové verzie
Context Window: 256K tokenov (16x väčšie ako v1)
Architektúra: Založené na Qwen3-VL
Licencia: Povolené komerčné použitie (NVIDIA Open Model License)
Na Hugging Face sa robotika stala najrýchlejšie rastúcim segmentom, pričom modely NVIDIA vedú v sťahovaní.
Rodina modelov Cosmos
| Model | Parametre | Funkcia |
|---|---|---|
| Cosmos Reason 2 | 2B / 8B | Physical AI reasoning VLM pre roboty a AI agentov |
| Cosmos Transfer 2.5 | - | Video-to-world štýlový prenos |
| Cosmos Predict 2.5 | 2B / 14B | Predikcia budúceho stavu ako video |
Kľúčové vlastnosti Cosmos Reason 2
- Vylepšené priestorovo-časové porozumenie s presnosťou časových značiek
- 2D/3D bodová lokalizácia a súradnice ohraničujúcich boxov
- Výstup trajektóriových dát pre robotické riadenie
- OCR podpora na čítanie textu v prostredí
- Chain-of-thought reasoning s
<think>tagmi
Isaac GR00T N1.6: Základný model humanoidného robota
Parametre: 3B
Base VLM: Cosmos-Reason-2B variant
Architektúra: VLA s 32-vrstvovým difúznym transformerom
GR00T N1.6 je otvorený vision-language-action model špeciálne vytvorený pre humanoidné roboty. Odomyká plné riadenie tela a používa Cosmos Reason pre lepšie kontextové porozumenie.
Kto to používa
- Franka Robotics, Humanoid a NEURA Robotics simulujú, trénujú a validujú správanie robotov
- Salesforce, Hitachi, Uber a VAST Data monitorovanie dopravy a produktivita na pracovisku
- Milestone vision AI agenti pre verejnú bezpečnosť
Nemotron Safety: Budovanie dôveryhodnej AI

Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII Detection: Nemotron-PII (založené na GLiNER)
Licencia: Povolené komerčné použitie
Pre podniky nasadzujúce AI zahŕňa Nemotron Safety modely bezpečnosti obsahu a detekciu PII s vysokou presnosťou.
Komponenty
- Content Safety Model: rozšírená viacjazyčná podpora s kultúrnymi nuansami
- PII Detection: deteguje citlivé osobné údaje pred ich únikom
- Topic Control: spravuje témy, o ktorých môže AI diskutovať
Kto to používa
- CrowdStrike, Cohesity a Fortinet: posilňujú bezpečnosť AI aplikácií
- CodeRabbit: poháňa AI code reviews so zlepšenou rýchlosťou a presnosťou
- Palantir: integrácia do Ontology frameworku pre špecializovaných AI agentov
Čo to znamená pre každého
Všetky modely a dáta sú dostupné teraz na GitHub a Hugging Face, tiež ako NVIDIA NIM mikroslužby pre škálovateľné nasadenie.
Prehľad otvorených dát
| Dataset | Veľkosť | Obsah |
|---|---|---|
| Jazykové tokeny | 10 biliónov | Viacjazyčné uvažovanie, kódovanie, bezpečnosť |
| Robotické trajektórie | 500 000 | Pohyb a manipulácia robotov |
| Proteínové štruktúry | 455 000 | Syntetické štruktúry pre biomedicínsku AI |
| Dáta zo senzorov vozidiel | 100 TB | Rôznorodé jazdné podmienky |
| Video z jazdy | 1 700+ hodín | Zriedkavé okrajové prípady z 25 krajín |
Odkazy na začiatok
- Nemotron modely: developer.nvidia.com/nemotron
- Cosmos modely: github.com/nvidia-cosmos
- Alpamayo: developer.nvidia.com/drive/alpamayo
- Isaac GR00T: developer.nvidia.com/isaac/gr00t
Pre bežných používateľov toto vydanie znamená lepších hlasových asistentov, inteligentnejšie vyhľadávanie dokumentov, rýchlejší vývoj liekov, bezpečnejšie samočinné autá a schopnejších robotov. Tieto technológie sa budú filtrovať do spotrebiteľských produktov počas celého roka 2026.
NVIDIA stavia na tom, že umožnením celého AI ekosystému predá viac GPU. Na základe spoločností, ktoré už tieto technológie prijímajú, sa táto stávka vypláca.


