NVIDIA vydáva masívnu kolekciu otvorených modelov, dát a nástrojov na urýchlenie vývoja AI

NVIDIA práve predstavila jedno z najväčších open-source AI vydaní v histórii. Nové modely pre reč, robotiku, autonómne vozidlá, zdravotníctvo a ďalšie oblasti.

Na CES 2026 NVIDIA oznámila to, čo môže byť doteraz najvýznamnejším open-source AI vydaním. Spoločnosť odhalila nové modely, datasety a nástroje pokrývajúce všetko od rozpoznávania reči až po objav liekov.

Rozsah je pozoruhodný:

10 biliónov jazykových tréningových tokenov
500 000 robotických trajektórií
455 000 proteínových štruktúr
100 terabajtov dát zo senzorov vozidiel

Veľké spoločnosti vrátane Bosch, Salesforce, Uber, Palantir a CrowdStrike už na týchto technológiách stavajú.

Nemotron RAG: Inteligentnejšie vyhľadávanie v dokumentoch

Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7B parametrov)
Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7B parametrov)
Tiež dostupné: 8B parametrový textový embedding model
Dĺžka kontextu: Až 8 192 tokenov
Licencia: Povolené komerčné použitie

Hľadanie informácií ukrytých v dokumentoch je každodenným problémom pre pracovníkov s vedomosťami. Nemotron RAG prináša multimodálnu inteligenciu do vyhľadávania dokumentov, spracováva text aj obrázky s presnými viacjazyčnými poznatkami v 26 jazykoch.

Ako to funguje

Nemotron RAG pipeline kombinuje tri komponenty:

Embedding Model: konvertuje dokumenty do vektorových reprezentácií na uloženie a vyhľadávanie
Reranking Model: preradí potenciálnych kandidátov do finálneho poradia pomocou krížovej pozornosti
Reasoning Model: generuje presné odpovede na základe získaného kontextu

Príklad z praxe: IT Help Desk Agent

NVIDIA demonštrovala, ako tieto modely spolupracujú v IT Help Desk agentovi:

Nemotron Nano 9B V2: primárny reasoning model na generovanie odpovedí
Llama 3.2 EmbedQA 1B V2: konvertuje dokumenty do vektorových embeddingov
Llama 3.2 RerankQA 1B V2: preradí získané dokumenty podľa relevantnosti

Tieto modely spoločne umožňujú agentovi presne odpovedať na používateľské otázky využitím generovania jazyka, vyhľadávania dokumentov a preraďovacích schopností.

Kto to používa

Cadence modeluje logické dizajnové aktíva ako mikro-architektúrne dokumenty, obmedzenia a verifikačné podklady. Inžinieri môžu klásť otázky ako "Chcem rozšíriť interrupt controller o podporu nízkoenergetického stavu, ukáž mi, ktoré sekcie špecifikácie potrebujú zmeny" a okamžite získať relevantné požiadavky.

IBM pilotne testuje tieto modely na zlepšenie vyhľadávania a uvažovania v technickej dokumentácii.

Nemotron Speech: Rozprávajte sa so svojimi zariadeniami ako nikdy predtým

Model: Nemotron-Speech-Streaming-En-0.6B
Parametre: 600M
Architektúra: Cache-aware FastConformer enkodér + RNN-T dekodér
Latencia: Pod 100ms streaming
Licencia: Povolené komerčné použitie

Nemotron Speech poskytuje rozpoznávanie reči v reálnom čase, ktoré je 10x rýchlejšie ako porovnateľné modely a vedie súčasné ASR rebríčky.

Kľúčové vlastnosti

Cache-aware streaming architektúra: zpracováva len nové audio úseky pri opätovnom použití cachovaného kontextu enkodéra
Runtime-konfigurovateľné režimy latencie: 80ms, 160ms, 560ms alebo 1,12s úseky bez potreby pretréningu
Natívna podpora interpunkcie a veľkých písmen
Natrénované na 285 000 hodinách audio dát z NVIDIA Granary datasetu

Kto to používa

Bosch už používa Nemotron Speech na umožnenie vodičom interagovať s vozidlami prostredníctvom hlasových príkazov. ServiceNow trénuje svoju rodinu modelov Apriel na Nemotron datasetoch pre nákladovo efektívny multimodálny výkon.

Očakávajte túto technológiu v zariadeniach inteligentnej domácnosti, systémoch zákazníckych služieb a nástrojoch pre prístupnost počas celého roka 2026.

Clara: Rýchlejší objav liekov a lepšie zdravotníctvo

La-Proteina: Dizajn proteínov na atómovej úrovni
ReaSyn v2: Uskutočniteľnosť syntézy liekov
KERMT: Výpočtové bezpečnostné testovanie
RNAPro: Predikcia 3D tvaru RNA
Dataset: 455 000 syntetických proteínových štruktúr

Nové Clara AI modely od NVIDIA majú za cieľ preklenúť priepasť medzi digitálnym objavom a reálnou medicínou. Hoci s týmito modelmi nebudete priamo interagovať, mohli by výrazne ovplyvniť vašu zdravotnú starostlivosť.

Prehľad modelov

Model	Funkcia	Dopad
La-Proteina	Dizajn veľkých, atómovo presných proteínov	Štúdium predtým neliečiteľných chorôb
ReaSyn v2	Začlenenie uskutočniteľnosti syntézy do objavu	Predchádzanie zmárnenému výskumu na nepraktických zlúčeninách
KERMT	Predikcia interakcií liek-telo	Odhalenie problémov pred nákladnými klinickými skúškami
RNAPro	Predikcia 3D tvarov RNA	Umožnenie personalizovanej RNA-based terapeutiky

Záver: Liečba by sa mohla k pacientom dostať rýchlejšie a za nižšie náklady.

Alpamayo: Robíme samočinné autá inteligentnejšími

Model: Alpamayo-R1-10B
Parametre: 10 miliárd (8,2B Cosmos Reason backbone + 2,3B action expert)
Tréningové dáta: 1+ miliarda obrázkov z 80 000 hodín viacerých kamier pri jazde
Dataset: 1 700+ hodín jazdných dát z 25 krajín
Licencia: Nekomerčná (výskum)

Nová rodina Alpamayo od NVIDIA urýchli cestu k skutočne autonómnym vozidlám. Toto je prvý otvorený reasoning VLA model v odvetví navrhnutý pre autonómnu jazdu.

Kľúčová inovácia: Chain-of-Thought Reasoning

Na rozdiel od tradičných AV systémov, ktoré len detegujú objekty a plánujú trasy, Alpamayo používa chain-of-thought reasoning. Dokáže:

Spracovať video vstup z viacerých kamier
Generovať jazdné trajektórie
Vysvetliť logiku za každým rozhodnutím

Príklad výstupu: "Posunúť sa doľava na zvýšenie odstupu od stavebných kužeľov zasahujúcich do jazdného pruhu"

Čo je súčasťou

Alpamayo 1: 10B reasoning VLA model na Hugging Face
AlpaSim: open-source end-to-end simulačný framework
Physical AI Open Datasets: 1 700+ hodín pokrývajúcich zriedkavé okrajové prípady z 25 krajín a 2 500+ miest

Kto to používa

Lucid Motors, JLR, Uber a Berkeley DeepDrive používajú Alpamayo na vývoj reasoning-based AV stackov pre Level 4 autonómiu.

Cosmos: Učíme roboty rozumieť fyzickému svetu

Cosmos Reason 2: 2B a 8B parametrové verzie
Context Window: 256K tokenov (16x väčšie ako v1)
Architektúra: Založené na Qwen3-VL
Licencia: Povolené komerčné použitie (NVIDIA Open Model License)

Na Hugging Face sa robotika stala najrýchlejšie rastúcim segmentom, pričom modely NVIDIA vedú v sťahovaní.

Rodina modelov Cosmos

Model	Parametre	Funkcia
Cosmos Reason 2	2B / 8B	Physical AI reasoning VLM pre roboty a AI agentov
Cosmos Transfer 2.5	-	Video-to-world štýlový prenos
Cosmos Predict 2.5	2B / 14B	Predikcia budúceho stavu ako video

Kľúčové vlastnosti Cosmos Reason 2

Vylepšené priestorovo-časové porozumenie s presnosťou časových značiek
2D/3D bodová lokalizácia a súradnice ohraničujúcich boxov
Výstup trajektóriových dát pre robotické riadenie
OCR podpora na čítanie textu v prostredí
Chain-of-thought reasoning s <think> tagmi

Isaac GR00T N1.6: Základný model humanoidného robota

Parametre: 3B
Base VLM: Cosmos-Reason-2B variant
Architektúra: VLA s 32-vrstvovým difúznym transformerom

GR00T N1.6 je otvorený vision-language-action model špeciálne vytvorený pre humanoidné roboty. Odomyká plné riadenie tela a používa Cosmos Reason pre lepšie kontextové porozumenie.

Kto to používa

Franka Robotics, Humanoid a NEURA Robotics simulujú, trénujú a validujú správanie robotov
Salesforce, Hitachi, Uber a VAST Data monitorovanie dopravy a produktivita na pracovisku
Milestone vision AI agenti pre verejnú bezpečnosť

Nemotron Safety: Budovanie dôveryhodnej AI

Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII Detection: Nemotron-PII (založené na GLiNER)
Licencia: Povolené komerčné použitie

Pre podniky nasadzujúce AI zahŕňa Nemotron Safety modely bezpečnosti obsahu a detekciu PII s vysokou presnosťou.

Komponenty

Content Safety Model: rozšírená viacjazyčná podpora s kultúrnymi nuansami
PII Detection: deteguje citlivé osobné údaje pred ich únikom
Topic Control: spravuje témy, o ktorých môže AI diskutovať

Kto to používa

CrowdStrike, Cohesity a Fortinet: posilňujú bezpečnosť AI aplikácií
CodeRabbit: poháňa AI code reviews so zlepšenou rýchlosťou a presnosťou
Palantir: integrácia do Ontology frameworku pre špecializovaných AI agentov

Čo to znamená pre každého

Všetky modely a dáta sú dostupné teraz na GitHub a Hugging Face, tiež ako NVIDIA NIM mikroslužby pre škálovateľné nasadenie.

Prehľad otvorených dát

Dataset	Veľkosť	Obsah
Jazykové tokeny	10 biliónov	Viacjazyčné uvažovanie, kódovanie, bezpečnosť
Robotické trajektórie	500 000	Pohyb a manipulácia robotov
Proteínové štruktúry	455 000	Syntetické štruktúry pre biomedicínsku AI
Dáta zo senzorov vozidiel	100 TB	Rôznorodé jazdné podmienky
Video z jazdy	1 700+ hodín	Zriedkavé okrajové prípady z 25 krajín

Odkazy na začiatok

Nemotron modely: developer.nvidia.com/nemotron
Cosmos modely: github.com/nvidia-cosmos
Alpamayo: developer.nvidia.com/drive/alpamayo
Isaac GR00T: developer.nvidia.com/isaac/gr00t

Pre bežných používateľov toto vydanie znamená lepších hlasových asistentov, inteligentnejšie vyhľadávanie dokumentov, rýchlejší vývoj liekov, bezpečnejšie samočinné autá a schopnejších robotov. Tieto technológie sa budú filtrovať do spotrebiteľských produktov počas celého roka 2026.

NVIDIA stavia na tom, že umožnením celého AI ekosystému predá viac GPU. Na základe spoločností, ktoré už tieto technológie prijímajú, sa táto stávka vypláca.

Nemotron RAG: Inteligentnejšie vyhľadávanie v dokumentoch

Ako to funguje

Príklad z praxe: IT Help Desk Agent

Kto to používa

Nemotron Speech: Rozprávajte sa so svojimi zariadeniami ako nikdy predtým

Kľúčové vlastnosti

Kto to používa

Clara: Rýchlejší objav liekov a lepšie zdravotníctvo

Prehľad modelov

Alpamayo: Robíme samočinné autá inteligentnejšími

Kľúčová inovácia: Chain-of-Thought Reasoning

Čo je súčasťou

Kto to používa

Cosmos: Učíme roboty rozumieť fyzickému svetu

Rodina modelov Cosmos

Kľúčové vlastnosti Cosmos Reason 2

Isaac GR00T N1.6: Základný model humanoidného robota

Kto to používa

Nemotron Safety: Budovanie dôveryhodnej AI

Komponenty

Kto to používa

Čo to znamená pre každého

Prehľad otvorených dát

Odkazy na začiatok

Pozrite sa, čo AI môže urobiť pre váš web