NVIDIA vydává masivní kolekci otevřených modelů, dat a nástrojů pro urychlení vývoje AI

NVIDIA právě představila jedno z největších open-source AI vydání v historii. Nové modely pro rozpoznávání řeči, robotiku, autonomní vozidla, zdravotnictví a další.

Na veletrhu CES 2026 NVIDIA oznámila možná nejvýznamnější open-source AI vydání dosud. Společnost představila nové modely, datasety a nástroje pokrývající vše od rozpoznávání řeči až po objevování léků.

Rozsah je pozoruhodný:

10 bilionů jazykových trénovacích tokenů
500 000 robotických trajektorií
455 000 proteinových struktur
100 terabajtů dat ze senzorů vozidel

Velké společnosti včetně Bosch, Salesforce, Uber, Palantir a CrowdStrike již na těchto technologiích staví.

Nemotron RAG: Chytřejší vyhledávání v dokumentech

Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7 miliard parametrů)
Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7 miliard parametrů)
Také k dispozici: 8B parametrový textový embedding model
Délka kontextu: Až 8 192 tokenů
Licence: Komerční použití povoleno

Hledání informací ukrytých v dokumentech je každodenní výzvou pro znalostní pracovníky. Nemotron RAG přináší multimodální inteligenci do vyhledávání dokumentů, zpracovává text i obrázky s přesnými vícejazyčnými poznatky napříč 26 jazyky.

Jak to funguje

Pipeline Nemotron RAG kombinuje tři komponenty:

Embedding Model: převádí dokumenty do vektorových reprezentací pro ukládání a vyhledávání
Reranking Model: přeřazuje potenciální kandidáty do finálního pořadí pomocí cross-attention
Reasoning Model: generuje přesné odpovědi na základě získaného kontextu

Příklad z praxe: IT Help Desk Agent

NVIDIA předvedla, jak tyto modely spolupracují v IT Help Desk agentovi:

Nemotron Nano 9B V2: primární reasoning model pro generování odpovědí
Llama 3.2 EmbedQA 1B V2: převádí dokumenty do vektorových embeddingů
Llama 3.2 RerankQA 1B V2: přeřazuje získané dokumenty podle relevance

Tyto modely společně umožňují agentovi přesně odpovídat na dotazy uživatelů využitím generování jazyka, vyhledávání dokumentů a schopností přeřazování.

Kdo to používá

Cadence modeluje logické návrhové assety jako dokumenty mikroarchitektury, omezení a verifikační podklady. Inženýři se mohou ptát například "Chci rozšířit řadič přerušení o podporu nízkopříkonového stavu, ukaž mi, které sekce specifikace potřebují změny" a okamžitě získat relevantní požadavky.

IBM pilotně testuje tyto modely pro zlepšení vyhledávání a uvažování napříč technickou dokumentací.

Nemotron Speech: Mluvte se svými zařízeními jako nikdy předtím

Model: Nemotron-Speech-Streaming-En-0.6B
Parametry: 600M
Architektura: Cache-aware FastConformer encoder + RNN-T decoder
Latence: Streamování pod 100ms
Licence: Komerční použití povoleno

Nemotron Speech poskytuje rozpoznávání řeči v reálném čase, které je 10x rychlejší než srovnatelné modely a vévodí současným ASR žebříčkům.

Klíčové vlastnosti

Cache-aware streaming architektura: zpracovává pouze nové audio chunky při opětovném použití cachovaného kontextu encoderu
Runtime-konfigurovatelné režimy latence: 80ms, 160ms, 560ms nebo 1,12s chunky bez přetrénování
Nativní podpora interpunkce a velkých písmen
Natrénováno na 285 000 hodinách audio dat z datasetu NVIDIA Granary

Kdo to používá

Bosch již používá Nemotron Speech k umožnění řidičům interagovat s vozidly pomocí hlasových příkazů. ServiceNow trénuje svou rodinu modelů Apriel na datasetech Nemotron pro nákladově efektivní multimodální výkon.

Očekávejte tuto technologii v chytrých domácích zařízeních, systémech zákaznického servisu a nástrojích pro přístupnost během roku 2026.

Clara: Rychlejší objevování léků a lepší zdravotní péče

La-Proteina: Návrh proteinů na atomové úrovni
ReaSyn v2: Proveditelnost syntézy léků
KERMT: Výpočetní bezpečnostní testování
RNAPro: Predikce 3D tvaru RNA
Dataset: 455 000 syntetických proteinových struktur

Nové AI modely Clara od NVIDIA mají za cíl překlenout propast mezi digitálním objevováním a reálnou medicínou. I když s těmito modely nebudete přímo interagovat, mohly by významně ovlivnit vaši zdravotní péči.

Přehled modelů

Model	Funkce	Dopad
La-Proteina	Navrhuje velké proteiny s atomovou přesností	Studium dosud neléčitelných nemocí
ReaSyn v2	Zahrnuje proveditelnost syntézy do objevování	Předchází plýtvání výzkumem na nepraktických sloučeninách
KERMT	Předpovídá interakce léku s tělem	Odhaluje problémy před nákladnými klinickými studiemi
RNAPro	Předpovídá 3D tvary RNA	Umožňuje personalizovanou terapii založenou na RNA

Závěr: Léčba by mohla pacienty dosáhnout rychleji a za nižší cenu.

Alpamayo: Chytřejší samořídící auta

Model: Alpamayo-R1-10B
Parametry: 10 miliard (8,2B Cosmos Reason backbone + 2,3B action expert)
Trénovací data: 1+ miliarda obrázků z 80 000 hodin vícekanálového řízení
Dataset: 1 700+ hodin jízdních dat z 25 zemí
Licence: Nekomerční (výzkum)

Nová rodina Alpamayo od NVIDIA urychlí cestu k opravdu autonomním vozidlům. Toto je první otevřený reasoning VLA model v odvětví navržený pro autonomní řízení.

Klíčová inovace: Chain-of-Thought Reasoning

Na rozdíl od tradičních AV systémů, které jen detekují objekty a plánují trasy, Alpamayo používá chain-of-thought reasoning. Dokáže:

Zpracovat video vstup z více kamer
Generovat jízdní trajektorie
Vysvětlit logiku za každým rozhodnutím

Příklad výstupu: "Posun doleva pro zvýšení odstupu od stavebních kuželů zasahujících do jízdního pruhu"

Co je zahrnuto

Alpamayo 1: 10B reasoning VLA model na Hugging Face
AlpaSim: open-source end-to-end simulační framework
Physical AI Open Datasets: 1 700+ hodin pokrývajících vzácné hraniční případy z 25 zemí a 2 500+ měst

Kdo to používá

Lucid Motors, JLR, Uber a Berkeley DeepDrive používají Alpamayo k vývoji AV stacků založených na reasoning pro Level 4 autonomii.

Cosmos: Učíme roboty rozumět fyzickému světu

Cosmos Reason 2: Verze s 2B a 8B parametry
Kontextové okno: 256K tokenů (16x větší než v1)
Architektura: Založeno na Qwen3-VL
Licence: Komerční použití povoleno (NVIDIA Open Model License)

Na Hugging Face se robotika stala nejrychleji rostoucím segmentem, přičemž modely NVIDIA vedou ve stahování.

Rodina modelů Cosmos

Model	Parametry	Funkce
Cosmos Reason 2	2B / 8B	Physical AI reasoning VLM pro roboty a AI agenty
Cosmos Transfer 2.5	-	Video-to-world stylový přenos
Cosmos Predict 2.5	2B / 14B	Predikce budoucího stavu jako video

Klíčové vlastnosti Cosmos Reason 2

Vylepšené prostorově-časové porozumění s přesností časových značek
2D/3D bodová lokalizace a souřadnice ohraničujících rámečků
Výstup trajektorických dat pro robotické řízení
Podpora OCR pro čtení textu v prostředí
Chain-of-thought reasoning s tagy <think>

Isaac GR00T N1.6: Foundation Model pro humanoidní roboty

Parametry: 3B
Základní VLM: Varianta Cosmos-Reason-2B
Architektura: VLA s 32vrstvým difuzním transformerem

GR00T N1.6 je otevřený vision-language-action model speciálně vytvořený pro humanoidní roboty. Odemyká plné řízení těla a používá Cosmos Reason pro lepší kontextové porozumění.

Kdo to používá

Franka Robotics, Humanoid a NEURA Robotics – simulují, trénují a validují chování robotů
Salesforce, Hitachi, Uber a VAST Data – monitorování provozu a produktivita na pracovišti
Milestone – vision AI agenti pro veřejnou bezpečnost

Nemotron Safety: Budování důvěryhodné AI

Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII Detection: Nemotron-PII (založeno na GLiNER)
Licence: Komerční použití povoleno

Pro firmy nasazující AI zahrnuje Nemotron Safety modely pro bezpečnost obsahu a detekci PII s vysokou přesností.

Komponenty

Content Safety Model: rozšířená vícejazyčná podpora s kulturními nuancemi
PII Detection: detekuje citlivá osobní data před jejich únikem
Topic Control: spravuje témata, o kterých může AI diskutovat

Kdo to používá

CrowdStrike, Cohesity a Fortinet: posilují bezpečnost AI aplikací
CodeRabbit: pohání AI code reviews se zlepšenou rychlostí a přesností
Palantir: integruje do frameworku Ontology pro specializované AI agenty

Co to znamená pro všechny

Všechny modely a data jsou dostupné nyní na GitHubu a Hugging Face, také jako NVIDIA NIM mikroslužby pro škálovatelné nasazení.

Přehled otevřených dat

Dataset	Velikost	Obsah
Jazykové tokeny	10 bilionů	Vícejazyčné uvažování, kódování, bezpečnost
Robotické trajektorie	500 000	Pohyb a manipulace robotů
Proteinové struktury	455 000	Syntetické struktury pro biomedicínskou AI
Data ze senzorů vozidel	100 TB	Různé jízdní podmínky
Jízdní video	1 700+ hodin	Vzácné hraniční případy z 25 zemí

Odkazy pro začátek

Nemotron modely: developer.nvidia.com/nemotron
Cosmos modely: github.com/nvidia-cosmos
Alpamayo: developer.nvidia.com/drive/alpamayo
Isaac GR00T: developer.nvidia.com/isaac/gr00t

Pro běžné uživatele toto vydání znamená lepší hlasové asistenty, chytřejší vyhledávání v dokumentech, rychlejší vývoj léků, bezpečnější samořídící auta a schopnější roboty. Tyto technologie se během roku 2026 dostanou do spotřebitelských produktů.

NVIDIA sází na to, že umožněním celého AI ekosystému prodá více GPU. Na základě společností, které tyto technologie již přijímají, se tato sázka vyplácí.

Nemotron RAG: Chytřejší vyhledávání v dokumentech

Jak to funguje

Příklad z praxe: IT Help Desk Agent

Kdo to používá

Nemotron Speech: Mluvte se svými zařízeními jako nikdy předtím

Klíčové vlastnosti

Kdo to používá

Clara: Rychlejší objevování léků a lepší zdravotní péče

Přehled modelů

Alpamayo: Chytřejší samořídící auta

Klíčová inovace: Chain-of-Thought Reasoning

Co je zahrnuto

Kdo to používá

Cosmos: Učíme roboty rozumět fyzickému světu

Rodina modelů Cosmos

Klíčové vlastnosti Cosmos Reason 2

Isaac GR00T N1.6: Foundation Model pro humanoidní roboty

Kdo to používá

Nemotron Safety: Budování důvěryhodné AI

Komponenty

Kdo to používá

Co to znamená pro všechny

Přehled otevřených dat

Odkazy pro začátek

Podívejte se, co AI může udělat pro váš web