NVIDIA vydává masivní kolekci otevřených modelů, dat a nástrojů pro urychlení vývoje AI

    /
    11 min čtení
    Ing. Patrik Kelemen
    NVIDIA vydává masivní kolekci otevřených modelů, dat a nástrojů pro urychlení vývoje AI

    NVIDIA právě představila jedno z největších open-source AI vydání v historii. Nové modely pro rozpoznávání řeči, robotiku, autonomní vozidla, zdravotnictví a další.

    Namiru AI

    AI zákaznická podpora pro váš web

    Vložte svou URL. Získejte agenta podpory za 30 sekund.

    Na veletrhu CES 2026 NVIDIA oznámila možná nejvýznamnější open-source AI vydání dosud. Společnost představila nové modely, datasety a nástroje pokrývající vše od rozpoznávání řeči až po objevování léků.

    Rozsah je pozoruhodný:

    • 10 bilionů jazykových trénovacích tokenů
    • 500 000 robotických trajektorií
    • 455 000 proteinových struktur
    • 100 terabajtů dat ze senzorů vozidel

    Velké společnosti včetně Bosch, Salesforce, Uber, Palantir a CrowdStrike již na těchto technologiích staví.


    Nemotron RAG: Chytřejší vyhledávání v dokumentech

    image

    Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7 miliard parametrů)
    Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7 miliard parametrů)
    Také k dispozici: 8B parametrový textový embedding model
    Délka kontextu: Až 8 192 tokenů
    Licence: Komerční použití povoleno

    Hledání informací ukrytých v dokumentech je každodenní výzvou pro znalostní pracovníky. Nemotron RAG přináší multimodální inteligenci do vyhledávání dokumentů, zpracovává text i obrázky s přesnými vícejazyčnými poznatky napříč 26 jazyky.

    Jak to funguje

    Pipeline Nemotron RAG kombinuje tři komponenty:

    1. Embedding Model: převádí dokumenty do vektorových reprezentací pro ukládání a vyhledávání
    2. Reranking Model: přeřazuje potenciální kandidáty do finálního pořadí pomocí cross-attention
    3. Reasoning Model: generuje přesné odpovědi na základě získaného kontextu

    Příklad z praxe: IT Help Desk Agent

    NVIDIA předvedla, jak tyto modely spolupracují v IT Help Desk agentovi:

    • Nemotron Nano 9B V2: primární reasoning model pro generování odpovědí
    • Llama 3.2 EmbedQA 1B V2: převádí dokumenty do vektorových embeddingů
    • Llama 3.2 RerankQA 1B V2: přeřazuje získané dokumenty podle relevance

    Tyto modely společně umožňují agentovi přesně odpovídat na dotazy uživatelů využitím generování jazyka, vyhledávání dokumentů a schopností přeřazování.

    Kdo to používá

    Cadence modeluje logické návrhové assety jako dokumenty mikroarchitektury, omezení a verifikační podklady. Inženýři se mohou ptát například "Chci rozšířit řadič přerušení o podporu nízkopříkonového stavu, ukaž mi, které sekce specifikace potřebují změny" a okamžitě získat relevantní požadavky.

    IBM pilotně testuje tyto modely pro zlepšení vyhledávání a uvažování napříč technickou dokumentací.


    Nemotron Speech: Mluvte se svými zařízeními jako nikdy předtím

    Model: Nemotron-Speech-Streaming-En-0.6B
    Parametry: 600M
    Architektura: Cache-aware FastConformer encoder + RNN-T decoder
    Latence: Streamování pod 100ms
    Licence: Komerční použití povoleno

    Nemotron Speech poskytuje rozpoznávání řeči v reálném čase, které je 10x rychlejší než srovnatelné modely a vévodí současným ASR žebříčkům.

    image

    Klíčové vlastnosti

    • Cache-aware streaming architektura: zpracovává pouze nové audio chunky při opětovném použití cachovaného kontextu encoderu
    • Runtime-konfigurovatelné režimy latence: 80ms, 160ms, 560ms nebo 1,12s chunky bez přetrénování
    • Nativní podpora interpunkce a velkých písmen
    • Natrénováno na 285 000 hodinách audio dat z datasetu NVIDIA Granary

    Kdo to používá

    Bosch již používá Nemotron Speech k umožnění řidičům interagovat s vozidly pomocí hlasových příkazů. ServiceNow trénuje svou rodinu modelů Apriel na datasetech Nemotron pro nákladově efektivní multimodální výkon.

    Očekávejte tuto technologii v chytrých domácích zařízeních, systémech zákaznického servisu a nástrojích pro přístupnost během roku 2026.


    Clara: Rychlejší objevování léků a lepší zdravotní péče

    image

    La-Proteina: Návrh proteinů na atomové úrovni
    ReaSyn v2: Proveditelnost syntézy léků
    KERMT: Výpočetní bezpečnostní testování
    RNAPro: Predikce 3D tvaru RNA
    Dataset: 455 000 syntetických proteinových struktur

    Nové AI modely Clara od NVIDIA mají za cíl překlenout propast mezi digitálním objevováním a reálnou medicínou. I když s těmito modely nebudete přímo interagovat, mohly by významně ovlivnit vaši zdravotní péči.

    Přehled modelů

    ModelFunkceDopad
    La-ProteinaNavrhuje velké proteiny s atomovou přesnostíStudium dosud neléčitelných nemocí
    ReaSyn v2Zahrnuje proveditelnost syntézy do objevováníPředchází plýtvání výzkumem na nepraktických sloučeninách
    KERMTPředpovídá interakce léku s tělemOdhaluje problémy před nákladnými klinickými studiemi
    RNAProPředpovídá 3D tvary RNAUmožňuje personalizovanou terapii založenou na RNA

    Závěr: Léčba by mohla pacienty dosáhnout rychleji a za nižší cenu.


    Alpamayo: Chytřejší samořídící auta

    image

    Model: Alpamayo-R1-10B
    Parametry: 10 miliard (8,2B Cosmos Reason backbone + 2,3B action expert)
    Trénovací data: 1+ miliarda obrázků z 80 000 hodin vícekanálového řízení
    Dataset: 1 700+ hodin jízdních dat z 25 zemí
    Licence: Nekomerční (výzkum)

    Nová rodina Alpamayo od NVIDIA urychlí cestu k opravdu autonomním vozidlům. Toto je první otevřený reasoning VLA model v odvětví navržený pro autonomní řízení.

    Klíčová inovace: Chain-of-Thought Reasoning

    Na rozdíl od tradičních AV systémů, které jen detekují objekty a plánují trasy, Alpamayo používá chain-of-thought reasoning. Dokáže:

    • Zpracovat video vstup z více kamer
    • Generovat jízdní trajektorie
    • Vysvětlit logiku za každým rozhodnutím

    Příklad výstupu: "Posun doleva pro zvýšení odstupu od stavebních kuželů zasahujících do jízdního pruhu"

    Co je zahrnuto

    • Alpamayo 1: 10B reasoning VLA model na Hugging Face
    • AlpaSim: open-source end-to-end simulační framework
    • Physical AI Open Datasets: 1 700+ hodin pokrývajících vzácné hraniční případy z 25 zemí a 2 500+ měst

    Kdo to používá

    Lucid Motors, JLR, Uber a Berkeley DeepDrive používají Alpamayo k vývoji AV stacků založených na reasoning pro Level 4 autonomii.


    Cosmos: Učíme roboty rozumět fyzickému světu

    image

    Cosmos Reason 2: Verze s 2B a 8B parametry
    Kontextové okno: 256K tokenů (16x větší než v1)
    Architektura: Založeno na Qwen3-VL
    Licence: Komerční použití povoleno (NVIDIA Open Model License)

    Na Hugging Face se robotika stala nejrychleji rostoucím segmentem, přičemž modely NVIDIA vedou ve stahování.

    Rodina modelů Cosmos

    ModelParametryFunkce
    Cosmos Reason 22B / 8BPhysical AI reasoning VLM pro roboty a AI agenty
    Cosmos Transfer 2.5-Video-to-world stylový přenos
    Cosmos Predict 2.52B / 14BPredikce budoucího stavu jako video

    Klíčové vlastnosti Cosmos Reason 2

    • Vylepšené prostorově-časové porozumění s přesností časových značek
    • 2D/3D bodová lokalizace a souřadnice ohraničujících rámečků
    • Výstup trajektorických dat pro robotické řízení
    • Podpora OCR pro čtení textu v prostředí
    • Chain-of-thought reasoning s tagy <think>

    Isaac GR00T N1.6: Foundation Model pro humanoidní roboty

    Parametry: 3B
    Základní VLM: Varianta Cosmos-Reason-2B
    Architektura: VLA s 32vrstvým difuzním transformerem

    GR00T N1.6 je otevřený vision-language-action model speciálně vytvořený pro humanoidní roboty. Odemyká plné řízení těla a používá Cosmos Reason pro lepší kontextové porozumění.

    Kdo to používá

    • Franka Robotics, Humanoid a NEURA Robotics – simulují, trénují a validují chování robotů
    • Salesforce, Hitachi, Uber a VAST Data – monitorování provozu a produktivita na pracovišti
    • Milestone – vision AI agenti pro veřejnou bezpečnost

    Nemotron Safety: Budování důvěryhodné AI

    image

    Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
    PII Detection: Nemotron-PII (založeno na GLiNER)
    Licence: Komerční použití povoleno

    Pro firmy nasazující AI zahrnuje Nemotron Safety modely pro bezpečnost obsahu a detekci PII s vysokou přesností.

    Komponenty

    • Content Safety Model: rozšířená vícejazyčná podpora s kulturními nuancemi
    • PII Detection: detekuje citlivá osobní data před jejich únikem
    • Topic Control: spravuje témata, o kterých může AI diskutovat

    Kdo to používá

    • CrowdStrike, Cohesity a Fortinet: posilují bezpečnost AI aplikací
    • CodeRabbit: pohání AI code reviews se zlepšenou rychlostí a přesností
    • Palantir: integruje do frameworku Ontology pro specializované AI agenty

    Co to znamená pro všechny

    Všechny modely a data jsou dostupné nyní na GitHubu a Hugging Face, také jako NVIDIA NIM mikroslužby pro škálovatelné nasazení.

    Přehled otevřených dat

    DatasetVelikostObsah
    Jazykové tokeny10 bilionůVícejazyčné uvažování, kódování, bezpečnost
    Robotické trajektorie500 000Pohyb a manipulace robotů
    Proteinové struktury455 000Syntetické struktury pro biomedicínskou AI
    Data ze senzorů vozidel100 TBRůzné jízdní podmínky
    Jízdní video1 700+ hodinVzácné hraniční případy z 25 zemí

    Odkazy pro začátek


    Pro běžné uživatele toto vydání znamená lepší hlasové asistenty, chytřejší vyhledávání v dokumentech, rychlejší vývoj léků, bezpečnější samořídící auta a schopnější roboty. Tyto technologie se během roku 2026 dostanou do spotřebitelských produktů.

    NVIDIA sází na to, že umožněním celého AI ekosystému prodá více GPU. Na základě společností, které tyto technologie již přijímají, se tato sázka vyplácí.

    Vytvořeno Namiru.ai - plug-and-play AI chat pro váš web.

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    Líbil se vám tento článek?

    Podívejte se, co AI může udělat pro váš web

    Vložte svou URL a sledujte, jak váš AI agent ožije během sekund.

    Vaši zákazníci dostanou okamžité odpovědi. Vy získáte leady, analytiku a svůj čas zpět.

    Bez kreditní karty

    Namiru.ai

    AI chat for your website