NVIDIA vydáva masívnu kolekciu otvorených modelov, dát a nástrojov na urýchlenie vývoja AI

    /
    11 min čítania
    Ing. Patrik Kelemen
    NVIDIA vydáva masívnu kolekciu otvorených modelov, dát a nástrojov na urýchlenie vývoja AI

    NVIDIA práve predstavila jedno z najväčších open-source AI vydaní v histórii. Nové modely pre reč, robotiku, autonómne vozidlá, zdravotníctvo a ďalšie oblasti.

    Namiru AI

    AI zákaznícka podpora pre váš web

    Vložte svoju URL. Získajte agenta podpory za 30 sekúnd.

    Na CES 2026 NVIDIA oznámila to, čo môže byť doteraz najvýznamnejším open-source AI vydaním. Spoločnosť odhalila nové modely, datasety a nástroje pokrývajúce všetko od rozpoznávania reči až po objav liekov.

    Rozsah je pozoruhodný:

    • 10 biliónov jazykových tréningových tokenov
    • 500 000 robotických trajektórií
    • 455 000 proteínových štruktúr
    • 100 terabajtov dát zo senzorov vozidiel

    Veľké spoločnosti vrátane Bosch, Salesforce, Uber, Palantir a CrowdStrike už na týchto technológiách stavajú.


    Nemotron RAG: Inteligentnejšie vyhľadávanie v dokumentoch

    image

    Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7B parametrov)
    Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7B parametrov)
    Tiež dostupné: 8B parametrový textový embedding model
    Dĺžka kontextu: Až 8 192 tokenov
    Licencia: Povolené komerčné použitie

    Hľadanie informácií ukrytých v dokumentoch je každodenným problémom pre pracovníkov s vedomosťami. Nemotron RAG prináša multimodálnu inteligenciu do vyhľadávania dokumentov, spracováva text aj obrázky s presnými viacjazyčnými poznatkami v 26 jazykoch.

    Ako to funguje

    Nemotron RAG pipeline kombinuje tri komponenty:

    1. Embedding Model: konvertuje dokumenty do vektorových reprezentácií na uloženie a vyhľadávanie
    2. Reranking Model: preradí potenciálnych kandidátov do finálneho poradia pomocou krížovej pozornosti
    3. Reasoning Model: generuje presné odpovede na základe získaného kontextu

    Príklad z praxe: IT Help Desk Agent

    NVIDIA demonštrovala, ako tieto modely spolupracujú v IT Help Desk agentovi:

    • Nemotron Nano 9B V2: primárny reasoning model na generovanie odpovedí
    • Llama 3.2 EmbedQA 1B V2: konvertuje dokumenty do vektorových embeddingov
    • Llama 3.2 RerankQA 1B V2: preradí získané dokumenty podľa relevantnosti

    Tieto modely spoločne umožňujú agentovi presne odpovedať na používateľské otázky využitím generovania jazyka, vyhľadávania dokumentov a preraďovacích schopností.

    Kto to používa

    Cadence modeluje logické dizajnové aktíva ako mikro-architektúrne dokumenty, obmedzenia a verifikačné podklady. Inžinieri môžu klásť otázky ako "Chcem rozšíriť interrupt controller o podporu nízkoenergetického stavu, ukáž mi, ktoré sekcie špecifikácie potrebujú zmeny" a okamžite získať relevantné požiadavky.

    IBM pilotne testuje tieto modely na zlepšenie vyhľadávania a uvažovania v technickej dokumentácii.


    Nemotron Speech: Rozprávajte sa so svojimi zariadeniami ako nikdy predtým

    Model: Nemotron-Speech-Streaming-En-0.6B
    Parametre: 600M
    Architektúra: Cache-aware FastConformer enkodér + RNN-T dekodér
    Latencia: Pod 100ms streaming
    Licencia: Povolené komerčné použitie

    Nemotron Speech poskytuje rozpoznávanie reči v reálnom čase, ktoré je 10x rýchlejšie ako porovnateľné modely a vedie súčasné ASR rebríčky.

    image

    Kľúčové vlastnosti

    • Cache-aware streaming architektúra: zpracováva len nové audio úseky pri opätovnom použití cachovaného kontextu enkodéra
    • Runtime-konfigurovateľné režimy latencie: 80ms, 160ms, 560ms alebo 1,12s úseky bez potreby pretréningu
    • Natívna podpora interpunkcie a veľkých písmen
    • Natrénované na 285 000 hodinách audio dát z NVIDIA Granary datasetu

    Kto to používa

    Bosch už používa Nemotron Speech na umožnenie vodičom interagovať s vozidlami prostredníctvom hlasových príkazov. ServiceNow trénuje svoju rodinu modelov Apriel na Nemotron datasetoch pre nákladovo efektívny multimodálny výkon.

    Očakávajte túto technológiu v zariadeniach inteligentnej domácnosti, systémoch zákazníckych služieb a nástrojoch pre prístupnost počas celého roka 2026.


    Clara: Rýchlejší objav liekov a lepšie zdravotníctvo

    image

    La-Proteina: Dizajn proteínov na atómovej úrovni
    ReaSyn v2: Uskutočniteľnosť syntézy liekov
    KERMT: Výpočtové bezpečnostné testovanie
    RNAPro: Predikcia 3D tvaru RNA
    Dataset: 455 000 syntetických proteínových štruktúr

    Nové Clara AI modely od NVIDIA majú za cieľ preklenúť priepasť medzi digitálnym objavom a reálnou medicínou. Hoci s týmito modelmi nebudete priamo interagovať, mohli by výrazne ovplyvniť vašu zdravotnú starostlivosť.

    Prehľad modelov

    ModelFunkciaDopad
    La-ProteinaDizajn veľkých, atómovo presných proteínovŠtúdium predtým neliečiteľných chorôb
    ReaSyn v2Začlenenie uskutočniteľnosti syntézy do objavuPredchádzanie zmárnenému výskumu na nepraktických zlúčeninách
    KERMTPredikcia interakcií liek-teloOdhalenie problémov pred nákladnými klinickými skúškami
    RNAProPredikcia 3D tvarov RNAUmožnenie personalizovanej RNA-based terapeutiky

    Záver: Liečba by sa mohla k pacientom dostať rýchlejšie a za nižšie náklady.


    Alpamayo: Robíme samočinné autá inteligentnejšími

    image

    Model: Alpamayo-R1-10B
    Parametre: 10 miliárd (8,2B Cosmos Reason backbone + 2,3B action expert)
    Tréningové dáta: 1+ miliarda obrázkov z 80 000 hodín viacerých kamier pri jazde
    Dataset: 1 700+ hodín jazdných dát z 25 krajín
    Licencia: Nekomerčná (výskum)

    Nová rodina Alpamayo od NVIDIA urýchli cestu k skutočne autonómnym vozidlám. Toto je prvý otvorený reasoning VLA model v odvetví navrhnutý pre autonómnu jazdu.

    Kľúčová inovácia: Chain-of-Thought Reasoning

    Na rozdiel od tradičných AV systémov, ktoré len detegujú objekty a plánujú trasy, Alpamayo používa chain-of-thought reasoning. Dokáže:

    • Spracovať video vstup z viacerých kamier
    • Generovať jazdné trajektórie
    • Vysvetliť logiku za každým rozhodnutím

    Príklad výstupu: "Posunúť sa doľava na zvýšenie odstupu od stavebných kužeľov zasahujúcich do jazdného pruhu"

    Čo je súčasťou

    • Alpamayo 1: 10B reasoning VLA model na Hugging Face
    • AlpaSim: open-source end-to-end simulačný framework
    • Physical AI Open Datasets: 1 700+ hodín pokrývajúcich zriedkavé okrajové prípady z 25 krajín a 2 500+ miest

    Kto to používa

    Lucid Motors, JLR, Uber a Berkeley DeepDrive používajú Alpamayo na vývoj reasoning-based AV stackov pre Level 4 autonómiu.


    Cosmos: Učíme roboty rozumieť fyzickému svetu

    image

    Cosmos Reason 2: 2B a 8B parametrové verzie
    Context Window: 256K tokenov (16x väčšie ako v1)
    Architektúra: Založené na Qwen3-VL
    Licencia: Povolené komerčné použitie (NVIDIA Open Model License)

    Na Hugging Face sa robotika stala najrýchlejšie rastúcim segmentom, pričom modely NVIDIA vedú v sťahovaní.

    Rodina modelov Cosmos

    ModelParametreFunkcia
    Cosmos Reason 22B / 8BPhysical AI reasoning VLM pre roboty a AI agentov
    Cosmos Transfer 2.5-Video-to-world štýlový prenos
    Cosmos Predict 2.52B / 14BPredikcia budúceho stavu ako video

    Kľúčové vlastnosti Cosmos Reason 2

    • Vylepšené priestorovo-časové porozumenie s presnosťou časových značiek
    • 2D/3D bodová lokalizácia a súradnice ohraničujúcich boxov
    • Výstup trajektóriových dát pre robotické riadenie
    • OCR podpora na čítanie textu v prostredí
    • Chain-of-thought reasoning s <think> tagmi

    Isaac GR00T N1.6: Základný model humanoidného robota

    Parametre: 3B
    Base VLM: Cosmos-Reason-2B variant
    Architektúra: VLA s 32-vrstvovým difúznym transformerom

    GR00T N1.6 je otvorený vision-language-action model špeciálne vytvorený pre humanoidné roboty. Odomyká plné riadenie tela a používa Cosmos Reason pre lepšie kontextové porozumenie.

    Kto to používa

    • Franka Robotics, Humanoid a NEURA Robotics simulujú, trénujú a validujú správanie robotov
    • Salesforce, Hitachi, Uber a VAST Data monitorovanie dopravy a produktivita na pracovisku
    • Milestone vision AI agenti pre verejnú bezpečnosť

    Nemotron Safety: Budovanie dôveryhodnej AI

    image

    Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
    PII Detection: Nemotron-PII (založené na GLiNER)
    Licencia: Povolené komerčné použitie

    Pre podniky nasadzujúce AI zahŕňa Nemotron Safety modely bezpečnosti obsahu a detekciu PII s vysokou presnosťou.

    Komponenty

    • Content Safety Model: rozšírená viacjazyčná podpora s kultúrnymi nuansami
    • PII Detection: deteguje citlivé osobné údaje pred ich únikom
    • Topic Control: spravuje témy, o ktorých môže AI diskutovať

    Kto to používa

    • CrowdStrike, Cohesity a Fortinet: posilňujú bezpečnosť AI aplikácií
    • CodeRabbit: poháňa AI code reviews so zlepšenou rýchlosťou a presnosťou
    • Palantir: integrácia do Ontology frameworku pre špecializovaných AI agentov

    Čo to znamená pre každého

    Všetky modely a dáta sú dostupné teraz na GitHub a Hugging Face, tiež ako NVIDIA NIM mikroslužby pre škálovateľné nasadenie.

    Prehľad otvorených dát

    DatasetVeľkosťObsah
    Jazykové tokeny10 biliónovViacjazyčné uvažovanie, kódovanie, bezpečnosť
    Robotické trajektórie500 000Pohyb a manipulácia robotov
    Proteínové štruktúry455 000Syntetické štruktúry pre biomedicínsku AI
    Dáta zo senzorov vozidiel100 TBRôznorodé jazdné podmienky
    Video z jazdy1 700+ hodínZriedkavé okrajové prípady z 25 krajín

    Odkazy na začiatok


    Pre bežných používateľov toto vydanie znamená lepších hlasových asistentov, inteligentnejšie vyhľadávanie dokumentov, rýchlejší vývoj liekov, bezpečnejšie samočinné autá a schopnejších robotov. Tieto technológie sa budú filtrovať do spotrebiteľských produktov počas celého roka 2026.

    NVIDIA stavia na tom, že umožnením celého AI ekosystému predá viac GPU. Na základe spoločností, ktoré už tieto technológie prijímajú, sa táto stávka vypláca.

    Vytvorené Namiru.ai - plug-and-play AI chat pre váš web.

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    Páčil sa vám tento článok?

    Pozrite sa, čo AI môže urobiť pre váš web

    Vložte svoju URL a sledujte, ako váš AI agent ožije za pár sekúnd.

    Vaši zákazníci dostanú okamžité odpovede. Vy získate leady, analytiku a svoj čas späť.

    Bez kreditnej karty

    Namiru.ai

    AI chat for your website