NVIDIA brengt enorme collectie open modellen, data en tools uit om AI-ontwikkeling te versnellen

    /
    11 min leestijd
    Ing. Patrik Kelemen
    NVIDIA brengt enorme collectie open modellen, data en tools uit om AI-ontwikkeling te versnellen

    NVIDIA heeft zojuist een van de grootste open-source AI-releases uit de geschiedenis uitgebracht. Nieuwe modellen voor spraak, robotica, autonome voertuigen, gezondheidszorg en meer.

    Namiru AI

    AI-klantenservice voor je website

    Plak je URL. Krijg een support-agent in 30 seconden.

    Op CES 2026 kondigde NVIDIA aan wat mogelijk de belangrijkste open-source AI-release tot nu toe is. Het bedrijf onthulde nieuwe modellen, datasets en tools die alles omvatten, van spraakherkenning tot geneesmiddelenonderzoek.

    De omvang is opmerkelijk:

    • 10 biljoen taaltrainingstokens
    • 500.000 roboticatrajecten
    • 455.000 eiwitstructuren
    • 100 terabyte aan voertuigsensordata

    Grote bedrijven waaronder Bosch, Salesforce, Uber, Palantir en CrowdStrike bouwen al op deze technologieën.


    Nemotron RAG: slimmer zoeken in documenten

    image

    Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7B parameters)
    Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7B parameters)
    Ook beschikbaar: 8B parameter text-only embedding model
    Contextlengte: Tot 8.192 tokens
    Licentie: Commercieel gebruik toegestaan

    Informatie vinden die verborgen zit in documenten is een dagelijkse uitdaging voor kenniswerkers. Nemotron RAG brengt multimodale intelligentie naar documentzoeken en verwerkt zowel tekst als afbeeldingen met nauwkeurige meertalige inzichten in 26 talen.

    Hoe het werkt

    De Nemotron RAG-pipeline combineert drie componenten:

    1. Embedding Model: zet documenten om in vectorrepresentaties voor opslag en ophalen
    2. Reranking Model: herordent potentiële kandidaten in definitieve volgorde met behulp van cross-attention
    3. Reasoning Model: genereert nauwkeurige antwoorden op basis van opgehaalde context

    Praktijkvoorbeeld: IT-helpdesk agent

    NVIDIA demonstreerde hoe deze modellen samenwerken in een IT-helpdesk agent:

    • Nemotron Nano 9B V2: primair redeneermodel voor het genereren van antwoorden
    • Llama 3.2 EmbedQA 1B V2: zet documenten om in vectorembeddings
    • Llama 3.2 RerankQA 1B V2: herordent opgehaalde documenten op relevantie

    Deze modellen stellen de agent gezamenlijk in staat om gebruikersvragen nauwkeurig te beantwoorden door gebruik te maken van taalgeneratie, documentophaling en herordening.

    Wie gebruikt het

    Cadence modelleert logische ontwerpassets zoals micro-architectuurdocumenten, beperkingen en verificatieonderpanden. Ingenieurs kunnen vragen stellen zoals "Ik wil de interrupt controller uitbreiden om een lage energiemodus te ondersteunen, laat me zien welke specificatiesecties moeten worden gewijzigd" en direct relevante vereisten naar boven halen.

    IBM test deze modellen om zoeken en redeneren in technische documentatie te verbeteren.


    Nemotron Speech: praat met je apparaten zoals nooit tevoren

    Model: Nemotron-Speech-Streaming-En-0.6B
    Parameters: 600M
    Architectuur: Cache-aware FastConformer encoder + RNN-T decoder
    Latentie: Sub-100ms streaming
    Licentie: Commercieel gebruik toegestaan

    Nemotron Speech levert realtime spraakherkenning die 10x sneller presteert dan vergelijkbare modellen en bovenaan de huidige ASR-ranglijsten staat.

    image

    Belangrijkste kenmerken

    • Cache-aware streaming architectuur: verwerkt alleen nieuwe audiofragmenten terwijl gecachte encodercontext wordt hergebruikt
    • Runtime-configureerbare latentiemodi: 80ms, 160ms, 560ms of 1,12s fragmenten zonder opnieuw trainen
    • Ingebouwde ondersteuning voor interpunctie en hoofdletters
    • Getraind op 285.000 uur audiodata uit de NVIDIA Granary-dataset

    Wie gebruikt het

    Bosch gebruikt Nemotron Speech al om bestuurders in staat te stellen via spraakopdrachten met voertuigen te communiceren. ServiceNow traint zijn Apriel-modelfamilie op Nemotron-datasets voor kostenefficiënte multimodale prestaties.

    Verwacht deze technologie in slimme huisapparaten, klantenservicesystemen en toegankelijkheidstools gedurende 2026.


    Clara: snellere geneesmiddelenontdekking en betere gezondheidszorg

    image

    La-Proteina: Eiwitontwerp op atoomniveau
    ReaSyn v2: Haalbaarheid van geneesmiddelensynthese
    KERMT: Computationele veiligheidstests
    RNAPro: RNA 3D-vormvoorspelling
    Dataset: 455.000 synthetische eiwitstructuren

    NVIDIA's nieuwe Clara AI-modellen zijn bedoeld om de kloof tussen digitale ontdekking en echte geneeskunde te overbruggen. Hoewel je niet direct met deze modellen zult werken, kunnen ze een aanzienlijke impact hebben op je gezondheidszorg.

    Modeloverzicht

    ModelFunctieImpact
    La-ProteinaOntwerp grote, atoom-nauwkeurige eiwittenBestudeer voorheen onbehandelbare ziekten
    ReaSyn v2Integreer synthesehaalbaarheid in ontdekkingVoorkom verspild onderzoek naar onpraktische verbindingen
    KERMTVoorspel geneesmiddel-lichaaminteractiesOntdek problemen vóór dure klinische proeven
    RNAProVoorspel RNA 3D-vormenMaak gepersonaliseerde RNA-gebaseerde therapeutica mogelijk

    Conclusie: Behandelingen kunnen patiënten sneller en tegen lagere kosten bereiken.


    Alpamayo: zelfrijdende auto's slimmer maken

    image

    Model: Alpamayo-R1-10B
    Parameters: 10 miljard (8,2B Cosmos Reason backbone + 2,3B action expert)
    Trainingsdata: 1+ miljard afbeeldingen uit 80.000 uur multi-camera rijden
    Dataset: 1.700+ uur rijdata uit 25 landen
    Licentie: Niet-commercieel (onderzoek)

    NVIDIA's nieuwe Alpamayo-familie zal het pad naar echt autonome voertuigen versnellen. Dit is het eerste open reasoning VLA-model van de industrie ontworpen voor autonoom rijden.

    Belangrijkste innovatie: Chain-of-Thought Reasoning

    In tegenstelling tot traditionele AV-systemen die alleen objecten detecteren en routes plannen, gebruikt Alpamayo chain-of-thought reasoning. Het kan:

    • Video-input van meerdere camera's verwerken
    • Rijtrajecten genereren
    • De logica achter elke beslissing uitleggen

    Voorbeelduitvoer: "Beweeg naar links om meer afstand te creëren van de bouwkegels die in de rijbaan komen"

    Wat is inbegrepen

    • Alpamayo 1: 10B reasoning VLA-model op Hugging Face
    • AlpaSim: open-source end-to-end simulatieframework
    • Physical AI Open Datasets: 1.700+ uur met zeldzame randgevallen uit 25 landen en 2.500+ steden

    Wie gebruikt het

    Lucid Motors, JLR, Uber en Berkeley DeepDrive gebruiken Alpamayo om reasoning-gebaseerde AV-stacks te ontwikkelen voor Level 4-autonomie.


    Cosmos: robots leren de fysieke wereld begrijpen

    image

    Cosmos Reason 2: 2B en 8B parameterversies
    Contextvenster: 256K tokens (16x groter dan v1)
    Architectuur: Gebaseerd op Qwen3-VL
    Licentie: Commercieel gebruik toegestaan (NVIDIA Open Model License)

    Op Hugging Face is robotica het snelst groeiende segment geworden, met NVIDIA's modellen die de downloads leiden.

    Cosmos-modelfamilie

    ModelParametersFunctie
    Cosmos Reason 22B / 8BPhysical AI reasoning VLM voor robots en AI-agents
    Cosmos Transfer 2.5-Video-naar-wereld stijloverdracht
    Cosmos Predict 2.52B / 14BToekomstige toestandsvoorspelling als video

    Belangrijkste kenmerken van Cosmos Reason 2

    • Verbeterd ruimtelijk-temporeel begrip met tijdstempelprecisie
    • 2D/3D-puntlokalisatie en bounding box-coördinaten
    • Trajectdata-uitvoer voor robotbesturing
    • OCR-ondersteuning voor het lezen van tekst in omgevingen
    • Chain-of-thought reasoning met <think>-tags

    Isaac GR00T N1.6: Humanoïde robot foundation model

    Parameters: 3B
    Basis VLM: Cosmos-Reason-2B variant
    Architectuur: VLA met 32-laags diffusietransformator

    GR00T N1.6 is een open vision-language-action model speciaal gebouwd voor humanoïde robots. Het ontgrendelt volledige lichaamscontrole en gebruikt Cosmos Reason voor beter contextueel begrip.

    Wie gebruikt het

    • Franka Robotics, Humanoid en NEURA Robotics , simuleren, trainen en valideren robotgedrag
    • Salesforce, Hitachi, Uber en VAST Data , verkeersmonitoring en werkplekproductiviteit
    • Milestone , vision AI-agents voor openbare veiligheid

    Nemotron Safety: betrouwbare AI bouwen

    image

    Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
    PII-detectie: Nemotron-PII (GLiNER-gebaseerd)
    Licentie: Commercieel gebruik toegestaan

    Voor bedrijven die AI implementeren, omvat Nemotron Safety contentveiligheidsmodellen en PII-detectie met hoge nauwkeurigheid.

    Componenten

    • Content Safety Model: uitgebreide meertalige ondersteuning met culturele nuance
    • PII-detectie: detecteert gevoelige persoonlijke gegevens voordat ze lekken
    • Onderwerpcontrole: beheert over welke onderwerpen de AI kan praten

    Wie gebruikt het

    • CrowdStrike, Cohesity en Fortinet: versterken AI-applicatiebeveiliging
    • CodeRabbit: ondersteunt AI-codebeoordelingen met verbeterde snelheid en nauwkeurigheid
    • Palantir: integreert in Ontology-framework voor gespecialiseerde AI-agents

    Wat dit voor iedereen betekent

    Alle modellen en data zijn nu beschikbaar op GitHub en Hugging Face, ook als NVIDIA NIM-microservices voor schaalbare implementatie.

    Open data-overzicht

    DatasetGrootteInhoud
    Taaltokens10 biljoenMeertalig redeneren, coderen, veiligheid
    Roboticatrajecten500.000Robotbeweging en manipulatie
    Eiwitstructuren455.000Synthetische structuren voor biomedische AI
    Voertuigsensordata100 TBDiverse rijomstandigheden
    Rijvideo1.700+ uurZeldzame randgevallen uit 25 landen

    Voor gewone gebruikers betekent deze release betere spraakassistenten, slimmer zoeken in documenten, snellere geneesmiddelenontwikkeling, veiligere zelfrijdende auto's en capabelere robots. Deze technologieën zullen gedurende 2026 in consumentenproducten terechtkomen.

    NVIDIA wedt erop dat ze meer GPU's verkopen door het hele AI-ecosysteem mogelijk te maken. Op basis van de bedrijven die deze technologieën al adopteren, werpt die gok zijn vruchten af.

    Gemaakt door Namiru.ai - plug-and-play AI-chat voor je website.

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    Vond je dit artikel leuk?

    Ontdek wat AI kan doen voor jouw website

    Plak je URL en zie je AI-agent in seconden tot leven komen.

    Je klanten krijgen direct antwoord. Jij krijgt leads, analyses en je tijd terug.

    Geen creditcard nodig

    Namiru.ai

    AI chat for your website