Op CES 2026 kondigde NVIDIA aan wat mogelijk de belangrijkste open-source AI-release tot nu toe is. Het bedrijf onthulde nieuwe modellen, datasets en tools die alles omvatten, van spraakherkenning tot geneesmiddelenonderzoek.
De omvang is opmerkelijk:
- 10 biljoen taaltrainingstokens
- 500.000 roboticatrajecten
- 455.000 eiwitstructuren
- 100 terabyte aan voertuigsensordata
Grote bedrijven waaronder Bosch, Salesforce, Uber, Palantir en CrowdStrike bouwen al op deze technologieën.
Nemotron RAG: slimmer zoeken in documenten

Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7B parameters)
Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7B parameters)
Ook beschikbaar: 8B parameter text-only embedding model
Contextlengte: Tot 8.192 tokens
Licentie: Commercieel gebruik toegestaan
Informatie vinden die verborgen zit in documenten is een dagelijkse uitdaging voor kenniswerkers. Nemotron RAG brengt multimodale intelligentie naar documentzoeken en verwerkt zowel tekst als afbeeldingen met nauwkeurige meertalige inzichten in 26 talen.
Hoe het werkt
De Nemotron RAG-pipeline combineert drie componenten:
- Embedding Model: zet documenten om in vectorrepresentaties voor opslag en ophalen
- Reranking Model: herordent potentiële kandidaten in definitieve volgorde met behulp van cross-attention
- Reasoning Model: genereert nauwkeurige antwoorden op basis van opgehaalde context
Praktijkvoorbeeld: IT-helpdesk agent
NVIDIA demonstreerde hoe deze modellen samenwerken in een IT-helpdesk agent:
- Nemotron Nano 9B V2: primair redeneermodel voor het genereren van antwoorden
- Llama 3.2 EmbedQA 1B V2: zet documenten om in vectorembeddings
- Llama 3.2 RerankQA 1B V2: herordent opgehaalde documenten op relevantie
Deze modellen stellen de agent gezamenlijk in staat om gebruikersvragen nauwkeurig te beantwoorden door gebruik te maken van taalgeneratie, documentophaling en herordening.
Wie gebruikt het
Cadence modelleert logische ontwerpassets zoals micro-architectuurdocumenten, beperkingen en verificatieonderpanden. Ingenieurs kunnen vragen stellen zoals "Ik wil de interrupt controller uitbreiden om een lage energiemodus te ondersteunen, laat me zien welke specificatiesecties moeten worden gewijzigd" en direct relevante vereisten naar boven halen.
IBM test deze modellen om zoeken en redeneren in technische documentatie te verbeteren.
Nemotron Speech: praat met je apparaten zoals nooit tevoren
Model: Nemotron-Speech-Streaming-En-0.6B
Parameters: 600M
Architectuur: Cache-aware FastConformer encoder + RNN-T decoder
Latentie: Sub-100ms streaming
Licentie: Commercieel gebruik toegestaan
Nemotron Speech levert realtime spraakherkenning die 10x sneller presteert dan vergelijkbare modellen en bovenaan de huidige ASR-ranglijsten staat.

Belangrijkste kenmerken
- Cache-aware streaming architectuur: verwerkt alleen nieuwe audiofragmenten terwijl gecachte encodercontext wordt hergebruikt
- Runtime-configureerbare latentiemodi: 80ms, 160ms, 560ms of 1,12s fragmenten zonder opnieuw trainen
- Ingebouwde ondersteuning voor interpunctie en hoofdletters
- Getraind op 285.000 uur audiodata uit de NVIDIA Granary-dataset
Wie gebruikt het
Bosch gebruikt Nemotron Speech al om bestuurders in staat te stellen via spraakopdrachten met voertuigen te communiceren. ServiceNow traint zijn Apriel-modelfamilie op Nemotron-datasets voor kostenefficiënte multimodale prestaties.
Verwacht deze technologie in slimme huisapparaten, klantenservicesystemen en toegankelijkheidstools gedurende 2026.
Clara: snellere geneesmiddelenontdekking en betere gezondheidszorg

La-Proteina: Eiwitontwerp op atoomniveau
ReaSyn v2: Haalbaarheid van geneesmiddelensynthese
KERMT: Computationele veiligheidstests
RNAPro: RNA 3D-vormvoorspelling
Dataset: 455.000 synthetische eiwitstructuren
NVIDIA's nieuwe Clara AI-modellen zijn bedoeld om de kloof tussen digitale ontdekking en echte geneeskunde te overbruggen. Hoewel je niet direct met deze modellen zult werken, kunnen ze een aanzienlijke impact hebben op je gezondheidszorg.
Modeloverzicht
| Model | Functie | Impact |
|---|---|---|
| La-Proteina | Ontwerp grote, atoom-nauwkeurige eiwitten | Bestudeer voorheen onbehandelbare ziekten |
| ReaSyn v2 | Integreer synthesehaalbaarheid in ontdekking | Voorkom verspild onderzoek naar onpraktische verbindingen |
| KERMT | Voorspel geneesmiddel-lichaaminteracties | Ontdek problemen vóór dure klinische proeven |
| RNAPro | Voorspel RNA 3D-vormen | Maak gepersonaliseerde RNA-gebaseerde therapeutica mogelijk |
Conclusie: Behandelingen kunnen patiënten sneller en tegen lagere kosten bereiken.
Alpamayo: zelfrijdende auto's slimmer maken

Model: Alpamayo-R1-10B
Parameters: 10 miljard (8,2B Cosmos Reason backbone + 2,3B action expert)
Trainingsdata: 1+ miljard afbeeldingen uit 80.000 uur multi-camera rijden
Dataset: 1.700+ uur rijdata uit 25 landen
Licentie: Niet-commercieel (onderzoek)
NVIDIA's nieuwe Alpamayo-familie zal het pad naar echt autonome voertuigen versnellen. Dit is het eerste open reasoning VLA-model van de industrie ontworpen voor autonoom rijden.
Belangrijkste innovatie: Chain-of-Thought Reasoning
In tegenstelling tot traditionele AV-systemen die alleen objecten detecteren en routes plannen, gebruikt Alpamayo chain-of-thought reasoning. Het kan:
- Video-input van meerdere camera's verwerken
- Rijtrajecten genereren
- De logica achter elke beslissing uitleggen
Voorbeelduitvoer: "Beweeg naar links om meer afstand te creëren van de bouwkegels die in de rijbaan komen"
Wat is inbegrepen
- Alpamayo 1: 10B reasoning VLA-model op Hugging Face
- AlpaSim: open-source end-to-end simulatieframework
- Physical AI Open Datasets: 1.700+ uur met zeldzame randgevallen uit 25 landen en 2.500+ steden
Wie gebruikt het
Lucid Motors, JLR, Uber en Berkeley DeepDrive gebruiken Alpamayo om reasoning-gebaseerde AV-stacks te ontwikkelen voor Level 4-autonomie.
Cosmos: robots leren de fysieke wereld begrijpen

Cosmos Reason 2: 2B en 8B parameterversies
Contextvenster: 256K tokens (16x groter dan v1)
Architectuur: Gebaseerd op Qwen3-VL
Licentie: Commercieel gebruik toegestaan (NVIDIA Open Model License)
Op Hugging Face is robotica het snelst groeiende segment geworden, met NVIDIA's modellen die de downloads leiden.
Cosmos-modelfamilie
| Model | Parameters | Functie |
|---|---|---|
| Cosmos Reason 2 | 2B / 8B | Physical AI reasoning VLM voor robots en AI-agents |
| Cosmos Transfer 2.5 | - | Video-naar-wereld stijloverdracht |
| Cosmos Predict 2.5 | 2B / 14B | Toekomstige toestandsvoorspelling als video |
Belangrijkste kenmerken van Cosmos Reason 2
- Verbeterd ruimtelijk-temporeel begrip met tijdstempelprecisie
- 2D/3D-puntlokalisatie en bounding box-coördinaten
- Trajectdata-uitvoer voor robotbesturing
- OCR-ondersteuning voor het lezen van tekst in omgevingen
- Chain-of-thought reasoning met
<think>-tags
Isaac GR00T N1.6: Humanoïde robot foundation model
Parameters: 3B
Basis VLM: Cosmos-Reason-2B variant
Architectuur: VLA met 32-laags diffusietransformator
GR00T N1.6 is een open vision-language-action model speciaal gebouwd voor humanoïde robots. Het ontgrendelt volledige lichaamscontrole en gebruikt Cosmos Reason voor beter contextueel begrip.
Wie gebruikt het
- Franka Robotics, Humanoid en NEURA Robotics , simuleren, trainen en valideren robotgedrag
- Salesforce, Hitachi, Uber en VAST Data , verkeersmonitoring en werkplekproductiviteit
- Milestone , vision AI-agents voor openbare veiligheid
Nemotron Safety: betrouwbare AI bouwen

Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII-detectie: Nemotron-PII (GLiNER-gebaseerd)
Licentie: Commercieel gebruik toegestaan
Voor bedrijven die AI implementeren, omvat Nemotron Safety contentveiligheidsmodellen en PII-detectie met hoge nauwkeurigheid.
Componenten
- Content Safety Model: uitgebreide meertalige ondersteuning met culturele nuance
- PII-detectie: detecteert gevoelige persoonlijke gegevens voordat ze lekken
- Onderwerpcontrole: beheert over welke onderwerpen de AI kan praten
Wie gebruikt het
- CrowdStrike, Cohesity en Fortinet: versterken AI-applicatiebeveiliging
- CodeRabbit: ondersteunt AI-codebeoordelingen met verbeterde snelheid en nauwkeurigheid
- Palantir: integreert in Ontology-framework voor gespecialiseerde AI-agents
Wat dit voor iedereen betekent
Alle modellen en data zijn nu beschikbaar op GitHub en Hugging Face, ook als NVIDIA NIM-microservices voor schaalbare implementatie.
Open data-overzicht
| Dataset | Grootte | Inhoud |
|---|---|---|
| Taaltokens | 10 biljoen | Meertalig redeneren, coderen, veiligheid |
| Roboticatrajecten | 500.000 | Robotbeweging en manipulatie |
| Eiwitstructuren | 455.000 | Synthetische structuren voor biomedische AI |
| Voertuigsensordata | 100 TB | Diverse rijomstandigheden |
| Rijvideo | 1.700+ uur | Zeldzame randgevallen uit 25 landen |
Links om te beginnen
- Nemotron-modellen: developer.nvidia.com/nemotron
- Cosmos-modellen: github.com/nvidia-cosmos
- Alpamayo: developer.nvidia.com/drive/alpamayo
- Isaac GR00T: developer.nvidia.com/isaac/gr00t
Voor gewone gebruikers betekent deze release betere spraakassistenten, slimmer zoeken in documenten, snellere geneesmiddelenontwikkeling, veiligere zelfrijdende auto's en capabelere robots. Deze technologieën zullen gedurende 2026 in consumentenproducten terechtkomen.
NVIDIA wedt erop dat ze meer GPU's verkopen door het hele AI-ecosysteem mogelijk te maken. Op basis van de bedrijven die deze technologieën al adopteren, werpt die gok zijn vruchten af.


