NVIDIA brengt enorme collectie open modellen, data en tools uit om AI-ontwikkeling te versnellen

NVIDIA heeft zojuist een van de grootste open-source AI-releases uit de geschiedenis uitgebracht. Nieuwe modellen voor spraak, robotica, autonome voertuigen, gezondheidszorg en meer.

Op CES 2026 kondigde NVIDIA aan wat mogelijk de belangrijkste open-source AI-release tot nu toe is. Het bedrijf onthulde nieuwe modellen, datasets en tools die alles omvatten, van spraakherkenning tot geneesmiddelenonderzoek.

De omvang is opmerkelijk:

10 biljoen taaltrainingstokens
500.000 roboticatrajecten
455.000 eiwitstructuren
100 terabyte aan voertuigsensordata

Grote bedrijven waaronder Bosch, Salesforce, Uber, Palantir en CrowdStrike bouwen al op deze technologieën.

Nemotron RAG: slimmer zoeken in documenten

Embedding Model: Llama-Nemotron-Embed-VL-1B-V2 (1,7B parameters)
Reranking Model: Llama-Nemotron-Rerank-VL-1B-V2 (1,7B parameters)
Ook beschikbaar: 8B parameter text-only embedding model
Contextlengte: Tot 8.192 tokens
Licentie: Commercieel gebruik toegestaan

Informatie vinden die verborgen zit in documenten is een dagelijkse uitdaging voor kenniswerkers. Nemotron RAG brengt multimodale intelligentie naar documentzoeken en verwerkt zowel tekst als afbeeldingen met nauwkeurige meertalige inzichten in 26 talen.

Hoe het werkt

De Nemotron RAG-pipeline combineert drie componenten:

Embedding Model: zet documenten om in vectorrepresentaties voor opslag en ophalen
Reranking Model: herordent potentiële kandidaten in definitieve volgorde met behulp van cross-attention
Reasoning Model: genereert nauwkeurige antwoorden op basis van opgehaalde context

Praktijkvoorbeeld: IT-helpdesk agent

NVIDIA demonstreerde hoe deze modellen samenwerken in een IT-helpdesk agent:

Nemotron Nano 9B V2: primair redeneermodel voor het genereren van antwoorden
Llama 3.2 EmbedQA 1B V2: zet documenten om in vectorembeddings
Llama 3.2 RerankQA 1B V2: herordent opgehaalde documenten op relevantie

Deze modellen stellen de agent gezamenlijk in staat om gebruikersvragen nauwkeurig te beantwoorden door gebruik te maken van taalgeneratie, documentophaling en herordening.

Wie gebruikt het

Cadence modelleert logische ontwerpassets zoals micro-architectuurdocumenten, beperkingen en verificatieonderpanden. Ingenieurs kunnen vragen stellen zoals "Ik wil de interrupt controller uitbreiden om een lage energiemodus te ondersteunen, laat me zien welke specificatiesecties moeten worden gewijzigd" en direct relevante vereisten naar boven halen.

IBM test deze modellen om zoeken en redeneren in technische documentatie te verbeteren.

Nemotron Speech: praat met je apparaten zoals nooit tevoren

Model: Nemotron-Speech-Streaming-En-0.6B
Parameters: 600M
Architectuur: Cache-aware FastConformer encoder + RNN-T decoder
Latentie: Sub-100ms streaming
Licentie: Commercieel gebruik toegestaan

Nemotron Speech levert realtime spraakherkenning die 10x sneller presteert dan vergelijkbare modellen en bovenaan de huidige ASR-ranglijsten staat.

Belangrijkste kenmerken

Cache-aware streaming architectuur: verwerkt alleen nieuwe audiofragmenten terwijl gecachte encodercontext wordt hergebruikt
Runtime-configureerbare latentiemodi: 80ms, 160ms, 560ms of 1,12s fragmenten zonder opnieuw trainen
Ingebouwde ondersteuning voor interpunctie en hoofdletters
Getraind op 285.000 uur audiodata uit de NVIDIA Granary-dataset

Wie gebruikt het

Bosch gebruikt Nemotron Speech al om bestuurders in staat te stellen via spraakopdrachten met voertuigen te communiceren. ServiceNow traint zijn Apriel-modelfamilie op Nemotron-datasets voor kostenefficiënte multimodale prestaties.

Verwacht deze technologie in slimme huisapparaten, klantenservicesystemen en toegankelijkheidstools gedurende 2026.

Clara: snellere geneesmiddelenontdekking en betere gezondheidszorg

La-Proteina: Eiwitontwerp op atoomniveau
ReaSyn v2: Haalbaarheid van geneesmiddelensynthese
KERMT: Computationele veiligheidstests
RNAPro: RNA 3D-vormvoorspelling
Dataset: 455.000 synthetische eiwitstructuren

NVIDIA's nieuwe Clara AI-modellen zijn bedoeld om de kloof tussen digitale ontdekking en echte geneeskunde te overbruggen. Hoewel je niet direct met deze modellen zult werken, kunnen ze een aanzienlijke impact hebben op je gezondheidszorg.

Modeloverzicht

Model	Functie	Impact
La-Proteina	Ontwerp grote, atoom-nauwkeurige eiwitten	Bestudeer voorheen onbehandelbare ziekten
ReaSyn v2	Integreer synthesehaalbaarheid in ontdekking	Voorkom verspild onderzoek naar onpraktische verbindingen
KERMT	Voorspel geneesmiddel-lichaaminteracties	Ontdek problemen vóór dure klinische proeven
RNAPro	Voorspel RNA 3D-vormen	Maak gepersonaliseerde RNA-gebaseerde therapeutica mogelijk

Conclusie: Behandelingen kunnen patiënten sneller en tegen lagere kosten bereiken.

Alpamayo: zelfrijdende auto's slimmer maken

Model: Alpamayo-R1-10B
Parameters: 10 miljard (8,2B Cosmos Reason backbone + 2,3B action expert)
Trainingsdata: 1+ miljard afbeeldingen uit 80.000 uur multi-camera rijden
Dataset: 1.700+ uur rijdata uit 25 landen
Licentie: Niet-commercieel (onderzoek)

NVIDIA's nieuwe Alpamayo-familie zal het pad naar echt autonome voertuigen versnellen. Dit is het eerste open reasoning VLA-model van de industrie ontworpen voor autonoom rijden.

Belangrijkste innovatie: Chain-of-Thought Reasoning

In tegenstelling tot traditionele AV-systemen die alleen objecten detecteren en routes plannen, gebruikt Alpamayo chain-of-thought reasoning. Het kan:

Video-input van meerdere camera's verwerken
Rijtrajecten genereren
De logica achter elke beslissing uitleggen

Voorbeelduitvoer: "Beweeg naar links om meer afstand te creëren van de bouwkegels die in de rijbaan komen"

Wat is inbegrepen

Alpamayo 1: 10B reasoning VLA-model op Hugging Face
AlpaSim: open-source end-to-end simulatieframework
Physical AI Open Datasets: 1.700+ uur met zeldzame randgevallen uit 25 landen en 2.500+ steden

Wie gebruikt het

Lucid Motors, JLR, Uber en Berkeley DeepDrive gebruiken Alpamayo om reasoning-gebaseerde AV-stacks te ontwikkelen voor Level 4-autonomie.

Cosmos: robots leren de fysieke wereld begrijpen

Cosmos Reason 2: 2B en 8B parameterversies
Contextvenster: 256K tokens (16x groter dan v1)
Architectuur: Gebaseerd op Qwen3-VL
Licentie: Commercieel gebruik toegestaan (NVIDIA Open Model License)

Op Hugging Face is robotica het snelst groeiende segment geworden, met NVIDIA's modellen die de downloads leiden.

Cosmos-modelfamilie

Model	Parameters	Functie
Cosmos Reason 2	2B / 8B	Physical AI reasoning VLM voor robots en AI-agents
Cosmos Transfer 2.5	-	Video-naar-wereld stijloverdracht
Cosmos Predict 2.5	2B / 14B	Toekomstige toestandsvoorspelling als video

Belangrijkste kenmerken van Cosmos Reason 2

Verbeterd ruimtelijk-temporeel begrip met tijdstempelprecisie
2D/3D-puntlokalisatie en bounding box-coördinaten
Trajectdata-uitvoer voor robotbesturing
OCR-ondersteuning voor het lezen van tekst in omgevingen
Chain-of-thought reasoning met <think>-tags

Isaac GR00T N1.6: Humanoïde robot foundation model

Parameters: 3B
Basis VLM: Cosmos-Reason-2B variant
Architectuur: VLA met 32-laags diffusietransformator

GR00T N1.6 is een open vision-language-action model speciaal gebouwd voor humanoïde robots. Het ontgrendelt volledige lichaamscontrole en gebruikt Cosmos Reason voor beter contextueel begrip.

Wie gebruikt het

Franka Robotics, Humanoid en NEURA Robotics , simuleren, trainen en valideren robotgedrag
Salesforce, Hitachi, Uber en VAST Data , verkeersmonitoring en werkplekproductiviteit
Milestone , vision AI-agents voor openbare veiligheid

Nemotron Safety: betrouwbare AI bouwen

Content Safety: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII-detectie: Nemotron-PII (GLiNER-gebaseerd)
Licentie: Commercieel gebruik toegestaan

Voor bedrijven die AI implementeren, omvat Nemotron Safety contentveiligheidsmodellen en PII-detectie met hoge nauwkeurigheid.

Componenten

Content Safety Model: uitgebreide meertalige ondersteuning met culturele nuance
PII-detectie: detecteert gevoelige persoonlijke gegevens voordat ze lekken
Onderwerpcontrole: beheert over welke onderwerpen de AI kan praten

Wie gebruikt het

CrowdStrike, Cohesity en Fortinet: versterken AI-applicatiebeveiliging
CodeRabbit: ondersteunt AI-codebeoordelingen met verbeterde snelheid en nauwkeurigheid
Palantir: integreert in Ontology-framework voor gespecialiseerde AI-agents

Wat dit voor iedereen betekent

Alle modellen en data zijn nu beschikbaar op GitHub en Hugging Face, ook als NVIDIA NIM-microservices voor schaalbare implementatie.

Open data-overzicht

Dataset	Grootte	Inhoud
Taaltokens	10 biljoen	Meertalig redeneren, coderen, veiligheid
Roboticatrajecten	500.000	Robotbeweging en manipulatie
Eiwitstructuren	455.000	Synthetische structuren voor biomedische AI
Voertuigsensordata	100 TB	Diverse rijomstandigheden
Rijvideo	1.700+ uur	Zeldzame randgevallen uit 25 landen

Links om te beginnen

Nemotron-modellen: developer.nvidia.com/nemotron
Cosmos-modellen: github.com/nvidia-cosmos
Alpamayo: developer.nvidia.com/drive/alpamayo
Isaac GR00T: developer.nvidia.com/isaac/gr00t

Voor gewone gebruikers betekent deze release betere spraakassistenten, slimmer zoeken in documenten, snellere geneesmiddelenontwikkeling, veiligere zelfrijdende auto's en capabelere robots. Deze technologieën zullen gedurende 2026 in consumentenproducten terechtkomen.

NVIDIA wedt erop dat ze meer GPU's verkopen door het hele AI-ecosysteem mogelijk te maken. Op basis van de bedrijven die deze technologieën al adopteren, werpt die gok zijn vruchten af.

Nemotron RAG: slimmer zoeken in documenten

Hoe het werkt

Praktijkvoorbeeld: IT-helpdesk agent

Wie gebruikt het

Nemotron Speech: praat met je apparaten zoals nooit tevoren

Belangrijkste kenmerken

Wie gebruikt het

Clara: snellere geneesmiddelenontdekking en betere gezondheidszorg

Modeloverzicht

Alpamayo: zelfrijdende auto's slimmer maken

Belangrijkste innovatie: Chain-of-Thought Reasoning

Wat is inbegrepen

Wie gebruikt het

Cosmos: robots leren de fysieke wereld begrijpen

Cosmos-modelfamilie

Belangrijkste kenmerken van Cosmos Reason 2

Isaac GR00T N1.6: Humanoïde robot foundation model

Wie gebruikt het

Nemotron Safety: betrouwbare AI bouwen

Componenten

Wie gebruikt het

Wat dit voor iedereen betekent

Open data-overzicht

Links om te beginnen

Ontdek wat AI kan doen voor jouw website