NVIDIA, AI 개발 가속화를 위한 대규모 오픈 모델, 데이터 및 도구 컬렉션 공개

NVIDIA가 역사상 가장 큰 규모의 오픈소스 AI 릴리스를 발표했습니다. 음성, 로보틱스, 자율주행차, 헬스케어 등을 위한 새로운 모델들이 포함되어 있습니다.

CES 2026에서 NVIDIA는 현재까지 가장 중요한 오픈소스 AI 릴리스를 발표했습니다. 음성 인식부터 신약 개발까지 모든 분야를 아우르는 새로운 모델, 데이터셋, 도구를 공개했습니다.

그 규모가 놀랍습니다:

10조 개의 언어 학습 토큰
50만 개의 로봇 궤적 데이터
45만 5천 개의 단백질 구조
100테라바이트의 차량 센서 데이터

Bosch, Salesforce, Uber, Palantir, CrowdStrike를 포함한 주요 기업들이 이미 이러한 기술을 기반으로 구축하고 있습니다.

Nemotron RAG: 더 스마트한 문서 검색

임베딩 모델: Llama-Nemotron-Embed-VL-1B-V2 (17억 파라미터)
재순위 모델: Llama-Nemotron-Rerank-VL-1B-V2 (17억 파라미터)
추가 제공: 80억 파라미터 텍스트 전용 임베딩 모델
컨텍스트 길이: 최대 8,192 토큰
라이선스: 상업적 사용 허용

문서에 묻혀 있는 정보를 찾는 것은 지식 근로자들의 일상적인 어려움입니다. Nemotron RAG는 문서 검색에 멀티모달 인텔리전스를 제공하여 텍스트와 이미지를 모두 처리하고 26개 언어에 걸쳐 정확한 다국어 인사이트를 제공합니다.

작동 방식

Nemotron RAG 파이프라인은 세 가지 구성 요소를 결합합니다:

임베딩 모델: 문서를 저장 및 검색을 위한 벡터 표현으로 변환
재순위 모델: 교차 어텐션을 사용하여 잠재적 후보를 최종 순서로 재정렬
추론 모델: 검색된 컨텍스트를 기반으로 정확한 응답 생성

실제 사례: IT 헬프 데스크 에이전트

NVIDIA는 IT 헬프 데스크 에이전트에서 이러한 모델들이 어떻게 함께 작동하는지 시연했습니다:

Nemotron Nano 9B V2: 응답 생성을 위한 주요 추론 모델
Llama 3.2 EmbedQA 1B V2: 문서를 벡터 임베딩으로 변환
Llama 3.2 RerankQA 1B V2: 검색된 문서의 관련성을 재정렬

이러한 모델들은 언어 생성, 문서 검색, 재순위 기능을 활용하여 에이전트가 사용자 질의에 정확하게 답변할 수 있도록 합니다.

사용 사례

Cadence는 마이크로 아키텍처 문서, 제약 조건, 검증 자료와 같은 논리 설계 자산을 모델링합니다. 엔지니어는 *"인터럽트 컨트롤러를 저전력 상태를 지원하도록 확장하고 싶은데, 어떤 사양 섹션을 변경해야 하는지 보여줘"*와 같은 질문을 하고 즉시 관련 요구사항을 찾을 수 있습니다.

IBM은 기술 문서 전반의 검색 및 추론을 개선하기 위해 이러한 모델을 시범 운영하고 있습니다.

Nemotron Speech: 전례 없는 방식으로 기기와 대화하기

모델: Nemotron-Speech-Streaming-En-0.6B
파라미터: 6억
아키텍처: 캐시 인식 FastConformer 인코더 + RNN-T 디코더
지연 시간: 100ms 미만 스트리밍
라이선스: 상업적 사용 허용

Nemotron Speech는 비교 가능한 모델보다 10배 빠른 실시간 음성 인식을 제공하며 현재 ASR 리더보드 1위를 차지하고 있습니다.

주요 기능

캐시 인식 스트리밍 아키텍처: 캐시된 인코더 컨텍스트를 재사용하면서 새로운 오디오 청크만 처리
런타임 구성 가능한 지연 모드: 재학습 없이 80ms, 160ms, 560ms 또는 1.12초 청크
네이티브 구두점 및 대문자 표기 지원
NVIDIA Granary 데이터셋의 28만 5천 시간 오디오 데이터로 학습

사용 사례

Bosch는 이미 Nemotron Speech를 사용하여 운전자가 음성 명령을 통해 차량과 상호작용할 수 있도록 하고 있습니다. ServiceNow는 비용 효율적인 멀티모달 성능을 위해 Nemotron 데이터셋으로 Apriel 모델 제품군을 학습시킵니다.

2026년 내내 스마트 홈 기기, 고객 서비스 시스템, 접근성 도구에서 이 기술을 기대할 수 있습니다.

Clara: 더 빠른 신약 개발과 더 나은 헬스케어

La-Proteina: 원자 수준 단백질 설계
ReaSyn v2: 약물 합성 가능성
KERMT: 계산 안전성 테스트
RNAPro: RNA 3D 형태 예측
데이터셋: 45만 5천 개의 합성 단백질 구조

NVIDIA의 새로운 Clara AI 모델은 디지털 발견과 실제 의학 사이의 격차를 해소하는 것을 목표로 합니다. 이러한 모델과 직접 상호작용하지는 않겠지만, 헬스케어에 상당한 영향을 미칠 수 있습니다.

모델 분석

모델	기능	영향
La-Proteina	대형 원자 수준 정밀 단백질 설계	이전에 치료 불가능했던 질병 연구
ReaSyn v2	발견 과정에 합성 가능성 통합	비실용적인 화합물에 대한 연구 낭비 방지
KERMT	약물-신체 상호작용 예측	비용이 많이 드는 임상 시험 전에 문제 발견
RNAPro	RNA 3D 형태 예측	개인 맞춤형 RNA 기반 치료제 가능

결론: 치료법이 더 빠르고 저렴한 비용으로 환자에게 도달할 수 있습니다.

Alpamayo: 자율주행차를 더 스마트하게

모델: Alpamayo-R1-10B
파라미터: 100억 (82억 Cosmos Reason 백본 + 23억 액션 전문가)
학습 데이터: 8만 시간의 멀티 카메라 주행에서 10억 개 이상의 이미지
데이터셋: 25개국에서 1,700시간 이상의 주행 데이터
라이선스: 비상업적 (연구용)

NVIDIA의 새로운 Alpamayo 제품군은 진정한 자율주행차로 가는 길을 가속화할 것입니다. 이것은 자율주행을 위해 설계된 업계 최초의 오픈 추론 VLA 모델입니다.

핵심 혁신: 사고의 연쇄 추론

단순히 객체를 감지하고 경로를 계획하는 기존 AV 시스템과 달리, Alpamayo는 사고의 연쇄 추론을 사용합니다. 다음을 수행할 수 있습니다:

여러 카메라의 비디오 입력 처리
주행 궤적 생성
각 결정의 논리 설명

출력 예시: "차선으로 침범하는 공사 콘으로부터 간격을 늘리기 위해 왼쪽으로 조금 이동"

포함 내용

Alpamayo 1: Hugging Face의 100억 추론 VLA 모델
AlpaSim: 오픈소스 엔드투엔드 시뮬레이션 프레임워크
Physical AI 오픈 데이터셋: 25개국 및 2,500개 이상의 도시에서 희귀한 엣지 케이스를 다루는 1,700시간 이상

사용 사례

Lucid Motors, JLR, Uber, Berkeley DeepDrive는 Alpamayo를 사용하여 레벨 4 자율성을 위한 추론 기반 AV 스택을 개발하고 있습니다.

Cosmos: 로봇에게 물리적 세계를 이해하도록 가르치기

Cosmos Reason 2: 20억 및 80억 파라미터 버전
컨텍스트 윈도우: 256K 토큰 (v1보다 16배 더 큼)
아키텍처: Qwen3-VL 기반
라이선스: 상업적 사용 허용 (NVIDIA 오픈 모델 라이선스)

Hugging Face에서 로보틱스는 가장 빠르게 성장하는 분야가 되었으며, NVIDIA의 모델이 다운로드를 선도하고 있습니다.

Cosmos 모델 제품군

모델	파라미터	기능
Cosmos Reason 2	20억 / 80억	로봇 및 AI 에이전트를 위한 물리적 AI 추론 VLM
Cosmos Transfer 2.5	-	비디오-월드 스타일 전환
Cosmos Predict 2.5	20억 / 140억	비디오로 미래 상태 예측

Cosmos Reason 2의 주요 기능

타임스탬프 정밀도를 갖춘 향상된 시공간 이해
2D/3D 포인트 로컬라이제이션 및 바운딩 박스 좌표
로봇 제어를 위한 궤적 데이터 출력
환경에서 텍스트를 읽기 위한 OCR 지원
<think> 태그를 사용한 사고의 연쇄 추론

Isaac GR00T N1.6: 휴머노이드 로봇 파운데이션 모델

파라미터: 30억
기본 VLM: Cosmos-Reason-2B 변형
아키텍처: 32층 확산 트랜스포머를 갖춘 VLA

GR00T N1.6은 휴머노이드 로봇을 위해 특별히 제작된 오픈 비전-언어-액션 모델입니다. 전신 제어를 가능하게 하고 더 나은 맥락 이해를 위해 Cosmos Reason을 사용합니다.

사용 사례

Franka Robotics, Humanoid, NEURA Robotics - 로봇 행동 시뮬레이션, 학습 및 검증
Salesforce, Hitachi, Uber, VAST Data - 교통 모니터링 및 작업장 생산성
Milestone - 공공 안전을 위한 비전 AI 에이전트

Nemotron Safety: 신뢰할 수 있는 AI 구축

콘텐츠 안전: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII 탐지: Nemotron-PII (GLiNER 기반)
라이선스: 상업적 사용 허용

AI를 배포하는 기업을 위해 Nemotron Safety는 콘텐츠 안전 모델과 높은 정확도의 PII 탐지를 포함합니다.

구성 요소

콘텐츠 안전 모델: 문화적 뉘앙스를 갖춘 확장된 다국어 지원
PII 탐지: 민감한 개인 데이터가 유출되기 전에 탐지
주제 제어: AI가 논의할 수 있는 주제 관리

사용 사례

CrowdStrike, Cohesity, Fortinet: AI 애플리케이션 보안 강화
CodeRabbit: 향상된 속도와 정확도로 AI 코드 리뷰 지원
Palantir: 전문 AI 에이전트를 위한 Ontology 프레임워크에 통합

모두에게 의미하는 것

모든 모델과 데이터는 GitHub 및 Hugging Face에서 지금 사용 가능하며, 확장 가능한 배포를 위한 NVIDIA NIM 마이크로서비스로도 제공됩니다.

오픈 데이터 요약

데이터셋	크기	내용
언어 토큰	10조	다국어 추론, 코딩, 안전
로봇 궤적	50만	로봇 동작 및 조작
단백질 구조	45만 5천	생의학 AI를 위한 합성 구조
차량 센서 데이터	100TB	다양한 주행 조건
주행 비디오	1,700시간 이상	25개국의 희귀한 엣지 케이스

시작하기 위한 링크

Nemotron 모델: developer.nvidia.com/nemotron
Cosmos 모델: github.com/nvidia-cosmos
Alpamayo: developer.nvidia.com/drive/alpamayo
Isaac GR00T: developer.nvidia.com/isaac/gr00t

일반 사용자에게 이번 릴리스는 더 나은 음성 비서, 더 스마트한 문서 검색, 더 빠른 약물 개발, 더 안전한 자율주행차, 더 유능한 로봇을 의미합니다. 이러한 기술은 2026년 내내 소비자 제품에 적용될 것입니다.

NVIDIA는 전체 AI 생태계를 활성화함으로써 더 많은 GPU를 판매할 수 있다고 확신하고 있습니다. 이미 이러한 기술을 채택하고 있는 기업들을 보면, 그 확신이 성과를 거두고 있습니다.

Nemotron RAG: 더 스마트한 문서 검색

작동 방식

실제 사례: IT 헬프 데스크 에이전트

사용 사례

Nemotron Speech: 전례 없는 방식으로 기기와 대화하기

주요 기능

사용 사례

Clara: 더 빠른 신약 개발과 더 나은 헬스케어

모델 분석

Alpamayo: 자율주행차를 더 스마트하게

핵심 혁신: 사고의 연쇄 추론

포함 내용

사용 사례

Cosmos: 로봇에게 물리적 세계를 이해하도록 가르치기

Cosmos 모델 제품군

Cosmos Reason 2의 주요 기능

Isaac GR00T N1.6: 휴머노이드 로봇 파운데이션 모델

사용 사례

Nemotron Safety: 신뢰할 수 있는 AI 구축

구성 요소

사용 사례

모두에게 의미하는 것

오픈 데이터 요약

시작하기 위한 링크

AI가 당신의 웹사이트