CES 2026において、NVIDIAはこれまでで最も重要なオープンソースAIリリースとなる可能性のある発表を行いました。同社は、音声認識から創薬まで、あらゆる分野をカバーする新しいモデル、データセット、ツールを公開しました。
その規模は驚異的です:
- 10兆の言語学習トークン
- 50万のロボティクス軌道データ
- 45万5千のタンパク質構造
- 100テラバイトの車両センサーデータ
Bosch、Salesforce、Uber、Palantir、CrowdStrikeなどの大手企業が、すでにこれらの技術を活用して開発を進めています。
Nemotron RAG: より賢いドキュメント検索

埋め込みモデル: Llama-Nemotron-Embed-VL-1B-V2(17億パラメータ)
リランキングモデル: Llama-Nemotron-Rerank-VL-1B-V2(17億パラメータ)
その他: 80億パラメータのテキスト専用埋め込みモデルも利用可能
コンテキスト長: 最大8,192トークン
ライセンス: 商用利用可能
ドキュメントに埋もれた情報を見つけることは、知識労働者にとって日常的な課題です。Nemotron RAGは、ドキュメント検索にマルチモーダルインテリジェンスをもたらし、テキストと画像の両方を処理し、26言語にわたって正確な多言語インサイトを提供します。
仕組み
Nemotron RAGパイプラインは3つのコンポーネントを組み合わせています:
- 埋め込みモデル: ドキュメントをベクトル表現に変換して保存・検索
- リランキングモデル: クロスアテンションを使用して候補を最終的な順序に並べ替え
- 推論モデル: 検索されたコンテキストに基づいて正確な応答を生成
実例: ITヘルプデスクエージェント
NVIDIAは、これらのモデルがITヘルプデスクエージェントでどのように連携するかを実証しました:
- Nemotron Nano 9B V2: 応答生成のための主要な推論モデル
- Llama 3.2 EmbedQA 1B V2: ドキュメントをベクトル埋め込みに変換
- Llama 3.2 RerankQA 1B V2: 検索されたドキュメントの関連性を再評価
これらのモデルが連携することで、エージェントは言語生成、ドキュメント検索、リランキング機能を活用してユーザーの質問に正確に回答できます。
導入事例
Cadenceは、マイクロアーキテクチャドキュメント、制約、検証資料などの論理設計資産をモデル化しています。エンジニアは*「割り込みコントローラーを低電力状態に対応させたいのですが、どの仕様セクションを変更する必要がありますか」*といった質問をすることで、関連する要件を即座に見つけることができます。
IBMは、技術ドキュメント全体の検索と推論を改善するために、これらのモデルのパイロット運用を行っています。
Nemotron Speech: かつてない自然さでデバイスと会話
モデル: Nemotron-Speech-Streaming-En-0.6B
パラメータ: 6億
アーキテクチャ: キャッシュ対応FastConformerエンコーダー + RNN-Tデコーダー
レイテンシ: 100ms未満のストリーミング
ライセンス: 商用利用可能
Nemotron Speechは、同等のモデルと比較して10倍高速に動作するリアルタイム音声認識を提供し、現在のASRリーダーボードでトップの性能を誇ります。

主な特徴
- キャッシュ対応ストリーミングアーキテクチャ: キャッシュされたエンコーダーコンテキストを再利用しながら、新しいオーディオチャンクのみを処理
- 実行時に設定可能なレイテンシモード: 再トレーニングなしで80ms、160ms、560ms、または1.12秒のチャンクを選択可能
- 句読点と大文字化のネイティブサポート
- NVIDIA Granaryデータセットの28万5千時間のオーディオデータで学習
導入事例
Boschは、すでにNemotron Speechを使用して、ドライバーが音声コマンドで車両と対話できるようにしています。ServiceNowは、コスト効率の高いマルチモーダル性能を実現するために、NemotronデータセットでAprielモデルファミリーをトレーニングしています。
2026年を通じて、この技術はスマートホームデバイス、カスタマーサービスシステム、アクセシビリティツールに搭載されることが期待されます。
Clara: より迅速な創薬とより良いヘルスケア

La-Proteina: 原子レベルのタンパク質設計
ReaSyn v2: 薬物合成の実現可能性
KERMT: 計算による安全性試験
RNAPro: RNAの3D形状予測
データセット: 45万5千の合成タンパク質構造
NVIDIAの新しいClara AIモデルは、デジタル発見と実世界の医療の間のギャップを埋めることを目指しています。これらのモデルと直接やり取りすることはありませんが、あなたのヘルスケアに大きな影響を与える可能性があります。
モデルの詳細
| モデル | 機能 | 影響 |
|---|---|---|
| La-Proteina | 大規模で原子レベルで正確なタンパク質を設計 | これまで治療不可能だった疾患の研究 |
| ReaSyn v2 | 合成の実現可能性を発見プロセスに組み込む | 実用的でない化合物への無駄な研究を防止 |
| KERMT | 薬物と体の相互作用を予測 | 高額な臨床試験前に問題を発見 |
| RNAPro | RNAの3D形状を予測 | 個別化されたRNA治療を可能に |
結論: 治療がより速く、より低コストで患者に届く可能性があります。
Alpamayo: 自動運転車をより賢く

モデル: Alpamayo-R1-10B
パラメータ: 100億(82億のCosmos Reasonバックボーン + 23億のアクションエキスパート)
学習データ: 8万時間のマルチカメラ運転から得られた10億以上の画像
データセット: 25カ国から収集された1,700時間以上の運転データ
ライセンス: 非商用(研究用)
NVIDIAの新しいAlpamayoファミリーは、真の自動運転車への道を加速します。これは自動運転向けに設計された業界初のオープン推論VLAモデルです。
主要なイノベーション: 思考の連鎖推論
従来のAVシステムが単にオブジェクトを検出して経路を計画するのとは異なり、Alpamayoは思考の連鎖推論を使用します。以下が可能です:
- 複数のカメラからのビデオ入力を処理
- 運転軌道を生成
- 各決定の背後にある論理を説明
出力例: 「車線に侵入している工事用コーンとの間隔を広げるために左に寄る」
提供内容
- Alpamayo 1: Hugging Face上の100億推論VLAモデル
- AlpaSim: オープンソースのエンドツーエンドシミュレーションフレームワーク
- Physical AI Open Datasets: 25カ国、2,500以上の都市から収集された1,700時間以上のレアエッジケース
導入事例
Lucid Motors、JLR、Uber、Berkeley DeepDriveは、Alpamayoを使用してレベル4自動運転のための推論ベースのAVスタックを開発しています。
Cosmos: ロボットに物理世界を理解させる

Cosmos Reason 2: 20億および80億パラメータバージョン
コンテキストウィンドウ: 25万6千トークン(v1の16倍)
アーキテクチャ: Qwen3-VLベース
ライセンス: 商用利用可能(NVIDIA Open Model License)
Hugging Faceでは、ロボティクスが最も急成長しているセグメントとなっており、NVIDIAのモデルがダウンロード数をリードしています。
Cosmosモデルファミリー
| モデル | パラメータ | 機能 |
|---|---|---|
| Cosmos Reason 2 | 20億 / 80億 | ロボットとAIエージェント向けの物理AI推論VLM |
| Cosmos Transfer 2.5 | - | ビデオからワールドへのスタイル転送 |
| Cosmos Predict 2.5 | 20億 / 140億 | ビデオとしての将来状態予測 |
Cosmos Reason 2の主な特徴
- タイムスタンプ精度による時空間理解の強化
- 2D/3Dポイント位置特定とバウンディングボックス座標
- ロボット制御のための軌道データ出力
- 環境内のテキストを読み取るためのOCRサポート
<think>タグによる思考の連鎖推論
Isaac GR00T N1.6: ヒューマノイドロボット基盤モデル
パラメータ: 30億
ベースVLM: Cosmos-Reason-2B変種
アーキテクチャ: 32層拡散トランスフォーマーを持つVLA
GR00T N1.6は、ヒューマノイドロボット専用に構築されたオープンビジョン言語アクションモデルです。全身制御を可能にし、より良い文脈理解のためにCosmos Reasonを使用します。
導入事例
- Franka Robotics、Humanoid、NEURA Robotics , ロボットの動作をシミュレート、トレーニング、検証
- Salesforce、Hitachi、Uber、VAST Data , 交通監視と職場の生産性向上
- Milestone , 公共安全のためのビジョンAIエージェント
Nemotron Safety: 信頼できるAIの構築

コンテンツ安全性: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII検出: Nemotron-PII(GLiNERベース)
ライセンス: 商用利用可能
AIを展開する企業にとって、Nemotron Safetyには、コンテンツ安全性モデルと高精度のPII検出が含まれています。
コンポーネント
- コンテンツ安全性モデル: 文化的ニュアンスを考慮した多言語サポートの拡張
- PII検出: 機密性の高い個人データが漏洩する前に検出
- トピック制御: AIが議論できるトピックを管理
導入事例
- CrowdStrike、Cohesity、Fortinet: AIアプリケーションのセキュリティを強化
- CodeRabbit: 速度と精度を向上させたAIコードレビューを実現
- Palantir: 専門的なAIエージェント向けのOntologyフレームワークに統合
これが意味すること
すべてのモデルとデータは、GitHubとHugging Faceで現在利用可能であり、スケーラブルな展開のためのNVIDIA NIMマイクロサービスとしても提供されています。
オープンデータの概要
| データセット | サイズ | 内容 |
|---|---|---|
| 言語トークン | 10兆 | 多言語推論、コーディング、安全性 |
| ロボティクス軌道 | 50万 | ロボットの動作と操作 |
| タンパク質構造 | 45万5千 | 生物医学AI向けの合成構造 |
| 車両センサーデータ | 100TB | 多様な運転条件 |
| 運転ビデオ | 1,700時間以上 | 25カ国からのレアエッジケース |
始めるためのリンク
- Nemotronモデル: developer.nvidia.com/nemotron
- Cosmosモデル: github.com/nvidia-cosmos
- Alpamayo: developer.nvidia.com/drive/alpamayo
- Isaac GR00T: developer.nvidia.com/isaac/gr00t
一般ユーザーにとって、このリリースはより優れた音声アシスタント、より賢いドキュメント検索、より迅速な創薬、より安全な自動運転車、より高性能なロボットを意味します。これらの技術は、2026年を通じて消費者向け製品に組み込まれていくでしょう。
NVIDIAは、AI エコシステム全体を支援することで、より多くのGPUを販売できると賭けています。すでにこれらの技術を採用している企業を見る限り、その賭けは成功しています。


