NVIDIA、AI開発を加速する大規模なオープンモデル、データ、ツールのコレクションをリリース

NVIDIAが史上最大規模のオープンソースAIリリースを発表。音声認識、ロボティクス、自動運転車、ヘルスケアなど、多岐にわたる新モデルを公開。

CES 2026において、NVIDIAはこれまでで最も重要なオープンソースAIリリースとなる可能性のある発表を行いました。同社は、音声認識から創薬まで、あらゆる分野をカバーする新しいモデル、データセット、ツールを公開しました。

その規模は驚異的です:

10兆の言語学習トークン
50万のロボティクス軌道データ
45万5千のタンパク質構造
100テラバイトの車両センサーデータ

Bosch、Salesforce、Uber、Palantir、CrowdStrikeなどの大手企業が、すでにこれらの技術を活用して開発を進めています。

Nemotron RAG: より賢いドキュメント検索

埋め込みモデル: Llama-Nemotron-Embed-VL-1B-V2(17億パラメータ)
リランキングモデル: Llama-Nemotron-Rerank-VL-1B-V2(17億パラメータ)
その他: 80億パラメータのテキスト専用埋め込みモデルも利用可能
コンテキスト長: 最大8,192トークン
ライセンス: 商用利用可能

ドキュメントに埋もれた情報を見つけることは、知識労働者にとって日常的な課題です。Nemotron RAGは、ドキュメント検索にマルチモーダルインテリジェンスをもたらし、テキストと画像の両方を処理し、26言語にわたって正確な多言語インサイトを提供します。

仕組み

Nemotron RAGパイプラインは3つのコンポーネントを組み合わせています:

埋め込みモデル: ドキュメントをベクトル表現に変換して保存・検索
リランキングモデル: クロスアテンションを使用して候補を最終的な順序に並べ替え
推論モデル: 検索されたコンテキストに基づいて正確な応答を生成

実例: ITヘルプデスクエージェント

NVIDIAは、これらのモデルがITヘルプデスクエージェントでどのように連携するかを実証しました:

Nemotron Nano 9B V2: 応答生成のための主要な推論モデル
Llama 3.2 EmbedQA 1B V2: ドキュメントをベクトル埋め込みに変換
Llama 3.2 RerankQA 1B V2: 検索されたドキュメントの関連性を再評価

これらのモデルが連携することで、エージェントは言語生成、ドキュメント検索、リランキング機能を活用してユーザーの質問に正確に回答できます。

導入事例

Cadenceは、マイクロアーキテクチャドキュメント、制約、検証資料などの論理設計資産をモデル化しています。エンジニアは*「割り込みコントローラーを低電力状態に対応させたいのですが、どの仕様セクションを変更する必要がありますか」*といった質問をすることで、関連する要件を即座に見つけることができます。

IBMは、技術ドキュメント全体の検索と推論を改善するために、これらのモデルのパイロット運用を行っています。

Nemotron Speech: かつてない自然さでデバイスと会話

モデル: Nemotron-Speech-Streaming-En-0.6B
パラメータ: 6億
アーキテクチャ: キャッシュ対応FastConformerエンコーダー + RNN-Tデコーダー
レイテンシ: 100ms未満のストリーミング
ライセンス: 商用利用可能

Nemotron Speechは、同等のモデルと比較して10倍高速に動作するリアルタイム音声認識を提供し、現在のASRリーダーボードでトップの性能を誇ります。

主な特徴

キャッシュ対応ストリーミングアーキテクチャ: キャッシュされたエンコーダーコンテキストを再利用しながら、新しいオーディオチャンクのみを処理
実行時に設定可能なレイテンシモード: 再トレーニングなしで80ms、160ms、560ms、または1.12秒のチャンクを選択可能
句読点と大文字化のネイティブサポート
NVIDIA Granaryデータセットの28万5千時間のオーディオデータで学習

導入事例

Boschは、すでにNemotron Speechを使用して、ドライバーが音声コマンドで車両と対話できるようにしています。ServiceNowは、コスト効率の高いマルチモーダル性能を実現するために、NemotronデータセットでAprielモデルファミリーをトレーニングしています。

2026年を通じて、この技術はスマートホームデバイス、カスタマーサービスシステム、アクセシビリティツールに搭載されることが期待されます。

Clara: より迅速な創薬とより良いヘルスケア

La-Proteina: 原子レベルのタンパク質設計
ReaSyn v2: 薬物合成の実現可能性
KERMT: 計算による安全性試験
RNAPro: RNAの3D形状予測
データセット: 45万5千の合成タンパク質構造

NVIDIAの新しいClara AIモデルは、デジタル発見と実世界の医療の間のギャップを埋めることを目指しています。これらのモデルと直接やり取りすることはありませんが、あなたのヘルスケアに大きな影響を与える可能性があります。

モデルの詳細

モデル	機能	影響
La-Proteina	大規模で原子レベルで正確なタンパク質を設計	これまで治療不可能だった疾患の研究
ReaSyn v2	合成の実現可能性を発見プロセスに組み込む	実用的でない化合物への無駄な研究を防止
KERMT	薬物と体の相互作用を予測	高額な臨床試験前に問題を発見
RNAPro	RNAの3D形状を予測	個別化されたRNA治療を可能に

結論: 治療がより速く、より低コストで患者に届く可能性があります。

Alpamayo: 自動運転車をより賢く

モデル: Alpamayo-R1-10B
パラメータ: 100億(82億のCosmos Reasonバックボーン + 23億のアクションエキスパート)
学習データ: 8万時間のマルチカメラ運転から得られた10億以上の画像
データセット: 25カ国から収集された1,700時間以上の運転データ
ライセンス: 非商用(研究用)

NVIDIAの新しいAlpamayoファミリーは、真の自動運転車への道を加速します。これは自動運転向けに設計された業界初のオープン推論VLAモデルです。

主要なイノベーション: 思考の連鎖推論

従来のAVシステムが単にオブジェクトを検出して経路を計画するのとは異なり、Alpamayoは思考の連鎖推論を使用します。以下が可能です:

複数のカメラからのビデオ入力を処理
運転軌道を生成
各決定の背後にある論理を説明

出力例: 「車線に侵入している工事用コーンとの間隔を広げるために左に寄る」

提供内容

Alpamayo 1: Hugging Face上の100億推論VLAモデル
AlpaSim: オープンソースのエンドツーエンドシミュレーションフレームワーク
Physical AI Open Datasets: 25カ国、2,500以上の都市から収集された1,700時間以上のレアエッジケース

導入事例

Lucid Motors、JLR、Uber、Berkeley DeepDriveは、Alpamayoを使用してレベル4自動運転のための推論ベースのAVスタックを開発しています。

Cosmos: ロボットに物理世界を理解させる

Cosmos Reason 2: 20億および80億パラメータバージョン
コンテキストウィンドウ: 25万6千トークン(v1の16倍)
アーキテクチャ: Qwen3-VLベース
ライセンス: 商用利用可能(NVIDIA Open Model License)

Hugging Faceでは、ロボティクスが最も急成長しているセグメントとなっており、NVIDIAのモデルがダウンロード数をリードしています。

Cosmosモデルファミリー

モデル	パラメータ	機能
Cosmos Reason 2	20億 / 80億	ロボットとAIエージェント向けの物理AI推論VLM
Cosmos Transfer 2.5	-	ビデオからワールドへのスタイル転送
Cosmos Predict 2.5	20億 / 140億	ビデオとしての将来状態予測

Cosmos Reason 2の主な特徴

タイムスタンプ精度による時空間理解の強化
2D/3Dポイント位置特定とバウンディングボックス座標
ロボット制御のための軌道データ出力
環境内のテキストを読み取るためのOCRサポート
<think>タグによる思考の連鎖推論

Isaac GR00T N1.6: ヒューマノイドロボット基盤モデル

パラメータ: 30億
ベースVLM: Cosmos-Reason-2B変種
アーキテクチャ: 32層拡散トランスフォーマーを持つVLA

GR00T N1.6は、ヒューマノイドロボット専用に構築されたオープンビジョン言語アクションモデルです。全身制御を可能にし、より良い文脈理解のためにCosmos Reasonを使用します。

導入事例

Franka Robotics、Humanoid、NEURA Robotics , ロボットの動作をシミュレート、トレーニング、検証
Salesforce、Hitachi、Uber、VAST Data , 交通監視と職場の生産性向上
Milestone , 公共安全のためのビジョンAIエージェント

Nemotron Safety: 信頼できるAIの構築

コンテンツ安全性: Llama-3.1-Nemotron-Safety-Guard-8B-v3
PII検出: Nemotron-PII(GLiNERベース)
ライセンス: 商用利用可能

AIを展開する企業にとって、Nemotron Safetyには、コンテンツ安全性モデルと高精度のPII検出が含まれています。

コンポーネント

コンテンツ安全性モデル: 文化的ニュアンスを考慮した多言語サポートの拡張
PII検出: 機密性の高い個人データが漏洩する前に検出
トピック制御: AIが議論できるトピックを管理

導入事例

CrowdStrike、Cohesity、Fortinet: AIアプリケーションのセキュリティを強化
CodeRabbit: 速度と精度を向上させたAIコードレビューを実現
Palantir: 専門的なAIエージェント向けのOntologyフレームワークに統合

これが意味すること

すべてのモデルとデータは、GitHubとHugging Faceで現在利用可能であり、スケーラブルな展開のためのNVIDIA NIMマイクロサービスとしても提供されています。

オープンデータの概要

データセット	サイズ	内容
言語トークン	10兆	多言語推論、コーディング、安全性
ロボティクス軌道	50万	ロボットの動作と操作
タンパク質構造	45万5千	生物医学AI向けの合成構造
車両センサーデータ	100TB	多様な運転条件
運転ビデオ	1,700時間以上	25カ国からのレアエッジケース

始めるためのリンク

Nemotronモデル: developer.nvidia.com/nemotron
Cosmosモデル: github.com/nvidia-cosmos
Alpamayo: developer.nvidia.com/drive/alpamayo
Isaac GR00T: developer.nvidia.com/isaac/gr00t

一般ユーザーにとって、このリリースはより優れた音声アシスタント、より賢いドキュメント検索、より迅速な創薬、より安全な自動運転車、より高性能なロボットを意味します。これらの技術は、2026年を通じて消費者向け製品に組み込まれていくでしょう。

NVIDIAは、AI エコシステム全体を支援することで、より多くのGPUを販売できると賭けています。すでにこれらの技術を採用している企業を見る限り、その賭けは成功しています。

作成者 Namiru.ai - あなたのウェブサイト用のプラグアンドプレイAIチャット。

Nemotron RAG: より賢いドキュメント検索

仕組み

実例: ITヘルプデスクエージェント

導入事例

Nemotron Speech: かつてない自然さでデバイスと会話

主な特徴

導入事例

Clara: より迅速な創薬とより良いヘルスケア

モデルの詳細

Alpamayo: 自動運転車をより賢く

主要なイノベーション: 思考の連鎖推論

提供内容

導入事例

Cosmos: ロボットに物理世界を理解させる

Cosmosモデルファミリー

Cosmos Reason 2の主な特徴

Isaac GR00T N1.6: ヒューマノイドロボット基盤モデル

導入事例

Nemotron Safety: 信頼できるAIの構築

コンポーネント

導入事例

これが意味すること

オープンデータの概要

始めるためのリンク

AIがあなたの ウェブサイト

AIがあなたのウェブサイト