NVIDIA、AI開発を加速する大規模なオープンモデル、データ、ツールのコレクションをリリース

    /
    7 分で読めます
    Ing. Patrik Kelemen
    NVIDIA、AI開発を加速する大規模なオープンモデル、データ、ツールのコレクションをリリース

    NVIDIAが史上最大規模のオープンソースAIリリースを発表。音声認識、ロボティクス、自動運転車、ヘルスケアなど、多岐にわたる新モデルを公開。

    Namiru AI

    AIカスタマーサポート あなたのウェブサイト向け

    URLを貼り付けてください。30秒でサポートエージェントが稼働します。

    CES 2026において、NVIDIAはこれまでで最も重要なオープンソースAIリリースとなる可能性のある発表を行いました。同社は、音声認識から創薬まで、あらゆる分野をカバーする新しいモデル、データセット、ツールを公開しました。

    その規模は驚異的です:

    • 10兆の言語学習トークン
    • 50万のロボティクス軌道データ
    • 45万5千のタンパク質構造
    • 100テラバイトの車両センサーデータ

    Bosch、Salesforce、Uber、Palantir、CrowdStrikeなどの大手企業が、すでにこれらの技術を活用して開発を進めています。


    Nemotron RAG: より賢いドキュメント検索

    image

    埋め込みモデル: Llama-Nemotron-Embed-VL-1B-V2(17億パラメータ)
    リランキングモデル: Llama-Nemotron-Rerank-VL-1B-V2(17億パラメータ)
    その他: 80億パラメータのテキスト専用埋め込みモデルも利用可能
    コンテキスト長: 最大8,192トークン
    ライセンス: 商用利用可能

    ドキュメントに埋もれた情報を見つけることは、知識労働者にとって日常的な課題です。Nemotron RAGは、ドキュメント検索にマルチモーダルインテリジェンスをもたらし、テキストと画像の両方を処理し、26言語にわたって正確な多言語インサイトを提供します。

    仕組み

    Nemotron RAGパイプラインは3つのコンポーネントを組み合わせています:

    1. 埋め込みモデル: ドキュメントをベクトル表現に変換して保存・検索
    2. リランキングモデル: クロスアテンションを使用して候補を最終的な順序に並べ替え
    3. 推論モデル: 検索されたコンテキストに基づいて正確な応答を生成

    実例: ITヘルプデスクエージェント

    NVIDIAは、これらのモデルがITヘルプデスクエージェントでどのように連携するかを実証しました:

    • Nemotron Nano 9B V2: 応答生成のための主要な推論モデル
    • Llama 3.2 EmbedQA 1B V2: ドキュメントをベクトル埋め込みに変換
    • Llama 3.2 RerankQA 1B V2: 検索されたドキュメントの関連性を再評価

    これらのモデルが連携することで、エージェントは言語生成、ドキュメント検索、リランキング機能を活用してユーザーの質問に正確に回答できます。

    導入事例

    Cadenceは、マイクロアーキテクチャドキュメント、制約、検証資料などの論理設計資産をモデル化しています。エンジニアは*「割り込みコントローラーを低電力状態に対応させたいのですが、どの仕様セクションを変更する必要がありますか」*といった質問をすることで、関連する要件を即座に見つけることができます。

    IBMは、技術ドキュメント全体の検索と推論を改善するために、これらのモデルのパイロット運用を行っています。


    Nemotron Speech: かつてない自然さでデバイスと会話

    モデル: Nemotron-Speech-Streaming-En-0.6B
    パラメータ: 6億
    アーキテクチャ: キャッシュ対応FastConformerエンコーダー + RNN-Tデコーダー
    レイテンシ: 100ms未満のストリーミング
    ライセンス: 商用利用可能

    Nemotron Speechは、同等のモデルと比較して10倍高速に動作するリアルタイム音声認識を提供し、現在のASRリーダーボードでトップの性能を誇ります。

    image

    主な特徴

    • キャッシュ対応ストリーミングアーキテクチャ: キャッシュされたエンコーダーコンテキストを再利用しながら、新しいオーディオチャンクのみを処理
    • 実行時に設定可能なレイテンシモード: 再トレーニングなしで80ms、160ms、560ms、または1.12秒のチャンクを選択可能
    • 句読点と大文字化のネイティブサポート
    • NVIDIA Granaryデータセットの28万5千時間のオーディオデータで学習

    導入事例

    Boschは、すでにNemotron Speechを使用して、ドライバーが音声コマンドで車両と対話できるようにしています。ServiceNowは、コスト効率の高いマルチモーダル性能を実現するために、NemotronデータセットでAprielモデルファミリーをトレーニングしています。

    2026年を通じて、この技術はスマートホームデバイス、カスタマーサービスシステム、アクセシビリティツールに搭載されることが期待されます。


    Clara: より迅速な創薬とより良いヘルスケア

    image

    La-Proteina: 原子レベルのタンパク質設計
    ReaSyn v2: 薬物合成の実現可能性
    KERMT: 計算による安全性試験
    RNAPro: RNAの3D形状予測
    データセット: 45万5千の合成タンパク質構造

    NVIDIAの新しいClara AIモデルは、デジタル発見と実世界の医療の間のギャップを埋めることを目指しています。これらのモデルと直接やり取りすることはありませんが、あなたのヘルスケアに大きな影響を与える可能性があります。

    モデルの詳細

    モデル機能影響
    La-Proteina大規模で原子レベルで正確なタンパク質を設計これまで治療不可能だった疾患の研究
    ReaSyn v2合成の実現可能性を発見プロセスに組み込む実用的でない化合物への無駄な研究を防止
    KERMT薬物と体の相互作用を予測高額な臨床試験前に問題を発見
    RNAProRNAの3D形状を予測個別化されたRNA治療を可能に

    結論: 治療がより速く、より低コストで患者に届く可能性があります。


    Alpamayo: 自動運転車をより賢く

    image

    モデル: Alpamayo-R1-10B
    パラメータ: 100億(82億のCosmos Reasonバックボーン + 23億のアクションエキスパート)
    学習データ: 8万時間のマルチカメラ運転から得られた10億以上の画像
    データセット: 25カ国から収集された1,700時間以上の運転データ
    ライセンス: 非商用(研究用)

    NVIDIAの新しいAlpamayoファミリーは、真の自動運転車への道を加速します。これは自動運転向けに設計された業界初のオープン推論VLAモデルです。

    主要なイノベーション: 思考の連鎖推論

    従来のAVシステムが単にオブジェクトを検出して経路を計画するのとは異なり、Alpamayoは思考の連鎖推論を使用します。以下が可能です:

    • 複数のカメラからのビデオ入力を処理
    • 運転軌道を生成
    • 各決定の背後にある論理を説明

    出力例: 「車線に侵入している工事用コーンとの間隔を広げるために左に寄る」

    提供内容

    • Alpamayo 1: Hugging Face上の100億推論VLAモデル
    • AlpaSim: オープンソースのエンドツーエンドシミュレーションフレームワーク
    • Physical AI Open Datasets: 25カ国、2,500以上の都市から収集された1,700時間以上のレアエッジケース

    導入事例

    Lucid Motors、JLR、Uber、Berkeley DeepDriveは、Alpamayoを使用してレベル4自動運転のための推論ベースのAVスタックを開発しています。


    Cosmos: ロボットに物理世界を理解させる

    image

    Cosmos Reason 2: 20億および80億パラメータバージョン
    コンテキストウィンドウ: 25万6千トークン(v1の16倍)
    アーキテクチャ: Qwen3-VLベース
    ライセンス: 商用利用可能(NVIDIA Open Model License)

    Hugging Faceでは、ロボティクスが最も急成長しているセグメントとなっており、NVIDIAのモデルがダウンロード数をリードしています。

    Cosmosモデルファミリー

    モデルパラメータ機能
    Cosmos Reason 220億 / 80億ロボットとAIエージェント向けの物理AI推論VLM
    Cosmos Transfer 2.5-ビデオからワールドへのスタイル転送
    Cosmos Predict 2.520億 / 140億ビデオとしての将来状態予測

    Cosmos Reason 2の主な特徴

    • タイムスタンプ精度による時空間理解の強化
    • 2D/3Dポイント位置特定とバウンディングボックス座標
    • ロボット制御のための軌道データ出力
    • 環境内のテキストを読み取るためのOCRサポート
    • <think>タグによる思考の連鎖推論

    Isaac GR00T N1.6: ヒューマノイドロボット基盤モデル

    パラメータ: 30億
    ベースVLM: Cosmos-Reason-2B変種
    アーキテクチャ: 32層拡散トランスフォーマーを持つVLA

    GR00T N1.6は、ヒューマノイドロボット専用に構築されたオープンビジョン言語アクションモデルです。全身制御を可能にし、より良い文脈理解のためにCosmos Reasonを使用します。

    導入事例

    • Franka Robotics、Humanoid、NEURA Robotics , ロボットの動作をシミュレート、トレーニング、検証
    • Salesforce、Hitachi、Uber、VAST Data , 交通監視と職場の生産性向上
    • Milestone , 公共安全のためのビジョンAIエージェント

    Nemotron Safety: 信頼できるAIの構築

    image

    コンテンツ安全性: Llama-3.1-Nemotron-Safety-Guard-8B-v3
    PII検出: Nemotron-PII(GLiNERベース)
    ライセンス: 商用利用可能

    AIを展開する企業にとって、Nemotron Safetyには、コンテンツ安全性モデルと高精度のPII検出が含まれています。

    コンポーネント

    • コンテンツ安全性モデル: 文化的ニュアンスを考慮した多言語サポートの拡張
    • PII検出: 機密性の高い個人データが漏洩する前に検出
    • トピック制御: AIが議論できるトピックを管理

    導入事例

    • CrowdStrike、Cohesity、Fortinet: AIアプリケーションのセキュリティを強化
    • CodeRabbit: 速度と精度を向上させたAIコードレビューを実現
    • Palantir: 専門的なAIエージェント向けのOntologyフレームワークに統合

    これが意味すること

    すべてのモデルとデータは、GitHubとHugging Faceで現在利用可能であり、スケーラブルな展開のためのNVIDIA NIMマイクロサービスとしても提供されています。

    オープンデータの概要

    データセットサイズ内容
    言語トークン10兆多言語推論、コーディング、安全性
    ロボティクス軌道50万ロボットの動作と操作
    タンパク質構造45万5千生物医学AI向けの合成構造
    車両センサーデータ100TB多様な運転条件
    運転ビデオ1,700時間以上25カ国からのレアエッジケース

    始めるためのリンク


    一般ユーザーにとって、このリリースはより優れた音声アシスタント、より賢いドキュメント検索、より迅速な創薬、より安全な自動運転車、より高性能なロボットを意味します。これらの技術は、2026年を通じて消費者向け製品に組み込まれていくでしょう。

    NVIDIAは、AI エコシステム全体を支援することで、より多くのGPUを販売できると賭けています。すでにこれらの技術を採用している企業を見る限り、その賭けは成功しています。

    作成者 Namiru.ai - あなたのウェブサイト用のプラグアンドプレイAIチャット。

    Patrik Kelemen
    Author
    Ing. Patrik Kelemen
    Founder of Namiru.aiSlovakia, EU

    Senior software engineer with 10+ years of experience, specializing in AI chat widgets and automation. Building Namiru.ai to help businesses leverage AI without complexity.

    AI AgentsAngularReactNodeJSAWSAzure
    この記事を楽しんでいただけましたか?

    AIがあなたの ウェブサイト

    URLを貼り付けて、AIエージェントが数秒で稼働する様子をご覧ください。

    お客様は即座に回答を得られます。あなたはリード、分析、そして時間を取り戻せます。

    クレジットカード不要

    Namiru.ai

    AI chat for your website