#マルチモーダル llm のAIニュース
4件の記事
マルチモーダル知識グラフ「RAG-Anything」を用いた複雑な実世界ドキュメントの理解
LayerX Tech Blog·6月9日·★★★★
Gemma 4 12B:開発者ガイド
Google が、消費者向けデバイスでの高性能なローカル AI 実行を目的とした高密度マルチモーダルモデル「Gemma 4 12B」を発表し、従来の視覚・音声エンコーダーを不要とする新アーキテクチャを採用した開発者向けのガイドを提供した。
Google Developers AI·6月3日·★★★★
NVIDIA、ドキュメント・音声・動画エージェント向け長文脈マルチモーダルモデル「Nemotron 3 Nano Omni」を発表
NVIDIA は、ドキュメントや音声、動画の分析に特化した新モデル「Nemotron 3 Nano Omni」を発表した。同社はハイブリッドアーキテクチャを採用し、長文脈処理における精度と推論速度を大幅に向上させた。
TLDR AI·4月29日·★★★★
2025年に最も閲覧された10の出版物
アマゾンの科学者らによる2025年で最も閲覧された出版物は、基盤モデルの安全枠組み、クラウド規模での形式的検証、高度なロボティクス、マルチモーダルAI推論などを含む。
Amazon Science·12月30日·★★★★