メインコンテンツへスキップ

#vlm のAIニュース

4件の記事

GPU バブルの解消:パイプラインデコーディングによる効率化

TLDR AI は、AI モデル生成時に GPU が待機する「バブル」現象を解説し、CPU と GPU の処理を重畳させるパイプラインデコーディング技術でこれを隠蔽する方法を紹介している。

TLDR AI·7月1日·★★★★

自律稼働デバイス向け高精度軽量VLM「PLaMo 2.1-VL」

Preferred Networksは、経済産業省とNEDOのプロジェクト支援を受け、自律稼働デバイス向けの高精度軽量Vision Language Model「PLaMo 2.1-VL」を開発した。8Bサイズと2Bサイズの2モデルを提供し、デバイス上での動作を可能にした。

Preferred Networks·4月3日·★★★★

NVIDIA GPUアクセラレーションエンドポイントを使用したKimi K2.5マルチモーダルVLMの構築

Kimiが最新のオープンソース視覚言語モデル「Kimi K2.5」を発表した。このモデルは汎用マルチモーダルモデルであり、NVIDIA GPUアクセラレーションエンドポイントを活用して構築できる。

NVIDIA Developer Blog·2月5日·★★★★

LLMで「何でも」できる時代のAIエンジニア生存戦略 - LLMのグラウンディング能力について

LLM/VLM時代において、グラウンディング(現実世界との接続)が苦手な点を克服するため、他のモデルとの組み合わせが重要であり、これが次世代AIエンジニアの必須スキルとなる。

Algomatic Tech Blog·7月18日·★★★★