#エッジ ai のAIニュース
15件の記事
Liquid AI、非トランスフォーマー型「Liquid Foundation Models 2.5」を公開(230M パラメータ)
Liquid AI は、状態空間と液体ニューラルネットワークに基づく非トランスフォーマーアーキテクチャの「LFM 2.5」を発表した。この 230M パラメータモデルはコンパクトながら、エッジ推論やシーケンス生成でトランスフォーマーの 3 倍サイズのモデルと同等の性能を達成している。
Transformers.js で提案されたクロスオリジンストレージ API の実験
Hugging Face が、Transformers.js 環境で提案されているクロスオリジンストレージ API の実装可能性を実験している。
NVIDIA XR AI を用いた AR グラスおよび XR デバイス向け AI エージェントの構築
NVIDIA は、AR グラスや XR デバイス上で動作する AI エージェントを構築するための技術とアプローチを NVIDIA Developer Blog で発表した。
Gemma 4 12B の紹介:統一型エンコーダー非搭載マルチモーダルモデル
Google DeepMind が、エンコーダーを不要とした新しいマルチモーダルモデル「Gemma 4 12B」を発表した。このモデルは画像とテキストの両方を処理できる統合型アーキテクチャを採用している。
データセンターがあなたのマシンへ(4 分読了)
TLDR AI は、従来のクラウド型データセンターから、ユーザーの端末内で処理を行う分散型アーキテクチャへの移行を提案している。これにより、遅延の削減やプライバシー保護が可能になると説明している。
Google AI Edge を活用した Gemma 4 12B のローカル導入:ラップトップで実行可能なエージェント型ワークフローの実現
Google DeepMind は、メモリ 16GB の一般的なラップトップでも動作する「Gemma 4 12B」モデルを発表し、macOS 上で Google AI Edge Gallery を介してローカルデータ処理や視覚的洞察生成を可能にするエージェント型 AI ワークフローを提供している。
メモリ効率を重視し、エッジでエージェント対応 AI を展開する NVIDIA JetPack 7.2 の発表
NVIDIA は、AI エージェントが物理環境へ移行する際に実世界での展開を加速させるため、メモリ効率を最適化した「NVIDIA JetPack 7.2」を発表した。これにより、NVIDIA Jetson 上でエッジデバイス向けの実用的な AI エージェントの導入が可能となる。
Reachy Mini が完全ローカル動作へ
Hugging Face は、ロボット「Reachy Mini」のソフトウェアをクラウド依存から切り離し、端末上で完全にローカルで動作可能にするアップデートを発表した。これにより、通信環境に依存しない自律制御が可能となる。
ホーム向け Gemini でサービスプロバイダーとハードウェアパートナーを支援
Google は、高度なカメラ知能や自然言語クエリ機能を統合したフルスタックの Gemini AI オファリングを開始し、スマートホームエコシステムを拡大する。これにより、サービスプロバイダーやハードウェアメーカーは、ブランド付きの予防的サービス構築に必要な参考設計と API を利用できるようになる。
Google Tensor SDK Beta と LiteRT の発表
Google が機械学習 SDK「Google Tensor ML SDK」をベータ版へ移行し、開発者が Google Pixel 10 デバイスの TPU で高性能なモデルを構築・展開できる機能を LiteRT と統合して提供開始した。
Cactus Needle(GitHub リポジトリ):Gemini 3.1 から蒸留された軽量モデルがローカル環境で高速動作
Cactus Needle は、Gemini 3.1 を基に蒸留された 2600 万パラメータの Simple Attention Network モデルであり、Mac や PC でローカルファインチューニングが可能。このモデルは Cactus 上で秒間 6,000 トークンのプレフィルと 1,200 トークンのデコード速度を達成し、スマホやウェアラブル端末向けに AI を再定義する目的で開発された。
CyberSecQwen-4B:防衛型サイバーセキュリティには小型・専門化・ローカル実行モデルが不可欠な理由
Qwen ベースの「CyberSecQwen-4B」は、消費者レベルのハードウェア上で動作し、データプライバシーを確保しながら大規模モデルを上回る防御性能を発揮する。この成果は、インフラコストをかけずに高性能を実現する小型専門モデルへの転換を示している。
ダイアログブースト:AmazonがAIでテレビ番組や映画の会話を強化する方法
Amazonは、AIを活用した新しい音声処理技術「ダイアログブースト」を開発し、テレビ番組や映画の会話を強化することで、数百万人の視聴者にとって娯楽コンテンツをよりアクセスしやすくしている。
Stability AIとArmがスマートフォン向けオンデバイス生成音声を実現
Stability AIとArmは、Arm KleidiAIライブラリとStable Audio Open技術を活用し、インターネット接続不要でスマートフォン上で高品質な音声生成を可能にした。処理速度は30倍向上し、生成時間が数分から数秒に短縮される。2025年3月3日のMWCバルセロナで発表予定。
Llama 3.2が小型化とマルチモーダル化を実現
OllamaがMetaと提携し、Llama 3.2をOllamaプラットフォームに導入する。